Esto depende de si está preocupado por ser condenado o por tratar con una causa probable (en los EE. UU.).
Supongamos que estás en casa. Usted inicia su VPN y se conecta a su proveedor de VPN externo. Si estoy monitoreando el tráfico saliente (desde su casa), sé que acaba de conectarse a una determinada dirección IP y que la dirección IP es un proveedor de VPN. Todo lo que está dentro de la carga útil del paquete está encriptado.
Luego, mientras está en casa, decide revisar su correo electrónico. Resulta que estoy monitoreando el tráfico saliente del proveedor de VPN (que no está cifrado). Lo grabo todo usando snort y ejecuto Wireshark contra la salida. Veo una conexión a su dirección de correo electrónico y un correo electrónico escrito. Esto puede ser protegido por SSL si es webmail. Si es un correo electrónico normal, es probable que sea texto simple. Si no es texto simple, puedo intentar interceptarlo en el receptor. El correo electrónico no tiene importancia legal (es decir, no lo está utilizando para planificar algo ilegal). Sin embargo, tomo nota del hecho de que confunde el uso de su, allí, y están. También notaré algunos modismos que te gusta usar.
Durante el curso del monitoreo del tráfico saliente, veo que su cuenta escribe varios correos electrónicos. Noto patrones de faltas de ortografía, y más figuras del habla. Los colecciono durante un mes o dos.
Luego puse los artículos que noté en Wireshark. Agrego varias cosas que se sabe que dices. Cada vez que se produce una falta de ortografía o el uso de una expresión idiomática (que usted usa) se encuentra en el contenido de CUALQUIER paquete que sale del servicio VPN que usa, lo veo.
Dado otro mes o dos tengo muchos puntos de datos. Algunos son sitios a los que fuiste, otros no. Lo primero que hago es eliminar todos los puntos de datos que salieron del proveedor de servicios VPN mientras NO estabas en línea (es decir, no te vi en línea desde casa, recuerda que comencé a monitorear esa conexión).
Luego miro el tráfico restante y veo si tengo puntos de clúster. Muchos temas recurrentes. El mismo tema sobre un sobre. Lo comparo con su tráfico no cifrado y su correo electrónico.
No he aplicado suficientes filtros para aislarlo del ruido (personas que usan los mismos modismos / errores ortográficos que usted), pero tendría un buen caso para una causa probable. Si tengo suficientes puntos de referencia, es como una huella digital.
Esencialmente, estoy aplicando un análisis bayesiano a un corpus de trabajo para decir algo sobre la probabilidad de que crea que un ejemplar sea un miembro del conjunto construido por mi sospechoso. La colección de obras que compararía con la que proviene de cualquier trabajo que el sospechoso haya reconocido públicamente es su responsabilidad. Ese análisis es bien conocido (y también hay un sitio completo de estadísticas de StackExchange).
Te dejaré responder, ¿qué obtendré en este momento?