No quiero que esto suene duro, pero esto es parte de mi trabajo diario, y para ser honesto, no creo que tengas la experiencia o el alcance necesarios para lograr algo como esto por ti mismo mientras logras algo. tipo de resultado significativo.
DLP es un dominio ENORME. Ni siquiera se te ha dado una dirección clara sobre qué es lo que necesitas atrapar, lo que hace que esto sea aún más difícil. ¿Robos de ventas internas o libros de negocios? PII? HIPAA? PCI? Es posible que no pase una auditoría de los dos últimos para poner en marcha su propia solución (hable con su auditor ANTES de comenzar el desarrollo).
Y ninguno de sus activadores detectará nada excepto un spambot deshonesto que se ejecuta en su red. En mi experiencia, las personas que exageran los datos saben que están haciendo algo malo y toman al menos UN paso para encubrirlo. Tampoco van a comenzar a enviar 100 veces más correos electrónicos de lo que suelen hacer. En el mejor de los casos, el uso de una expresión regular para números sociales o de A / R puede detectar algunos casos accidentales de Outlook que completa automáticamente la dirección incorrecta y que el remitente la envíe sin mirar.
- ¿Cómo va a distinguir los números de tarjeta de 16 dígitos de cualquier otra secuencia de 16 dígitos?
- Puede capturarlos a todos, pero ¿quién está revisando estos falsos positivos? ¿Hay alguien? Si no tiene el presupuesto para una solución comercial, ¿tiene analistas que revisarán cualquier cosa que encuentre?
- documentos de Word. ¿Está capturando y / o leyendo a través de ellos?
- ¿Se ha cambiado el nombre de los archivos de texto o documentos como otra cosa?
- Imágenes. ¿Está realizando OCR en todas las imágenes salientes?
- Flujos de datos alternativos / stego?
- Si exporto la información del titular de la tarjeta a un PDF y la coloco en un archivo zip cifrado, ¿lo captaría? ¿Qué pasa si coloco ese zip cifrado dentro de otro rar cifrado? Tendría que descifrar al menos una capa de archivo zip / rar y analizar un PDF para atraparlo. Podrías bloquear todos los archivos adjuntos binarios, pero cuando recurran a un canal alternativo para enviarlo de otra forma, ¿lo captarás?
- ¿Quieres capturar números de seguridad social? ¿Cómo los distinguirá de los números de teléfono mal escritos? ¿Es 273-555-1010 un número de teléfono o un social? ¿Qué tal 123769931? Las mismas expresiones regulares atraparán a cualquiera.
Tenga en cuenta que ninguno de estos casos implica un cambio en la velocidad o los archivos adjuntos, como está proponiendo que buscaría. Es solo un correo electrónico malicioso entre muchos mensajes benignos que enviaré ese día. Tal vez el tuyo sea diferente, pero, según mi experiencia, la mayoría de las personas no son lo suficientemente tontas como para simplemente descargar la PII en el cuerpo del correo electrónico y enviarlo; El 90% de las veces se encapsula en al menos otro formato (pdf, txt, doc, doc en zip zip, zip en rar, etc.).
Su pregunta se refería específicamente al correo electrónico, pero también debe considerar a las personas que usan mensajes de Facebook, Dropbox, memorias USB, etc. para filtrar datos ... de lo contrario, puede que no se moleste. El correo electrónico es solo un pequeño vector.
No es mi intención arrojarte sobre ti, solo señalar algunas de mis experiencias con este campo con la esperanza de que te ahorre un poco de dolor de cabeza. No tiene idea de en qué se está metiendo si no tiene presupuesto para herramientas. DLP es una de las pocas áreas en las que creo que las soluciones comerciales pueden hacerlo mucho mejor que rodar las suyas.