IPv6 Spams dataset?

2

Mi tesis de maestría es sobre "Gestionar el spam bajo IPv6". Me gustaría usar el algoritmo de aprendizaje de máquina en la información recuperada de los encabezados de correo para ordenar los correos no deseados de correos legítimos. Para hacer mis pruebas, obviamente necesito un gran conjunto de datos de spam y correos electrónicos legítimos (hams). Desafortunadamente, no he podido encontrar un conjunto de datos suficientemente grande de spams IPv6 y correos electrónicos legítimos (hams) en los conjuntos de datos de Internet. ¿Alguien sabe de un conjunto de datos de este tipo en el dominio público?

Alternativamente, cualquier idea para crear mi propio conjunto de datos sería muy apreciada. ¿Hay algún investigador que trabaje en este dominio al que pueda contactar?

Por ahora estoy básicamente usando spams de gmail de algunos amigos míos, puedo encontrar pocos spam ipv6 pero la cantidad que necesito es mucho mayor si quiero resultados explotables del aprendizaje automático ...

PD: Sé que este no es el mejor tipo de pregunta que hacer en steckexchange, ya que conduce más a una discusión abierta, pero realmente necesito ayuda y esto es por el bien de la ciencia, por favor sea indulgente ^^

    
pregunta Vrael 06.04.2017 - 15:25
fuente

0 respuestas

Lea otras preguntas en las etiquetas