¿Suponiendo que existe un número suficiente de entradas benignas?

1

Me he encontrado con varias soluciones de seguridad basadas en aprendizaje automático que entrenan a sus detectores / modelos utilizando entradas "benignas". El supuesto es que el operador tiene acceso a entradas benignas suficientemente exhaustivas (entradas benignas que brindan suficiente cobertura de entrada y código para el uso típico).

¿Es un supuesto realista en la práctica? ¿Hay formas de generar automáticamente tales entradas benignas? ¿O es eso una infancia académica?

    
pregunta John 28.11.2015 - 00:07
fuente

2 respuestas

1
  

¿Es un supuesto realista en la práctica? ¿Hay formas de generar automáticamente tales entradas benignas? ¿O es eso una infancia académica?

Eso altamente depende de qué tipo de datos de entrada está intentando simular. Así que la respuesta corta es: solo alguien que esté familiarizado con tu dominio puede decidir eso.

Esto es lo que quiero decir: si las "entradas benignas" que intenta simular son datos de usuario realistas de los servicios de ubicación de Google, o el comportamiento de navegación típico en Amazon.com, entonces sí, la capacidad de simular esas entradas está "en Su infancia académica ".

Por otra parte, si está intentando realizar una prueba de lápiz en una aplicación que acepta un protocolo estandarizado, por ejemplo, el certificado Protocolo de administración (CMP) - que tiene un número muy pequeño de tipos de mensajes aceptados (~ 30 para CMP), entonces no, en realidad es bastante fácil generar un conjunto completo y exhaustivo de entradas de ejemplo.

Entonces, ¿qué estás tratando de hacer? ¿Qué tipo de datos de entrada estás tratando de simular? Si edita su pregunta para proporcionar más detalles, podemos darle una mejor respuesta.

    
respondido por el Mike Ounsworth 28.11.2015 - 02:22
fuente
0

¿Es realista suponer que sus clientes proporcionarán suficiente tráfico para capacitar adecuadamente a su detector heurístico? Eso depende de la implementación.

Tu negocio puede ser cíclico. Es posible que tenga ventas ocupadas durante un período de vacaciones y luego realice un inventario el mes siguiente. Si no entrena el sistema con datos de ventas e inventario, puede identificar falsamente su tráfico de inventario como hostil. Pero como es su negocio , usted debe conocer esos ciclos y dar cuenta de ellos. Ningún sistema heurístico puede predecir cómo funciona su negocio, o qué tipo de tráfico consideraría "normal" su negocio.

Entonces, así como no pueden reconocer su tráfico como normal, sus sistemas son igualmente incapaces de generar inherentemente el tráfico "benigno". Por eso se le solicita que proporcione explícitamente sus ejemplos.

    
respondido por el John Deters 28.11.2015 - 01:46
fuente

Lea otras preguntas en las etiquetas