Contraseña agrietada Palabras en mandarín Juego de caracteres en inglés

1

Buscaré realizar una auditoría de contraseña de dominio en la que el usuario usará caracteres en inglés, pero puede que tenga un 40% de hablantes de mandarín, por lo que anticipo un gran número de nombres, frases o palabras escritas en mandarín ( pero escrito usando el juego de caracteres en inglés).

Me gustaría realizar un ataque híbrido y, por lo tanto, espero expandir mi lista de diccionarios para incluir frases / palabras / nombres que no estén en inglés, pero ingresados en el conjunto de caracteres en inglés.

¿Alguien sabe de un recurso que se ajuste a esta descripción o tenga acceso a dicho diccionario / lista de palabras? He hecho un poco de google pero no pude encontrar mucho.

Aprecia cualquier entrada.

    
pregunta nopnosrac 28.07.2014 - 21:15
fuente

3 respuestas

3

No hablo chino, pero creo que la palabra operativa a utilizar para sus búsquedas de Google es "pinyin". Este es el método oficial para codificar texto chino en caracteres latinos (aunque no es el único). Así que quieres "listas de palabras en mandarín en pinyin".

Con estos términos, encuentro este diccionario descargable que parece prometedor. En el archivo .u8 , uno encontrará líneas como esta:

 北極熊 北极熊 [bei3 ji2 xiong2] /polar bear/

con la transcripción pinyin entre corchetes [ y ] . Debería poder crear una lista de palabras a partir de este archivo.

    
respondido por el Tom Leek 28.07.2014 - 22:01
fuente
0

Debe mirar en el IME chino (Editor de métodos de entrada) que se proporciona con Windows, y también en los populares de terceros. Sin embargo, todos operan casi igual. Básicamente, ingresa una palabra al escribir caracteres latinos que la emiten, luego la computadora presenta una lista de posibilidades y selecciona una de un menú. Al escribir las contraseñas, la mayoría de los chinos solo ingresan los sonidos, por ejemplo. "xeixei".

    
respondido por el user25221 29.07.2014 - 17:05
fuente
0

Yo diría que el ataque de diccionario basado en palabras es más una práctica de lenguaje alfabético y no tan efectivo en un lenguaje basado en caracteres como el chino.

La mayoría de los caracteres chinos se pueden ver como "palabras" por sí mismas y los chinos a menudo piensan en unidades de caracteres en lugar de palabras. Por ejemplo, usan 字典 (literalmente "libro de caracteres", diccionario de caracteres) en lugar de 词典 ("libro de palabras", diccionario de palabras). Así que es natural que una persona china cree secuencias de caracteres que tengan sentido pero que no aparezcan en ninguna lista de palabras (es como la versión china de passw0rd ).

Por ejemplo, el ejemplo en la respuesta de Tom, 北极熊 , se compone de 北 (norte), 极 (extrme, entendido como polo cuando se sigue a 北) y 熊 (oso). Alguien podría fácilmente tener 南极熊 (oso del polo sur) como su contraseña y esto podría no aparecer en ninguna lista de palabras ya que no es una cosa real. De manera similar, los nombres de la mayoría de las personas no tienen ningún sentido como palabras y es muy probable que las usen en contraseñas.

Un enfoque más completo sería crear todas las posibles pronunciaciones de los personajes en Pinyin y usarlas en tu diccionario. Esto será como crear un alfabeto para el chino. Esto podría explicar por qué la "lista de palabras" en algunas fuentes es mucho más pequeña.

Por supuesto, puede agregar palabras de varios caracteres para acelerar el proceso.

    
respondido por el billc.cn 12.05.2017 - 20:56
fuente

Lea otras preguntas en las etiquetas