He estado jugando con esta idea, pero hipotéticamente, si tuvieras un administrador de contraseñas que usaría cualquier posible interpretación (por ejemplo, no caracteres de control como BEL, NUL, DEL, etc., o caracteres sustitutos) código Unicode puntos, y un algoritmo de backend y hash del sitio que los aceptaría, ¿cuántos bits de entropía proporcionaría una contraseña de dieciséis caracteres?
No estoy 100% seguro de que estoy calculando esto correctamente, pero de acuerdo con esta respuesta de StackOverflow , hay 1,111,998 puntos de código válidos posibles para este propósito, por lo que cada carácter debe proporcionar log2(1111998) ≈ 20 bits of entropy per character
, ¿correcto?
¿Esto rompería algún algoritmo común de hashing de contraseña como bcrypt? ¿Hay algún problema imprevisto en el uso de puntos de código Unicode sin asignar en contraseñas, excepto en algunos sitios que restringen el conjunto de caracteres disponibles para usar?