Al enviar HTML que contiene entidades al OWASP HTMLSanitzer , las entidades se convierten.
Por ejemplo:
BEFORE: <p>blah blah blah ♦</p>
El HTML resultante termina pareciéndose a esto:
AFTER: <p>blah blah blah ?</p>
La entidad se convierte de nuevo a su carácter original de Unicode.
¿Por qué OWASP hace eso? ¿Las entidades son inseguras? Para mí, tener las entidades resuelve cualquier problema en el camino con texto Unicode.
Además, ¿hay una manera de permitir que las entidades permanezcan intactas en HTMLSanitzer?