Estaba explorando cómo los sitios web rastrean a los usuarios y cómo se implementan los paywalls. WSJ.com tiene las mejores formas de detectar usuarios que han leído contenido (lo cual no puedo averiguar cómo lo han hecho).
Los mecanismos estándar conocidos para rastrear a los usuarios (para colocar un muro de pago) son con
- Parámetros de solicitud (incluidos los encabezados de referencia)
- Cookies / Almacenamiento local / Almacenamiento de archivos
- Navegación privada o navegador diferente (relacionado con las cookies)
- encabezados de ETag (forma menos conocida de seguimiento de usuarios)
- direcciones IP
- WebRTC / Service Workers (que se ejecutan en segundo plano)
- Relacionado el almacenamiento en caché del certificado SSL (leer un artículo, no estaba claro cómo se hace)
- Información de huellas dactilares del navegador enviada
Con respecto a wsj.com, la página carga toneladas de javascript de casi 10s de dominios. Su certificado SSL es compartido por decenas de sitios web (esto podría deberse a que utilizan Akamai para servir contenido)
Me preocupa cómo un sitio web me está rastreando en los navegadores, aunque tengo (casi) una pizarra limpia