Client Tracker: geolocalización abierta para analítica editorial y mapeo de audiencias

Resumen

Introducción: la medición del alcance territorial de contenidos académicos informa estadísticas de internacionalización, la interrupción de servicios de terceros que ofrecían mapas de lectores, que era la que utilizaban las revistas científicas cubanas, dejó a numerosas revistas sin una herramienta de geolocalización simple, abierta y reproducible. Objetivo: describir el diseño y desarrollo de una aplicación web de acceso abierto para identificar la localización aproximada de usuarios y visualizarla en mapas interactivos. Método: se realizó una investigación de desarrollo e innovación tecnológica en abril del 2024. La aplicación web se diseñó sobre sistema operativo Ubuntu 24.04 al utilizar las herramientas: Microsoft Visual Studio Code y el navegador Chrome. Se utilizó como lenguaje de programación JavaScript y Python y sus librerías React y FastAPI respectivamente. La aplicación se confeccionó en tres etapas: búsqueda de información, selección de las herramientas de programación y creación de la aplicación. Resultados: el sistema obtiene el país y, cuando es posible, la región/ciudad (radio de precisión configurable), agrega eventos en tiempo real y muestra calor y marcadores en un mapa (UI responsiva). Se ofrece integración REST/JS, registro auditado y opciones de anonimización y retención. Conclusiones: ClientTracker aporta una alternativa ligera y auditable para visibilizar alcance geográfico de contenidos académicos, con buenas prácticas de privacidad y rutas de mejora para precisión, rendimiento y gobierno de datos.

Palabras clave

Geolocalización por IP, Mapas interactivos, Visualización de datos, Revistas científicas, Open source.

Abstract

Introduction: Measuring the territorial reach of academic content informs internationalization statistics. The interruption of third-party services offering reader maps, which was used by Cuban scientific journals, left numerous journals without a simple, open, and reproducible geolocation tool. Objective: To describe the design and development of an open-access web application to identify the approximate location of users and display it on interactive maps. Method: A technological development and innovation research project was conducted in April 2024. The web application was designed on the Ubuntu 24.04 operating system using Microsoft Visual Studio Code and the Chrome browser. The programming languages used were JavaScript and Python, along with their React and FastAPI libraries, respectively. The application was developed in three stages: information search, programming tool selection, and application creation. Results: The system retrieves the country and, when possible, the region/city (configurable accuracy radius), aggregates real-time events, and displays heat and markers on a map (responsive UI). REST/JS integration, audit trail, and anonymization and retention options are offered. Conclusions: ClientTracker provides a lightweight and auditable alternative for visualizing the geographic reach of academic content, with best privacy practices and improvement paths for accuracy, performance, and data governance.

Keywords

IP geolocation, Interactive maps, Data visualization, Scientific journals, Open source.

Introducción

La medición del alcance territorial de los contenidos académicos trasciende la mera curiosidad estadística para erigirse como una herramienta estratégica fundamental para las editoriales y portales científicos. Visualizar geográficamente la distribución de lectores y autores proporciona una capa de inteligencia invaluable que informa directamente decisiones críticas de negocio y difusión del conocimiento. Este análisis permite identificar mercados emergentes para la internacionalización, optimizar estrategias de marketing dirigidas, priorizar inversiones en traducción de artículos según la demanda regional y evaluar la idoneidad de índices y bases de datos específicos para la audiencia real de la publicación. Por consiguiente, la integración de mapas de datos en los tableros de mando editoriales se convierte en un componente indispensable para cualquier organización que busque maximizar su impacto global de manera informada y eficiente. [1]

Históricamente, la implementación de esta funcionalidad se ha sustentado en la dependencia de servicios externos. Muchas revistas y portales institucionales incorporaron widgets o plataformas de terceros que, de forma sencilla, generaban mapas de visitas atractivos visualmente. Sin embargo, esta practicidad generó una vulnerabilidad latente. La caída o el cierre repentino de varios de estos servicios, un fenómeno común en el dinámico ecosistema digital, dejó un vacío tanto funcional como metodológico. Este episodio puso de manifiesto una problemática subyacente: si bien el uso de estos mapas estaba ampliamente extendido, existía una escasa estandarización y documentación sobre los procesos de creación de estas herramientas, lo que impedía su reconstrucción o despliegue reproducible de manera autónoma e independiente.

En paralelo, el panorama tecnológico y normativo relacionado con la privacidad y el seguimiento de usuarios ha experimentado una transformación radical y acelerada. La creciente regulación (como el GDPR) y las políticas de los navegadores han llevado a la deprecación progresiva de las cookies de terceros, elemento central del tracking tradicional. Asimismo, la dirección IP es ahora ampliamente considerada un dato de carácter personal, cuyo tratamiento exige máximas garantías. Este nuevo paradigma exige soluciones técnicas que adopten enfoques server-side, minimicen la recolección de datos y documenten de forma transparente y auditable su tratamiento para garantizar el cumplimiento legal. La antigua dependencia de servicios externos no auditables se vuelve insostenible en este contexto, y crea una necesidad apremiante de herramientas alternativas. [2]

La importancia de la creación de un sustituto reside en abordar un problema multifacético: la pérdida de una funcionalidad crítica, la necesidad de soberanía tecnológica y el imperativo de cumplir con los más altos estándares de privacidad. Por lo anterior se realiza el presente estudio con el objetivo de describir el diseño y desarrollo de una aplicación web de acceso abierto para identificar la localización aproximada de usuarios y visualizarla en mapas interactivos.

Método

Clasificación del estudio. Innovación tecnológica (creación de software) con evaluación funcional interna.

El equipo se integró por un desarrollador de software, que laboró desde noviembre hasta diciembre del 2024. Por la simplicidad de la aplicación no se hizo control de versiones en repositorios de git.

Arquitectura y flujo

1. Captura: endpoint REST y snippet JS opcional para eventos de “lectura”/“visita”.

2. Resolución geográfica: servicio de geolocalización por IP con cache y radios de confianza configurables.

3. Agregación: almacenamiento orientado a series temporales (contadores por país/región/ciudad, ventana y buckets).

4. Visualización: mapa interactivo y capa de calor; filtros por rango temporal, país, referrer y path.

5. Privacidad: truncamiento/anonimización de IP, salting, retención limitada y bloqueo de trazas por ruta.

Tecnologías

Backend en Python/Node (API REST), base de datos relacional + clave/valor para cache, job queue para resolución diferida, y Leaflet para cartografía interactiva (tiles libres) con layers de marcadores y calor. Integraciones opcionales con colas (RabbitMQ/Redis) y almacenamiento de eventos en frío.

Recolección de información

No se accede a datos personales adicionales; no se usan cookies de terceros; la IP se trata con técnicas de minimización (truncamiento/anonimización), y se ofrece opt-out por encabezado y parámetro.

Evaluación del software

Pruebas unitarias y de integración; load testing con perfiles de 50–500 rps; verificación de latencia p95 en resolución geográfica; validación visual en navegadores modernos y dispositivos móviles; revisión de accesibilidad (atajos, alt text, contraste).

Ética

Diseño privacy by default: desactivado el guardado de IP sin anonimización; documentación de las bases legales posibles (interés legítimo/consentimiento según caso) y guías para retención mínima.

Resultados

Interfaz de usuario (UI)

La vista principal cuenta con el formulario de acceso y registro a través del email ( FIGURA 1 ). Al acceder al usuario se muestra el script que debe ser colocado en el HTML del sitio al que se le desean seguir las estadísticas.

Figura 1: Vista principal de Client Tracker.

En la FIGURA 2 se muestra el mapa resultado, que se observa en el lugar del HTML que se colocó, o como página independiente al acceder a la url de registro con la ruta relativa #id/map.

Figura 2: Vista de mapa de ClientTracker.

Experiencia de usuario(UX)

Atajos de teclado para filtros, tooltips con radio de precisión y confidence, paginación de eventos recientes, y modo oscuro. Documentación integrada con guías de despliegue (README.MD).

Requerimientos

— Hardware/escala: ~1 vCPU y 512–1024 MB RAM para ≤50 rps; escala horizontal por workers.

— SO: Linux x86_64/ARM64.

— Dependencias: motor de BD (PostgreSQL/SQLite según escala), servidor de aplicaciones y reverse proxy con TLS.

Pruebas más recientes

— p95 latencia de registro < 40 ms (sin resolución síncrona).

— p95 latencia de resolución geográfica (con cache caliente) ~5–10 ms/consulta.

— Accesibilidad: contraste AA y navegación por teclado en vistas clave.

— Integraciones: webhook hacia tableros de métricas y pipelines ETL.

Discusión

La geolocalización por IP, que es la que se usa por defecto en la aplicación desarrollada, ofrece, en general, una alta fiabilidad a nivel de país pero una precisión decreciente al acercarnos a niveles subnacionales; esto se debe a la asignación de bloques de direcciones IP a proveedores o ASNs que sirven amplias áreas geográficas y a la dinámica del ruteo en Internet, por lo que la interpretación de datos a nivel de ciudad requiere precaución metodológica y presentación explícita de incertidumbre en los informes. [1]

Bases de datos comerciales y abiertas han mejorado su granularidad y sus factores de confianza en los últimos años, pero la variabilidad entre prefijos, la entrada de nuevas redes móviles y el uso creciente de NATs/CG-NAT obliga a desplegar actualizaciones frecuentes y mecanismos de validación cruzada (p. ej., comparar resultados con muestras de clientes voluntarios) para evitar sesgos sistemáticos en los informes de cobertura. [2]

Tratar de la dirección IP como dato personal en muchos marcos regulatorios impone obligaciones de transparencia, limitación de la finalidad y medidas técnicas (anonimización, minimización, retención limitada); así, cualquier despliegue operativo debe acompañarse de registros de tratamiento, evaluaciones de impacto cuando proceda y opciones técnicas de exclusión para usuarios, a fin de reducir riesgos legales y reputacionales. [3], [4] En la base de datos de la presente aplicación no se recopilan datos como el nombre de usuario u otros personales, lo que garantiza la privacidad de los mismos.

Los cambios en la industria sobre cookies de terceros y las iniciativas de privacidad (como Privacy Sandbox) modifican las palancas disponibles para medir audiencias; por eso, las estrategias de medición basadas exclusivamente en client-side cookies se vuelven frágiles, y conviene diseñar arquitecturas híbridas que combinen señales limpias del servidor con mediciones opcionales en el cliente para mantener continuidad en las series temporales. [5], [6], [7]

La instrumentación server-side, el enfoque desarrollado en ClientTracker, aporta ventajas concretas: mayor resiliencia ante bloqueadores, control centralizado del procesamiento y posibilidades de aplicar lógica de minimización antes del almacenamiento permanente; sin embargo, exige controles de latencia, mecanismos de de duplicación y transparencia sobre qué eventos se elevan al servidor para evitar sesgos de captura. [8], [9]

Las inferencias geográficas sufren distorsiones originadas en la infraestructura (CDN, anycast, túneles VPN, mobile offload), por lo que los análisis deben incorporar métricas de confianza, comparaciones temporales y filtros para detectar picos que correspondan a cambios infraestructurales y no a variaciones reales en la audiencia; sin ese enfoque, se corre el riesgo de tomar decisiones editoriales sobre datos artefactuales. [10] Esta es una de las limitaciones de ClientTracker, ya que con su enfoque minimalista, y su registro único de IP no posibilitan estos tipos de análisis.

La elección de la biblioteca cartográfica (Leaflet en este caso) responde a prioridades de ligereza, extensibilidad y compatibilidad con tiles abiertos; optar por una herramienta con amplio ecosistema facilita integraciones, reduce la dependencia de proveedores y permite aplicar capas de datos (por ejemplo, incertidumbre o agrupamientos) sin cargar el cliente con peso innecesario. [11]

En el plano académico y de I+D, hay trabajos recientes que exploran enfoques híbridos, combinando datos de ruteo, reverse DNS, latencias medidas y aprendizaje automático, que muestran potencial para mejorar la precisión en contextos concretos; dichos enfoques requieren, no obstante, colecciones de entrenamiento representativas y validación ética para evitar amplificar sesgos geográficos. [12]

Conclusiones

Client Tracker ofrece una alternativa práctica y prudente para mapear la huella geográfica de audiencias académicas mediante una arquitectura privacy-first y modular que comunica incertidumbre, prioriza minimización y retención corta, y combina captura server-side con opciones client-side para mantener continuidad de métricas; su adopción debe acompañarse de actualizaciones frecuentes de las bases de geolocalización, validación cruzada de resultados, políticas claras de gobernanza de datos y revisiones técnicas que mitiguen sesgos derivados de la infraestructura de red y garanticen una herramienta útil para la toma de decisiones editoriales sin sacrificar cumplimiento ni transparencia.

CONTRIBUCIÓN DE AUTORÍA

Redacción – borrador original: Annier J. Fajardo Quesada

Redacción – revisión y edición: Todos los autore

Conceptualización: Annier J. Fajardo Quesada, Rolando J. Álvarez Pérez

Curación de datos: René Herrero Pacheco, Jimmy J. Calás Torres

Análisis formal: Annier J. Fajardo Quesada, Rolando J. Álvarez Pérez

Investigación: Todos los autores

Metodología: Annier J. Fajardo Quesada, Jimmy J. Calás Torres

Administración del proyecto: Annier J. Fajardo Quesada

Recursos: René Herrero Pacheco, Rolando J. Álvarez Pérez

Software: Annier J. Fajardo Quesada, Jimmy J. Calás Torres

Supervisión: Annier J. Fajardo Quesada, Rolando J. Álvarez Pérez

Validación: Rolando J. Álvarez Pérez, René Herrero Pacheco

Visualización: Jimmy J. Calás Torres, René Herrero Pacheco

CONFLICTOS DE INTERÉS

Los autores declaran que no existen conflictos de intereses.

FINANCIAMIENTO

Los autores no recibieron financiación para el desarrollo del presente artículo.

REFERENCIAS BIBLIOGRÁFICAS

MaxMind [Internet]. Malden, MA, USA: MaxMind Inc. MaxMind, GeoIP; 2024 [citado 14 Ene 2026]. Geolocation Accuracy. Disponible en: https://support.maxmind.com/knowledge-base/articles/maxmind-geolocation-accuracy
MaxMind [Internet]. Malden, MA, USA: MaxMind Inc. MaxMind, GeoIP; 2024 [citado 14 Ene 2026]. GeoIP Release Notes - 2024 Archive. Disponible en: https://dev.maxmind.com/geoip/release-notes/2024/
European Data Protection Board [Internet]. Bruselas, Bélgica: EDPB SME; 2025 [citado 14 Ene 2026]. Guide What is personal data?. Disponible en: https://www.edpb.europa.eu/sme-data-protection-guide/faq-frequently-asked-questions/answer/what-personal-data_en
European Data Protection Board [Internet]. Bruselas, Bélgica: EDPB SME; 2025 [citado 14 Ene 2026]. Secure personal data. Disponible en: https://www.edpb.europa.eu/sme-data-protection-guide/secure-personal-data_en
CookieScript [Internet]. Lituania: Objectis Ltd; 2025 [citado 14 Ene 2026]. Guides: Google Privacy Sandbox. Disponible en: https://cookie-script.com/guides/google-privacy-sandbox
Reuters [Internet]. EE.UU: Thomson Reuters; 2025 [citado 14 Ene 2026]. Britain says Google’s online-ad commitments no longer needed. Disponible en: https://www.reuters.com/sustainability/boards-policy-regulation/britain-says-googles-online-ad-commitments-no-longer-needed-2025-06-13/
Business Insider [Internet]. California, Colorado; Insider Inc; 2024 [citado 14 Ene 2026]. O'Reilly L. Inside Google’s rocky path towards killing off the web cookie. Disponible en: https://www.businessinsider.com/inside-googles-plan-end-cookies-chrome-browser-2024-1
Matomo [Internet]. New Zealand: Matomo.org; c.2024–2025 [actualizado 23 Mar 2025; citado 14 Ene 2026]. What is server-side tagging?. Disponible en: https://matomo.org/faq/tag-manager/what-is-server-side-tagging/
Data Marketing School [Internet]. Rennes, France: Data Marketing School.com; 2024 [citado 14 Ene 2026]. . Rollin L. Matomo Server-Side tracking with Google Tag Manager. Disponible en: https://data-marketing-school.com/en/blog/google-tag-manager/matomo-server-side/
Cloudflare Radar [Internet]. South Korea: Cloudflare Inc; 2024 [citado 14 Ene 2026]. Year in Review 2023: Explore worldwide trends that shaped our Internet this year. Disponible en: https://radar.cloudflare.com/year-in-review/2023
Leaflet [Internet]. Kyiv, Ukraine: OpenStreetMap Contributors ; 2025 [citado 14 Ene 2026]. Agafonkin V. Leaflet - a JavaScript library for interactive maps. Disponible en: https://leafletjs.com/
Yasin Nur A. Accuracy and coverage analysis of IP geolocation databases [Internet]. In: Sixth International Balkan Conference on Communications and Networking (BalkanCom 2023). İstanbul, Türkiye: Bahcesehir University (BAU). Fazıl Say Conference Hall in South Campus; 2023 [citado 2025/08/20]. Disponible en: https://ieeexplore.ieee.org/document/10167899

Este es un artículo publicado bajo una licencia del Creative Commons