Introducción: la medición del alcance territorial de contenidos académicos informa estadísticas de internacionalización, la interrupción de servicios de terceros que ofrecían mapas de lectores, que era la que utilizaban las revistas científicas cubanas, dejó a numerosas revistas sin una herramienta de geolocalización simple, abierta y reproducible. Objetivo: describir el diseño y desarrollo de una aplicación web de acceso abierto para identificar la localización aproximada de usuarios y visualizarla en mapas interactivos. Método: se realizó una investigación de desarrollo e innovación tecnológica en abril del 2024. La aplicación web se diseñó sobre sistema operativo Ubuntu 24.04 al utilizar las herramientas: Microsoft Visual Studio Code y el navegador Chrome. Se utilizó como lenguaje de programación JavaScript y Python y sus librerías React y FastAPI respectivamente. La aplicación se confeccionó en tres etapas: búsqueda de información, selección de las herramientas de programación y creación de la aplicación. Resultados: el sistema obtiene el país y, cuando es posible, la región/ciudad (radio de precisión configurable), agrega eventos en tiempo real y muestra calor y marcadores en un mapa (UI responsiva). Se ofrece integración REST/JS, registro auditado y opciones de anonimización y retención. Conclusiones: ClientTracker aporta una alternativa ligera y auditable para visibilizar alcance geográfico de contenidos académicos, con buenas prácticas de privacidad y rutas de mejora para precisión, rendimiento y gobierno de datos.
Geolocalización por IP, Mapas interactivos, Visualización de datos, Revistas científicas, Open source.
Introduction: Measuring the territorial reach of academic content informs internationalization statistics. The interruption of third-party services offering reader maps, which was used by Cuban scientific journals, left numerous journals without a simple, open, and reproducible geolocation tool. Objective: To describe the design and development of an open-access web application to identify the approximate location of users and display it on interactive maps. Method: A technological development and innovation research project was conducted in April 2024. The web application was designed on the Ubuntu 24.04 operating system using Microsoft Visual Studio Code and the Chrome browser. The programming languages used were JavaScript and Python, along with their React and FastAPI libraries, respectively. The application was developed in three stages: information search, programming tool selection, and application creation. Results: The system retrieves the country and, when possible, the region/city (configurable accuracy radius), aggregates real-time events, and displays heat and markers on a map (responsive UI). REST/JS integration, audit trail, and anonymization and retention options are offered. Conclusions: ClientTracker provides a lightweight and auditable alternative for visualizing the geographic reach of academic content, with best privacy practices and improvement paths for accuracy, performance, and data governance.
IP geolocation, Interactive maps, Data visualization, Scientific journals, Open source.
La medición del alcance territorial de los contenidos académicos trasciende la mera curiosidad estadística para erigirse como una herramienta estratégica fundamental para las editoriales y portales científicos. Visualizar geográficamente la distribución de lectores y autores proporciona una capa de inteligencia invaluable que informa directamente decisiones críticas de negocio y difusión del conocimiento. Este análisis permite identificar mercados emergentes para la internacionalización, optimizar estrategias de marketing dirigidas, priorizar inversiones en traducción de artículos según la demanda regional y evaluar la idoneidad de índices y bases de datos específicos para la audiencia real de la publicación. Por consiguiente, la integración de mapas de datos en los tableros de mando editoriales se convierte en un componente indispensable para cualquier organización que busque maximizar su impacto global de manera informada y eficiente. [1]
Históricamente, la implementación de esta funcionalidad se ha sustentado en la dependencia de servicios externos. Muchas revistas y portales institucionales incorporaron widgets o plataformas de terceros que, de forma sencilla, generaban mapas de visitas atractivos visualmente. Sin embargo, esta practicidad generó una vulnerabilidad latente. La caída o el cierre repentino de varios de estos servicios, un fenómeno común en el dinámico ecosistema digital, dejó un vacío tanto funcional como metodológico. Este episodio puso de manifiesto una problemática subyacente: si bien el uso de estos mapas estaba ampliamente extendido, existía una escasa estandarización y documentación sobre los procesos de creación de estas herramientas, lo que impedía su reconstrucción o despliegue reproducible de manera autónoma e independiente.
En paralelo, el panorama tecnológico y normativo relacionado con la privacidad y el seguimiento de usuarios ha experimentado una transformación radical y acelerada. La creciente regulación (como el GDPR) y las políticas de los navegadores han llevado a la deprecación progresiva de las cookies de terceros, elemento central del tracking tradicional. Asimismo, la dirección IP es ahora ampliamente considerada un dato de carácter personal, cuyo tratamiento exige máximas garantías. Este nuevo paradigma exige soluciones técnicas que adopten enfoques server-side, minimicen la recolección de datos y documenten de forma transparente y auditable su tratamiento para garantizar el cumplimiento legal. La antigua dependencia de servicios externos no auditables se vuelve insostenible en este contexto, y crea una necesidad apremiante de herramientas alternativas. [2]
La importancia de la creación de un sustituto reside en abordar un problema multifacético: la pérdida de una funcionalidad crítica, la necesidad de soberanía tecnológica y el imperativo de cumplir con los más altos estándares de privacidad. Por lo anterior se realiza el presente estudio con el objetivo de describir el diseño y desarrollo de una aplicación web de acceso abierto para identificar la localización aproximada de usuarios y visualizarla en mapas interactivos.
Clasificación del estudio. Innovación tecnológica (creación de software) con evaluación funcional interna.
El equipo se integró por un desarrollador de software, que laboró desde noviembre hasta diciembre del 2024. Por la simplicidad de la aplicación no se hizo control de versiones en repositorios de git.
1. Captura: endpoint REST y snippet JS opcional para eventos de “lectura”/“visita”.
2. Resolución geográfica: servicio de geolocalización por IP con cache y radios de confianza configurables.
3. Agregación: almacenamiento orientado a series temporales (contadores por país/región/ciudad, ventana y buckets).
4. Visualización: mapa interactivo y capa de calor; filtros por rango temporal, país, referrer y path.
5. Privacidad: truncamiento/anonimización de IP, salting, retención limitada y bloqueo de trazas por ruta.
Backend en Python/Node (API REST), base de datos relacional + clave/valor para cache, job queue para resolución diferida, y Leaflet para cartografía interactiva (tiles libres) con layers de marcadores y calor. Integraciones opcionales con colas (RabbitMQ/Redis) y almacenamiento de eventos en frío.
No se accede a datos personales adicionales; no se usan cookies de terceros; la IP se trata con técnicas de minimización (truncamiento/anonimización), y se ofrece opt-out por encabezado y parámetro.
Pruebas unitarias y de integración; load testing con perfiles de 50–500 rps; verificación de latencia p95 en resolución geográfica; validación visual en navegadores modernos y dispositivos móviles; revisión de accesibilidad (atajos, alt text, contraste).
Diseño privacy by default: desactivado el guardado de IP sin anonimización; documentación de las bases legales posibles (interés legítimo/consentimiento según caso) y guías para retención mínima.
La vista principal cuenta con el formulario de acceso y registro a través del email ( FIGURA 1 ). Al acceder al usuario se muestra el script que debe ser colocado en el HTML del sitio al que se le desean seguir las estadísticas.
En la FIGURA 2 se muestra el mapa resultado, que se observa en el lugar del HTML que se colocó, o como página independiente al acceder a la url de registro con la ruta relativa #id/map.
Atajos de teclado para filtros, tooltips con radio de precisión y confidence, paginación de eventos recientes, y modo oscuro. Documentación integrada con guías de despliegue (README.MD).
— Hardware/escala: ~1 vCPU y 512–1024 MB RAM para ≤50 rps; escala horizontal por workers.
— SO: Linux x86_64/ARM64.
— Dependencias: motor de BD (PostgreSQL/SQLite según escala), servidor de aplicaciones y reverse proxy con TLS.
— p95 latencia de registro < 40 ms (sin resolución síncrona).
— p95 latencia de resolución geográfica (con cache caliente) ~5–10 ms/consulta.
— Accesibilidad: contraste AA y navegación por teclado en vistas clave.
— Integraciones: webhook hacia tableros de métricas y pipelines ETL.
La geolocalización por IP, que es la que se usa por defecto en la aplicación desarrollada, ofrece, en general, una alta fiabilidad a nivel de país pero una precisión decreciente al acercarnos a niveles subnacionales; esto se debe a la asignación de bloques de direcciones IP a proveedores o ASNs que sirven amplias áreas geográficas y a la dinámica del ruteo en Internet, por lo que la interpretación de datos a nivel de ciudad requiere precaución metodológica y presentación explícita de incertidumbre en los informes. [1]
Bases de datos comerciales y abiertas han mejorado su granularidad y sus factores de confianza en los últimos años, pero la variabilidad entre prefijos, la entrada de nuevas redes móviles y el uso creciente de NATs/CG-NAT obliga a desplegar actualizaciones frecuentes y mecanismos de validación cruzada (p. ej., comparar resultados con muestras de clientes voluntarios) para evitar sesgos sistemáticos en los informes de cobertura. [2]
Tratar de la dirección IP como dato personal en muchos marcos regulatorios impone obligaciones de transparencia, limitación de la finalidad y medidas técnicas (anonimización, minimización, retención limitada); así, cualquier despliegue operativo debe acompañarse de registros de tratamiento, evaluaciones de impacto cuando proceda y opciones técnicas de exclusión para usuarios, a fin de reducir riesgos legales y reputacionales. [3], [4] En la base de datos de la presente aplicación no se recopilan datos como el nombre de usuario u otros personales, lo que garantiza la privacidad de los mismos.
Los cambios en la industria sobre cookies de terceros y las iniciativas de privacidad (como Privacy Sandbox) modifican las palancas disponibles para medir audiencias; por eso, las estrategias de medición basadas exclusivamente en client-side cookies se vuelven frágiles, y conviene diseñar arquitecturas híbridas que combinen señales limpias del servidor con mediciones opcionales en el cliente para mantener continuidad en las series temporales. [5], [6], [7]
La instrumentación server-side, el enfoque desarrollado en ClientTracker, aporta ventajas concretas: mayor resiliencia ante bloqueadores, control centralizado del procesamiento y posibilidades de aplicar lógica de minimización antes del almacenamiento permanente; sin embargo, exige controles de latencia, mecanismos de de duplicación y transparencia sobre qué eventos se elevan al servidor para evitar sesgos de captura. [8], [9]
Las inferencias geográficas sufren distorsiones originadas en la infraestructura (CDN, anycast, túneles VPN, mobile offload), por lo que los análisis deben incorporar métricas de confianza, comparaciones temporales y filtros para detectar picos que correspondan a cambios infraestructurales y no a variaciones reales en la audiencia; sin ese enfoque, se corre el riesgo de tomar decisiones editoriales sobre datos artefactuales. [10] Esta es una de las limitaciones de ClientTracker, ya que con su enfoque minimalista, y su registro único de IP no posibilitan estos tipos de análisis.
La elección de la biblioteca cartográfica (Leaflet en este caso) responde a prioridades de ligereza, extensibilidad y compatibilidad con tiles abiertos; optar por una herramienta con amplio ecosistema facilita integraciones, reduce la dependencia de proveedores y permite aplicar capas de datos (por ejemplo, incertidumbre o agrupamientos) sin cargar el cliente con peso innecesario. [11]
En el plano académico y de I+D, hay trabajos recientes que exploran enfoques híbridos, combinando datos de ruteo, reverse DNS, latencias medidas y aprendizaje automático, que muestran potencial para mejorar la precisión en contextos concretos; dichos enfoques requieren, no obstante, colecciones de entrenamiento representativas y validación ética para evitar amplificar sesgos geográficos. [12]
Client Tracker ofrece una alternativa práctica y prudente para mapear la huella geográfica de audiencias académicas mediante una arquitectura privacy-first y modular que comunica incertidumbre, prioriza minimización y retención corta, y combina captura server-side con opciones client-side para mantener continuidad de métricas; su adopción debe acompañarse de actualizaciones frecuentes de las bases de geolocalización, validación cruzada de resultados, políticas claras de gobernanza de datos y revisiones técnicas que mitiguen sesgos derivados de la infraestructura de red y garanticen una herramienta útil para la toma de decisiones editoriales sin sacrificar cumplimiento ni transparencia.
Redacción – borrador original: Annier J. Fajardo Quesada
Redacción – revisión y edición: Todos los autore
Conceptualización: Annier J. Fajardo Quesada, Rolando J. Álvarez Pérez
Curación de datos: René Herrero Pacheco, Jimmy J. Calás Torres
Análisis formal: Annier J. Fajardo Quesada, Rolando J. Álvarez Pérez
Investigación: Todos los autores
Metodología: Annier J. Fajardo Quesada, Jimmy J. Calás Torres
Administración del proyecto: Annier J. Fajardo Quesada
Recursos: René Herrero Pacheco, Rolando J. Álvarez Pérez
Software: Annier J. Fajardo Quesada, Jimmy J. Calás Torres
Supervisión: Annier J. Fajardo Quesada, Rolando J. Álvarez Pérez
Validación: Rolando J. Álvarez Pérez, René Herrero Pacheco
Visualización: Jimmy J. Calás Torres, René Herrero Pacheco
Los autores declaran que no existen conflictos de intereses.
Los autores no recibieron financiación para el desarrollo del presente artículo.
Copyright 2025 Annier Jesús Fajardo Quesada1 et al.
Este es un artículo publicado bajo una licencia del Creative Commons