Aprendizajes de una periodista que visualiza datos para entender el mundo

Aprendizajes de una periodista que visualiza datos para entender el mundo

Picture of Por: Hassel Fallas

Por: Hassel Fallas

Periodista y analista de datos

Publicado el 22 de agosto de 2022

Este gráfico que les muestro es, probablemente, uno de los primeros que hice y marcó un antes y un después en mi carrera como periodista y visualizadora de datos. Es sobre el impacto que, a partir de 2008, tuvo la crisis inmobiliaria de Estados Unidos en el turismo de Costa Rica. 

Se trata de un gráfico de doble eje o combinado. El eje derecho es la cantidad semestral de turistas, representada por las barras azules. El eje izquierdo -la línea naranja- es la variación porcentual que tuvo cada semestre respecto del mismo periodo del año anterior. La imagen permite ver la relación entre las dos variables y las tendencias de la crisis.

De esta forma, se evidencia que el golpe más bajo de la crisis fue en el semestre que cerró en julio de 2009, cuando la llegada de turistas fue un 12% inferior a la registrada en igual lapso de julio de 2008. Una tragedia para miles de familias que dependían del turismo porque, en aquél momento, 7 de cada 10 visitantes que llegaban a mi tierra, eran estadounidenses. 

Esa breve explicación sobre cómo leer el gráfico y su contexto fue una de las primeras grandes lecciones que tuve que aprender para tratar de comunicarme mejor con los gráficos: entender que al igual que la redacción de los reportajes, los gráficos requieren de tiempo para pensarse y producirse.   

 Esa revelación llegó cuando yo era reportera de Economía en La Nación de Costa Rica y estaba empeñada en informar de la crisis de la mejor manera posible. La forma más precisa que encontré de hacerlo fue mediante el análisis y la visualización de datos. 

Al principio mis bases de datos y los gráficos eran sencillos: se apoyaban en una recopilación mensual de ingresos de turistas. Acumulaba los datos en períodos de doce, seis o tres meses, sacaba variaciones y tendencias. Por eso, siempre que me preguntan: ¿cómo empezaste en periodismo de datos y visualización de información? Respondo que la culpa la tuvo la crisis.  

A partir de ese momento, me percaté de que trabajar con datos y graficarlos me ayudaba a amplificar el contexto de lo que iba a publicar e ir más allá de la versión oficial. 

Fue un ejercicio que me dió primicias para incontables portadas impresas y también me permitió cambiar mi mentalidad sobre la visualización de datos, porque si los gráficos no son claros, comprensibles, capaces de informar y de generar conocimiento se convierten en una pérdida de tiempo y espacio.

Los elementos de codificación

En ese camino hacia el periodismo visual también aprendí que los gráficos tienen su propio lenguaje para comunicarse con el usuario, sus elementos de codificación que debemos tener presentes a la hora de diseñarlos. 

Aprendí que el marco de referencia es esencial para interpretar el gráfico. Añadir la escala o escalas para medir la magnitud de la información, las leyendas para comprender de qué trata esa información y también para decodificar los colores. 

Comprendí que en el contenido es clave representar los números de manera proporcional a su magnitud. Elegir los gráficos es tan importante como la selección del color y las formas que usamos. 

Finalmente, entendí que las leyendas o anotaciones son esenciales y por eso deben ser sucintas y específicas para guiar al lector en la comprensión y uso de los datos presentados.  Son el contexto fundamental de la información.

Por todas esas razones y experiencias es que me gusta afirmar que la visualización de datos es una forma de explorar la información y con ella explicar visualmente la complejidad de las circunstancias, fenómenos y problemas del mundo que nos rodea. 

Por todas esas razones y experiencias es que me gusta afirmar que la visualización de datos es una forma de explorar la información y con ella explicar visualmente la complejidad de las circunstancias, fenómenos y problemas del mundo que nos rodea. 

Visualización para analizar y comunicar

Para mí, el análisis de datos y la visualización son hermanas siamesas, siempre están unidas. Simultáneamente, la visualización es una herramienta de análisis de datos y una herramienta de comunicación visual.

Como herramienta de análisis, la visualización sirve para encontrar ángulos noticiosos que suelen quedar ocultos entre tablas dinámicas o cruzadas.

Análisis visual de datos para encontrar cluster o conglomerados de contratos públicos que, en el estado de Sonora, México, se comportan de manera similar o siguen patrones parecidos en la forma en que fueron entregados.

Como herramienta de comunicación, la visualización facilita al receptor la comprensión de un tema complejo.

Visualización para evidenciar cómo la falta de planificación urbana y de transporte público multiplicó la necesidad de un auto particular en Costa Rica y con ello, el sector transporte se convirtió en el rey de las emisiones de gases contaminantes de la atmósfera.

Si en periodismo, el análisis y la visualización de datos son hermanas siamesas, su hermana mayor es la rigurosidad.  La misma precisión que exige el periodismo debe aplicarse al análisis y a la representación visual de la información.

  • Todo análisis de datos y visualización debe basarse en información confiable, precisa y verificada. Una buena visualización de datos  comienza con una investigación honesta, con buena calidad e integridad de los datos.

«Puedo equivocarme, por eso no debo confiarme»

Cuando inicio un reportaje o una investigación a partir del análisis y la visualización de datos, siempre repito este mantra: “Puedo equivocarme, por eso no debo confiarme”

¿Por qué? Los que llevamos años en estas tareas del análisis y la visualización sabemos que los procesos repetitivos suelen convertirse en una rutina y en la rutina suele refugiarse un exceso de confianza que puede conducirnos a subestimar riesgos y a dar por verdaderas conclusiones sin la verificación adecuada. 

Todos somos susceptibles a los errores sin importar cuántos años de experiencia tengamos a cuestas. Hace poco, una colega me pidió ayuda para determinar si durante la pandemia de Covid-19, el gobierno de su país había entregado la mayoría de los subsidios de emergencia a empresas de militantes de su partido. 

Cuando crucé la base de datos de los beneficiarios del subsidio con la de los miembros del partido en el poder, el primer recuento arrojó que el 100% de ellos estaba en la lista de los favorecidos. ¡Aquello era una bomba de titular! pero totalmente equivocado. En la fórmula para cruzar los datos yo había omitido un mecanismo de control para detectar falsos y eso alteró los resultados. Por suerte, mi mantra funcionó. Validé el resultado dos veces más en R y Excel y la conclusión verdadera fue muy distinta:  Mucho menos de la mitad de los beneficiarios del subsidio eran militantes del partido de Gobierno.

#ELDIP2022 | El poder de la visualización de los datos

¿Cómo lograr un buen análisis y visualización de datos?

No irse de cabeza con los primeros resultados de un análisis de datos es crucial.  Tanto como los siguientes seis pasos que suelen ser – en mi criterio- el basamento sobre el que se edifica una sólida visualización de datos: 

  1. Limpiar y ordenar los datos para detectar inconsistencias y asegurar su precisión. Buscar errores ortográficos y de tipografía; espacios vacíos, valores extremos, malos formatos de fechas y números, además de valores duplicados que podrían distorsionar el análisis.
  2. Explorar los datos para entender de qué tratan y su contexto. ¿Qué se puede y qué no probar con ellos?
  3. Ir más allá de la aritmética básica. Decir quién tiene más, quién tiene menos, no es suficiente. Cuando se trabaja con datos sobre incidencia de crimen, enfermedades o de cualquier otro fenómeno entre ciudades, departamentos o países es vital calcular tasas para comparar adecuadamente. 
  4. Ir más allá de los promedios estadísticos que suelen ser engañosos. Recordar que además del promedio existen la mediana -que nos enseña el valor central de una serie de datos- y la moda, el número que más veces se repite en un conjunto de datos. Estas medidas nos ayudan a definir mejor las tendencias y la interpretación de los datos. 
  5. Hacer un análisis explicativo para determinar cuáles datos tienen más valor noticioso para crear un mensaje coherente, contextualizado y preciso. 
  6. Finalmente, elegir los gráficos preguntándose: ¿cuál es la mejor forma de presentar la información? De explicarla de forma sencilla, sin robarle profundidad. 
error: No se puede descargar