Hace unas semanas, en la Unidad de Inteligencia de Datos de La Nación, donde laboro como editora, empezamos un proyecto beta llamado #TallerDataLN.
¿En qué consiste? En compartir, por medio de Twitter, lo que tres periodistas, un programador/diseñador y un ingeniero en Sistemas sabemos o vamos aprendiendo sobre periodismo de datos. También invitamos a otros apasionados del big data a compartir lo que conocen de análisis de datos, business intelligence, ciencia de datos, estadística, visualización, software y cualquier otro tema que nos ayude a mejorar la calidad de nuestros análisis.
Pero lo más importante es que, en el proceso, aprendemos a hacer con las ideas y pistas que unos y otros nos damos. Y por supuesto, compartimos nuestras conclusiones durante el debate con quienes deseen seguirnos en el hashtag #TallerDataLN.
Hasta ahora, hemos tratado tres temas: herramientas y pautas para hacer periodismo de datos, cómo garantizar la integridad de los datos para hacer periodismo y cómo acercarnos cada vez más a la ciencia de datos.
Adjunto, un resumen de algunas de las ideas expuestas por tema.
Herramientas y pautas
Las predilectas de la periodista Mercedes Agüero
- #Periodismodedatos: es dar valor añadido al lector con análisis de datos, pero no hay que olvidar los métodos de investigación.
- El #periodistadedatos se apoya en ingenieros y programadores pero debe aprender a analizar de datos por su cuenta y visualizar
- Tech & Tools (http://webjournalist.org/topics/tools/) es un sitio que reúne 124 herramientas en línea para visualizar y analizar datos, hacer scrapping, compartir código, compartir documentos, editar audios, editar fotos, aprender lo básico de programación, organizar búsqueda en redes sociales, crear timelines o imágenes interactivas.
- Las herramientas en línea nos facilitan la labor, pero no sustituyen el reporteo, rigurosidad y obligación de confirmar
- Aprender a buscar en la web es vital para no perder tiempo y credibilidad. Recomendación, este manual: Herramientas Digitales para Periodistas de Sandra Crucianelli
- #TallerdataLN si necesita fuentes, en su idioma, para su investigación @Mecheagueror nos recomienda:http://goo.gl/enBKCP
Integridad de datos
La integridad de datos es la que nos permite tener la confianza de que las bases de datos que usamos para hacer periodismo son exactas y fiables. Es decir, es el proceso que nos garantiza que los datos están completos, que en ellos no hay inconsistencias, omisiones o errores (deliberados o involuntarios) que puedan alterar los resultados del análisis que vamos a realizar.
¿Cómo se logra? Daryl Zúniga, ingeniero de la Unidad nos ofreció algunas pistas.
- Paso 1 Es vital: Definir formato de la base de datos a solicitar: Excel, TXT, CSV o un back up de sistema relacional, que es lo ideal
- Paso 2: definir a partir de qué fecha solicitará los datos (últimos 5 años, x ejemplo)
- Paso 2: también es importante preguntar a la entidad proveedora cada cuánto actualiza esos datos y definir cada cuánto usted solicitará actualizaciones
- Paso3 ¿Cómo obtener datos de calidad? Exigir diccionario de datos con las características de la base
- El diccionario de datos debe darnos tipo de dato que incluye la base (x ejemplo: fechas), su espacio en bytes, por ejemplo #periodismodedatos
- Garantizar integridad de los datos cimenta un análisis de calidad #periodismodedatos, dice Daryl Z, Ingeniero de Data @nacion
- Lo más importante antes de empezar un proyecto con bases de datos es definir las reglas para cimentar el diseño de la misma.
Si le interesa conocer más sobre este tema, le recomendamos: la guía de habilidades para su primer trabajo como analista de datos
Ciencia de datos:
Michael Herradora, minero de datos de La Nación nos dio sus definiciones, retos y oportunidades que tenemos los periodistas para acercarnos a la Ciencia de Datos.
- Ciencia de datos es extraer, procesar, analizar, visualizar la información para convertirla en conocimiento para tomar decisiones
- El científico de datos está abierto a probar herramientas, siempre. Su objetivo es transformar esa información en conocimiento
- Un científico de datos que haga todo solo es un unicornio, no existe. El trabajo es en equipo #periodismodedatos
- El científico de datos se rodea de otros profesionales en ingeniería, economía, estadística, periodismo, programación, etc.
- Para los periodistas el big data es fundamental para ver desde un árbol hasta el bosque completo, @mherradora #periodismodedatos
- Antes de Big Data yo no podía recolectar información de todos los árboles, ahora sí y actualizarla cuantas veces sea necesario
- Un #periodistadedatos que quiere llegar a ser científico de datos debe: aprender a programar como primer paso
- Aprender constantemente nuevos trucos y programas para lidiar con información compleja
- Informarse constantemente sobre ciencia de datos, Estadística, tendencias en manejo de bases de datos
- Poner en práctica lo aprendido, jugar con los datos, encontrarles sentido 4/4 @mherradora #periodismodedatos
Si le interesa conocer más de este tema, le recomendamos este libro: Qué es Ciencia de Datos y no olvide #TallerDataLN