Gracias a los datos abiertos y a las herramientas de monitoreo pareciera que el trabajo de periodismo de datos fuese simple pero los obstáculos están en todos los frentes.
Por: Mara Destefanis. Egresada de la ECI. CEO de Big Data Machine.
Frente a la digitalización y gran volumen de datos actual, el desafío del periodista se presenta a la hora de acceder a fuentes actualizadas y convertir formatos desestructurados en estructurados para analizar la investigación periodística.
Los datos abiertos sirven para la transparencia, participación y colaboración ciudadana, lo que permite mejorar el trabajo colaborativo entre ciudadanos, periodistas y gobiernos.
El periodismo es uno de los principales agentes que solicita y exige el acceso a fuentes de datos públicos sensibles y significativos para toda la sociedad. Es un desafío que recién comienza y aquí en Córdoba los futuros comunicadores ya están transitando dicha experiencia.
El primer paso y desafío es el escrapeo de datos, es decir extraer los datos desde fuentes como sitios web para convertirlos a un formato que permita su análisis y procesamiento posterior. Las fuentes abiertas actuales a las que se puede acceder son:
- Estadísticas de censos generales, http://estadistica.cba.gov.ar
- Información pública de la Ciudad de Córdoba, http://transparencia.cordoba.gov.ar
- Datos públicos nacionales http://datospublicos.gob.ar
- Datos abiertos de La Nación: http://www.lanacion.com.ar/data
En síntesis, hoy se comienza a recorrer el camino hacia la concientización de contar con datos públicos para la transparencia y la necesidad de trabajos colaborativos de los diferentes agentes de una sociedad para un mismo fin común. Dentro de los obstáculos, el principal sigue siendo el acceso a las fuentes de datos que se originan en los gobiernos provinciales y nacionales y su posterior gestión. En cuanto gestión de datos públicos online, una de las herramientas presentadas y trabajadas fue BigDataMachine, con la cual se obtuvo información sobre la opinión pública en diferentes temáticas.
El viernes 7 de noviembre se realizó el Primer MediaThon “Maratón de Periodismo de Datos” actividad organizada dentro de las III Jornadas de Comunicación Digital organizada por la Escuela de Ciencias de la Información y la Incubadora de empresas de la Universidad Nacional de Córdoba, bajo la temática “La información en la Complejidad de las Interacciones globales”. En este marco, dos ejemplos de proyectos muestran sus principales obstáculos a la hora de realizar periodismo de datos:
Una investigación de posibles candidatos a gobernador/a de Córdoba, se basó en datos de una consultora privada y de la AFIP ya que la información disponible en la Municipalidad de Córdoba estaba desactualizada. Entre los datos, las declaraciones juradas fue uno de los ítems más difíciles de obtener porque están ocultas o desactualizadas. Confrontando los datos obtenidos con la realidad, demostraron huecos informativos de datos sensibles que son indispensables a la hora de elegir un futuro gobernador provincial.
En tanto, otro de los proyectos se focalizó en analizar cuáles son las fábricas que presentan algún tipo de peligro inflamable, a causa de la explosión sucedida el día anterior en una fábrica de Alta Córdoba. Localizar dichas fábricas y advertir a los ciudadanos encontró sus obstáculos ya que al comunicarse con la oficina de Bomberos y Municipalidad, los datos de fábricas y empresas de alto riesgo de Córdoba, como sus respectivas habilitaciones no estaban disponibles. Por lo cual la tarea de escrapiar la información se vio dificultada y tuvieron que recurrir a páginas amarillas y datos de la AFIP para detectar cuáles son las empresas registradas que corren tales riesgos.