Claves

Cómo hacer periodismo de datos

Por @cdperiodismo

Publicado el 10 de octubre del 2010

Paul Bradshaw, escritor y preparador en periodismo de datos, explica cómo empezar en esta rama, desde llegar a la información hasta hacaerla pública. Las recomendaciones fueron proporcionadas en The Guardian. Según entiendo, el periodismo de datos está relacionado con la idea de recabar información y transmitirla a través de cuadros estadísticos y mapas.  A continuación, la traducción:

El periodismo de datos es inmenso. No me refiero a que está de moda-aunque desde hace unos meses lo está- sino en el sentido de “incomprensiblemente enorme”. Representa la convergencia de varios campos que importan dentro de sus propias reglas, desde la investigación y estadísticas hasta diseñar y programar. La idea de combinar esas habilidades para contar historias importantes es poderosa, pero también intimidante.  ¿Quién puede hacer todo eso?

La realidad muestra que casi nadie lo está haciendo, pero hay suficientes partes distintas del rompecabezas para que las personas se comprometan en esto de manera más simple y puedan partir de ahí. Para mí, esas partes se reducen a estas cuatro cosas:

1. Encontrando datos:

Encontrar datos puede suponer cualquier cosa, desde tener un conocimiento experto y contactos,  hasta ser capaz de usar habilidades de reportear asistidas por la computadora, o para algunos, habilidades técnicas específicas como MySQL o Python, que reúnen la data por ti.

2. Cuestionando los datos:

Cuestionar los datos de manera correcta significa que debes tener un buen conocimiento de la jerga y el contexto más amplio en que se encuentran los datos, además de las estadísticas (estar familiarizado con las hojas de cálculo te ayudará a ahorrar mucho tiempo).

3. Visualizando los datos:

Históricamente,  la forma visual en que serán presentados los datos ha sido responsabilidad de los diseñadores y programadores, pero un creciente número de personas con antecedentes de redacción están intentando participar en ambas cosas. En parte porque hay una mayor conciencia de lo que es posible, y en parte porque las barreras de experimentar han disminuido.

4. Mezclando los datos:

Herramientas como ManyEyes para visualización, y Yahoo! Pipes para “mashups” han hecho posible que yo consiga que los estudiantes de periodismo se enganchen de manera rápida con las posibilidades, y muchos son atrapados por el bichito del periodismo de datos poco después.

Cómo empezar:

Entonces, ¿dónde empieza un periodista de datos en ciernes? Una respuesta obvia sería “con los datos”, pero también hay una segunda respuesta: “Con una pregunta”.

Los periodistas tienen que balancear su rol de responder a eventos con su rol como activos buscadores de historias. Y los datos no tienen nada diferente. Aron Pilhofer, de The New York Times, te recomienda que “empieces pequeño, y con algo que ya conoces o haces. Y siempre, siempre, siempre recuerda que el objetivo aquí es el periodismo“. Charles Arthur, de The Guardian, sugiere que “encuentres una historia que será mejor contada a través de números”, mientras que Jonathan Richards, de The Times, recomienda encontar “tus propios pies” y crear ideas siguiendo blogs del campo y atendiendo reuniones como Hacks/Hackers.

Es relativamente fácil encontrar conjuntos de datos que son publicados por reguladores, grupos de consumidores, beneficencias, instituciones científicas y negocios.  También puedes obtener información del datablog de The Guardian.

Sin embargo, un segundo enfoque propone empezar con una pregunta. Por ejemplo:  “¿Las cámaras de vigilancia de velocidad hacen gastar o ahorrar dinero?”. Esto es algo que recientemente fue preguntado en Help Me Investigate, el sitio web que dirijo de periodismo de investigación con la multitud como fuente.  También puedes enviar una solicitud de libertad de información.

Cualquiera sea el camino que sigas, es posible que el verdadero trabajo recaiga en encontrar más pedazos de información o datos para completar la imagen que quieres clarificar. Los datos del gobierno, por ejemplo, serán difundidos con jerga y códigos que necesitas entender. Una llamada a la organización que corresponde proporcionará algo de luz. Si eso toma mucho tiempo, una búsqueda avanzada de uno de los códigos más ocultos también puede ayudar (puedes limitar tu búsqueda, por ejemplo, incluyendo site: gov.uk filetype: pdf, o parámetros equivalentes para la búsqueda que quieras hacer.

También necesitarás contextualizar la información inicial con más datos. Digamos que tienes información sobre un proyecto de ley sobre un cambio de salario en un departamento gubernamental, por ejemplo:  ¿Ha aumentado el personal del departamento? ¿Cómo es en comparación con otros departamentos? ¿Y qué hay de la inflación y los cambios en el costo de vida? Este contexto puede hacer la diferencia entre encontrar una historia y dejarla pasar.

Tu información necesitará ser limpiada: busca nombres distintos para la misma cosa, errrores de puntuación y ortografía, datos mal formateados, datos que fueron ingresados de manera incorrecta, e información que no está. Herramientas como Freebase Gridworks pueden ayudar.

Además, puedes tener problemas con información que es brindada en formatos inconvenientes como un PDF, Powerpoint, o una página web poco atractiva. Si tienes suerte, podrás copiar y pegar los datos en una hoja de cálculo. Pero no siempre tendrás suerte.

En casos así, tener conocimiento en programación te será útil.  Otra alternativa es usar una website como Scraperwiki, la cual tiene ejemplos que puedes customizar y una comunidad de usuarios que te puede ayudar.  También hay herramientas online como Yahoo! Pipes y el Firefox plugin OutWit Hub.  Si los datos están en HTML puedes escribir una fórmula de una línea en las hojas de cálculo de Google para sacar la información. Si todo lo anterior falla, tendrás que hacerlo a mano, pero hagas lo que hagas, asegúrate de publicar tu hoja de cálculo en la web y publica sobre tu investigación en un blog para que otros no tengan que repetir tu duro trabajo.

Ahora tienes que preocuparte  en la visualización. Corta todo lo que no importa para que puedas visualizar tu historia. Hay docenas de herramientas online gratuitas que puedes usar para hacerlo. ManyEyesTableau Public son buenos para empezar cuadros. Este poster de  A. Abela (PDF) es una buena guía para saber qué cuadros son mejores para cada tipo de información.

Juega un poco. Si eres bueno con los gráficos, trata de mejorar tus cuadros usando color y etiquetas. Y siempre incluye un texto que proporcione el enlace de la fuente original.

Para mapas, puedes utilizar OpenHeatMap, que es fácil de utilizar. También está  Yahoo! Pipes para trazar un mapa a distintos puntos de interés. Si quieres hacer algo más sofisticado, necesitarás saber más de programación y APIS. En ese momento, pensarás: “El periodismo de datos es enorme”.

¿Y saben qué? Ya lo había dicho.

Publicado por:

Sígueme

COMPATIR EN REDES

COMENTARIOS