Los diarios de la Guerra de Afganistán de Wikileaks: cómo se realizó la operación periodística con los datos
Simon Rogers
The Guardian
28 de Julio de 2010
Traducido para Rebelión por Ricardo García Pérez
La revelación de miles de archivos de la Guerra de Afganistán hecha por Wikileaks ha sido una
labor de periodismo de datos. Con esto fue con lo que lo hicimos.
• Consulta el resumen de
datos
• Selección de The
Guardian de los sucesos clave procedentes de los archivos de Afganistán de Wikieleaks: los
datos
Datos de Wikileaks de los
ataques con artefactos explosivos en Afganistán

Bueno, siempre quisimos reportajes basados en datos: ahora los tenemos. En grandes
cantidades. Los esperábamos con ansia. Los diarios de la Guerra de
Afganistán de Wikileaks representan una victoria fabulosa del
periodismo sustentado en datos de investigación, no sólo para nosotros, The Guardian,
sino también para The New York Times
y Der Spiegel.
También es una muestra de periodismo con datos en acción. Lo que quisimos fue posibilitar
que nuestro equipo de reporteros especializados extrajera de la información
historias cargadas de humanidad; y nos propusimos analizarla para dibujar una
imagen global, para mostrar el desarrollo real de la guerra.
Ha sido un mes muy ajetreado para quienes hemos trabajado con los datos en The Guardian; así
es como hemos llegado hasta aquí.
Lo que pretendíamos hacer nos dejó claro enseguida que no íbamos a publicar la base de
datos completa. Wikileaks ya iba a hacerlo y nosotros queríamos estar seguros
de no revelar los nombres de los informadores ni de poner en peligro
innecesariamente a los soldados de la OTAN. Al mismo tiempo, debíamos facilitar
la utilización de los datos a nuestro equipo de periodistas de investigación: David Leigh, Nick Davies, Declan Walsh, Simon Tisdall y Richard Norton-Taylor.
También queríamos que al lector le resultara más sencillo acceder a la
información fundamental, la del mundo real, de forma tan clara y transparente
como fuéramos capaces de presentarla.
Los datos nos llegaron en un archivo de Excel inmenso, compuesto por 92.201 filas de datos,
algunas de ellas sin nada en absoluto o con los datos en un formato lamentable.
Todo archivo de Excel que sobrepase las 60.000 filas ralentiza el programa de
forma espectacular; guardar información cuesta un tiempo largo y penoso
(seleccionar la primera fila, desactivar la función de guardado automático en
las preferencias,...). No ayuda a los periodistas a tratar de buscar noticias
entre los datos y resulta demasiado voluminosa para elaborar informes significativos.
Por fortuna, desde que existe COINS, los grandes
grupos de datos no nos dan ningún miedo. Harold Frayman, que
junto a John Houston suele ocuparse de lidiar con los datos de formatos
pdf y otros para el Datablog, elaboró una
base de datos interna muy sencilla. Ahora los periodistas podían buscar
noticias por palabras o sucesos clave. De repente, el conjunto de datos se
volvió asequible y resultó más fácil generar reportajes relevantes.
Los datos estaban bien estructurados (en este mismo artículo se puede leer más sobre el
funcionamiento de esa estructura); por ejemplo, los sucesos estaban
clasificados, unas veces de forma más fiable que otras.
También empezamos a filtrar los datos para que nos resultara más fácil relatar uno de
los episodios más importantes de la guerra: el aumento de ataques con
artefactos explosivos (por sus siglas en inglés, IED, Improvised Explosive
Device): las bombas de fabricación casera que se depositan en las cunetas y
cuya explosión es imprevisible e imposible de combatir. Este subconjunto de
datos seguía siendo inmenso... pero más fácil de manejar. Entre 2004 y 2009
había en torno a 7.500 explosiones de artefactos o emboscadas (una emboscada es
aquella situación en la que el ataque con explosivos se combina, por ejemplo,
con fuego de armas cortas o lanzamiento de cohetes o granadas). Se encontraron
y desactivaron otros 8.000 artefactos explosivos caseros. Queríamos ver la
evolución de estos acontecimientos a lo largo del tiempo, así como la imagen
comparativa que arrojaban.
El resultado son los datos que aparecen a continuación, que nos muestran lo siguiente:
• Los ataques con artefactos explosivos a lo largo del tiempo
• En qué regiones se produjeron
• Información sobre bajas recogida en la base de datos
Pincha aquí para
descargar una vista completa de la plantilla de datos
Los datos de las bajas comportaban escollos especiales; a menudo se habían recopilado sin
exactitud y estaban incompletos. Nosotros les hemos añadido, además, las bajas
registradas por la OTAN para verificar la veracidad de los datos, y se verá
cómo varían.
Pero esta panorámica general no transmite la enormidad de los millares de explosiones.
Hay un lapso de tiempo concreto, los tres días previos a las elecciones
presidenciales del año pasado, en el que se registró la explosión de más de 100
artefactos. ¿Se imagina cómo se vive en una situación así cada vez que hay que
bajarse de un camión en mitad de la carretera?
Aquí es donde entró en escena el desarrollador Daithí Ó Crualaoich. Nos
ayudó a señalar en un mapa la latitud y la longitud de cada uno de esos
sucesos; y no sólo eso, sino que elaboró un mapa que se pudiera editar (los
diseñadores lo llaman «mapa de vectores»). Y luego el diseñador gráfico Paul Scruton consiguió
ponerlo bonito para el periódico. Se puede descargar desde Scrib’d: pincha aquí
para ver los ataques con artefactos explosivos en Afganistán desde 2006 hasta 2009.
Lograr transmitir toda esa información a través de la red es un asunto distinto; Alastair Dant (con
la ayuda de Igor Clark) elaboró dos gráficos interactivos para la página web:
• Una guía interactiva de
todos los artefactos explosivos depositados, elaborada a
partir de una base de datos que incorpora los datos geográficos (para la que Paddy Allen y Mark McCormick realizaron las labores de diseño)
• Una «portada» interactiva
para nuestra selección de 300 sucesos fundamentales.
El equipo de investigadores seleccionó esos sucesos fundamentales porque los consideró
particularmente relevantes; la guía de Alastair ayuda a navegar por ellos, y si
se pincha en cada uno, conduce a una página elaborada por Harold (para la que
Daithi y Lisa van Gelder realizaron
labores de desarrollo esenciales), donde los usuarios pueden leer el informe
completo.
Queríamos sacar lo máximo posible de los datos brutos existentes y hemos publicado dos
grandes grupos de datos:
• La información completa
relativa a artefactos explosivos: un total de 16.000, entre los que
explosionaron y los que se descubrieron y desactivaron
• El conjunto total de
incidentes significativos seleccionados por los especialistas de The
Guardian
Se da la inevitable circunstancia de que la labor que contribuye a perfilar una historia
no es tan estimulante como el propio reportaje. Pero en el futuro, cuando se
vayan haciendo públicos cada vez más conjuntos de datos, serán tareas a las que
los periodistas tendrán que hacer frente. Como escribió Roy Grenslade
hace un par de días, la forma de revelación emergente a través de Internet, de la que con tanto éxito ha sido
pionera Wikileaks en los últimos dos años, merece nuestro elogio y debe ser
defendida frente a las fuerzas reaccionarias que pretenden evitar que se dé a
conocer.
¿Hemos publicado lo suficiente? Por desgracia, no. ¿Hemos empezado a dar sentido a un
conjunto de datos increíblemente complejo? Eso esperamos.
Ahora le toca a usted. ¿Puede ayudarnos a dar más sentido a esta información en bruto?
DATOS: Descarga de la hoja
resumen.
Fuente: http://www.guardian.co.uk/news/datablog/2010/jul/27/wikileaks-afghanistan-data-datajournalism
¡Hazte voluntario para traducir al español otros artículos como este! manda un correo electrónico a espagnol@worldcantwait.net y escribe "voluntario para traducción" en la línea de memo.
E-mail:
espagnol@worldcantwait.net
|