{"id":358513,"date":"2021-07-19T15:53:37","date_gmt":"2021-07-19T19:53:37","guid":{"rendered":"https:\/\/gijn.org\/?p=358513"},"modified":"2025-07-15T06:51:27","modified_gmt":"2025-07-15T10:51:27","slug":"consejos-para-crear-una-base-de-datos-efectiva-para-tus-investigaciones","status":"publish","type":"post","link":"https:\/\/gijn.org\/es\/recurso\/consejos-para-crear-una-base-de-datos-efectiva-para-tus-investigaciones\/","title":{"rendered":"Consejos para crear una base de datos efectiva para tus investigaciones"},"content":{"rendered":"<p><span style=\"font-weight: 400\">Este a\u00f1o, mientras Colombia fue estremecida por manifestaciones, enfrentamientos armados y acusaciones de abuso de poder por parte de la polic\u00eda, los periodistas trabajaron duro para hacer seguimiento y contextualizar los sucesos.<\/span><\/p>\n<p><span style=\"font-weight: 400\">A medida que la crisis escalaba, medios independientes y organizaciones de derechos humanos comenzaron a crear sus propias bases de datos para registrar las muertes asociadas con las protestas. Varios organismos registraron m\u00e1s de 70 hasta principios de julio. Tambi\u00e9n comenzaron a registrar alegatos relacionados con el abuso de poder, violencia y detenciones a manifestantes.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Una de estas bases de datos la dise\u00f1\u00f3 Rutas del Conflicto, una organizaci\u00f3n de medios digitales que usa t\u00e9cnicas de periodismo de investigaci\u00f3n y de datos para cubrir el conflicto armado en Colombia, mismo que lleva 50 a\u00f1os. Este a\u00f1o, el grupo cubri\u00f3 la violencia relacionada con las protestas, que comenzaron por una reforma fiscal propuesta, pero se transform\u00f3 en protestas m\u00e1s generales en contra del gobierno.<\/span><\/p>\n<aside class=\"module align-right half type-pull-quote\"><i><span style=\"font-weight: 400\">Las redacciones en todo el mundo est\u00e1n creando sus propias bases de datos al ver una falta de datos oficiales, o que los datos disponibles no son confiables.<\/span><\/i><span style=\"font-weight: 400\">\u00a0<\/span><\/aside>\n<p><span style=\"font-weight: 400\">Dirigido por el periodista \u00d3scar Parra, un equipo de reporteros, estudiantes de periodismo, un desarrollador y un dise\u00f1ador gr\u00e1fico crearon una\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/rutasdelconflicto.com\/especiales\/victimas-mortales-paro\"><span style=\"font-weight: 400\">base de datos para registrar las muertes durante las protestas\u00a0<\/span><\/a><span style=\"font-weight: 400\">que estremecieron ciudades por todo el pa\u00eds.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Recopilando y confirmando informaci\u00f3n de los sucesos diarios, comunicados de prensa, reportes de organismos sin fines de lucro y entrevistas con testigos, este equipo pudo crear una base de datos verificados de la violencia. Eso les permiti\u00f3 hacer un mapa de los sucesos y explorar qui\u00e9nes eran las v\u00edctimas, mientras que analizaban las circunstancias vinculadas a sus muertes y expon\u00edan c\u00f3mo la violencia policial era responsable de muchos de los incidentes.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Esta no fue la primera vez que Parra cre\u00f3 una base de datos para hacer periodismo. De hecho, Rutas del Conflicto se lanz\u00f3 en 2012 cuando \u00e9l cubr\u00eda un proceso de justicia transicional en el que exparamilitares dieron pruebas sobre su papel en la guerra de Colombia contra las Fuerzas Armadas Revolucionarias de Colombia, FARC.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Parra se dio cuenta que las audiencias a menudo revelaban detalles sobre masacres en las cuales los civiles y los combatientes enemigos hab\u00edan sido asesinados. \u201cEntonces me pareci\u00f3 que ser\u00eda bueno agrupar toda esa informaci\u00f3n en una base de datos para intentar crear <\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/rutasdelconflicto.com\/masacres\"><span style=\"font-weight: 400\">herramientas de mapeo<\/span><\/a><span style=\"font-weight: 400\">\u00a0y l\u00edneas de tiempo\u201d, afirma, a\u00f1adiendo que las historias personales relacionadas con cada comparecencia no daban una imagen completa de lo que estaba pasando como podr\u00eda hacerlo un mapa.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Parra us\u00f3 sus conocimientos como ingeniero en sistemas, su carrera anterior, y su pasi\u00f3n por el periodismo de investigaci\u00f3n para capacitar a un grupo de estudiantes, y busc\u00f3 financiamiento para la primera etapa de Rutas del Conflicto, que m\u00e1s adelante ganar\u00eda el reconocimiento del <\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.semana.com\/nacion\/articulo\/rutas-del-conflicto-fue-el-proyecto-ganador-de-sitio-web-del-ano-en-los-data-journalism-awards-2017\/544075\/\"><span style=\"font-weight: 400\">sitio web del a\u00f1o en los <em>Data Journalism Awards 2017.<\/em><\/span><\/a><\/p>\n<div style=\"width: 791px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/La-Paz-en-el-terreno-rutas-del-conflicto-graphic.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-353194\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/La-Paz-en-el-terreno-rutas-del-conflicto-graphic.jpg\" alt=\"\" width=\"781\" height=\"463\" srcset=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/La-Paz-en-el-terreno-rutas-del-conflicto-graphic.jpg 540w, https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/La-Paz-en-el-terreno-rutas-del-conflicto-graphic-336x199.jpg 336w\" sizes=\"auto, (max-width: 781px) 100vw, 781px\" \/><\/a><p class=\"wp-caption-text\">La Paz en el Terreno es un proyecto de datos que examin\u00f3 la violencia en Colombia despu\u00e9s de la firma de los acuerdos de paz. Imagen: Cortes\u00eda de Rutas del Conflicto.<\/p><\/div>\n<p><span style=\"font-weight: 400\">Desde entonces, el equipo ha seguido los mismos pasos para recopilar, organizar y procesar informaci\u00f3n sobre c\u00f3mo las v\u00edctimas del conflicto sufrieron\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/rutasdelconflicto.com\/rios-vida-muerte\/\"><span style=\"font-weight: 400\">desapariciones forzosas en r\u00edos\u00a0<\/span><\/a><span style=\"font-weight: 400\">a lo largo del pa\u00eds y la <\/span><a rel=\"noopener\" target=\"_blank\" href=\"http:\/\/tierraendisputa.com\/\"><span style=\"font-weight: 400\">relaci\u00f3n entre la violencia en Colombia y las disputas por la propiedad de tierras<\/span><\/a><span style=\"font-weight: 400\">.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Los medios alrededor del mundo est\u00e1n creando sus propias bases de datos al ver una falta de datos oficiales, o que los datos disponibles no son confiables. Otras las han creado como un recurso de periodismo o de investigaci\u00f3n mientras ocurren los sucesos, o cuando es necesario comprobar de forma cruzada varias fuentes de informaci\u00f3n.<\/span><\/p>\n<p><span style=\"font-weight: 400\">\u201cNo tener al alcance los datos que necesitas no es raz\u00f3n para no contar una historia que consideras \u00fatil para el p\u00fablico\u201d, dice Romina Colman, experta argentina en periodismo de datos y editora de data para OCCRP en Am\u00e9rica Latina.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Aunque que los periodistas de investigaci\u00f3n pueden encontrar informaci\u00f3n en todo tipo de formatos, informes en PDF, registros impresos, entrevistas, archivos escaneados, documentos escritos a mano, archivos viejos, con la pericia adecuada todos se pueden transformar en bases de datos procesables.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Esto lo aprend\u00ed en 2009, cuando trabaj\u00e9 en la creaci\u00f3n de una base de datos con <\/span><a href=\"https:\/\/gijn.org\/member\/consejo-de-redaccion-cdr-colombia\/\"><span style=\"font-weight: 400\">Consejo de Redacci\u00f3n<\/span><\/a><span style=\"font-weight: 400\"> (CdR), una asociaci\u00f3n miembro de GIJN de periodistas de investigaci\u00f3n de Colombia. Quer\u00edamos crear una base de datos para socios periodistas que los ayudara a investigar a funcionarios p\u00fablicos relacionados con temas de corrupci\u00f3n. En ese momento, las herramientas para extraer datos de documentos eran escasas. El periodismo de datos apenas comenzaba en Colombia, y pod\u00edamos obtener informaci\u00f3n limitada por parte del gobierno en formatos digitales manejables.<\/span><\/p>\n<aside class=\"module align-right half type-pull-quote\"><i><span style=\"font-weight: 400\">Aunque los periodistas de investigaci\u00f3n pueden encontrar informaci\u00f3n en todo tipo de formatos, con la pericia adecuada todos se pueden transformar en bases de datos procesables.<\/span><\/i><\/aside>\n<p><span style=\"font-weight: 400\">As\u00ed que comenzamos transcribiendo cientos de documentos en papel, muchos escritos a mano, en los que los funcionarios p\u00fablicos declaraban sus conflictos de intereses y donantes para las campa\u00f1as. Terminamos con una recopilaci\u00f3n de m\u00e1s de dos millones de registros un par de a\u00f1os despu\u00e9s, despu\u00e9s de agregar otros datos relacionados de m\u00e1s de 20 fuentes oficiales. Eso llev\u00f3 a realizar varias piezas que revelaban mala praxis pol\u00edtica, como esta sobre <\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.semana.com\/nacion\/articulo\/fraude-agrario-historico-que-tierrero\/267994-3\/\"><span style=\"font-weight: 400\">la distribuci\u00f3n sospechosa de tierras<\/span><\/a><span style=\"font-weight: 400\">, realizada por la revista l\u00edder de investigaci\u00f3n Semana.<\/span><\/p>\n<p><span style=\"font-weight: 400\">En 2011, a medida que la gesti\u00f3n y an\u00e1lisis de datos ganaban popularidad como t\u00e9cnica de periodismo, Colombia se uni\u00f3 al <\/span><em><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.opengovpartnership.org\/about\/\"><span style=\"font-weight: 400\">Open Government Partnership<\/span><\/a><\/em><span style=\"font-weight: 400\"><em>,<\/em> una iniciativa mundial firmada por 78 pa\u00edses para mejorar la transparencia. Eso nos permiti\u00f3 a mi equipo y a m\u00ed seguir creando bases de datos para contar historias relevantes. <\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/archivo.colombiacheck.com\/especiales\/contralorias\/\"><span style=\"font-weight: 400\">Una trataba sobre las conexiones entre contralores locales, funcionarios p\u00fablicos con la tarea de supervisar el trabajo de alcaldes y gobernadores, y las personas que deb\u00edan ser supervisadas<\/span><\/a><span style=\"font-weight: 400\">. Otra analiz\u00f3\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"http:\/\/archivo.colombiacheck.com\/especiales\/zoom\/\"><span style=\"font-weight: 400\">qui\u00e9n financi\u00f3 las campa\u00f1as presidenciales y del congreso en 2018<\/span><\/a><span style=\"font-weight: 400\">\u00a0haciendo una comprobaci\u00f3n cruzada de los informes de los candidatos con contratos p\u00fablicos, registros de empresas, y datos hist\u00f3ricos de funcionarios p\u00fablicos.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Aunque los periodistas han estado creando bases de datos desde la d\u00e9cada de los 80, la tecnolog\u00eda para extraer datos de sitios web, convertir PDF o archivos escaneados en formatos editables, y combinar grandes cantidades de informaci\u00f3n ha surgido en los \u00faltimos a\u00f1os y se ha vuelto m\u00e1s accesible. Una creciente cantidad de periodistas se han capacitado en lo que sol\u00eda llamarse reportaje asistido por computadora, ahora conocido como periodismo de datos, y las colaboraciones entre reporteros y desarrolladores o ingenieros en computaci\u00f3n han aumentado, haciendo que sea m\u00e1s f\u00e1cil y viable crear bases de datos con fines period\u00edsticos.<\/span><\/p>\n<p><span style=\"font-weight: 400\">De manera global, los medios han creado bases de datos para investigar <\/span><a href=\"https:\/\/gijn.org\/stories\/inside-a-pioneering-italian-data-journalism-collaboration\/\"><span style=\"font-weight: 400\">bienes confiscados a delincuentes<\/span><\/a><span style=\"font-weight: 400\">\u00a0en Italia,\u00a0<\/span><a href=\"https:\/\/gijn.org\/stories\/how-they-did-it-reuters-massive-database-of-taser-deaths\/\"><span style=\"font-weight: 400\">muertes por pistolas de descarga el\u00e9ctrica<\/span><\/a><span style=\"font-weight: 400\">\u00a0y\u00a0<\/span><a href=\"https:\/\/gijn.org\/stories\/how-they-did-it-building-a-database-of-police-use-of-force-in-the-us\/\"><span style=\"font-weight: 400\">el uso de la fuerza por parte de la polic\u00eda<\/span><\/a><span style=\"font-weight: 400\">\u00a0en Estados Unidos, adem\u00e1s de colaborar con investigaciones transnacionales. Recientemente, un grupo de periodistas de 12 pa\u00edses cre\u00f3 una base de datos con informaci\u00f3n que nunca se hab\u00eda sistematizado, implicando 2 460 casos de violencia contra los defensores de derechos ambientales en Latinoam\u00e9rica. El grupo posteriormente public\u00f3 36 reportajes de investigaci\u00f3n sobre estos datos en un proyecto especial llamado <\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/tierraderesistentes.com\/es\/\"><span style=\"font-weight: 400\">Tierra de Resistentes<\/span><\/a><span style=\"font-weight: 400\">.\u00a0<\/span><\/p>\n<div id=\"attachment_353199\" style=\"width: 772px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/Team-tierra-de-resistentes.png\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-353199\" class=\"wp-image-353199 size-full\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/Team-tierra-de-resistentes.png\" alt=\"\" width=\"762\" height=\"327\" srcset=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/Team-tierra-de-resistentes.png 762w, https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/Team-tierra-de-resistentes-336x144.png 336w\" sizes=\"auto, (max-width: 762px) 100vw, 762px\" \/><\/a><p id=\"caption-attachment-353199\" class=\"wp-caption-text\">Algunos de los periodistas del proyecto Tierra de Resistentes. Imagen: Captura de pantalla.<\/p><\/div>\n<p><span style=\"font-weight: 400\">Del otro lado del mundo, el Proyecto de Periodismo sobre Crimen Organizado y Corrupci\u00f3n gan\u00f3 el Sigma Award 2020 por su investigaci\u00f3n sobre la <\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.occrp.org\/en\/troikalaundromat\/\"><span style=\"font-weight: 400\">Lavander\u00eda Troika<\/span><\/a><span style=\"font-weight: 400\">, en la cual la OCCRP us\u00f3 <\/span><a href=\"https:\/\/gijn.org\/2021\/06\/15\/a-reporters-guide-how-to-investigate-organized-crimes-finances\/\"><span style=\"font-weight: 400\">tecnolog\u00eda de vanguardia para extraer datos de m\u00e1s de 1.3 millones de transacciones<\/span><\/a><span style=\"font-weight: 400\">\u00a0de cientos de registros bancarios. Este trabajo expuso c\u00f3mo los oligarcas y pol\u00edticos rusos invirtieron en secreto sus mal habidos millones en el exterior, lavaron dinero y evadieron impuestos.<\/span><\/p>\n<p><span style=\"font-weight: 400\">Estos proyectos son conocidos por haber reunido informaci\u00f3n que no estaba disponible p\u00fablicamente o no era una recopilaci\u00f3n centralizada, para narrar historias con un gran impacto, pero que no hubiesen sido posibles sin las bases de datos que les permitieron a los periodistas investigar la historia. <\/span><\/p>\n<p><span style=\"font-weight: 400\">Hay que destacar que los periodistas de investigaci\u00f3n tambi\u00e9n pueden crear bases de datos en una escala m\u00e1s peque\u00f1a y aun as\u00ed tener un impacto enorme. Por lo mismo aqu\u00ed tienes una gu\u00eda paso a paso sobre c\u00f3mo abordar la creaci\u00f3n de bases de datos para investigaciones.<\/span><\/p>\n<h4><strong>1. Prep\u00e1rate<\/strong><\/h4>\n<ul>\n<li style=\"font-weight: 400\"><b>Explora los documentos<\/b><span style=\"font-weight: 400\"> de los cu\u00e1les extraer\u00e1s los datos. Comprueba si puedes identificar patrones, los elementos repetitivos te dar\u00e1n pistas sobre c\u00f3mo estructurar tu base de datos. Si comienzas desde cero, obtendr\u00e1s los registros de entrevistas y de periodismo tradicional, analiza casos o historias similares para encontrar denominadores comunes. Puede ser \u00fatil hablar con expertos en esta etapa de exploraci\u00f3n.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Define el alcance<\/b><span style=\"font-weight: 400\"> de los datos que recopilar\u00e1s. \u00bfQu\u00e9 per\u00edodo cubrir\u00e1s? \u00bfQu\u00e9 casos se incluir\u00e1n? (Esto requiere un criterio claro y extremadamente espec\u00edfico). \u00bfHabr\u00e1 un l\u00edmite en la cantidad de registros que procesar\u00e1s? Los recursos de tu proyecto, tiempo, equipo, fondos y tecnolog\u00eda, te ayudar\u00e1n a responder estas preguntas.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Haz una lista de las preguntas<\/b><span style=\"font-weight: 400\">\u00a0que quieres responder durante la investigaci\u00f3n. Esto guiar\u00e1 el dise\u00f1o de la base de datos.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Fomenta el trabajo en equipo<\/b><span style=\"font-weight: 400\">, especialmente en esta etapa inicial. Las discusiones entre colegas facilitan estas etapas cruciales y fortalecen tu trabajo. De hecho, as\u00ed fue que comenz\u00f3 el proyecto Tierra de Residentes: la base de datos y la investigaci\u00f3n se molde\u00f3 durante <\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/tierraderesistentes.com\/es\/2018\/11\/29\/primer-taller-tierra-de-resistentes\/\"><span style=\"font-weight: 400\">talleres de periodismo de investigaci\u00f3n<\/span><\/a><span style=\"font-weight: 400\">.<\/span><\/li>\n<\/ul>\n<h4><strong>2. Dise\u00f1a y desarrolla la base de datos<\/strong><\/h4>\n<ul>\n<li style=\"font-weight: 400\"><b>Comienza definiendo qu\u00e9 ser\u00e1 cada registro (fila)<\/b><span style=\"font-weight: 400\">: casos, personas, lugares, productos, sucesos, pa\u00edses, transacciones, etc.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Luego, haz una lista de los elementos que ayudar\u00edan a identificar cada registro:<\/b><span style=\"font-weight: 400\"> estos ser\u00e1n tus campos (columnas). Por ejemplo, si cada fila es una persona, luego los campos podr\u00edan ser nombre, n\u00famero de identificaci\u00f3n, edad, ubicaci\u00f3n, profesi\u00f3n, etc.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Define una clave para cada registro.<\/b><span style=\"font-weight: 400\">\u00a0Los n\u00fameros de identificaci\u00f3n son una mejor idea (cuando est\u00e9n disponibles) que los nombres. Tambi\u00e9n puedes inventar c\u00f3digos combinando dos o tres aspectos que hagan que cada registro sea \u00fanico Esta clave ser\u00e1 esencial si necesitas hacer comprobaciones cruzadas entre dos o m\u00e1s conjuntos de datos.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Aparte de los campos identificadores, incluye otras notas para agregar detalles. <\/b><span style=\"font-weight: 400\">P\u00e1rrafos cortos sirven para la narrativa y para la clasificaci\u00f3n, como los que se refieren a caracter\u00edsticas comunes y que establecen categor\u00edas. Para estos campos de categor\u00eda, es \u00fatil pensar sobre qu\u00e9 historia saldr\u00eda de cada uno. Por ejemplo, puedes incluir una columna de \u201craza\u201d para analizar si hay un patr\u00f3n de racismo implicado en cierto conjunto de datos.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>La uniformidad es fundamental.<\/b><span style=\"font-weight: 400\"> Usa configuraciones de validaci\u00f3n para garantizar que los n\u00fameros se escriban como n\u00fameros, que las fechas est\u00e9n en el formato correcto, y que las categor\u00edas siempre tengan la misma ortograf\u00eda. En la medida de lo posible, haz que la mayor\u00eda de los campos sean de opci\u00f3n m\u00faltiple en lugar de preguntas abiertas.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Incluye campos para identificar qui\u00e9n agreg\u00f3 cada segmento de informaci\u00f3n y cu\u00e1l es la fuente original<\/b><span style=\"font-weight: 400\"> (pon un enlace tambi\u00e9n). Esto ser\u00e1 \u00fatil m\u00e1s adelante si necesitas comprobar algunos datos.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Trata de no excederte con la cantidad de campos.<\/b><span style=\"font-weight: 400\">\u00a0Crea solo los que ser\u00e1n relevantes para tu investigaci\u00f3n y para el an\u00e1lisis de datos, y los que tu equipo sea capaz de llenar.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Tu base de datos puede necesitar m\u00e1s de una tabla,<\/b><span style=\"font-weight: 400\">\u00a0dependiendo de la complejidad del tema y las relaciones entre los elementos involucrados.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Aseg\u00farate de que el dise\u00f1o de la base de datos sea f\u00e1cil de usar<\/b><span style=\"font-weight: 400\">\u00a0por todos los implicados en el proyecto, sin importar su nivel con la tecnolog\u00eda. \u201cTambi\u00e9n debe ser una herramienta dise\u00f1ada especialmente para periodistas y con periodistas\u201d, dice Paul Radu, cofundador y jefe de innovaci\u00f3n en OCCRP.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Haz que la base de datos se pueda expandir:<\/b><span style=\"font-weight: 400\">\u00a0tu dise\u00f1o puede ser el primer paso de un proyecto m\u00e1s grande posteriormente, hecho por ti o tu equipo, o por otra persona.<\/span><\/li>\n<\/ul>\n<h4><strong>3. Probar, probar, probar<\/strong><\/h4>\n<ul>\n<li style=\"font-weight: 400\"><b>Haz una prueba piloto a la base de datos.<\/b><span style=\"font-weight: 400\">\u00a0Llena algunos registros para ver si funciona de la manera que esperas y para evaluar si ser\u00e1 \u00fatil para las historias en las que piensas trabajar. Una buena manera de estimar cu\u00e1nto puede tardar el proyecto: mide y calcula el tiempo promedio que tarda agregar una entrada nueva, auditar y luego confirmar la informaci\u00f3n.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Haz una lista de \u201cqu\u00e9 pasar\u00eda si\u2026\u201d<\/b><span style=\"font-weight: 400\">\u00a0para analizar posibles obst\u00e1culos o escenarios de error y establecer c\u00f3mo los resolver\u00e1s.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Eval\u00faa la fiabilidad y coherencia de los campos m\u00e1s importantes.<\/b><span style=\"font-weight: 400\">\u00a0Si tienes varias fuentes que dicen cosas distintas, lo que es com\u00fan con cifras o fechas, puedes mover la informaci\u00f3n a una columna de detalles en la que puedes describir la discrepancia en lugar de decidir arbitrariamente qui\u00e9n dice la verdad.<\/span><\/li>\n<\/ul>\n<h4><strong>4. Llenar la base de datos<\/strong><\/h4>\n<ul>\n<li style=\"font-weight: 400\"><b>Aplica lo aprendido en este proceso de pruebas<\/b><span style=\"font-weight: 400\">\u00a0para capacitar en la pr\u00e1ctica a los reporteros que recopilar\u00e1n, agregar\u00e1n y analizar\u00e1n la informaci\u00f3n en la base de datos. Aseg\u00farate de que todos comprendan los conceptos y categor\u00edas del mismo modo.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Usa herramientas de almacenamiento colaborativo<\/b><span style=\"font-weight: 400\">, para que el acceso no dependa de una sola persona.\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Divide los datos usando las categor\u00edas que definiste en la etapa de dise\u00f1o<\/b><span style=\"font-weight: 400\">\u00a0para que las reglas est\u00e9n claras sobre qui\u00e9n recopila cu\u00e1l informaci\u00f3n y c\u00f3mo evitar los duplicados.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Si necesitas extraer datos de la web o documentos de texto, concentra tu esfuerzo<\/b><span style=\"font-weight: 400\">\u00a0en lo que es m\u00e1s relevante para tu investigaci\u00f3n, y lo que determinar\u00e1 el enfoque de tus historias. En el proyecto de Troika,\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.occrp.org\/en\/troikalaundromat\/about-the-data\"><span style=\"font-weight: 400\">por ejemplo, determinar el\u00a0<\/span><i><span style=\"font-weight: 400\">prop\u00f3sito<\/span><\/i><span style=\"font-weight: 400\">\u00a0de las transacciones fue clave<\/span><\/a><span style=\"font-weight: 400\">.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Si la cantidad de datos que tienes es muy grande para ser manejable, considera contratar a un profesional externo<\/b><span style=\"font-weight: 400\">\u00a0o una empresa para transcribir los documentos en una base de datos dise\u00f1ada previamente con tu redacci\u00f3n.<\/span><\/li>\n<\/ul>\n<h4><strong>5. Auditar y comprobar la veracidad de los datos<\/strong><\/h4>\n<ul>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Crear la base de datos solo es el primer paso de la investigaci\u00f3n.\u00a0<\/span><b>Antes de analizar los datos y sacar conclusiones, tienes que confirmar con las fuentes originales,<\/b><span style=\"font-weight: 400\">\u00a0ya sea que eso implique documentos o los protagonistas de las historias. \u201cLlevamos nuestros datos a los municipios donde ocurrieron estas masacres para que los sobrevivientes pudieran corregir los errores que los medios y otras personas llevaban a\u00f1os diciendo\u201d, explica Parra, sobre uno de sus proyectos en Rutas del Conflicto.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Decide qu\u00e9 tipo de auditor\u00eda har\u00e1s,<\/b> ya<span style=\"font-weight: 400\">\u00a0que puede variar dependiendo del alcance de tu proyecto. Puedes comprobar todos y cada uno de los registros al hacer una referencia cruzada de los mismos con los documentos originales o puedes realizar comprobaciones aleatorias, pero deben cubrir una amplia cantidad de entradas en la base de datos. En cualquier escenario, la persona que revisa los datos no debe ser la persona que los introdujo.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>\u00bfQu\u00e9 deber\u00edas buscar en la auditor\u00eda?<\/b><span style=\"font-weight: 400\">\u00a0Errores ortogr\u00e1ficos, de n\u00fameros, fechas, duplicados, y entradas que no cumplan con el criterio.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Dos ideas para revisar n\u00fameros:<\/b><span style=\"font-weight: 400\"> haz que el sistema sume autom\u00e1ticamente totales, comp\u00e1ralos con los de los documentos originales y clasifica los datos para encontrar valores at\u00edpicos (las cifras muy grandes o muy peque\u00f1as podr\u00edan ser un error).<\/span><\/li>\n<li style=\"font-weight: 400\"><b>La base de datos no estar\u00e1 lista para usarse hasta que<\/b> se haga una comprobaci\u00f3n de veracidad, auditor\u00eda de datos, confrontaciones de fuentes personales y revisi\u00f3n legal.<b><br \/>\n<\/b><\/li>\n<\/ul>\n<div id=\"attachment_353192\" style=\"width: 781px\" class=\"wp-caption alignnone\"><a href=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/Database-image-from-Rutas-del-Conflicto.png\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-353192\" class=\"wp-image-353192 size-full\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/Database-image-from-Rutas-del-Conflicto.png\" alt=\"\" width=\"771\" height=\"420\" srcset=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/Database-image-from-Rutas-del-Conflicto.png 987w, https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/Database-image-from-Rutas-del-Conflicto-336x183.png 336w, https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/Database-image-from-Rutas-del-Conflicto-771x420.png 771w, https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/Database-image-from-Rutas-del-Conflicto-768x419.png 768w\" sizes=\"auto, (max-width: 771px) 100vw, 771px\" \/><\/a><p id=\"caption-attachment-353192\" class=\"wp-caption-text\">Un mapa detallando los ataques a defensores ambientales en Sudam\u00e9rica y Centroam\u00e9rica, del equipo en Tierra de Resistentes. Imagen: Captura de pantalla.<\/p><\/div>\n<h4><strong>Software<\/strong><\/h4>\n<p><span style=\"font-weight: 400\">Como periodista, no necesitas convertirte en un desarrollador de sistemas para trabajar en un proyecto con bases de datos. Mejor incluye a alguien con esta habilidad en tu equipo y trabaja en colaboraci\u00f3n. Esta lista de herramientas puede ser \u00fatil:<\/span><\/p>\n<ul>\n<li style=\"font-weight: 400\"><b>Aplicaciones para crear formularios web<\/b><span style=\"font-weight: 400\"> que ayudar\u00e1n a los periodistas a llenar la base de datos: Google Forms, <\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/nodejs.org\/en\/\"><span style=\"font-weight: 400\">Node.js<\/span><\/a><span style=\"font-weight: 400\">,\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.djangoproject.com\/\"><span style=\"font-weight: 400\">Django<\/span><\/a><span style=\"font-weight: 400\">, o\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/medium.com\/@amelie_yeh\/data-visualization-on-the-web-with-flask-11a3b1f7a476\"><span style=\"font-weight: 400\">Flask.<\/span><\/a><\/li>\n<li style=\"font-weight: 400\"><b>Almacenamiento de bases de datos:\u00a0<\/b><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.mongodb.com\/cloud\/atlas\"><span style=\"font-weight: 400\">MongoDB Atlas\u00a0<\/span><\/a><span style=\"font-weight: 400\">o\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/firebase.google.com\/\"><span style=\"font-weight: 400\">Google\u2019s Firebase<\/span><\/a><span style=\"font-weight: 400\">.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Para estructurar y procesar informaci\u00f3n:\u00a0<\/b><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.python.org\/\"><span style=\"font-weight: 400\">Python<\/span><\/a><span style=\"font-weight: 400\">\u00a0(que se puede conectar con las opciones de almacenamiento mencionadas arriba),\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.postgresql.org\/\"><span style=\"font-weight: 400\">PostgreSQL<\/span><\/a><span style=\"font-weight: 400\">,\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/aws.amazon.com\/elasticsearch-service\/the-elk-stack\/#:~:text=The%20ELK%20stack%20is%20an,Elasticsearch%2C%20Logstash%2C%20and%20Kibana.\"><span style=\"font-weight: 400\">ELK Stack<\/span><\/a><span style=\"font-weight: 400\">, y\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.claris.com\/\"><span style=\"font-weight: 400\">Filemaker.<\/span><\/a><span style=\"font-weight: 400\">\u00a0<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Para extracci\u00f3n de datos y conversi\u00f3n de PDF:<\/b><span style=\"font-weight: 400\">\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/pdf.wondershare.com\/pdf-converter-pro\/\"><span style=\"font-weight: 400\">Wondershare Pdf Converter Pro,<\/span><\/a><span style=\"font-weight: 400\"> el convertidor b\u00e1sico de Google Documents, <\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.ilovepdf.com\/\"><span style=\"font-weight: 400\">iLovePDF<\/span><\/a><span style=\"font-weight: 400\">,\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/smallpdf.com\/\"><span style=\"font-weight: 400\">Smallpdf,<\/span><\/a><span style=\"font-weight: 400\">\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/tabula.technology\/\"><span style=\"font-weight: 400\">Tabula,<\/span><\/a><span style=\"font-weight: 400\">\u00a0<\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.import.io\/\"><span style=\"font-weight: 400\">Import.io.<\/span><\/a><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Por supuesto, siempre puedes descargar los datos del sistema de bases de datos y\u00a0<\/span><b>trabajar con ellos en Excel o Google Spreadsheets.<\/b><span style=\"font-weight: 400\">\u00a0Comenzar con uno de estos tambi\u00e9n puede ser la mejor opci\u00f3n para proyectos m\u00e1s peque\u00f1os.<\/span><\/li>\n<\/ul>\n<h4><strong>Recomendaciones y consejos finales<\/strong><\/h4>\n<ul>\n<li style=\"font-weight: 400\"><b>La seguridad es un asunto clave<\/b><span style=\"font-weight: 400\"> en este tipo de proyectos, as\u00ed que usa comunicaciones cifradas, respalda los datos y considera tu seguridad personal.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Aprende a usar Excel,<\/b><span style=\"font-weight: 400\">\u00a0pero tambi\u00e9n colabora con <\/span><i><span style=\"font-weight: 400\">data scientists<\/span><\/i><span style=\"font-weight: 400\"> y desarrolladores.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Toma en cuenta los instrumentos que puedan facilitar el trabajo:<\/b><span style=\"font-weight: 400\"> herramientas de extracci\u00f3n, formularios en l\u00ednea para llenar la base de datos, convertidores de PDF, escaneo con reconocimiento \u00f3ptico de caracteres y procesadores de texto masivo. En OCCRP, <\/span><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/aleph.occrp.org\/?_gl=1*1iqo6qs*_ga*MzcwNTU2NzQ2LjE2MjE5NDEwMDM.*_ga_NHCZV5EYYY*MTYyMjY5NTU4NC4xMi4xLjE2MjI2OTU2MjYuMTg.\"><span style=\"font-weight: 400\">crearon Aleph<\/span><\/a><span style=\"font-weight: 400\">, una plataforma que hace casi todas estas tareas, ayuda con el acceso sencillo, b\u00fasqueda, transliteraci\u00f3n y exploraci\u00f3n de grandes vol\u00famenes de registros de documentos en m\u00faltiples formatos.<\/span><\/li>\n<li style=\"font-weight: 400\"><span style=\"font-weight: 400\">Ya que estas iniciativas usualmente requieren equipos grandes,\u00a0<\/span><b>decide qui\u00e9n ser\u00e1 el l\u00edder del proyecto<\/b><span style=\"font-weight: 400\">\u00a0y toma en cuenta las recomendaciones para colaboraciones de investigaci\u00f3n.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Mant\u00e9n la transparencia en la metodolog\u00eda y los recursos<\/b><span style=\"font-weight: 400\"> para tu audiencia, asumiendo que los protocolos de seguridad lo permiten. Ense\u00f1a una muestra de los documentos originales a partir de los cuales creaste la base de datos para fomentar la credibilidad.<\/span><\/li>\n<li style=\"font-weight: 400\"><b>Publica tu informaci\u00f3n de contacto junto con la investigaci\u00f3n<\/b><span style=\"font-weight: 400\">\u00a0para que los lectores puedan comunicarse con preguntas o si encuentran un error en la base de datos.<\/span><\/li>\n<\/ul>\n<h4><strong>Recursos adicionales<\/strong><\/h4>\n<p class=\"entry-title\"><a href=\"https:\/\/gijn.org\/2020\/12\/18\/periodismo-de-datos-experiencias-detras-de-proyectos-reconocidos-de-america-latina\/\"><em>Periodismo de datos: experiencias detr\u00e1s de proyectos reconocidos de Am\u00e9rica Latina<\/em><\/a><\/p>\n<p class=\"entry-title\"><a href=\"https:\/\/gijn.org\/2021\/07\/16\/como-reporteros-analizaron-20-anos-de-datos-sobre-incendios-en-areas-protegidas-en-venezuela\/\"><em>C\u00f3mo reporteros analizaron 20 a\u00f1os de datos sobre incendios en \u00e1reas protegidas de Venezuela<\/em><\/a><\/p>\n<p class=\"entry-title\"><a href=\"https:\/\/gijn.org\/2021\/03\/18\/mis-herramientas-favoritas-gustavo-faleiros\/\"><em>Mis herramientas favoritas: Gustavo Faleiros<\/em><\/a><\/p>\n<hr \/>\n<p><a href=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/miriam-1.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"wp-image-354917 alignleft\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/miriam-1-1170x1253.jpg\" alt=\"\" width=\"145\" height=\"156\" srcset=\"https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/miriam-1-1170x1253.jpg 1170w, https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/miriam-1-336x360.jpg 336w, https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/miriam-1-771x826.jpg 771w, https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/miriam-1-768x823.jpg 768w, https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/miriam-1-1434x1536.jpg 1434w, https:\/\/gijn.org\/wp-content\/uploads\/2021\/07\/miriam-1.jpg 1870w\" sizes=\"auto, (max-width: 145px) 100vw, 145px\" \/><\/a> <em><strong><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/twitter.com\/Miriescribe\">Miriam Forero Ariza<\/a><\/strong> es una periodista de datos e investigaci\u00f3n independiente colombiana cuyo trabajo ha sido publicado por Vice, Colombiacheck y El Espectador. Tiene m\u00e1s de una d\u00e9cada de experiencia en investigaciones colaborativas, an\u00e1lisis de datos y visualizaciones. Es coautora del Manual Iberoamericano de Periodismo de Datos.<\/em><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Serie de consejos extra\u00eddos de las experiencias de varios periodistas internacionales sobre la recopilaci\u00f3n y creaci\u00f3n de bases de datos efectivas para realizar periodismo de investigaci\u00f3n.<\/p>\n","protected":false},"author":3031154,"featured_media":1091299,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_price":"","_stock":"","_tribe_ticket_header":"","_tribe_default_ticket_provider":"","_tribe_ticket_capacity":"0","_ticket_start_date":"","_ticket_end_date":"","_tribe_ticket_show_description":"","_tribe_ticket_show_not_going":false,"_tribe_ticket_use_global_stock":"","_tribe_ticket_global_stock_level":"","_global_stock_mode":"","_global_stock_cap":"","_tribe_rsvp_for_event":"","_tribe_ticket_going_count":"","_tribe_ticket_not_going_count":"","_tribe_tickets_list":"[]","_tribe_ticket_has_attendee_info_fields":false,"republication-tracker-tool-hide-widget":false,"footnotes":"","_tec_slr_enabled":"","_tec_slr_layout":""},"categories":[23182],"tags":[23927,27748,23524,27749,27750,27751,27752,23818,27753,27754,27755,27756,23495,26223,27757,24963,27758,27759,23767,27760,27761,27762,27763],"gijn_topic":[18875],"series":[],"gijn_language":[17790],"gijn_region":[],"class_list":["post-358513","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-recurso","tag-bases-de-datos-es","tag-colaboraciones-es","tag-colombia","tag-conflicto-es","tag-congress-es","tag-consejo-de-redaccion-es","tag-data-journalism-es","tag-datos-es","tag-desarrolladores-es","tag-equipo-multidisciplinario-es","tag-farc-es","tag-government-es","tag-investigacion-es","tag-latin-america-es","tag-miriam-forero-es","tag-occrp-es","tag-oscar-parra-es","tag-paz-es","tag-periodismo-de-datos-es","tag-protestas-es","tag-romina-colman-es","tag-rutas-del-conflicto-es","tag-tierra-de-resistentes-es","gijn_topic-herramientas-y-consejos","gijn_language-es-es"],"acf":[],"ticketed":false,"_links":{"self":[{"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/posts\/358513","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/users\/3031154"}],"replies":[{"embeddable":true,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/comments?post=358513"}],"version-history":[{"count":1,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/posts\/358513\/revisions"}],"predecessor-version":[{"id":2382134,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/posts\/358513\/revisions\/2382134"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/media\/1091299"}],"wp:attachment":[{"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/media?parent=358513"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/categories?post=358513"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/tags?post=358513"},{"taxonomy":"gijn_topic","embeddable":true,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/gijn_topic?post=358513"},{"taxonomy":"series","embeddable":true,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/series?post=358513"},{"taxonomy":"gijn_language","embeddable":true,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/gijn_language?post=358513"},{"taxonomy":"gijn_region","embeddable":true,"href":"https:\/\/gijn.org\/es\/wp-json\/wp\/v2\/gijn_region?post=358513"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}