Ilustración: Louiza Karageorgiou para GIJN

Recursos

» Guía

Guía para reportajes sobre la rendición de cuentas de la IA

por Lam Thuy Vo • 1 de julio de 2026

Leer este artículo en

Nota editorial: Esta guía es una colaboración entre el equipo de Rendición de Cuentas de IA, del Pulitzer Center, y GIJN. Karen Hao, Laís Martins y Pablo Jiménez Arandia co-desarrollaron algunos de los materiales descritos en este artículo.

En todo el mundo, la inteligencia artificial (IA) se ha convertido en una fuerza que influye en muchos aspectos de la sociedad. La tecnología juega un papel exageradamente importante en muchas economías y tiene implicaciones para los trabajadores intelectuales a nivel global. Los jugadores más poderosos en este campo son un puñado de entidades basadas sobre todo en Estados Unidos, Europa o China. Muchas de ellas son grandes compañías de tecnología que han reunido miles de millones de dólares en inversiones, y están en posición de fijar el tono de cómo se desarrolla y despliega esta tecnología.

Pero la IA también ha generado mucha controversia en cada etapa de su desarrollo, desde su cadena de suministros hasta sus usos. Los centros de datos necesarios para desarrollarla consumen extraordinarias cantidades de agua y energía. Los trabajadores que categorizan los datos que la IA necesita enfrentan bajos salarios y problemas de salud mental. Las tecnologías de IA en sí mismas han demostrado tener sesgos y alucinaciones.

El campo de la IA está repleto de historias para los periodistas de investigación. El propósito de esta guía es ayudar a los reporteros a entender los detalles de la tecnología sobre la que descansa la IA, y darles un marco a través del cual examinarla.

¿Qué es la IA?

Muchas personas piensan en la inteligencia artificial y la relacionan con ChatGPT.

Pero la verdad es mucho más compleja. La inteligencia artificial describe el proceso de usar máquinas para copiar la toma de decisiones humanas y puede pensarse como un término amplio que reúne varias tecnologías.

Los científicos e investigadores comenzaron a usar el término en la década de 1950 y desde entonces han encontrado muchas formas distintas de recrear la inteligencia humana a través de la tecnología.

Uno de los métodos de IA más populares y extendidos hoy en día es el aprendizaje automático y todas las formas que asume, incluyendo sus subconjuntos: el aprendizaje profundo y la IA generativa.

El aprendizaje automático es el proceso de analizar datos para encontrar patrones que nos permiten hacer predicciones o decisiones basadas en esos hallazgos. Estos análisis usan varios métodos matemáticos, desde estadísticas simples a redes neuronales complejas, a menudo dependiendo de la cantidad de datos que se procesan. El resultado de este entrenamiento es un programa de computador, o modelo IA, que puede reunir datos nuevos y hacer predicciones, o generar nueva información con base en estos datos antiguos. Puedes imaginar los productos del aprendizaje automático como una reorganización de datos antiguos. Como un ejemplo de su uso, los modelos de aprendizaje automático simple pueden emplearse por parte de agencias gubernamentales para asignar puntajes de riesgo a quienes podrían recibir ayudas estatales, o a quienes aplican para recibir beneficios de acceso a vivienda.

El aprendizaje profundo es un subconjunto del aprendizaje automático. Requiere de una gran cantidad de entrada de datos, a menudo millones, y usa complejos métodos de análisis, como las redes neuronales. Estas redes, para darle sentido a los datos, usan métodos matemáticos que copian la estructura del cerebro y consisten en nodos interconectados (puedes aprender más aquí sobre redes neuronales). Este tipo de aprendizaje automático a menudo se usa por parte de grandes compañías de tecnología. Lo emplean para predecir términos en motores de búsqueda o sistemas de recomendación para los servicios de streaming.

Luego está la IA generativa que es un subconjunto del aprendizaje automático. Requiere de todavía más datos, y durante su fase de entrenamiento, incluso de más energía y métodos matemáticos para construir sus modelos. La IA generativa se distingue de otros métodos de aprendizaje automático en que no sólo produce recomendaciones para una línea de tiempo o un puntaje predictivo, sino también crea nuevo contenido, como textos o imágenes. Esa es la tecnología que ahora encontramos en los Grandes Modelos de Lenguaje (LLM, por sus siglas en inglés) mediante chatbots como ChatGPT o Gemini, así como apps que crean imágenes a partir de instrucciones de texto, como Midjourney.

El diagrama a continuación presenta todas las versiones del aprendizaje automático.

Representación gráfica de la inteligencia artificial y sus subconjuntos, incluyendo el aprendizaje automático, el aprendizaje profundo y la IA generativa. Imagen: Cortesía del Pulitzer Center.

Saber cómo funciona el aprendizaje automático a grandes rasgos les ayuda a los periodistas a hablar sobre el tema, hacer preguntas informadas sobre la tecnología y encontrar formas de acceder mejor a las distintas etapas del desarrollo de la IA para sus reportajes.

Marco de referencia para historias de rendición de cuentas de la IA

Cuando comenzamos a desarrollar la serie AI Spotlight, con Karen Hao, volvíamos sobre una misma pregunta: ¿qué nos habría gustado saber cuando comenzamos a hacer periodismo sobre IA? La respuesta fue un marco para identificar y darle forma a las historias de IA.

La IA cubre una serie amplia de temas y tecnologías, y puede resultar abrumador decidir dónde comenzar. Nuestro marco gira en torno a las cuatro etapas del desarrollo de la IA contemporánea. En la base están las entradas, los datos y la computación que hace posibles los sistemas de hoy. Desde allí, se construyen y entrenan los modelos, formados por datos y decisiones de diseño. Finalmente, estos modelos se aplican en el mundo real. Cada una de estas etapas de desarrollo viene con sus propios temas relacionados, actores involucrados, y personas o estructuras impactadas.

Veremos cada una de estas etapas, discutiendo los conceptos clave y las historias arquetípicas.

Toma de pantalla: Una representación gráfica del marco para hacer periodismo sobre la rendición de cuentas de la IA. Cortesía del Pulitzer Center

Investigar los datos utilizados

Los modelos IA más simples pueden usar conjuntos de entrenamiento que tienen algunos cientos de puntos de datos, mientras los modelos más complejos, como los LLM, a menudo se entrenan en grandes porciones del internet. Puede ser igualmente amplio el rango de material en los datos de entrenamiento. Pueden asumir la forma de datos estructurados y tabulares, organizados en filas y columnas, o texto sin estructura excavado de plataformas de redes sociales, portales de noticias o foros en línea. Con cada vez más frecuencia se incluyen también imágenes y videos en los entrenamientos.

La mayoría de los reportajes que se centran en la etapa de desarrollo de datos tiende a enfocarse en sistemas más avanzados, que se entrenan en conjuntos masivos de datos y propiedad intelectual. En particular, en cómo el material con derechos de autor o los datos personales terminan en los conductos para el entrenamiento de los modelos de IA. Esta historia de The Atlantic, por ejemplo, observa cómo Meta presuntamente usó miles de libros pirateados para entrenar a Llama, su modelo de IA generativo. Un vocero de Meta no quiso hacer comentarios a los periodistas de The Atlantic, citando un litigio contra la compañía. Otra historia, de The New York Times, halló que las compañías aseguradoras de automóviles están comprando datos de conducción personales de apps aparentemente inocuas para calificar el riesgo de los conductores.

Pero mirar los datos también implica mirar el trabajo humano que permite el uso de estos conjuntos de datos entrenados. Mientras las compañías tienden a presentar su recolección de datos y entrenamiento como procesos altamente automatizados, la realidad es que los conjuntos de entrenamiento a menudo se limpian y categorizan por parte de una subclase de categorizadores de datos, que se hallan predominantemente en el Sur Global, y operan mediante firmas de subcontratistas y plataformas de trabajo digital. Estos trabajadores categorizan imágenes de perros y gatos, que alimentan a clasificadores de imágenes; dibujan cajas alrededor de objetos en las grabaciones de las cámaras de tablero, para entrenar automóviles autónomos; o identifican discursos de odio y contenido violento, para impedir que los LLM lo reproduzcan.

Los reportajes alrededor del mundo han demostrado que los trabajadores de datos están explotados, reciben menos ingresos de los que deberían y a veces se les obliga a lidiar con contenido traumático. Esta investigación del Bureau of Investigative Journalism muestra cómo, alrededor del mundo, los trabajadores de bajos ingresos de economías de plataformas se usan sin que ellos lo sepan en sistemas de reconocimiento facial usados por el gobierno ruso. Otra historia de Africa Uncensored examinó la creciente industria del “tutor IA”, en la que trabajadores altamente educados entrenan chatbots de LLM para producir respuestas de calidad más alta.

Investigar la computación

Una vez los conjuntos de datos de entrenamiento se recogen y limpian, las compañías los usan para entrenar sus modelos de IA. Si bien los modelos simples de IA se pueden entrenar en una fracción de segundo con un portátil de uso personal, los modelos más complejos, como ChatGPT de OpenAI, exigen cantidades masivas de poder de computación. Chips de computadora especializados, que se almacenan de centros de datos, permiten el acceso a dicho poder de computación, que se conoce como “cómputo”.

Los reportajes sobre la etapa de desarrollo del “cómputo” se tiende a enfocar en los impactos ambientales, sociales y económicos de la extensa infraestructura física y su rápida expansión, que impulsa la IA moderna. Cuando desarrollamos por primera vez la serie AI Spotlight, en 2024, los centros de datos aún eran un tema relativamente nuevo en los reportajes. Desde entonces, se ha publicado una rica variedad de ellos en América Latina, Asia, África y los Estados Unidos, que demuestran la enorme cantidad de agua y energía que consumen los centros de datos, así como los esfuerzos corporativos y gubernamentales para esconder estas cifras. En Brasil, por ejemplo, la becaria del Pulitzer Laís Martins halló que un centro de datos de TikTok debía usar tanta electricidad como 2,2 millones de personas. La compañía no respondió a las solicitudes de comentarios de la periodista.

Los reportajes sobre los centros de datos se extienden más allá del impacto ambiental. También examinan cómo los centros de datos afectan el tejido social de las comunidades locales, sus promesas generalmente incumplidas de crecimiento económico y los intensos esfuerzos de lobby a un nivel tanto local como nacional para atraerlos y construirlos. Laís desarrolló una versión ajustada de nuestro marco, enfocada tan sólo en reportar sobre los centros de datos. Puedes encontrarlo a continuación.

Imagen: Cortesía del Pulitzer Center

Investigar los modelos

La mezcla de datos de entrenamiento y computación produce un modelo IA, un artefacto técnico que hace predicciones, clasifica o, en el caso de la IA generativa, crea nuevo contenido. Al igual que los datos y la computación, los modelos IA varían en complejidad y escala, y van de los sistemas de aprendizaje automático relativamente simples, que se usan para calcular las primas de los seguros médicos, hasta sofisticados sistemas de aprendizaje profundo, capaces de generar imágenes realistas.

Las historias que se enfocan en los modelos IA tienden a centrarse en los temas relacionados con sesgos, errores o los efectos negativos que tiene la automatización sobre las comunidades y las instituciones.

Cuando se puede acceder a cómo los desarrolladores de la IA tomaron ciertas decisiones de diseño, como qué datos de entrenamiento o parámetros se usaron para un modelo, hay investigaciones que pueden profundizar en ellas. Esta investigación de El Confidencial, por ejemplo, obtuvo la fórmula para un sistema de IA que se usa en el sistema carcelario catalán, y que supuestamente predice quién cometería un delito en el futuro. Según los periodistas, el modelo sistemáticamente asignaba un riesgo más alto a ciertos grupos, basado en factores discriminadores o irrelevantes.

Cuando esta información no está disponible, puedes analizar en cambio lo que el modelo arroja. Una historia de Rest of World sistemáticamente analizó 3.000 imágenes producidas por MidJourney IA, una popular herramienta de generación de imágenes, y halló que el sistema reproduce estereotipos crudos sobre diversas culturas. Según los periodistas, la compañía no respondió a sus solicitudes de comentario. Otra investigación, del Philippine Center for Investigative Journalism, hizo ingeniería inversa de lo que arrojaba el algoritmo de Grab, una popular aplicación de transporte, al recoger miles de cotizaciones para sus trayectos. Halló que Grab siempre cobra a los consumidores tarifas adicionales que se supone sólo deben estar presentes durante horas de tráfico pesado. En una respuesta escrita a PCIJ por parte del centro de operaciones de Grab en Filipinas, éste dijo que había “cooperado plenamente con la solicitud del Comité de Regulación de Franquicias de Transporte Terrestre”, al participar en las audiencias.

Investigar las aplicaciones

Por último, es importante que los periodistas investiguen cómo la inteligencia artificial se usa en el mundo real. Cuando la tecnología IA funciona mal, o no como se pretende, pueden verse afectadas muchas personas que están sujetas a decisiones hechas por sistemas automáticos, como algoritmos o aplicaciones de IA generativa.

En una historia del Guardian, la periodista Johana Bhuiyan demostró cómo la excesiva dependencia del gobierno de los Estados Unidos en las aplicaciones de traducción dejó a una persona que buscaba asilo atrapada durante seis meses en un centro de detención de ICE. La aplicación, que se equivocó en idiomas para los que tenía pocos recursos, tradujo mal, y la persona no pudo comunicarse con nadie de forma adecuada. El Departamento de Seguridad Nacional de Estados Unidos no respondió a la periodista del Guardian.

La historia de Hera Rizwan, sobre el uso de reconocimiento facial por parte del gobierno indio, halló que la aplicación que usaban los funcionarios públicos para entregar raciones de alimentos de emergencia no logró reconocer algunas mujeres embarazadas o que estaban amamantando, porque sus rostros habían cambiado con respecto a las imágenes viejas de ellas en las bases de datos gubernamentales. El Ministerio de la Mujer y del Desarrollo del Niño no respondió a las preguntas de Rizwan.

Los reportajes sobre la rendición de cuentas en torno a la IA están al alcance de cualquiera

Como muestran los ejemplos que se han expuesto, nuestro marco de rendición de cuentas puede ayudar a los periodistas a hacer reportajes sobre la IA, de acuerdo con niveles diversos de recursos y esfuerzos técnicos. Las historias pueden ser más cortas o largas, con mayor impacto humano o centradas en aspectos técnicos. Esperamos que estas aproximaciones y ejemplos les ayuden a otros periodistas a encontrar su propia aproximación local a los reportajes sobre la rendición de cuentas en IA.

Recursos

Algorithmic Literacy for Journalists: un recurso con explicaciones y otros recursos para periodistas.
AI Spotlight Series Open-Sourced Curriculum: ofrece tutoriales de video, marcos, y diapositivas de la iniciativa del Pulitzer Center para educar a los periodistas del mundo sobre la IA.
Guía para periodistas sobre cómo detectar contenido generado por IA
Guía para investigar los algoritmos de las redes sociales

Investigación

Algorithmic Justice League: una organización que documenta y examina el daño de los algoritmos.
AI Now Institute: un instituto independiente que publica investigaciones sobre IA y la rendición de cuentas de los algoritmos.
Center for Democracy and Technology: una organización sin ánimo de lucro que publica informes sobre libertades civiles en la era digital.
Data and Society: una organización de investigación sin ánimo de lucro enfocada en la tecnología, los datos y las políticas públicas.
Algorithm Watch: un grupo sin ánimo de lucro con sede en Zurich y Berlín.
Privacy International: un grupo sin ánimo de lucro con sede en Londres.
Derechos Digitales: una organización sin ánimo de lucro dedicada a los derechos digitales en América Latina.
African Digital Rights Network: una organización panafricana sobre derechos digitales.

Gabriel Geiger es un periodista de investigación basado en Atenas, Grecia, especializado en reportajes de rendición de cuentas sobre vigilancia y algoritmos. Actualmente es un periodista de investigación en Lighthouse Reports, una organización sin ánimo de lucro con base en los Países Bajos. Su trabajo ha aparecido en WIRED, Le Monde, Der Spiegel y el Guardian, entre otros.

Lam Thuy Vo es una periodista que mezcla el análisis de datos con reportajes en el terreno, para examinar cómo los sistemas y políticas afectan a los individuos. Actualmente es una periodista de investigación que trabaja con Documented, una sala de redacción independiente, sin ánimo de lucro, dedicada a reportar con y para comunidades inmigrantes, y es profesora asociada de periodismo de datos en el Craig Newmark Graduate School of Journalism. Anteriormente, fue periodista en The Markup, BuzzFeed News, The Wall Street Journal, Al Jazeera America y Planet Money de NPR.

Esta obra está licenciada bajo un Creative Commons Reconocimiento-Sin Derivadas 4.0 Licencia Internacional

Republica nuestros artículos de forma gratuita, en línea o de manera impresa, bajo una licencia Creative Commons.

Leer otras historias etiquetadas con:

investigación de algoritmos rendición de cuentas rendición de cuentas IA

Republica este artículo

Esta obra está licenciada bajo un Creative Commons Reconocimiento-Sin Derivadas 4.0 Licencia Internacional

Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

<h2>Gu&iacute;a para reportajes sobre la rendici&oacute;n de cuentas de la IA</h2> por <a href="https://pulitzercenter.org/people/lam-thuy-vo" target="_blank">Lam Thuy Vo</a> for Global Investigative Journalism Network &bull; 1 de julio de 2026 Nota editorial: Esta gu&iacute;a es una colaboraci&oacute;n entre el equipo de Rendici&oacute;n de Cuentas de IA, del Pulitzer Center, y GIJN. Karen Hao, La&iacute;s Martins y Pablo Jim&eacute;nez Arandia co-desarrollaron algunos de los materiales descritos en este art&iacute;culo.En todo el mundo, la inteligencia artificial (IA) se ha convertido en una fuerza que influye en muchos aspectos de la sociedad. La tecnolog&iacute;a juega un papel exageradamente importante en muchas econom&iacute;as y tiene implicaciones para los trabajadores intelectuales a nivel global. Los jugadores m&aacute;s poderosos en este campo son un pu&ntilde;ado de entidades basadas sobre todo en Estados Unidos, Europa o China. Muchas de ellas son grandes compa&ntilde;&iacute;as de tecnolog&iacute;a que han reunido miles de millones de d&oacute;lares en inversiones, y est&aacute;n en posici&oacute;n de fijar el tono de c&oacute;mo se desarrolla y despliega esta tecnolog&iacute;a.Pero la IA tambi&eacute;n ha generado mucha controversia en cada etapa de su desarrollo, desde su cadena de suministros hasta sus usos. Los centros de datos necesarios para desarrollarla consumen extraordinarias cantidades de agua y energ&iacute;a. Los trabajadores que categorizan los datos que la IA necesita enfrentan bajos salarios y problemas de salud mental. Las tecnolog&iacute;as de IA en s&iacute; mismas han demostrado tener sesgos y alucinaciones.El campo de la IA est&aacute; repleto de historias para los periodistas de investigaci&oacute;n. El prop&oacute;sito de esta gu&iacute;a es ayudar a los reporteros a entender los detalles de la tecnolog&iacute;a sobre la que descansa la IA, y darles un marco a trav&eacute;s del cual examinarla.<h4>&iquest;Qu&eacute; es la IA?</h4>Muchas personas piensan en la inteligencia artificial y la relacionan con ChatGPT.Pero la verdad es mucho m&aacute;s compleja. La inteligencia artificial describe el proceso de usar m&aacute;quinas para copiar la toma de decisiones humanas y puede pensarse como un t&eacute;rmino amplio que re&uacute;ne varias tecnolog&iacute;as.Los cient&iacute;ficos e investigadores comenzaron a usar el t&eacute;rmino en la d&eacute;cada de 1950 y desde entonces han encontrado muchas formas distintas de recrear la inteligencia humana a trav&eacute;s de la tecnolog&iacute;a.Uno de los m&eacute;todos de IA m&aacute;s populares y extendidos hoy en d&iacute;a es el aprendizaje autom&aacute;tico y todas las formas que asume, incluyendo sus subconjuntos: el aprendizaje profundo y la IA generativa.El aprendizaje autom&aacute;tico es el proceso de analizar datos para encontrar patrones que nos permiten hacer predicciones o decisiones basadas en esos hallazgos. Estos an&aacute;lisis usan varios m&eacute;todos matem&aacute;ticos, desde estad&iacute;sticas simples a redes neuronales complejas, a menudo dependiendo de la cantidad de datos que se procesan. El resultado de este entrenamiento es un programa de computador, o modelo IA, que puede reunir datos nuevos y hacer predicciones, o generar nueva informaci&oacute;n con base en estos datos antiguos. Puedes imaginar los productos del aprendizaje autom&aacute;tico como una reorganizaci&oacute;n de datos antiguos. Como un ejemplo de su uso, los modelos de aprendizaje autom&aacute;tico simple pueden emplearse por parte de agencias gubernamentales para asignar puntajes de riesgo a quienes podr&iacute;an recibir ayudas estatales, o a quienes aplican para recibir beneficios de acceso a vivienda.El aprendizaje profundo es un subconjunto del aprendizaje autom&aacute;tico. Requiere de una gran cantidad de entrada de datos, a menudo millones, y usa complejos m&eacute;todos de an&aacute;lisis, como las redes neuronales. Estas redes, para darle sentido a los datos, usan m&eacute;todos matem&aacute;ticos que copian la estructura del cerebro y consisten en nodos interconectados (puedes aprender m&aacute;s<a href="https://youtu.be/aircAruvnKk?si=aEp3J_qQUC2kf8WU"> aqu&iacute;</a> sobre redes neuronales). Este tipo de aprendizaje autom&aacute;tico a menudo se usa por parte de grandes compa&ntilde;&iacute;as de tecnolog&iacute;a. Lo emplean para predecir t&eacute;rminos en motores de b&uacute;squeda o sistemas de recomendaci&oacute;n para los servicios de streaming.Luego est&aacute; la IA generativa que es un subconjunto del aprendizaje autom&aacute;tico. Requiere de todav&iacute;a m&aacute;s datos, y durante su fase de entrenamiento, incluso de m&aacute;s energ&iacute;a y m&eacute;todos matem&aacute;ticos para construir sus modelos. La IA generativa se distingue de otros m&eacute;todos de aprendizaje autom&aacute;tico en que no s&oacute;lo produce recomendaciones para una l&iacute;nea de tiempo o un puntaje predictivo, sino tambi&eacute;n crea nuevo contenido, como textos o im&aacute;genes. Esa es la tecnolog&iacute;a que ahora encontramos en los Grandes Modelos de Lenguaje (LLM, por sus siglas en ingl&eacute;s) mediante chatbots como ChatGPT o Gemini, as&iacute; como apps que crean im&aacute;genes a partir de instrucciones de texto, como Midjourney.El diagrama a continuaci&oacute;n presenta todas las versiones del aprendizaje autom&aacute;tico.&nbsp;Saber c&oacute;mo funciona el aprendizaje autom&aacute;tico a grandes rasgos les ayuda a los periodistas a hablar sobre el tema, hacer preguntas informadas sobre la tecnolog&iacute;a y encontrar formas de acceder mejor a las distintas etapas del desarrollo de la IA para sus reportajes.<h4>Marco de referencia para historias de rendici&oacute;n de cuentas de la IA</h4>Cuando comenzamos a desarrollar la serie AI Spotlight, con Karen Hao, volv&iacute;amos sobre una misma pregunta: &iquest;qu&eacute; nos habr&iacute;a gustado saber cuando comenzamos a hacer periodismo sobre IA? La respuesta fue un marco para identificar y darle forma a las historias de IA.La IA cubre una serie amplia de temas y tecnolog&iacute;as, y puede resultar abrumador decidir d&oacute;nde comenzar. Nuestro marco gira en torno a las cuatro etapas del desarrollo de la IA contempor&aacute;nea. En la base est&aacute;n las entradas, los datos y la computaci&oacute;n que hace posibles los sistemas de hoy. Desde all&iacute;, se construyen y entrenan los modelos, formados por datos y decisiones de dise&ntilde;o. Finalmente, estos modelos se aplican en el mundo real. Cada una de estas etapas de desarrollo viene con sus propios temas relacionados, actores involucrados, y personas o estructuras impactadas.Veremos cada una de estas etapas, discutiendo los conceptos clave y las historias arquet&iacute;picas.<h4>Investigar los datos utilizados</h4>Los modelos IA m&aacute;s simples pueden usar conjuntos de entrenamiento que tienen algunos cientos de puntos de datos, mientras los modelos m&aacute;s complejos, como los LLM, a menudo se entrenan en grandes porciones del internet. Puede ser igualmente amplio el rango de material en los datos de entrenamiento. Pueden asumir la forma de datos estructurados y tabulares, organizados en filas y columnas, o texto sin estructura excavado de plataformas de redes sociales, portales de noticias o foros en l&iacute;nea. Con cada vez m&aacute;s frecuencia se incluyen tambi&eacute;n im&aacute;genes y videos en los entrenamientos.La mayor&iacute;a de los reportajes que se centran en la etapa de desarrollo de datos tiende a enfocarse en sistemas m&aacute;s avanzados, que se entrenan en conjuntos masivos de datos y propiedad intelectual. En particular, en c&oacute;mo el material con derechos de autor o los datos personales terminan en los conductos para el entrenamiento de los modelos de IA. Esta historia de The Atlantic, por ejemplo, observa c&oacute;mo<a href="https://www.theatlantic.com/technology/archive/2025/03/libgen-meta-openai/682093/"> Meta presuntamente us&oacute; miles de libros pirateados para entrenar a Llama, su modelo de IA generativo</a>. Un vocero de Meta no quiso hacer comentarios a los periodistas de The Atlantic, citando un litigio contra la compa&ntilde;&iacute;a. Otra historia, de The New York Times, hall&oacute; que<a href="https://www.nytimes.com/2024/04/23/technology/general-motors-spying-driver-data-consent.html"> las compa&ntilde;&iacute;as aseguradoras de autom&oacute;viles est&aacute;n comprando datos de conducci&oacute;n personales de apps aparentemente inocuas para calificar el riesgo de los conductores</a>.Pero mirar los datos tambi&eacute;n implica mirar el trabajo humano que permite el uso de estos conjuntos de datos entrenados. Mientras las compa&ntilde;&iacute;as tienden a presentar su recolecci&oacute;n de datos y entrenamiento como procesos altamente automatizados, la realidad es que los conjuntos de entrenamiento a menudo se limpian y categorizan por parte de una subclase de categorizadores de datos, que se hallan predominantemente en el Sur Global, y operan mediante firmas de subcontratistas y plataformas de trabajo digital. Estos trabajadores categorizan im&aacute;genes de perros y gatos, que alimentan a clasificadores de im&aacute;genes; dibujan cajas alrededor de objetos en las grabaciones de las c&aacute;maras de tablero, para entrenar autom&oacute;viles aut&oacute;nomos; o identifican discursos de odio y contenido violento, para impedir que los LLM lo reproduzcan.Los reportajes alrededor del mundo han demostrado que los trabajadores de datos est&aacute;n explotados, reciben menos ingresos de los que deber&iacute;an y a veces se les obliga a lidiar con contenido traum&aacute;tico. Esta investigaci&oacute;n del Bureau of Investigative Journalism muestra c&oacute;mo, alrededor del mundo,<a href="https://www.thebureauinvestigates.com/stories/2024-03-27/online-gig-work-is-feeding-russias-surveillance-machine"> los trabajadores de bajos ingresos de econom&iacute;as de plataformas se usan sin que ellos lo sepan en sistemas de reconocimiento facial usados por el gobierno ruso</a>. Otra historia de Africa Uncensored examin&oacute;<a href="https://africauncensored.online/blog/2025/08/26/fuelling-the-agi-hype-the-recruitment-playbook-to-land-big-tech-contracts/"> la creciente industria del &ldquo;tutor IA&rdquo;</a>, en la que trabajadores altamente educados entrenan chatbots de LLM para producir respuestas de calidad m&aacute;s alta.<h4>Investigar la computaci&oacute;n</h4>Una vez los conjuntos de datos de entrenamiento se recogen y limpian, las compa&ntilde;&iacute;as los usan para entrenar sus modelos de IA. Si bien los modelos simples de IA se pueden entrenar en una fracci&oacute;n de segundo con un port&aacute;til de uso personal, los modelos m&aacute;s complejos, como ChatGPT de OpenAI, exigen cantidades masivas de poder de computaci&oacute;n. Chips de computadora especializados, que se almacenan de centros de datos, permiten el acceso a dicho poder de computaci&oacute;n, que se conoce como &ldquo;c&oacute;mputo&rdquo;.Los reportajes sobre la etapa de desarrollo del &ldquo;c&oacute;mputo&rdquo; se tiende a enfocar en los impactos ambientales, sociales y econ&oacute;micos de la extensa infraestructura f&iacute;sica y su r&aacute;pida expansi&oacute;n, que impulsa la IA moderna. Cuando desarrollamos por primera vez la serie AI Spotlight, en 2024, los centros de datos a&uacute;n eran un tema relativamente nuevo en los reportajes. Desde entonces, se ha publicado una rica variedad de ellos en <a href="https://amenazaroboto.com/el-calor-detras-de-la-nube">Am&eacute;rica Latina</a>,<a href="https://www.malaysiakini.com/news/760917"> Asia</a>,<a href="https://www.youtube.com/watch?v=wDpgwvzHwaQ"> &Aacute;frica</a> y los<a href="https://www.bloomberg.com/graphics/2025-ai-data-centers-electricity-prices/"> Estados Unidos</a>, que demuestran la enorme cantidad de agua y energ&iacute;a que consumen los centros de datos, as&iacute; como los esfuerzos corporativos y gubernamentales para<a href="https://elpais.com/tecnologia/2025-03-07/descifrando-el-consumo-de-agua-de-la-ia-asi-oculta-amazon-cuanto-bebe-su-nube-en-espana.html"> esconder estas cifras</a>. En Brasil, por ejemplo, la becaria del Pulitzer La&iacute;s Martins hall&oacute; que un centro de datos de<a href="https://www.intercept.com.br/2025/07/03/data-center-tiktok-energia-estudo-interno/"> TikTok deb&iacute;a usar tanta electricidad como 2,2 millones de personas</a>. La compa&ntilde;&iacute;a no respondi&oacute; a las solicitudes de comentarios de la periodista.Los reportajes sobre los centros de datos se extienden m&aacute;s all&aacute; del impacto ambiental. Tambi&eacute;n examinan c&oacute;mo los centros de datos<a href="https://www.techpolicy.press/mumbais-data-center-dreams-run-on-coal-and-inequality/"> afectan el tejido social de las comunidades locales</a>, sus<a href="https://www.aosfatos.org/noticias/brazils-data-center-race-ignores-environmental-impact-uses-fake-identities/?"> promesas generalmente incumplidas</a> de crecimiento econ&oacute;mico y los intensos<a href="https://www.investigate-europe.eu/posts/big-tech-data-centres-secrecy-eu-law-environment-footprint"> esfuerzos de lobby</a> a un nivel tanto local como nacional para atraerlos y construirlos. La&iacute;s desarroll&oacute; una versi&oacute;n ajustada de nuestro marco, enfocada tan s&oacute;lo en reportar sobre los centros de datos. Puedes encontrarlo a continuaci&oacute;n.<h4>Investigar los modelos</h4>La mezcla de datos de entrenamiento y computaci&oacute;n produce un modelo IA, un artefacto t&eacute;cnico que hace predicciones, clasifica o, en el caso de la IA generativa, crea nuevo contenido. Al igual que los datos y la computaci&oacute;n, los modelos IA var&iacute;an en complejidad y escala, y van de los sistemas de aprendizaje autom&aacute;tico relativamente simples, que se usan para<a href="https://sha.africauncensored.online/"> calcular las primas de los seguros m&eacute;dicos</a>, hasta sofisticados<a href="https://docs.google.com/document/d/1dV9slqe9_fkoGzKTtmRgJPYagu4MAJ8xbFh3Tg0yaVI/edit?tab=t.0#heading=h.z1mp00mogdch"> sistemas de aprendizaje profundo</a>, capaces de generar im&aacute;genes realistas.Las historias que se enfocan en los modelos IA tienden a centrarse en los temas relacionados con sesgos, errores o los efectos negativos que tiene la automatizaci&oacute;n sobre las comunidades y las instituciones.Cuando se puede acceder a c&oacute;mo los desarrolladores de la IA tomaron ciertas decisiones de dise&ntilde;o, como qu&eacute; datos de entrenamiento o par&aacute;metros se usaron para un modelo, hay investigaciones que pueden profundizar en ellas. Esta investigaci&oacute;n de El Confidencial, por ejemplo,<a href="https://www.elconfidencial.com/tecnologia/2024-04-24/riscanvi-algoritmo-cataluna-prisiones-presos-inteligencia-artificial_3871170/"> obtuvo la f&oacute;rmula para un sistema de IA que se usa en el sistema carcelario catal&aacute;n</a>, y que supuestamente predice qui&eacute;n cometer&iacute;a un delito en el futuro. Seg&uacute;n los periodistas, el modelo sistem&aacute;ticamente asignaba un riesgo m&aacute;s alto a ciertos grupos, basado en factores discriminadores o irrelevantes.Cuando esta informaci&oacute;n no est&aacute; disponible, puedes analizar en cambio lo que el modelo arroja. Una historia de Rest of World sistem&aacute;ticamente analiz&oacute; 3.000 im&aacute;genes producidas por MidJourney IA, una popular herramienta de generaci&oacute;n de im&aacute;genes, y<a href="https://restofworld.org/2023/ai-image-stereotypes/"> hall&oacute; que el sistema reproduce estereotipos crudos sobre diversas culturas</a>. Seg&uacute;n los periodistas, la compa&ntilde;&iacute;a no respondi&oacute; a sus solicitudes de comentario. Otra investigaci&oacute;n, del Philippine Center for Investigative Journalism, hizo ingenier&iacute;a inversa de lo que arrojaba el algoritmo de Grab, una popular aplicaci&oacute;n de transporte, al recoger miles de cotizaciones para sus trayectos. Hall&oacute; que<a href="https://pulitzercenter.org/stories/grab-fares-surge-under-opaque-algorithm"> Grab siempre cobra a los consumidores tarifas adicionales que se supone s&oacute;lo deben estar presentes durante horas de tr&aacute;fico pesado</a>. En una respuesta escrita a PCIJ por parte del centro de operaciones de Grab en Filipinas, &eacute;ste dijo que hab&iacute;a &ldquo;cooperado plenamente con la solicitud del Comit&eacute; de Regulaci&oacute;n de Franquicias de Transporte Terrestre&rdquo;, al participar en las audiencias.<h4>Investigar las aplicaciones</h4>Por &uacute;ltimo, es importante que los periodistas investiguen c&oacute;mo la inteligencia artificial se usa en el mundo real. Cuando la tecnolog&iacute;a IA funciona mal, o no como se pretende, pueden verse afectadas muchas personas que est&aacute;n sujetas a decisiones hechas por sistemas autom&aacute;ticos, como algoritmos o aplicaciones de IA generativa.En una historia del Guardian, la periodista Johana Bhuiyan<a href="https://www.theguardian.com/us-news/2023/sep/07/asylum-seekers-ai-translation-apps"> demostr&oacute; c&oacute;mo la excesiva dependencia del gobierno de los Estados Unidos en las aplicaciones de traducci&oacute;n dej&oacute; a una persona que buscaba asilo atrapada durante seis meses en un centro de detenci&oacute;n de ICE</a>. La aplicaci&oacute;n, que se equivoc&oacute; en idiomas para los que ten&iacute;a pocos recursos, tradujo mal, y la persona no pudo comunicarse con nadie de forma adecuada. El Departamento de Seguridad Nacional de Estados Unidos no respondi&oacute; a la periodista del Guardian.La historia de Hera Rizwan, sobre el uso de reconocimiento facial por parte del gobierno indio, hall&oacute; que<a href="https://pulitzercenter.org/stories/ai-facial-recognition-denying-food-pregnant-women-across-india?_gl=1*15fxgp5*_up*MQ..*_gs*MQ..&amp;gclid=Cj0KCQjwiJvQBhCYARIsAMjts3LP9l0wdabdPKjpThkB40xQ6GafuYalFZyblj-yzVmXCsHr77CPebcaAt8REALw_wcB&amp;gbraid=0AAAAAD46U0LmnoOKkJ8TvkItRGg3L-Aif"> la aplicaci&oacute;n que usaban los funcionarios p&uacute;blicos para entregar raciones de alimentos de emergencia no logr&oacute; reconocer algunas mujeres embarazadas o que estaban amamantando</a>, porque sus rostros hab&iacute;an cambiado con respecto a las im&aacute;genes viejas de ellas en las bases de datos gubernamentales. El Ministerio de la Mujer y del Desarrollo del Ni&ntilde;o no respondi&oacute; a las preguntas de Rizwan.<h4>Los reportajes sobre la rendici&oacute;n de cuentas en torno a la IA est&aacute;n al alcance de cualquiera</h4>Como muestran los ejemplos que se han expuesto, nuestro marco de rendici&oacute;n de cuentas puede ayudar a los periodistas a hacer reportajes sobre la IA, de acuerdo con niveles diversos de recursos y esfuerzos t&eacute;cnicos. Las historias pueden ser m&aacute;s cortas o largas, con mayor impacto humano o centradas en aspectos t&eacute;cnicos. Esperamos que estas aproximaciones y ejemplos les ayuden a otros periodistas a encontrar su propia aproximaci&oacute;n local a los reportajes sobre la rendici&oacute;n de cuentas en IA.<h4>Recursos</h4><ul>
<li><a href="https://alfj.org/">Algorithmic Literacy for Journalists</a>: un recurso con explicaciones y otros recursos para periodistas.</li>
<li><a href="https://engage.pulitzercenter.org/ai-spotlight-curriculum">AI Spotlight Series Open-Sourced Curriculum</a>: ofrece<a href="https://www.youtube.com/watch?v=UseVWal07zU"> tutoriales de video</a>,<a href="https://www.youtube.com/watch?v=3-civOxAvtQ"> marcos</a>, y diapositivas de la iniciativa del Pulitzer Center para educar a los periodistas del mundo sobre la IA.</li>
<li><a href="https://gijn.org/es/recurso/como-detectar-contenido-generado-por-ia/">Gu&iacute;a para periodistas sobre c&oacute;mo detectar contenido generado por IA</a></li>
<li><a href="https://gijn.org/es/recurso/guia-para-investigar-los-algoritmos-de-las-redes-sociales/">Gu&iacute;a para investigar los algoritmos de las redes sociales</a></li>
</ul><h4>Investigaci&oacute;n</h4><ul>
<li><a href="https://www.ajl.org/">Algorithmic Justice League</a>: una organizaci&oacute;n que documenta y examina el da&ntilde;o de los algoritmos.</li>
<li><a href="https://ainowinstitute.org/">AI Now Institute</a>: un instituto independiente que publica investigaciones sobre IA y la rendici&oacute;n de cuentas de los algoritmos.</li>
<li><a href="https://cdt.org/">Center for Democracy and Technology</a>: una organizaci&oacute;n sin &aacute;nimo de lucro que publica informes sobre libertades civiles en la era digital.</li>
<li><a href="https://datasociety.net/">Data and Society</a>: una organizaci&oacute;n de investigaci&oacute;n sin &aacute;nimo de lucro enfocada en la tecnolog&iacute;a, los datos y las pol&iacute;ticas p&uacute;blicas.</li>
<li><a href="https://algorithmwatch.org/en/">Algorithm Watch</a>: un grupo sin &aacute;nimo de lucro con sede en Zurich y Berl&iacute;n.</li>
<li><a href="https://privacyinternational.org/">Privacy International</a>: un grupo sin &aacute;nimo de lucro con sede en Londres.</li>
<li><a href="https://www.derechosdigitales.org/pt/home-pt/">Derechos Digitales</a>: una organizaci&oacute;n sin &aacute;nimo de lucro dedicada a los derechos digitales en Am&eacute;rica Latina.</li>
<li><a href="https://www.africandigitalrightsnetwork.org/">African Digital Rights Network</a>: una organizaci&oacute;n panafricana sobre derechos digitales.</li>
</ul><a href="https://pulitzercenter.org/people/gabriel-geiger">Gabriel Geiger</a> es un periodista de investigaci&oacute;n basado en Atenas, Grecia, especializado en reportajes de rendici&oacute;n de cuentas sobre vigilancia y algoritmos. Actualmente es un periodista de investigaci&oacute;n en Lighthouse Reports, una organizaci&oacute;n sin &aacute;nimo de lucro con base en los Pa&iacute;ses Bajos. Su trabajo ha aparecido en WIRED, Le Monde, Der Spiegel y el Guardian, entre otros.<hr><a href="https://gijn.org/wp-content/uploads/2026/07/Headshot.jpeg-336x336-1.webp"><img class=" wp-image-3097994 alignleft" src="https://gijn.org/wp-content/uploads/2026/07/Headshot.jpeg-336x336-1.webp" alt="" width="142" height="142"></a><a href="https://pulitzercenter.org/people/gabriel-geiger">Gabriel Geiger</a> es un periodista de investigaci&oacute;n basado en Atenas, Grecia, especializado en reportajes de rendici&oacute;n de cuentas sobre vigilancia y algoritmos. Actualmente es un periodista de investigaci&oacute;n en Lighthouse Reports, una organizaci&oacute;n sin &aacute;nimo de lucro con base en los Pa&iacute;ses Bajos. Su trabajo ha aparecido en WIRED, Le Monde, Der Spiegel y el Guardian, entre otros.<a href="https://gijn.org/wp-content/uploads/2026/07/Lam-Thuy-No-Undocumented-336x276-1.png"><img class=" wp-image-3098017 alignleft" src="https://gijn.org/wp-content/uploads/2026/07/Lam-Thuy-No-Undocumented-336x276-1.png" alt="" width="141" height="116"></a><a href="https://documentedny.com/author/lam-thuy-vo/">Lam Thuy Vo</a> es una periodista que mezcla el an&aacute;lisis de datos con reportajes en el terreno, para examinar c&oacute;mo los sistemas y pol&iacute;ticas afectan a los individuos. Actualmente es una periodista de investigaci&oacute;n que trabaja con Documented, una sala de redacci&oacute;n independiente, sin &aacute;nimo de lucro, dedicada a reportar con y para comunidades inmigrantes, y es profesora asociada de periodismo de datos en el Craig Newmark Graduate School of Journalism. Anteriormente, fue periodista en The Markup, BuzzFeed News, The Wall Street Journal, Al Jazeera America y Planet Money de NPR.
	This <a target="_blank" href="https://gijn.org/es/recurso/guia-para-reportajes-sobre-la-rendicion-de-cuentas-de-la-ia/">article</a> first appeared on <a target="_blank" href="https://gijn.org">Global Investigative Journalism Network</a> and is republished here under a Creative Commons license.
	<img id="republication-tracker-tool-source" src="https://gijn.org/?republication-pixel=true&amp;post=657947&amp;ga=UA-21528033-17">

Leer siguiente

Herramientas y consejos para reportear

Consejos para investigar la relación entre pesticidas y cáncer

por Rowan Philp • 8 de julio de 2026

En la conferencia IRE de 2026, periodistas veteranos compartieron consejos sobre cómo sortear los problemas de causalidad y la jerga toxicológica en las investigaciones basadas en datos sobre la exposición a pesticidas.

Testigos graban videos con sus teléfonos celulares en el lugar donde Alex Pretti fue asesinado por agentes del Servicio de Aduanas y Protección Fronteriza de EE. UU. en Minneapolis, Minnesota. Imagen: Alejandro Díaz Manrique / Shutterstock

Herramientas y consejos para reportear

Cómo verificar un video grabado por un testigo

por Alex Mahadevan, Poynter • 16 de junio de 2026

Desde el tiroteo de Minneapolis hasta el secuestro de Guthrie, las habilidades de investigación visual son ahora imprescindibles. Aquí te explicamos cómo aplicarlas.

La investigación Fantasmas del Erario requirió miles de solicitudes de acceso a la información, una extensa interconexión de bases de datos y programación, así como herramientas de análisis de redes para detectar patrones de contratación pública que abarcan dos décadas. Imagen: Captura de pantalla, Quinto Elemento Lab

Periodismo de datos

México eliminó su agencia de transparencia. Periodistas siguen investigando corrupción

por César López Linares, LatAm Journalism Review • 11 de junio de 2026

Un año después de que México disolviera el organismo autónomo que supervisaba la transparencia gubernamental, los periodistas siguen encontrando maneras de acceder a documentos públicos y realizar investigaciones basadas en datos.

Periodismo de datos Premios

Los Premios Sigma 2026 celebran la excelencia del periodismo de datos en diez proyectos internacionales

por Rowan Philp • 15 de mayo de 2026

Diez proyectos periodísticos de datos sobresalientes, procedentes de otros tantos países, fueron seleccionados entre los 31 finalistas —26 proyectos individuales y cinco portafolios— por un diverso Comité de Premios compuesto por 17 jueces.

Configuración de accesibilidad

Tamaño del texto

opciones de color

Herramientas de lectura

otros

Recursos

Guía para reportajes sobre la rendición de cuentas de la IA

Leer este artículo en

¿Qué es la IA?

Marco de referencia para historias de rendición de cuentas de la IA

Investigar los datos utilizados

Investigar la computación

Investigar los modelos

Investigar las aplicaciones

Los reportajes sobre la rendición de cuentas en torno a la IA están al alcance de cualquiera

Recursos

Investigación

Leer otras historias etiquetadas con:

Republica este artículo

Leer siguiente

Herramientas y consejos para reportear

Consejos para investigar la relación entre pesticidas y cáncer

Herramientas y consejos para reportear

Cómo verificar un video grabado por un testigo

Periodismo de datos

México eliminó su agencia de transparencia. Periodistas siguen investigando corrupción

Periodismo de datos Premios

Los Premios Sigma 2026 celebran la excelencia del periodismo de datos en diez proyectos internacionales

Recursos

Guía para reportajes sobre la rendición de cuentas de la IA

Leer este artículo en

Recursos relacionados

Guía práctica para periodistas: colaboración con organizaciones de la sociedad civil y organizaciones no gubernamentales

Guía de GIJN para investigar emisiones de metano en vertederos y sus soluciones

Bases de datos de código abierto por país

Guía de fuente abierta para investigar a compañías chinas

Compartir

¿Qué es la IA?

Marco de referencia para historias de rendición de cuentas de la IA

Investigar los datos utilizados

Investigar la computación

Investigar los modelos

Investigar las aplicaciones

Los reportajes sobre la rendición de cuentas en torno a la IA están al alcance de cualquiera

Recursos

Investigación

Recursos relacionados

Guía práctica para periodistas: colaboración con organizaciones de la sociedad civil y organizaciones no gubernamentales

Guía de GIJN para investigar emisiones de metano en vertederos y sus soluciones

Bases de datos de código abierto por país

Guía de fuente abierta para investigar a compañías chinas

Artículos relacionados

Consejos para investigar la relación entre pesticidas y cáncer

Cómo verificar un video grabado por un testigo

México eliminó su agencia de transparencia. Periodistas siguen investigando corrupción

Los Premios Sigma 2026 celebran la excelencia del periodismo de datos en diez proyectos internacionales

Leer otras historias etiquetadas con:

Republica este artículo

Leer siguiente

Herramientas y consejos para reportear

Consejos para investigar la relación entre pesticidas y cáncer

Herramientas y consejos para reportear

Cómo verificar un video grabado por un testigo

Periodismo de datos

México eliminó su agencia de transparencia. Periodistas siguen investigando corrupción

Periodismo de datos Premios

Los Premios Sigma 2026 celebran la excelencia del periodismo de datos en diez proyectos internacionales