10 распространенных ошибок в журналистике данных
10 распространенных ошибок в журналистике данных

Что может быть не так с вашим дата-проектом? Разбираем самые распространённые ошибки. Изображение: Shutterstock

Современная журналистика данных завоёвывает внимание аудитории, а порой и становится основой для изменения государственной политики, показывая убедительные и понятные доказательства последствий изменения климата, плохого госрегулирования, расовой или гендерной дискриминации. Но некоторые сферы остаются ею мало затронутыми.

Традиционные журналистские расследования часто обходят стороной некоторые «слепые зоны» – например, мало у кого из «сторожевых псов» есть возможность проследить телефонные звонки распространяющих фейки роботов и подтвердить, что за ними стоят мошенники. Мало кто также желает рассматривать вопросы нарушения прав в религиозных организациях. В дата-журналистике тоже много «слепых зон» в том, что она освещает, как оценивает данные и как рассказывает истории.

В кулуарах ежегодного саммита NICAR в этом году репортёр GIJN Рован Филп расспросил спикеров и участников о пробелах в журналистике данных, темах, которые часто остаются в тени, и навыках, которых не хватает редакциям. Мы задали те же вопросы надёжным источникам из стран Глобального Юга.

  1. Отсутствие связи между анализом данных и повествованием

«Мы мало работаем над повествованием. Часто данные воспринимаются нами как самоцель, а не как отправная точка для сильной журналистской работы», – говорит Сара Коэн, заведующая кафедрой журналистики в Школе журналистики Уолтера Кронкайта. «Я – член жюри [премии в области журналистики данных], и могу сказать, что мы отсеиваем 90% заявок, в которых видно отличную работу с данными, но не видно отличной журналистики. Нам нужны оба аспекта, ведь если мы забываем собственно о журналистике, то какой во всём этом смысл?»

Мэри-Джо Уэбстер, редакторка данных в Minneapolis Star Tribune, согласилась: «Данные – это хребет материала, но слишком часто они заменяют собой и всё его тело. Вообще, я думаю, что стоит ввести в оборот термин «дата-истории». Молодым журналистам нужно помнить, что материалы – это истории, а данные – источник, который делает эти истории авторитетными». Она добавила: «Бывало, мы тратили по три месяца на один абзац – искали самые поразительные данные и очеловечивали их».

«Дата-журналисты склонны думать, что их исследования интересны сами по себе, но это не так. Людям интересны люди! …Настоящее слепое пятно, которое я вижу у многих дата-журналистов – это повествовательная, нарративная часть в целом», – согласилась Коэн.

  1. Неправильное размещение гиперссылок для слабовидящей аудитории 

На страницах дата-материалов читателям часто предлагают кликнуть на ссылку типа «нажмите здесь», чтобы перейти на оригинальные источники данных, или приводится ссылка «читать другие материалы» по теме, а то и просто – гиперссылка URL. При этом авторы невольно забывают, что слепые или слабовидящие читатели, а также все прочие, кто использует программы для чтения с экрана, не смогут разобраться в гиперссылках, размещённых в тексте таким образом.

«Нужно использовать полную описательную фразу, а не просто писать «нажмите здесь», потому что для устройства чтения с экрана это просто будет элементом списка», – объясняет Хелина Селемон, журналистка-расследовательница New York Amsterdam News. «Размещайте ссылку на словах, которые действительно описывают то, на что она ссылается». СМИ также не предлагают новости в упрощённой подаче для людей с психическими нарушениями».

Не ставьте гиперссылки на фразах типа «нажмите здесь», поскольку такая практика может затруднить анализ данных людьми с ограниченными возможностями, и теми, кто используют программы для чтения с экрана. Изображение: Скриншот, IT-блог Калифорнийского университета

  1. Отсутствие проверки резко отклоняющихся значений в официальных данных

 «Один из аспектов, который беспокоит меня больше всего, – это когда данные приводят нас к неверным выводам», – говорит тренерка по журналистике данных из Аргентины Сандра Кручианелли, член ICIJ и основательница Sololocal.Info. «Данные могут быть неполными, устаревшими или даже неправильно загруженными в базу данных».

Кручианелли рассказала о реальном примере написания статьи о финансировании избирательной кампании, когда в официальной базе данных было указано, что один донор внёс миллион долларов на нужды политической партии. «Сумма была такой большой, что мы не поверили», – вспоминает она. «Мы нашли донора, чтобы спросить, действительно ли он сделал такое пожертвование. Оказалось, что он пожертвовал только 100 000 долларов. Когда мы проконсультировались с человеком, ответственным за базу данных, нам сказали: «Это была ошибка при вводе данных». Представьте себе, если бы мы сделали заголовок о миллионе!»

Поскольку проверить каждую строку данных нереально, она рекомендует журналистам смотреть на крайние значения. «Когда мы анализируем данные, сами цифры тоже могут лгать», – отметила она. «Вот почему очень важно всё верифицировать. Что больше всего изменилось с течением времени или что больше всего уменьшилось?»

(Этот тезис уже приводился в статье GIJN «Обход кулуаров» по мотивам конференции NICAR в 2023 году, в которой также отмечалась распространённая угроза ошибок из-за пустых строк в электронных таблицах. См. статью GIJN «10 простых ошибок в данных, которые могут испортить расследование»).

  1. Игнорирование тревожных сигналов в данных из-за нехватки репортёров

Как много новостных изданий сегодня могут себе позволить отдельного репортёра, например, по трудовым вопросам, местной политике или начальному образованию? В прошлом такие узкопрофильные коллеги часто находили важные, но сложные истории – и «красные флажки»  – в данных, которые они получали от своих нишевых отраслевых источников, и передавали эти данные редакторам расследований или дата-проектов, которые затем часто привлекали такого профильного репортёра для участия в командной работе. Майк Рейли, основатель JournalistsToolbox.AI, говорит, что глобальное сокращение штата новостных редакций привело к отказу от многих дата-расследований из-за отсутствия профильных репортёров, которые могут предоставить ключевой контекст по сложным темам.

«Нам нужно творчески подойти к заполнению этого пробела – сотрудничество, безусловно, поможет», – сказал Рейли. Он добавил, что редакторам данных следует активнее думать о том, какие данные они могут упускать из виду в своих «непрофильных» областях, например авиации, утилизации отходов или уходе за пожилыми людьми.

  1. Изменение климата: застревание в накатанной колее

«Несмотря на то, что СМИ широко освещают наиболее очевидные последствия изменения климата, например, аномальную жару, наводнения и засухи, необходимо углублять анализ», – считает Хассель Фаллас, редакторка анализа данных в La Data Cuenta, латиноамериканском независимом медиа, специализирующемся на журналистике данных, связанных с изменением климата и гендерными вопросами. «Изданиям необходимо углубляться в анализ мер по адаптации к изменению климата: долгосрочные стратегии по смягчению последствий и адаптации».

Фаллас добавила: «Рассматривая только наиболее заметные последствия изменения климата, мы рискуем упустить из виду всю сложность проблемы и её различные аспекты. Например, адаптация к изменению климата выходит за рамки экологических вопросов и охватывает социально-экономические, политические и культурные аспекты».

Команда La Data Cuenta использовала данные для изучения более глубоких последствий изменения климата, как, например, эта диаграмма запланированной миграции во многих странах из-за рисков, связанных с последствиями изменения климата и стихийными бедствиями. Изображение: Скриншот, La Data Cuenta

  1. Нехватка внимания к историям о торговле людьми

В последние годы широкий общественный резонанс вызвали несколько громких расследований, связанных с торговлей людьми, в которых речь шла о жестоких условиях труда мигрантов, работающих на военных базах США за рубежом и в глобальных сетях быстрого питания на Ближнем Востоке. Торговля рабочей силой часто сопряжена с эксплуатацией, тяжёлыми условиями труда, ограничениями на передвижение и даже конфискацией паспортов работников теми фирмами-подрядчиками, которые сотрудничают с международными работодателями за рубежом.

Энди Лерен – бывший редактор отдела расследований NBC News, который работал над несколькими подобными историями, – считает, что эти расследования представляют собой лишь верхушку глобального айсберга эксплуатации работников, и что найти и проанализировать важные данные кому-то ещё предстоит.

«Совсем недавно мы рассказывали о складах западных компаний на Ближнем Востоке, где работали жертвы торговли людьми, и я не сомневаюсь, что такая картина встречается очень часто», – говорит Лерен, который сейчас работает директором программы журналистских расследований в Школе журналистики Крейга Ньюмарка при Городском университете Нью-Йорка. «В разных частях света крупные корпорации сталкиваются с огромным спросом на дешёвую рабочую силу. Фирмы, поставляющие работников, имеют огромный стимул сокращать расходы, что приводит к жестокому обращению с рабочими-мигрантами из таких стран, как Пакистан, Шри-Ланка, Непал и Филиппины. Такие истории требуют времени и командной работы, но они есть!»

  1. Недостаточное внимание к данным при расследовании потребительских афер

Одна из потенциально богатых данными тем, которой журналисты уделяют мало внимания, связана с кражей личных данных и онлайн-мошенничеством. Кроме собственно количества СМС, электронных писем и звонков, направленных на то, чтобы обманом заставить людей раскрыть свои личные или финансовые данные, важным поводом расследовать эти темы, по словам экспертов, будет общественный резонанс, ведь многие жертвы стесняются сообщать или признаваться, что попались на удочку мошенников.

«Существует целый ряд мошенничеств, связанных с кражей личных данных, фишингом, принуждением людей к передаче паспортных данных и кодов безопасности, которые проводятся в рамках организованных кампаний», – говорит Джереми Каплан, директор по учебной части в Школе журналистики Крейга Ньюмарка. «Мы не видим достаточного освещения. Как работают эти мошенники? Что способствует их появлению? Какие банды за ними стоят? Что говорят нам данные о тенденциях угроз?»

Он добавил: «Если я отправлю вам электронное письмо со словами: «Ваш ребёнок – подросток положил деньги на неправильный счёт в нашем банке – дата её рождения X, и мы хотим перенаправить их на правильный счёт», – повестись на такое могут многие».

  1. Игнорирование «положительных» дата-историй

Трудно представить себе традиционные расследования, ведущие к позитивным выводам. Но как раз журналистика данных может легко раскрыть неизвестные или непредвиденные положительные результаты государственной политики – а это поможет и укрепить доверие аудитории, и повлиять на противников такой политики.

Новостные издания редко пишут про значительные улучшения важных показателей, как, например, недавнее резкое сокращение крайней бедности в мире и младенческой смертности, которая за последние три десятилетия снизилась на 59%, или обнадеживающее увеличение, скажем, представительства женщин в парламентах многих стран Африки.

Каплан считает, что редакциям стоит подумать, не слишком ли много у них негатива, и предупреждает, что аудитория замечает, когда баланс между негативными и хотя бы сколько-нибудь положительными данными «идёт наперекосяк».

По его словам, хорошие уроки работы с данными можно извлечь из книги «Фактология: 10 ложных представлений о мире, и почему всё гораздо лучше, чем мы думаем» шведского эксперта в области общественного здравоохранения Ханса Рослинга, который призвал журналистов «убедиться, что всё может быть одновременно и плохо, и хорошо».

«Рослинг провёл несколько замечательных экспериментов с данными, которые показали положительные тенденции с течением времени – например, резкое сокращение числа людей, живущих на один доллар в день», – вспоминает Каплан. «Мы склонны думать, что дела обстоят гораздо хуже, чем показывают данные, и СМИ играют в этом не последнюю роль. Это одна из главных причин, по которой люди не хотят читать новости, – хотя критические материалы тоже безусловно важны – аудитория часто считает, что там слишком много негатива».

Освещая несоразмерный вред или дискриминацию со стороны какой-либо организации в рамках крупного проекта, репортёры часто находят и положительные моменты – какой-нибудь город или сектор, где предотвратили ущерб или достигли преимуществ. По словам Каплана, о таком стоит написать в следующих материалах – особенно если причины позитивных изменений не были предусмотрены политиками.

  1. Неумение создавать разнопрофильные команды и партнёрства 

«Существенный недостаток – отсутствие во многих редакциях видения того, как создавать междисциплинарные команды для журналистики данных», – говорит Фаллас из La Data Cuenta. Во многих СМИ есть «отдел дата-журналистики», который, по сути, представляет собой одного человека, который должен делать всё: собирать данные, анализировать их, визуализировать, сообщать о них, писать статьи и даже делать вирусные ролики для TikTok. Так не работает. Проекты по журналистике данных должны быть комплексными, в них с самого начала должны участвовать репортёры, аналитики данных, визуализаторы данных, эксперты по социальным сетям и редакторы».

По словам Фаллас, это касается и внешнего сотрудничества – в том числе налаженных партнёрских отношений с организациями гражданского общества, научными кругами и экспертами, а также медиа-партнёрства в рамках региональных проектов с изданиями, которые обладают отличными от ваших навыкам и другой аудиторией.

«Вместо того, чтобы всегда выбирать схожих партнёров для расследований, важно определять и отбирать их по тем сильным сторонам, которые нужны в конкретном проекте: анализ данных, визуализация, повествование, создание подкастов, графический дизайн», – говорит она.

  1. Отсутствие передовых навыков анализа данных и применения ИИ

«Работа с электронными таблицами, как Excel, так и Google Sheets – основополагающий навык для журналистики данных», – отметила Фаллас. «Однако многие репортёры ограничиваются лишь основами этих инструментов: сложение, вычитание, определение того, какой показатель вырос или упал. Анализ может идти гораздо дальше этих элементарных функций. Очень важно, чтобы всё больше журналистов изучали языки программирования, например R и Python. Понимание того, как применять алгоритмы машинного обучения или статистические методы, например, линейной регрессии или кластерного анализа, поможет затем проводить и более сложный анализ данных. Эти инструменты позволят лучше раскрывать закономерности и находить ответы, представляющие больший общественный интерес».

По словам Фаллас, журналистам необходимо изучать инструменты генеративного ИИ, чтобы «критически, но хитро» применять их в качестве помощников для решения некоторых основных и трудоёмких задач, связанных с данными, которые в противном случае могут застопорить расследование.

«Например, несколько недель назад в Пуэрто-Рико я провела семинар для коллег, где мы обсуждали как преимущества, так и ограничения использования ChatGPT для решения проблем в журналистике данных», – вспоминает она. Мы обсудили четкие способы создания «подсказок». Мы подчеркнули, что нужно думать, а не просто «копипастить». Генеративный ИИ может послужить ценным инструментом для изучения языков программирования, которые позволяют углубиться в суть».


Rowan Philp, senior reporter, GIJNРован Филп – штатный автор GIJN. Ранее был главным репортёром южноафриканской газеты Sunday Times, где в качестве иностранного корреспондента он освещал новости, политику, коррупцию и конфликты в более чем двух десятках стран.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

Советы Советы и инструменты

Топ-10 инструментов 2023 года по версии GIJN

10 полезных и удобных в использовании инструментов, о которых репортёры GIJN узнали на конференциях NICAR23, IRE23 и 13-й Глобальной конференции журналистов-расследователей (GIJC23) в Швеции.

Журналистика данных Награды Новости и аналитика

Интервью с исполнительной директоркой Sigma Awards Марианной Бушар

О роли премии Sigma Awards для журналистского сообщества, критериях отбора победителей, эволюции журналистики данных, текущих тенденциях и эффективных стратегиях для тех, кто работает с данными.

Советы Журналистика данных

Веб-скрейпинг без программирования с помощью Data Miner: Пошаговая инструкция

Расширение для браузера Data Miner извлекает данные с веб-страниц и сохраняет их в формате Excel, CSV или JSON. Редакторка турецкой редакции GIJN Пинар Даг предлагает пошаговую инструкцию по использованию этого инструмента.

Ресурс Ресурс Советы

Бесплатные инновационные инструменты для извлечения данных, не требующие навыков программирования

Новейшие бесплатные инструменты извлечения данных и оптического распознавания символов (OCR), которые журналисты могут использовать для преобразования громоздких документов в таблицы с возможностью поиска.