Советы по поиску труднодоступных данных
Большая часть инфраструктуры, необходимой для проведения эффективных журналистских расследований – от всемирных баз данных до передовых инструментов поиска информации в открытых источниках – уже создана, и участники 12-й Глобальной конференции журналистов-расследователей (#GIJC21) призвали журналистов всего мира использовать эти методы в своей работе.
Во время блиц-раунда на #GIJC21 у каждого из выступающих – репортеров и редакторов – было всего по пять минут, чтобы рассказать, что журналистам следует использовать для сбора труднодоступной информации.
Вот некоторые из прозвучавших на этой сессии советов.
Распознавание лиц
Подумайте о возможности использовать инструменты, позволяющие распознавать лица, – включая Findclone – для отслеживания и опознания людей, подозреваемых в экстремизме и занимающих неожиданные позиции во власти (например, неонацистов в правоохранительных органах). Независимый журналист Себастьен Бурдон, занимающийся расследованиями действий ультраправых, объяснил, что Findclone может подобрать пять совпадений – по шкале вероятности от нуля до единицы, – ориентируясь на фотографии лиц, размещенных на таких платформах социальных сетей, как российская ВК (ВКонтакте), и – что очень важно – инструмент ищет совпадения даже в удаленных аккаунтах. Занимающаяся расследованиями некоммерческая организация Bellingcat отметила, что применение таких систем, как Findclone, «очень ограничено, но дает отличные результаты, если нужно найти человека в соцсети ВК». При этом журналистам следует учитывать серьезные этические проблемы, связанные с использованием программ для распознавания лиц, и помнить, что эти системы часто используются с недобрыми намерениями.
Краудсорсинг
Попробуйте собирать данные и свидетельства с помощью таких инструментов, как CrowdNewsroom. Директор швейцарского отделения CrowdNewsroom Марк Энгельхардт рассказал, что инструмент позволяет журналистам запускать краудсорсинговые кампании, собирать данные с помощью простого в использовании инструмента для редактирования, а затем анализировать и проверять поступающую информацию. «Люди могут делиться своими данными или личными историями через эту платформу – и делать это безопасным для себя образом», – сказал он.
По словам Энгельхардта, независимая платформа Correctiv уже использовала CrowdNewsroom для проведения нескольких расследований, включая отслеживание денег, стоящих за кампанией рекламных постеров в поддержку одной ультраправой европейской политической партии. В сборе данных для проекта приняли участие 3 500 человек.
Энгельхардт утверждает, что, поскольку этот метод зависит от привлечения помощи общественности, чтобы стать успешными, проектам нужно сотрудничать с НПО и партнерами из СМИ, их также продвигать свои идеи офлайн на общественных мероприятиях в заинтересованных сообществах.
Базы данных
Используйте возможности инструмента Aleph, созданного Проектом по освещению организованной преступности и коррупции (Organized Crime & Corruption Reporting Project – OCCRP). Редактор данных OCCRP Ян Строжик рекомендует Aleph как интерактивный глобальный архив для проведения расследований. Основная работа в ходе расследований на основе данных приходится на извлечение, очистку, разбор и преобразование информации – вся эта работа представляет собой «нижнюю часть айсберга», которую аудитория обычно не видит. По словам Строжика, несколько функций этого архива помогут журналистам справиться с этим менее гламурным этапом работы с данными.
Сейчас Aleph включает 309 общедоступных наборов данных, 200 скрейперов и данные о более чем 150 миллионах организаций. Строжик добавил, что платформа также позволяет репортерам безопасно делиться своими расследованиями с коллегами, загружать практически любые типы файлов, осуществлять поиск в различных скриптах и превращать данные в интерактивные графики, показывающие всю систему связей.
Если вы хотите составить карту заявок на добычу полезных ископаемых и соблюдения нормативных требований в ЮАР – или же помочь журналистам, живущим в других странах, разобраться в том, как работает угольная промышленность, – ознакомьтесь с инструментом #MineAlerts, разработанным организацией Oxpeckers, занимающейся экологическими расследованиями. Журналистка и менеджер по работе с данными Oxpeckers Андисва Матикинча пояснила, что платформа сочетает цифровую базу данных и инструмент геожурналистики, а также включает документы, связанные с заявками на получение лицензий и действующими шахтами, а также информацию по важнейшему вопросу использования воды в шахтах.
Similarly, the Offshore Leaks Database allows journalists to search for investigations involving companies that operate across borders. Delphine Reuter, a data journalist at the International Consortium of Investigative Journalists (ICIJ), said this free, open source database already contains data for 800,000 entities and that this number would soon swell with the addition of data from the Pandora Papers. Reuter also offered several tips for using the tool:
База данных Offshore Leaks Database позволяет журналистам искать информацию для расследований, касающихся компаний, ведущих деятельность в нескольких странах. По словам дата-журналистки Международного консорциума журналистов-расследователей (International Consortium of Investigative Journalists – ICIJ) Дельфины Рейтер, эта бесплатная база данных на основе открытого исходного кода уже содержит данные о 800 000 юридических лиц, и это число скоро увеличится, когда к ней будет добавлено больше информации из «Архива Пандоры». Рейтер также предложила несколько советов по использованию этого инструмента:
- Во время поиска попробуйте использовать разные варианты написания – например, «limited» и «ltd», или «corporation» и «corp.» – и берите названия в кавычки.
- Работая с разделом «Могущественные игроки» (Power Players), включающим данные, которые были получены в ходе таких расследований, как Panama Papers и Paradise Papers, обращайте внимание на источник и дату, когда были собраны данные, и помните, что эти данные представляют информацию на тот момент, когда эти расследования проводились. Рейтер советует журналистам также проверять обновленные корпоративные записи для получения актуальной информации.
- Хотя в базе данных можно проводить поиск по имени, адресу или стране, Рейтер отметила, что для получения точных результатов часто важно искать информацию о трастах и офшорных компаниях в категории «юрисдикция» (англ. “jurisdiction”).
Ресурсы по конкретным странам
Обратите внимание, что существуют также обширные базы данных по отдельным странам, например Украине и Казахстану. IT-специалист из Украины Дмитрий Чаплинский советует журналистам, которые ищут информацию из государственных реестров, документы о раскрытии активов, данные о государственных закупках и другие официальные документы из Украины и Казахстана, обратить внимание на две регулярно обновляемые базы данных с открытым исходным кодом. Ring – это система поиска документов по более чем 20 базам данных в Украине, включающим 29 миллионов публичных записей. Open Base – это аналогичное хранилище данных по Казахстану, содержащее около десятка источников данных. По словам Чаплинского, поиск в Ring можно осуществлять на украинском, английском и русском языках.
Набор инструментов «на каждый день»
Конечно, совершенно новые инструменты осваивать очень интересно, но не менее ценно, на наш взгляд, изучать инструменты, которыми давно пользуются редакции, проводящие расследования. Мохаммад Хаддад, редактор данных в Al Jazeera Media Network, рассказал о пяти своих любимых инструментах, которые он использует каждый день.
- Mapbox – и его функция Scrollytelling. «Если вы хотите рассказать историю, связанную с географией, то это именно тот инструмент, который вам нужен, – сказал Хаддад. – Это, безусловно, наш любимый инструмент для работы с картами. Вы можете взять с собой читателей даже в кругосветное путешествие – с помощью этого инструмента мы провели нашу аудиторию по реке Нил и через спорный пограничный район, расположенный между Индией и Китаем».
- Nivo. «Это отличный инструмент для визуализации данных, он требует минимального знания программирования, а в результате мы получаем очень сложные визуализации данных, – объяснил Хаддад. – Al Jazeera использовала Nivo для анализа и создания визуализации о том, как страны в ООН голосовали по разным вопросам начиная с 1946 года».
- AMP Stories. «Этой мобильной платформой для создания онлайн-повествования легко пользоваться. Она отлично подходит для работы над историями, в центре которых стоят персонажи, и очень хорошо работает на мобильных телефонах, с которых, скорее всего, приходит большая часть вашего трафика, – отметил он. – Мы использовали AMP Stories для создания серии «100 лиц народа рохинджа», а также серий, посвященных чернокожим людям, убитым в США, и людям, убитым в Палестине и Мьянме».
- Chartbeat. «Чтобы понять, какой отклик находит ваша история у аудитории, используйте в режиме реального времени аналитику Chartbeat, – советует Хаддад. – Для меня самая полезная функция этого инструмента – индикатор эффективности в социальных сетях, который помогает увидеть, как вашими историями делились в социальных медиа».
- R и R Studio. «Мои самые любимые инструменты – это R и R Studio, – признается Хаддад. – Инструменты приходят и уходят, поэтому лучший инструмент – тот, который можно создать на языке программирования. R популярен у всей нашей команды, мы используем его для решения многих задач – начиная со сбора данных и заканчивая редактированием. Что можно делать с помощью R? Практически все».
Al Jazeera’s Mohammad Haddad used the Nivo data visualization tool to create an interactive project tracking UN votes back to 1946. Image: ScreenshotОдна из поразительных общих особенностей всех инструментов, о которых рассказали участники дискуссии, – они позволяют управлять огромными объемами информации – и показывают, что любой репортер потенциально может найти и скачать в интернете доступные на различных языках данные в виде разных скриптов, типов файлов и изображений.
Дополнительные ресурсы
Любимые инструменты журналистов-расследователей.
Десять инструментов расследователя, о которых вы, возможно, не слышали.
Любимые инструменты Мохаммеда Хаддада из Al Jazeera.
Глубинная сеть для журналистики: 7 рекомендаций по использованию данных OCCRP.
Как проводить расследования о компаниях из базы данных Offshore Leaks, искать данные по локации и изучать схемы взаимосвязей (инструкция к базе ICIJ в трех частях).
Поиск данных о корпорациях и их владельцах: Путеводитель GIJN.
Рован Филп (Rowan Philp) – постоянный автор GIJN, лауреат многих журналистских наград, работавший более чем в двух десятках стран. В течение 15 лет Филп был главным репортером и главой лондонского бюро Sunday Times в Южной Африке. Сейчас он живет и работает в Бостоне.