Как они это сделали: методы и инструменты, которые использовали для расследования Paradise Papers
ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ
В то время, как корпорации, политики и знаменитости всего мира изощряются в поиске способов скрыть свои богатства в налоговых гаванях, журналисты, работающие над международным расследованием «Документы райских островов» (Paradise Papers), утверждают новые ценности современной журналистики: совместная работа и компьютерные технологии, которые позволяют нам по-другому подходить к методам поиска данных, их анализа и последующего освещения в новостях.
Для расследования использовали три платформы: для внутренних коммуникаций участников — Global I-Hub, для поиска документов — Global Knowledge Center и для опредления связей между доументами — Linkurius.
Специально для этого расследования, Междунарождный консорциум журналистов-расследователей (ICIJ) создал три рабочих платформы, которые были доступны 383 репортерам из 67 стран: одну – для внутренней коммуникации участников (Global I-Hub), вторую – для поиска документов (Global Knowledge Center) и третью – для определения связей между этими данными (Linkurius).
“Это единственный способ, который позволяет проводить такую масштабную совместную работу,” рассказала журналистам Марина Уокер, заместитель директора ICIJ, когда они встретились в Мюнхене в марте 2017, чтобы скоординировать усилия участников этого расследования, обнародованного семь месяцев спустя.
Как и в случае с расследованием «Панамских документов», новая утечка 13,4 млн. документов офшорных юридических фирм Appleby и Asiaciti Trust появилась благодаря двум журналистам немецкой газеты Süddeutsche Zeitung: Бастиану Обермайеру и Фредерику Обермайеру. Они показали полученные данные ICIJ, чтобы организовать расследование, известное сегодня как Paradize Papers. Большинство журналистов, которые работали над этим проектом, уже участвовали в других международных расследованиях ICIJ и были знакомы с методами работы консорциума. Но с каждым расследованием появляются новые вызовы.
Расследование заняло несколько месяцев, которые репортеры потратили на изучение документов, электронных писем, PDF-файлов и индексированных изображений на зашифрованной платформе Global Knowledge Center. В результате команда получила огромное количество материалов. Когда журналисты находили данные о компаниях или публичных лицах, информация о которых их интересовала в рамках этого расследования, они начинали сбор данных на местах. Такая работа часто означала поездки, перекрестную проверку информации и изучение внешних баз данных, а также проведение интервью и поиски других источников информации, что помогало понять потенциальное значение информации для расследования.
Собранные данные включали записи финансовых транзакций, контракты, банковские переводы и списки клиентов, а также способы уклонения от налогов и сохранения тайны своих активов в оффшорных зонах.
Команда ICIJ, под руководством Марины Уокер, была постоянным организатором и координатором работы журналистов, которые расследовали Paradise Papers. Будучи специалистами в своих областях, Мар Кабра, Эмилия Диаз-Страк, Сесиль С. Галлеро и Ригоберто Карвахаль помогли журналистам разобраться с миллионами блоков данных в различных форматах. Сначала данные не были структурированы. Но после того, как их упорядочили, были обнаружены финансовые транзакции, контракты, банковские переводы и списки клиентов, а также способы, которые использовали такие транснациональные компании как Glencore, чтобы обходить правила, уклоняться от налогов и прятать свои активы в оффшорных зонах.
Были получены огромные массивы информации, которые охватывали период почти в 70 лет: с 1950 по 2016 год – это одно из главных отличий между утечкой информации фирм Appleby и Asiaciti Trust, благодаря которой журналисты смогли провести расследование Paradise Papers, и утечкой документов фирмы Mossack Fonseca, которая стала основой расследований Panama Papers. Но профиль клиента на этот раз также совершенно другой: транснациональные компании и баснословно богатые люди, имущество которых можно найти в 19 налоговых гаванях, в числе которых Бермудские и Багамские острова, Барбадос, Мальта и остров Мэн. Среди людей, о которых есть информация в базах данных — Королева Елизавета, члены правительства президента Дональда Трампа, певцы Боно и Шакира, а также корпорации Apple, Nike и Facebook.
Если бы участвующие в этом расследовании журналисты работали в одиночку и не пользовались новыми методами работы с данными и современными технологиями, внедренными членами команды ICIJ, на расследование ушли бы не месяцы, а несколько лет. ICIJ стал образцом организации, которая проводит трансграничные расследования.
Участники расследования рассказали об инструментах и программах, которые использовали, когда работали над проектом Paradise Papers. Они разделены на три категории: цифровая безопасность, поиск документов и сопоставление данных.
Цифровая безопасность
VeraCrypt
ICIJ хранит 13.4 миллионов документов, относящихся к Paradise Papers, в зашифрованной системе с открытыми исходными кодами VeraCrypt, которая позволяет хранить “скрытые документы.” В этой программе применяется двойное шифрование: необходимо вводить пароль, чтобы получить доступ к первому уроню хранения информации, и второй – чтобы получить доступ ко второму, невидимому, уровню. Таким образом, маловероятно, что люди, которые не входят в проводящую расследование команду, заметят второй, секретный уровень.
Зашифрованные электронные письма
Все члены команды ICIJ и люди, которые предоставляют нам информацию, общаются и обмениваются документами с помощью зашифрованных электронных писем, используя для этого такие расширения как Mailvelope. Для этого всего лишь необходимо обменяться ключами приватности PGP (Pretty Good Privacy).
Global I-Hub
Это своего рода внутренний Facebook для участников расследования. В Global I-Hub можно зайти после регистрации и через двухфакторную систему подтверждения подлинности. На этой платформе группы делятся по интересам. Также есть общая лента новостей и внутренняя система обмена сообщениями. “Это наша виртуальная редакция,” говорит Мар Кабра, редактор по работе с данными ICIJ. Для этой платформы испозуется программное обеспечение с открытыми исходными кодами Oxwall.
Поиск Документов
The Knowledge Center
Для анализа документов журналистам необходимо получать доступ к зашифрованной платформе Knowledge Center, для чего необходимо ввести имя пользователя и код подтверждения. Эта поисковая система сейчас включает базы данных трех последних крупных утечек документов: Offshore Leaks, Panama Papers и Paradise Papers.
Поисковая система позволяет нам видеть папки документов, которые сгруппированы по годам и типам документов, а также позволяет находить документы по ключевым словам.
Разработчики из ICIJ внедрили Knowledge Center, используя три программы: Apache Tika для извлечения и обработки данных; Apache Solr для систематизации документов; и Blacklight для интуитивного и удобного поиска.
Nuix
Разработчики ICIJ и команда Süddeutsche Zeitung использовали программное обеспечение Nuix для обработки более 10 миллионов документов, в том числе электронных писем, отсканированных документов, PDF-файлов и изображений. С помощью этой австралийской платформы проводилась экспертиза информации и оптическое распознание изображений для сохранения их в текстовых документах, которые легче анализировать. Например, когда вы сканируете контракт или билет, которые сохранены в виде изображения, Nuix распознает, есть ли на них текст, и извлекает его.
После обработки всех введенных данных техническая команда Paradise Papers создала базу данных, в которой журналисты могли изучать все виды файлов.
Взаимосвязь Данных
Linkurious и Neo4j
Для визуализации большого объема данных расследования Paradise Papers журналисты работали с лицензированной программой Linkurious, которая трансформирует данные в графику, с помощью которой можно проследить изменяющиеся, сложные связи между богатыми и влиятельными людьми. Этот инструмент работает очень просто: в поисковую систему вводятся имена тех, кто вас интересует, и в результате вы получаете график, где показаны все связи, информация о которых есть в базе.
Для работы в системе Linkurius техническая команда ICIJ провела некоторую подготовительную работу: документы Paradise Papers были изначально в формате SQL, но потом, с помощью программного обеспечения Talend, переведены в графический формат Neo4j.
Верхнее изображение предоставлено ICIJ; вторая фотография сделана Фабиалой Торрес Лопес. Впервые статья Фабиолы была опубликована на сайте IJNet и размещена здесь с ее разрешения.
___________________________________________________
Автор: Фабиола Торрес Лопес – сооснователь и редактор OjoPúblico — неприбыльной расследовательской группы-члена GIJN из Лимы, Перу. Ранее Фабиола восемь лет работала журналистом-расследователем в газете El Comercio и готовила материалы о политической коррупции, а также о проблемах в социальной сфере и здравоохранении. Она стипендиатка ICFJ Knight, сооснователь Hacks/Hackers Lima, и бывшая стипендиатка программы по цифровой журналистике журнала Kiplinger.
Редакция русского текста: Ольга Симанович – региональный редактор GIJN, работала тележурналистом, сценаристом, медиа-тренером и редактором в Украине. Ольга была репортером телевизионных новостей “Вікна-Новини” на канале СТБ и участвовала в международных расследованиях SCOOP.
Перевод на русский: Наталия Жачек, стажёр в Институте развития региональной прессы.