Истории

Темы

Глубинная сеть для журналистики: 7 рекомендаций по использованию OCCRP Data

ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ

За последние полгода команда data-инженеров Центра по исследованию коррупции и организованной преступности (OCCRP) разработала новые элементы для платформы OCCRP Data, объединив более 200 различных пакетов данных. Теперь вы можете вести поиск по ним всем одновременно!

OCCRP Data, один из ресурсов «Информационного портала расследователя» (Investigative Dashboard), предлагает журналистам быстрый доступ к сведениям из глубинной сети. На сегодня он содержит более 170 публичных источников и свыше ста миллионов элементов информации для открытого поиска.

Уникальность этой базе данных добавляет наличие в ней санкционных списков, имеющих отношение к политике или криминалитету.

Речь идет о новостных архивах, судебных документах, сведениях из утечек, а также о материалах узкой направленности, включая парламентские запросы британских депутатов, базы данных коммерческих компаний и закупок, отчеты неправительственных организаций и даже данные о полетах неофициальных «воздушных тюрем ЦРУ».

Все это данные из открытых источников. Если вы связаны со структурой OCCRP, у вас будет доступ более чем к 250 миллионам массивов данных.

Уникальность этой базе данных добавляет наличие в ней санкционных списков, имеющих отношение к политике или криминалитету.

Новая платформа предоставляет пользователю как никогда «компактный» поиск различных типов информации, таких как электронные письма, документы, содержимое корпоративных или земельных реестров, причем каждый вид информации отображается максимально удобным образом.

Вот несколько подсказок, как наиболее эффективно применять OCCRP Data.

Отбирайте нужное прямо в браузере

В OCCRP Data есть электронные письма, документы в формате PDF и Word, старые новостные архивы и даже поэмы Редьярда Киплинга (последние, если честно, из WikiLeaks). Абсолютно новый интерфейс позволяет вам видеть документы, вести по ним поиск и просматривать в браузере без необходимости скачивать или открывать их. Тем самым процесс поиска ускоряется и становится более «плавным».

Новые варианты поисковых фильтров

С OCCRP Data вы можете фильтровать результаты проделанного поиска по источникам, типу документа, а также по электронным письмам, телефонным номерам, адресам, названиям структур, стран и другим параметрам, указанным в колонке слева.

Выделяйте связи

Вы можете исследовать структурированные данные по-новому, потому что OCCRP Data использует извлечение объекта по документам и электронным письмам для поиска телефонных номеров, имен людей, названий компаний, адресов, номеров удостоверений личности и других интересующих вас ключевых связующих деталей. Просто кликните по объекту, и увидите опции тегов на экране предварительного просмотра.

Сравнивайте большие массивы данных

OCCRP Data может находить перекрестные ссылки по двум спискам данных. Платформа в определенном порядке выводит совпадающую информацию и позволяет вам сравнивать сведения. Сначала кликните на источнике, затем кликните на опции «перекрестные ссылки» (Cross Reference), чтобы выбрать другой источник, с которым будет производиться сравнение.

Следите за поисковым запросом, получайте уведомления

В OCCRP Data теперь есть функция уведомления, позволяющая отслеживать появление данных по искомым элементам: когда в базу данных добавляется новая информация, вы получите сообщение об этом. Просто активируйте иконку колокольчика справа, рядом с вашим поисковым запросом.

Поддержка иностранных языков

Содержание OCCRP Data теперь доступно не только на английском. Интерфейс переведен и поддерживает русский язык, а также боснийско-сербско-хорватский. Команда data-инженеров работает над добавлением и других языков, например, испанского и немецкого.

Функционал расширенного поиска

Используйте функциональные возможности усложненного расширенного поиска, если вам нужен поиск с учетом расстояния между ключевыми словами, поиск точного сочетания, комбинированные запросы или учет орфографических ошибок.

Хотите задать вопрос?

Каждый пользователь OCCRP Data может познакомиться с информацией на Aleph Wiki, где команда data-инженеров рассказывает о применении ресурса, его функциях и концепции развития. И журналистам, и техническим специалистам предлагается прочесть руководство пользователя. С нами также можно связаться по электронному адресу data@occrp.org, чтобы оставить отзыв.

_____________________________________________

Центр по исследованию коррупции и организованной преступности (OCCRP) — журналистский проект, объединяющий 40 некоммерческих расследовательских центров, десятки независимых журналистов и несколько крупных региональных новостных СМИ в разных частях света.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

Советы и инструменты

На передовой COVID-19: Советы по данным, источникам и новым подходам

«Освещать COVID-19 — это, во многом, как работа военного корреспондента. Очень мало источников, есть враг, повсюду хаос… и высокая опасность, если неаккуратен — можешь погибнуть». Вот советы трёх опытных журналистов уже начавших работать на передовой кризиса, связанного с пандемией.

Советы и инструменты

Мои любимые инструменты с кубинской дата-журналисткой Барбарой Маседой

Как дата-журналисты добывают данные в стране, где госучреждения – непрозрачны, интернет – ненадежен, публичная информация может быть удалена, а пресс-секретари даже не разговаривают с представителями независимых медиа.