Истории

Темы

Мои любимые инструменты с кубинской дата-журналисткой Барбарой Маседой

ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ

В рубрике Мои любимые инструменты мы поговорим с Барбарой Маседой, основательницей и редактором Proyecto Inventario – платформы открытых данных для журналистов, которые пишут о её родной Кубе.

Слабое проникновение интернета в жизнь страны и недостаточная прозрачность государства сильно осложняют – а иногда и делают невозможным – поиск даже самых базовых данных для репортажей и расследований. Закончив факультет журналистики Гаванского университета, Маседа несколько лет посвятила разработке метода количественного подхода к новостям, в том числе, в Бирмингемском университете в Великобритании.

Барбара Маседа основала Proyecto Inventario в 2018. Фото: предоставлено Factual

Обучаясь в Стенфордском университете по стипендиальной программе им. Джона Найта, в 2018 году она основала Proyecto Inventario. Целью ее проекта стало облегчение доступа к данным о разных сферах жизни на Кубе для независимых журналистов.

С начала пандемии коронавируса Proyecto Inventario стал основным источником данных о распространении вируса на Кубе. Проект собирает информацию про выявленные случаи и упорядочивает по дате, месту и особенностям пациента. Визуализации Proyecto Inventario, подготовленные с помощью платформы Flourish, используются несколькими независимыми СМИ на Кубе.

Proyecto Inventario визуализирует данные о распространении коронавируса на Кубе. Фото: снимок экрана.

Маседа, недавно ставшая участницей стипендиальной программы TED2020, сама управляет Proyecto Inventario: ведёт страницы в социальных сетях, отвечает на вопросы журналистов и планирует дальше развивать инициативу с помощью краудфандинга и получения грантов.

Вот некоторые её любимые инструменты, которыми она пользуется для преодоления сложностей с журналистикой данных о Кубе и на Кубе.

Klaxon

«Можно по-разному автоматизировать выявление изменений на веб-сайтах. В Proyecto Inventario мы пользуемся функциями Klaxon. Это онлайн-инструмент, созданный проектом Маршала (The Marshall Project). Klaxon очень удобен, позволяет отслеживать много веб-сайтов и компонентов различных веб-страниц. Можно детально настраивать всё под свои потребности, фокусироваться на отдельных элементах – поэтому он вполне нам подходит.

Klaxon вообще хорошее подспорье в журналистской работе, но на Кубе в особенности: большинство государственных веб-сайтов у нас не дают подписаться на обновления, если хочешь узнавать о появлении новой информации или данных. Кроме того, независимая журналистика на Кубе – вне закона, так что у нас практически нет контакта с пресс-секретарями государственных учреждений. Поэтому автоматические уведомления об изменениях на веб-сайтах — это конечно же один из лучших вариантов для своевременного получения сообщений о публикации новой официальной информации.

Независимая журналистика на Кубе вне закона, поэтому у нас практически нет взаимоотношений с пресс-секретарями государственных учреждений.

Например, мы отслеживаем официальное хранилище кубинских законов, Gaceta Oficial. Благодаря Klaxon мы в течение часа получаем уведомление о публикации нового нормативно-правового акта, и можем привлечь внимание журналистов или редакторов, которые работают над соответствующими темами.

«Другой способ использования Klaxon — это несовершенная, но эффективная замена скрейпера, который регулярно запускается в облаке. Если у вас нет навыков или времени для настройки собственного скрейпера, то можно с помощью Klaxon собирать и сохранять таблицы данных или списки, или любой другой источник данных с конкретного веб-сайта по мере их обновления».

Klaxon позволяет отслеживать изменения фамилий чиновников на веб-сайте госучреждения, чтобы своевременно узнавать о новых назначениях в администрации. Фото: Снимок экрана

Sublime Text 

«В Sublime Text мне нравится, что его можно использовать для создания своего рода локального поискового сервера на вашем компьютере. Если у вас локально в виде текстовых файлов хранятся сотни и тысячи документов, то с помощью этого мощного текстового редактора можно находить те данные, которые будут наиболее актуальными в вашем расследовании. Прочитайте чудесный учебник Фридриха Линденберга «Инструментарий бедного журналиста для майнинга текстовых данных», если вы хотите научиться работать с этим инструментом.

В стране, где совсем мало информации доступно онлайн, в журналистской работе мы часто опираемся на сливы документов и баз данных, которые получаем из рук в руки на флэшках. Как раз для таких случаев инструмент очень полезен. Я бы сказала, он пригодится даже если информация есть онлайн, но формат не оптимален для пользователей и поисковых систем.

Взять опять-таки публикации кубинского законодательства. Долгое время новые акты в хранилище публиковались в виде файлов PDF, сжатых архиватором в RAR. В таком случае полезно скачать веб-сайт целиком, преобразовать всё в нужный формат, а потом упорядочить информацию так, чтобы упростить журналистам поиск».

Sublime Text позволяет искать ключевое слово, например, «телекоммуникации» в тысячах документов и законодательных актов. Фото: снимок экрана

Wayback Machine

«Все любят Wayback Machine, а мы – тем более, ведь у нас в стране публичные реестры работают очень криво. Веб-страницы и даже целые сайты на Кубе постоянно оказываются недоступны, поэтому такой ресурс как Wayback Machine очень выручает, предоставляя доступ к сохранённым ранее версиям.

Одна из проблем в доступе к данным возникает, когда госучреждение удаляет старые записи при размещении нового набора данных. Например, в самой последней версии реестра несельскохозяйственных кооперативов не содержится сведений о компаниях, которые прежде вносились в реестр, но затем были из него исключены. С помощью Wayback Machine мы получили предыдущие версии этого реестра и добавили все неактивные или закрывшиеся кооперативы в базу данных, доступную журналистам и всем желающим.

Веб-страницы и даже целые сайты на Кубе постоянно оказываются недоступны, поэтому Wayback Machine очень выручает сохранёнными версиями.

Wayback Machine также может быть отличной нейтральной стороной для создания копий веб-сайтов, которые, на ваш взгляд, могут исчезнуть, поменяться или просто очень важны для вашего расследования. Мы создали базу данных по всем перелетам кубинских врачей из Бразилии назад на Кубу в конце 2018 года после отмены программы Mais Médicos. Перед публикацией мы убедились, что все новостные статьи, из которых мы брали информацию о количестве медиков на каждом рейсе, были сохранены в Wayback Machine. Это важная мера предосторожности для тех, кто освещает работу правительства, которое любит дискредитировать критические статьи и ставить под сомнение правдивость репортёров.»

Video Street View

Используйте Google My Maps для упорядочивания видео и поиска по ним. Фото: снимок экрана.

Строго говоря, это не инструмент, а идея, которая может быть полезна журналистам в странах, где нет Google Street View, как на Кубе. Столкнувшись с невозможностью воспользоваться Google Street View как инструментом геолокации для OSINT (сбора информации из открытых источников) как в других странах, мы нашли альтернативу. Люди постят целые часы видеозаписей с кубинских улиц на платформах в социальных сетях, например YouTube, Facebook, Twitter и других. Обычно это видео, записанные кубинцами, живущими за рубежом, которые приезжают проведать свои семьи и хотят запечатлеть ностальгические сцены из тех районов, где они когда-то жили, или маршруты, по которым они ходили на работу.»

DocumentCloud

«В Proyecto Inventario большая часть нашей работы состоит в структурировании информации, содержащейся в документах. Этот процесс облегчает ресурс DocumentCloud, где есть все функции для обработки документов: распознавание текста, извлечение элементов и так далее.

Но кроме всех этих функций DocumentCloud, которые полюбились многим журналистам, мне также нравится возможность доступа к документам, которыми делятся другие пользователи. Там можно найти информацию про мою страну. Поиск по открытым документам — отличный способ узнать пару деталей про Кубу, которые может быть были вообще не имели значения для того коллеги или редакции, которые проводили расследование и размещали эти документы, а для меня могут оказаться очень важными.»

Упоминания телекоммуникационного оператора Кубы (ETECSA) в результатах поиска на DocumentCloud. Фото: снимок экрана.

Kumu.io

«Визуализация связей в социальных сетях, отображение холдинговых структур, создание генеалогических древ — вот основные задачи, которые Kumu.io облегчает чуть ли не каждый день. Мы много анализируем социальные сети. Удобно, что сетевые карты Kumu.io можно легко встроить и обновить, внеся изменения в открытый документ Google Sheet с исходными данными — хотя можно использовать и другие варианты источников.»

Кристина Пуга – журналистка из Нью-Йорка, которая пишет для NBCNews.com о латиноамериканском сообществе в США. Она также создала сайт WiserWithAge.com, где рассказывает о вдохновляющих людях в возрасте 60 лет и старше, чтобы передать их мудрость младшим поколениям.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

Советы Советы и инструменты

Четыре важных совета по использованию Wayback Machine

Wayback Machine от Internet Archive – виртуальная машина времени. Сервис уже 27 лет сохраняет архив почти всей публично доступной Сети. О фишках Wayback Machine рассказал журналист ProPublica Крэйг Сильверман.

Новости и аналитика Советы и инструменты

Кто стоит за проблемным веб-сайтом: Методы известных расследователей

Вы нашли в сети анонимный веб-сайт и хотите отыскать его владельца? Старшая специалистка по вычислительным методам Центра цифровой журналистики Tow при Колумбийском университете При Бенгани и журналист-расследователь Markup Джон Киган поделились своими методами и инструментами, которые помогут узнать, кому принадлежит подозрительный ресурс.

Расследование военных преступлений в Йемене

Методология Советы и инструменты

Методы расследования военных преступлений в Йемене

На примере Йемена расследователи продемонстрировали, как с помощью инноваций можно разобраться в хаосе конфликта и привлечь к персональной ответственности преступников, а затем — применять эту практику в аналогичных конфликтах.