Истории

Темы

Хэштег #ddj в Твиттере и эволюция сообщества дата-журналистов

ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ

Один из самых забавных твитов с хэштегом #ddj обнаружен в коллекции Салли Стейнберг «бубличная эфемерность» в Смитсоновском музее, которая повествует о постепенном сужении бублично-пончиковых дырок с ходом истории. Фото: Центральный архив, Национальный музей американской истории.

 

 

 

Примечание редактора: Этот отрывок взят из книги «Пособие по журналистике данных: Критический подход к данным» под редакцией Лилианы Боунегру и Джонатана Грея, опубликованной издательством Амстердамского университета. Глава «Хэштег #ddj в Твиттере», написана Юнис Оу из GIJN и социологом Марком Смитом, и перепечатывается здесь с разрешения.

Отслеживать журналистику данных по одному тегу нелегко. Специалисты в этой сфере используют мириад хэштегов, связанных с их работой, например, #datajournalism, #ddj, #dataviz, #infographics и #data. Глобальная сеть журналистов-расследователей (GIJN) — это международная ассоциация расследовательских СМИ, поддерживающая обучение и обмен информацией между коллегами в этой отрасли. Когда она впервые начала обозревать журналистику данных по публикациям в Twitter шесть лет назад, то самым популярным хэштегом был #ddj (data-driven journalism, журналистика, движимая данными).

Книга «Пособие по журналистике данных: Критический подход к данным» под редакцией Лилианы Боунегру и Джонатана Грея; издательство Амстердамского университета.

Сам термин этот довольно спорный. Можно сказать, что данные лишь инструмент для журналистики, основа информации, но не двигатель работы. Данные состоят из структурированных фактов, статистики, которую ещё нужно отфильтровать, проанализировать и выявить там закономерности, чтобы сделать из этого всего истории. Мы ведь не говорим про «журналистику, движимую интервью» и не называем статью на основе публичных данных «журналистика, движимая документами»: в хороших историях собственно данные — лишь одна из составляющих.

Роль #ddj

Но несмотря на эти аргументы, хэштег #ddj стал повсеместно использоваться в профильных сообществах и служить основной меткой для обмена информацией про отраслевые проекты и мероприятия по всему миру. Журналисты данных используют этот хэштег, чтобы рассказать о своей работе широкой зарубежной аудитории. Этот хэштег также упрощает отраслевые дискуссии в социальных сетях: члены дата-сообщества могут искать, находить и распространять контент с помощью этого хэштега. Беседы, помеченные #ddj, могут вестись на самые разные темы: от прогноза результатов выборов до ошибок в толковании графиков вероятности, от этичности публикации тех или иных данных до привлечения к ответственности разработчиков искусственного интеллекта.

С помощью анализа соцсетей NodeXL мы еженедельно находим по хэштегу #ddj в Twitter дата-истории и анализируем их для рубрики GIJN «Топ-10 в журналистике данных». Снимок экрана.

Рождение Toп-10 #ddj

Еженедельный рейтинг Топ-10 #ddj GIJN впервые был опубликован в январе 2014 года, когда один из нас впервые твитнул сетевой график хэштега #ddj. Этот график, отразивший структуру твитов с хэштегом #ddj и ответов на них, был создан с помощью NodeXL инструмента анализа и визуализации для соцсетей, выполненного как надстройка к электронным таблицам Excel. Сетевой график отражает закономерности, которые можно выявить из ответов, упоминаний и ретвитов. Так можно определить ключевых людей, группы и обсуждаемые темы.

Как международная организация журналистов-расследователей, GIJN всегда ищет способы повысить информированность о том, что происходит в сфере расследовательской журналистики и журналистики данных. Когда исполнительный директор GIJN Дэвид Каплан увидел сетевой график Смита, то предложил использовать такую карту для еженедельной десятки #ddj, демонстрируя самые популярные и интересные примеры журналистики данных. (Вместе со Смитом они попробовали вести еженедельный обзор расследовательской журналистики, но в этой области так и не удалось найти хэштег, работающий настолько же эффективно, как #ddj для данных).

Хотя GIJN постоянно отслеживает изменения в графе, всё-таки нужен и куратор-человек, который уберёт повторяющиеся элементы и выделит наиболее интересные.
С самого рождения этой рубрики, за шесть лет мы накопили более 250 иллюстраций, отражающих обсуждения насущных тем в сообществе журналистики данных, где применялся хэштег #ddj. Теперь с её помощью все заинтересованные лица могут сразу увидеть общую картину, если у них нет времени лично следить за твитами с хэштегом #ddj.

«Иллюстрации» тут следует понимать не только в переносном смысле. Этот анализ даёт нам точную картину сообщества журналистики данных в Twitter, так же как фотожурналистика показывает участников реальных событий на страницах новостных изданий.

Эволюция публикаций с #ddj в Twitter

Чтобы посмотреть, как менялись публикации в Twitter с хэштегом #ddj, мы провели очень поверхностный анализ данных, отобранных с 2014 по 2019 год по хэштегу #ddj. Мы сделали восьминедельную выборку с февраля по март за каждый из шести лет, всего 48 недель. В публикациях и ответах фигурировал самый разный контент, чаще всего — аналитические материалы, премии, гранты, события, курсы, вакансии, инструменты, ресурсы и расследования. Типы публикуемого контента не менялись годами.

В 2014 году мы выделили статьи, в которых обсуждалось развитие всей сферы журналистики данных. Среди них материалы о том, что журналистика данных нужна как двигатель подотчетности и расследований, а также прогноз того, что будущее журналистики — анализ данных. Но в последние годы мы увидели обсуждение новых тем, в частности искусственного интеллекта, масштабных утечек и совместных расследований, основанных на данных. Были также и детальные инструкции, в которых журналисты рассказывали о процессе работы с данными и обменивались опытом использования баз данных, а не только обсуждали, должны ли СМИ допустить работу с данными в свои редакции. Также в опубликованных расследованиях мы заметили преобладание тем электорального анализа, иммиграции, загрязнения, климата и футбола.

Еженедельный GIJN-овский анализ публикаций с тегом #ddj не только выделяет наиболее популярные твиты и URL, но и приводит список основных участников дискуссии в области журналистики данных.

Ведущие дата-журналисты

Ведущие участники в обсуждении по тегу #ddj в Twitter. Снимок экрана

Вот «знакомые все лица» в центре обсуждения по тегу #ddj, в том числе отраслевые эксперты Эдвард Тафт, Альберто Каиро, Мартин Штабе, Нейт Силвер и Натан Яу — а также «дата-команды» из Европы и Северной Америки, в том числе Le Telegramme, Tages-Anzeiger, Berliner Morgenpost, FiveThirtyEight, Financial Times и Upshot из New York Times. Их работа может вдохновлять, просвещать и приводить к дальнейшим дискуссиям. Журналисты всего мира могут пользоваться случаем и пообщаться с этими лидерами мнений.

Часто #ddj сопровождается рядом других хэштегов, показанных в картографировании от Connected Action, это позволяет участникам сообщества находить другие подобные истории.

Хэштеги, используемые дата-журналистами. Скриншот.

Наиболее распространённые хэштеги, появляющиеся рядом с #ddj —#dataviz, #visualization, #datajournalism, #opendata, #data и #infographics. Из этого становится понятно, что активисты в этой сфере заботятся не только о доступности публичных данных, но и о креативной подаче и визуализации данных для читателей.

Однако картографирование #ddj с помощью NodeXL ни в коей мере не является репрезентативным для всей отрасли — ведь в анализ включаются только публикации в Twitter. Более того, обычно те, у кого больше подписчиков в Twitter и потому больше ретвитов, заметнее на таких графиках.

Также мы отметили, что большинство топовых твитов обычно публикуются из Европы и обеих Америк, особенно из Германии и США, хотя есть и чуть-чуть твитов из Азии и Африки. Это может быть вызвано неоднородностью базы пользователей Twitter, ведь в других регионах сравнительно менее развиты сообщества журналистики данных, либо в других регионах журналисты данных находят друг друга по другим хэштегам или вообще не используют Twitter.

В 2020 году мы наблюдали, что некоторые материалы выдающихся организаций по журналистике данных, которые широко публиковались в Twitter, не появлялись в нашем сетевом графе, поскольку при публикации использовали не #ddj, а какой-то другой хэштег или публиковали посты вообще без него. Мы подозреваем, что когда Twitter перешёл на формат твитов со 140 до 280 символов в ноябре 2017 года, то это подвигло некоторых на использование более длинных тэгов, например, #datajournalism.

Забавные открытия в #ddj

Часто мы находим очень сильные журналистские работы и красивые визуализации, но иногда попадаются и просто веселые публикации.

В завершение хотим коротко рассказать о некоторых забавных находках по хэштегу #ddj в прошлом году.

Как починить туалет и другие вещи, которые мы не смогли бы сделать без Google-поиска.

В милом и глубокомысленном визуальном эссе пользователь Xaquín G.V. проанализировал поисковые запросы и показал, что чаще всего чинят люди. Во многих жарких странах холодильники; для североамериканцев и жителей Восточной Азии унитазы; а вот в Северной и Восточной Европе чаще всего люди ищут информацию о починке … лампочек.

Следующих график найден в коллекции Салли Стейнберг «Бубличная эфемерность» в Смитсоновском музее. Он повествует о постепенном сужении бублично-пончиковых дырок в ходе истории. В другом материале графический дизайнер Найджел Холмс показал и объяснил странно-прекрасные соревнования по всему миру, от улиточных гонок до забегов с жёнами на руках — в книге «Безумные соревнования».

Ещё в нашей коллекции есть материал о том, что женщины по всему миру осознают, как непрактично малы карманы женских джинсов, и это подтверждает неопровержимый набор данных и анализ от Puddingviz.

Наконец, существуют ли вообще пиковые сезоны зачатий? Visme провели анализ ООНовской статистики родов — и кажется, таки существуют. Они нашли корреляцию трёх разных переменных: месяцы пиковой рождаемости, времена года и широта страны (расстояние от экватора), которые могут влиять на «ритмы совокуплений» в разных странах.

Дополнительные материалы по теме

С чего начать: Сборники советов по журналистике данных.

Наши еженедельные рейтинги Топ-10 журналистики данных(на русском).

Единороги и суперсила: уроки журналистики данных из Португалии.


Юнис Оу (Eunice Au) — программный менеджер GIJN.  В течение восьми лет была журналисткой в Малайзии: с 2011 по 2015 год она работала в New Straits Times, а затем — малайзийским корреспондентом сингапурского издания Straits Times. Она также писала для Sun, Malaysian Today and Madam Chair.

Марк Смит — социолог, основатель и руководитель консалтинговой группы Connected Action, которая применяет техники анализа соцсетей для бизнес-анализа. GIJN выражает особую благодарность Марку и его коллегам за их необычайную поддержку в еженедельной десятке #ddj с момента создания рубрики.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

Журналистика данных Награды Новости и аналитика

Интервью с исполнительной директоркой Sigma Awards Марианной Бушар

О роли премии Sigma Awards для журналистского сообщества, критериях отбора победителей, эволюции журналистики данных, текущих тенденциях и эффективных стратегиях для тех, кто работает с данными.

Советы Журналистика данных

Веб-скрейпинг без программирования с помощью Data Miner: Пошаговая инструкция

Расширение для браузера Data Miner извлекает данные с веб-страниц и сохраняет их в формате Excel, CSV или JSON. Редакторка турецкой редакции GIJN Пинар Даг предлагает пошаговую инструкцию по использованию этого инструмента.

Журналистика данных

Топ-10 DDJ: Бизнес-империя «Вагнера», карьера Барби и результаты выборов в Испании

Сколько российских солдат ушли в «самоволку» , кем работала Барби, почему в Германии опаздывают поезда, и как выглядит бизнес-империя основателя ЧВК «Вагнер» – в рейтинге Топ-10 журналистики данных.

Журналистика данных

Топ-10 DDJ: Аномальная жара, популярные французские имена и звёздные футболистки

Среди самой популярной журналистики данных недели мы нашли материал об изменениях в глобальной демографии, исследование об активах Московской православной церкви в Украине, обзор самых популярных имён во Франции и анализ, предсказывающий будущих звёзд Чемпионата мира по футболу среди женщин.