Авторка этой статьи, редакторка турецкой редакции GIJN Пинар Даг проводит тренинг по работе с данными в Измирском экономическом университете в Турции. Изображение предоставила Пинар Даг.
Работа с данными: Практические советы для небольшой редакции
ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ
Небольшим редакциям как никогда важно осознавать значимость использования данных. Тем не менее, они часто сталкиваются с различными препятствиями: нехваткой финансирования, дефицитом ресурсов и устаревшими взглядами на традиционную журналистику.
Генеративный искусственный интеллект помогает сэкономить время и увеличить отдачу от работы с данными. Такой подход кажется пугающим, но если обеспечивать целостность статистики, быстро очищать данные и писать код, крупные, средние и даже маленькие редакции могут успешно реализовывать сложные дата-проекты.
(Более подробно о том, как интегрировать искусственный интеллект в работу новостей, читайте в Парижской хартии по искусственному интеллекту и журналистике, к которой присоединилась GIJN).
Возможно, стоит обсудить ряд вопросов: Как небольшие редакции могут извлечь выгоду из новых возможностей? Могут ли новые инструменты эффективно работать с любыми типами данных? И можно ли использовать их для работы со всеми видами данных?
Как небольшим редакциям начать эту трансформацию?
В этой статье мы советуем, с чего начать работу, предлагая ответы на следующие вопросы.
- Почему дата-журналистика необходима для небольших редакций?
- Каковы преимущества анализа новостных данных в небольшой команде?
- Как создавать влиятельные дата-проекты при ограниченном бюджете и штате сотрудников?
- Какие тренинги, мастер-классы и доступные онлайн-курсы по работе с данными могут быть полезны для небольших редакций?
- Как организовать работу в небольшой редакции, чтобы команда могла эффективно работать с данными?
- Какие инструменты для работы с данными могут использовать небольшие редакции (бесплатные или за небольшую плату)?
- Где найти открытые источники данных?
- Чему можно научиться у небольших редакций, ставших лауреатами премии Sigma Awards?
Каковы преимущества использования данных в небольшой команде?
Небольшим редакциям следует обратить внимание на использование данных и инвестирование в создание дата-материалов, поскольку это даёт значительные преимущества в плане точности, глубины, удержания внимания аудитории и её лояльности.
Использование данных помогает редакциям публиковать более точные, надёжные и быстрые новости, что увеличивает интерес и конкурентоспособность перед целевой аудиторией.
Анализ данных в режиме реального времени помогает быстро обнаруживать и корректировать неточности и верифицировать информацию. Этот метод также позволяет предоставлять более всесторонние новости.
Сбор и анализ данных из различных источников предлагает читателям более глубокую и широкую перспективу.
Всесторонний анализ данных повышает конкурентоспособность редакций. Он также привлекает внимание читателей и повышает вовлечённость.
Визуализация данных, в частности, помогает читателям легче воспринимать сложные темы и эффективнее обрабатывать информацию. Также есть возможность прогнозировать будущие тенденции и события.
Решения, основанные на данных, позволяют более эффективно использовать ресурсы редакции.
Как создавать влиятельные дата-проекты при ограниченном бюджете и штате сотрудников?
Всё дело – в коммуникации. Всегда общайтесь с командой и говорите о трудностях, с которыми вы сталкиваетесь. Без коммуникации не будет хорошей дата-истории!
Определите роли и придерживайтесь процедуры работы с данными: от сбора и конвертации данных (обычно с бумажного носителя в цифровой формат), до очистки, обработки, анализа и подготовки истории.
Для эффективной работы необходимо установить и поддерживать систему организации и обмена (данными, файлами, заметками и т. д.).
Сначала определите сроки, ориентируясь на этапы проекта, а не на календарь.
Освойте метаданные. Чем лучше вы ориентируетесь в наборе данных, тем проще с ним работать. Создайте словарь для незнакомых терминов – это сэкономит время при работе с данными, с которыми вы лучше знакомы. В этом и есть сила метаданных!
Делайте заметки. Документируйте всё, что вы делаете, чтобы экономить время и заставить вашу команду обдумывать стратегии проекта. Помимо этого, как можно чаще сохраняйте данные и делайте бекапы, чтобы не потерять свой проект.
Экспериментируйте с новыми языками программирования. Использование Excel и аналогичных инструментов – это норма, однако освоение других языков программирования, таких как R или Python, должно стать вашим следующим шагом. Рассмотрите возможность внедрения искусственного интеллекта в ваш рабочий процесс в качестве дополнительного инструмента.
Используйте блок-схемы. Их можно постоянно улучшать и дополнять, а при возникновении трудностей – переделывать проект вместе с командой, используя этот подход.
Интересный пример: Три журналиста Ortak создали проект «Турция: Золотая жила троллей» (Turkey: A Gold Mine of Trolls). Расследователи раскрыли сеть троллей, которые вели как минимум 181 аккаунт в X, проанализировали их таймлайн, цели и возможные мотивы. Команда также открыла доступ ко всем наборам данных.
Вот упрощённый план для редакций, которые хотят заниматься журналистикой данных при ограниченном бюджете и ресурсах:
- Проведите анализ потребностей.
- Определите доступные источники данных (включая бесплатные платформы открытых данных).
- Создайте дата-команду, даже если она небольшая (например, два человека, которые знают понемногу обо всём, и ещё два, которые владеют основными инструментами анализа данных).
- Регулярно обучайте свою команду (OSINT, ИИ, бесплатные онлайн-курсы, тренинги с приглашёнными экспертами).
- Определите, какими дата-проектами вы будете заниматься (с чёткими ограничениями, границами и пониманием общественного интереса).
- Сосредоточьтесь на этапе сбора и анализа данных (использование генеративного ИИ позволит уделять меньше внимания технической части и больше – журналистской).
- Обратите внимание на разные способы визуализации данных (виды визуализации по их функциям).
- Постарайтесь укрепить взаимодействие и усилить коммуникацию с читателями (социальные сети, кампании, опросы).
- Как можно чаще собирайте обратную связь.
- Используйте инструменты с открытым исходным кодом (простые в использовании и легко настраиваемые).
- Создайте список открытых источников (местных, национальных и глобальных) и не стесняйтесь отправлять запросы на предоставление информации.
- Используйте структурированные источники, которые легко анализировать. Такие наборы данных могут «спасти жизнь». Используйте GitHub, чтобы обновлять и делиться своими наборами данных для будущих проектов.
Важно помнить следующее: любая история может стать дата-историей, любой журналист может стать дата-журналистом, а любая редакция может создавать дата-проекты.
Какие тренинги и онлайн-курсы по работе с данными могут быть полезны?
- Тренинги в области данных для журналистов и редакторов.
- Экспертные консультации. Журналистам в небольших редакциях бывает сложно найти время для анализа данных в повседневной новостной рутине, поэтому поддержка внешних специалистов или работа с тренером точно не будет лишней. Для усовершенствования навыков работы с данными доступны различные тренинги, мастер-классы и курсы в формате MOOC (массовые открытые онлайн-курсы).
- Настройте онлайн-оповещения для отслеживания интересного нового контента и анонсов курсов в сети.
- Работа с локальными трекерами данных. Подумайте о возможности создания сети гражданских дата-журналистов.
Как организовать небольшую редакцию для эффективной работы с данными?
- Подготовьтесь заранее, ещё до начала проекта.
- Создайте список избранных файлов для быстрого доступа к необходимым ресурсам.
- Ведите списки контактов (и постоянно обновляйте их).
- В свободное время практикуйте навыки работы с базами данных.
- Предложите команде практические задания и установите сроки.
- Храните специальный файл с базой данных, он вам понадобится для проекта.
- Почаще используйте базы данных и обновляйте их.
- Стремитесь найти новые подходы или взглянуть на данные по-новому.
- Создавайте командную атмосферу, в которой каждый участник разделяет цели и идеи.
Признайте, что зачастую самый важный шаг – понять, как преобразовать данные в увлекательную историю.
Какие инструменты для работы с данными можно использовать (бесплатные или недорогие)?
Небольшие новостные редакции часто предпочитают простые в использовании и доступные инструменты для создания дата-историй. Однако важно учитывать редакторскую независимость – откуда взялись эти инструменты (предпочтительны версии с открытым исходным кодом) – и этические рамки журналистики данных. Вот несколько удобных инструментов для работы с данными.
- Voyant Tools: веб-платформа для чтения и анализа цифровых текстов.
- Microsoft Excel или Google Sheets: распространённые программы для работы с электронными таблицами, которые есть почти на каждом компьютере. Они идеально подходят для анализа, очистки и создания простых визуализаций. Эти инструменты могут стать отличной отправной точкой для проектов, основанных на данных.
- GPT Excel: дополнения к существующим инструментам, использующие искусственный интеллект.
- OpenRefine: сервис с открытым исходным кодом, используемый для очистки и стандартизации данных. Идеально подходит для очистки и организации сложных наборов данных.
- Tabula: инструмент журналистики данных с открытым исходным кодом, который помогает извлекать данные из PDF-файлов.
- R: язык программирования для статистических вычислений и визуализации данных. Широко используется при скрейпинге, биоинформатике и анализе данных.
- Python: ещё один язык программирования, позволяющий работать быстро и более эффективно интегрировать системы.
- Datawrapper: позволяет создавать интерактивные графики, карты и инфографику благодаря своему простому интерфейсу. Не требует навыков программирования, а также помогает улучшить визуальное оформление вашей истории. Особенно полезен Datawrapper River.
- Flourish: платформа для создания интерактивных визуализаций данных. Благодаря удобному интерфейсу и разнообразным возможностям для создания изображений вы сможете улучшить визуальное повествование вашего дата-проекта. Попробуйте воспользоваться Flourish для редакций.
- Tableau Public: платформа, позволяющая пользователям анализировать данные и создавать интерактивные визуализации. Бесплатная версия – экономичный вариант для небольших редакций.
- Trello или Airtable: подобные инструменты управления проектами позволяют оптимизировать организацию и рабочий процесс ваших дата-проектов. С их помощью можно управлять наборами данных, назначать и отслеживать задачи.
Эти инструменты помогают небольшим редакциям эффективно работать над дата-проектами. Какие из них выбрать, зависит от ваших потребностей, возможностей и бюджета.
Где найти открытые источники данных?
- Государственные учреждения: многие официальные правительственные сайты располагают собственными платформами открытых данных по самым разным темам. Например, data.gov в США и data.gov.uk в Великобритании предлагают широкий спектр статистической информации по здравоохранению, образованию, транспорту, погоде, экономике и многим другим темам.
- Международные организации: Организация объединённых наций, Всемирный банк и Европейский союз имеют платформы открытых данных различной тематики. Они включают международные наборы данных по глобальному развитию, правам человека, окружающей среде, экономике и другим областям.
- Города и муниципалитеты: многие местные органы власти предоставляют платформы открытых данных, которые могут содержать информацию о дорожном движении, использовании водных ресурсов, проектах преобразования города, зелёных насаждениях и других подобных темах. Один из примеров: веб-сайт муниципалитета Стамбула – портал открытых данных (см. скриншот видео ниже).
- Образовательные учреждения: у университетов и исследовательских институтов есть открытые наборы данных по различным областям науки. Эти данные можно использовать в материалах на социальные, медицинские и многие другие темы.
- Медиа-организации: некоторые редакции предоставляют архивы новостей, данные политических кампаний, результаты выборов и другие наборы данных. Например, Bianet и ProPublica.
- НПО: неправительственные организации могут поделиться наборами данных, касающихся различных социальных проблем: нарушений прав человека, загрязнения окружающей среды, миграции, трудовых прав, неравенства и других вопросов. Вот несколько примеров наборов данных: о фемициде, а также о старении и здравоохранении.
- Исследовательские институты: научно-исследовательские организации и фонды проводят глубокие исследования по определённым темам и могут поделиться результатами своей работы. Такие наборы данных охватывают экономику, здравоохранение, окружающую среду, уголовное правосудие, образование и многие другие области.
Перечисленные ресурсы могут быть полезны при работе с данными, однако всегда следует проверять актуальность, надёжность и точность источников, а также правильность их интерпретации.
Портал открытых данных муниципалитета Стамбула (см. ниже) предлагает широкий спектр официальных наборов данных.
Чему можно научиться у небольших редакций, ставших лауреатами премии Sigma Awards?
Sigma Awards – это международная награда, которую вручают за выдающиеся достижения в области журналистики данных. Ею отмечают лучшие практики и инновации в области анализа данных, визуализации и сторителлинга.
Эта премия также подчёркивает важную роль данных в производстве новостей и стимулирует развитие работы в этом направлении. Для вдохновения можно ознакомиться с базой данных Sigma Awards, в которой хранится информация о 2200 проектах, которые участвовали в конкурсе за последние четыре года. Там указаны бюджеты, штат сотрудников, методы работы, продолжительность проектов, тематика, содержание и многое другое.
Журналистика данных становится неотъемлемой частью нашего ежедневного новостного рациона. И небольшие редакции не могут позволить себе обходить её стороной. Чтобы оставаться на плаву, таким командам необходимо использовать данные для создания материалов, помогая общественности вникать в современные проблемы, делая сложные темы более понятными и обогащая свой сторителлинг. С помощью упомянутых инструментов и советов путь к внедрению дата-журналистики может оказаться гораздо доступнее и проще, чем казалось раньше.
Эта статья основана на презентации Пинар Даг «Использование данных в небольших редакциях».
Пинар Даг – редакторка турецкой редакции GIJN и преподавательница в Университете Кадир Хас. Соучредительница Data Literacy Association, Data Journalism Platform Turkey и DağMedya, она сосредоточила свои профессиональные усилия на повышении грамотности в области данных, открытых данных, визуализации данных и журналистики данных. Она также входит в состав жюри Sigma Awards за лучшую дата-журналистику.