Истории

Темы

10 советов по визуализации данных о COVID-19

ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ

English

Изображение предоставлено Университетом Джона Хопкинса: Johns Hopkins University

Cоставленная Университетом Джона Хопкинса карта распространения COVID-19 – с ее четкими цифрами и красными кругами на черном фоне – стала для многих репортеров и их аудитории по всему миру заслуживающей доверия картиной пандемии коронавируса.

Эта карта – один из примеров широкого использования инструментов визуализации данных как одного из самых сильных средств, помогающих людям разобраться в том, как невидимая угроза распространяется по всему миру.

Но всемирно известный специалист в области визуализации профессор Альберто Каиро считает, что можно было бы улучшить даже превосходную карту Университета Джона Хопкинса: ведь в районе Европы круги представляют количество случаев для каждой страны, а в районе США каждый круг соответствует округу – и люди могут сделать на этой основе неправильные выводы.

«Это замечательная карта, – сказал Каиро, возглавляющий кафедру визуальной журналистики в Школе коммуникаций Университета Майами. – Но не лучше ли было бы, если бы данные были представлены более последовательно? Например – везде представлять данные по стране, а при увеличении карты давать данные по округам?»

Во время 12-го вебинара организованной GIJN серии, посвященной журналистским расследованиям о пандемии, журналистка-расследовательница Даниэль Айвори и эксперт по работе с данными в области здравоохранения Аманда Макулец присоединились к Каиро и поделились идеями о том, как журналистам выбирать и представлять данные и созданную на их основе инфографику. В вебинаре участвовали 266 журналистов из 46 стран мира.

Видеозапись этой онлайн-сессии в русском переводе вы можете найти на нашей Фейсбук-странице.

https://www.facebook.com/gijnInRussian/videos/1671821286315361/

Спикеры сошлись на том, что журналисты после тщательной проверки информации должны не только отображать данные наиболее подходящим и понятным способом, но также четко объяснять инфографику и данные и открыто сообщать, если с данными связана какая-то неопределенность.

По словам Каиро, визуализация данных стала во всем мире одним из наиболее эффективных форматов, позволяющих представить информацию и помочь людям понять, что происходит во время пандемии.

«По-моему, совершенно ясно, что наиболее сложная часть освещения кризиса, вызванного пандемией, связана с качеством данных, а не с их визуализацией, – сказал Каиро, чья последняя книга называется «Как лгут графики» (How Charts Lie — Getting Smarter about Visual Information – более подробно об этом можно прочитать в статье  на IJNet). – Хорошая новость в том, что визуализация становится очень популярной. Но я также вижу много ошибок в визуализированных данных о пандемии».

Макулец, эксперт по работе с данными в области здравоохранения и операционный директор Общества визуализации данных (Data Visualization Society), напомнила, что журналисты должны понимать, как были собраны данные о COVID-19, прежде чем решиться использовать эту информацию в инфографике.

Например, она указала на десять различных ситуаций – от использования палочек для тестирования на коронавирус до ввода результатов в электронные таблицы, – где возможна человеческая ошибка и разрыв во времени сбора данных – до того, как эти данные появятся в национальных базах данных.

Журналистка The New York Times Айвори рассказала, как трудно было сопоставлять данные о COVID-19, потому что представители системы здравоохранения в разных штатах и округах часто ссылаются на различные базы данных или используют различные определения категорий, которые кладутся в основу анализа.

Недавно Айвори и ее коллеги продемонстрировали, что более трети смертей от COVID-19 в США связаны с приютами и другими учреждениями, где осуществляется долгосрочный уход за пожилыми людьми, включая дома престарелых.

«Нам удалось собрать данные практически из каждого штата, и мы все еще работаем над этим — практически круглосуточно», — сказал Айвори. «Около 70% данных мы находим вручную, с помощью звонков или захододв на веб-сайты штатов, а большая часть остальной информации получена с помощью [автоматического] скрейпинга. Надеюсь, мы сможем наладить этот процесс на постоянной основе, чтобы собрать еще больше. Но мы очень осторожны, и всегда открыто заявляем о том, что мы чего-то не знаем».

Айвори сказала, что телефонные звонки чиновникам из отделов здравоохранения остаются лучшим способом разобраться в явно запутанных или противоречивых данных, которые поступают из регионов.

Из приведенных в трех докладах советов о том, как сделать визуализацию данных COVID-19 правильно.

Мы обобщили рекомендации трех специалистов, участвовавших в вебинаре, и предлагаем вам десять советов, которые помогут правильно подойти к созданию визуализации данных о COVID-19.

1. Объясните, как читать график, до того как объясните, как понимать данные. К недавнему графику, отражающему количество исчезнувших из-за пандемии рабочих мест, The New York Times добавила четкие, написанные простым языком пояснения, например, «Каждый круг в графике представляет область занятости. Чем больше круг, тем больше людей выполняют эту работу».

2. Пишите текст, сопровождающий график, одновременно с созданием самого графика: это помогает структурировать информацию как вам самим, так и вашим читателям.

3. Сортируйте данные интуитивно понятным способом, например, по хронологии или разбивая на сопоставимые группы.

В этом примере Каиро реорганизовал данные о COVID-19 из малопонятной диаграммы, составленной Департаментом здравоохранения штата Джорджия (слева) в новую диаграмму (справа), где данные сгруппированы по округам и расположены в хронологическом порядке.

4. Если вы или ваша аудитория плохо знакомы с визуализацией данных, начните с простого, например, с карт, столбцовых диаграмм или линейных графиков. Вы можете использовать такие инструменты, как Datawrapper, Flourish и iNZight. Используйте также созданные экспертами онлайн-учебники, например, это руководство, написанное Каиро.

5. Не ограничивайте себя использованием только простых инструментов и графиков. Время от времени бросайте вызов своей аудитории, представляя им данные по-новому, создавая новые типы визуализаций.

Это только несколько разных типов визуализации, среди которых редакторы могут выбирать самые подходящие. Источник фотографии – datavizcatalogue.com/RU/.

6. Не старайтесь визуализировать слишком много данных, лучше сократите их количество, если кажется, что их черезчур много. Определитесь с ключевыми моментами и придерживайтесь их.

7. Не существует плохих форматов визуализации, но некоторые из них подходят для определенных наборов данных и аудитории больше, чем другие. Графики, которые выглядят особенно нелогично, могут даже нуждаться в дополнительном графике для объяснения непонятных моментов. Например, параллельно с картограммами – которые искажают области карты в зависимости от их отношения к переменной – должны быть представлены обычные карты этой местности.

8. Используйте линейные шкалы для чисел, а нелинейные – включая логарифмические шкалы – для демонстрации скорости изменения. Объясняйте нелинейные графики четко и понятно, поскольку читателям трудно в них разобраться.

На примере данных о поколениях грызунов Каиро сравнил линейную шкалу (вверху) с логарифмической шкалой (внизу), чтобы показать, почему нелинейные шкалы важны для иллюстрации скорости изменения. Иллюстрацию предоставил Альберто Каиро.

9. По возможности, отражайте в визуализации неопределенность в представленных данных, например, пределы погрешности или доверительные интервалы. О неопределенности, которую нельзя измерить, – связанной, например, с тем, как собирались данные, – можно написать в сопроводительном тексте.

10. Забудьте традиционную мантру дизайнеров «показывай, а не рассказывай». По словам Каиро, визуальные журналисты должны «и показывать, и рассказывать». Когда-то многие дизайнеры рассматривали сопроводительный текст как второстепенную по важности добавку к графикам, а сейчас он считается критически важным: он позволяет еще раз подчеркнуть основные выводы и помогает читателям понять инфографику.

GIJN благодарит за перевод этой статьи на русский наших коллег из Международной журналистской сети IJNet.


Рован Филп (Rowan Philp) — лауреат многих журналистских наград, работавший более чем в двух десятках стран. В течение 15 лет Филп был главным репортером и главой лондонского бюро Sunday Times в Южной Африке. Сейчас он живет и работает в Бостоне.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

10 распространенных ошибок в журналистике данных

Журналистика данных Примеры из практики Советы и инструменты

10 типичных ошибок в журналистике данных

На конференции по дата-журналистике NICAR-2024 репортёр GIJN Рован Филп расспросил спикеров и участников о пробелах в журналистике данных, темах, которые часто остаются в тени, и навыках, которых не хватает редакциям.

Журналистика данных Награды Новости и аналитика

Интервью с исполнительной директоркой Sigma Awards Марианной Бушар

О роли премии Sigma Awards для журналистского сообщества, критериях отбора победителей, эволюции журналистики данных, текущих тенденциях и эффективных стратегиях для тех, кто работает с данными.

Советы Журналистика данных

Веб-скрейпинг без программирования с помощью Data Miner: Пошаговая инструкция

Расширение для браузера Data Miner извлекает данные с веб-страниц и сохраняет их в формате Excel, CSV или JSON. Редакторка турецкой редакции GIJN Пинар Даг предлагает пошаговую инструкцию по использованию этого инструмента.

Журналистика данных

Топ-10 DDJ: Аномальная жара, популярные французские имена и звёздные футболистки

Среди самой популярной журналистики данных недели мы нашли материал об изменениях в глобальной демографии, исследование об активах Московской православной церкви в Украине, обзор самых популярных имён во Франции и анализ, предсказывающий будущих звёзд Чемпионата мира по футболу среди женщин.