10 советов по визуализации данных о COVID-19
ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ
Cоставленная Университетом Джона Хопкинса карта распространения COVID-19 – с ее четкими цифрами и красными кругами на черном фоне – стала для многих репортеров и их аудитории по всему миру заслуживающей доверия картиной пандемии коронавируса.
Эта карта – один из примеров широкого использования инструментов визуализации данных как одного из самых сильных средств, помогающих людям разобраться в том, как невидимая угроза распространяется по всему миру.
Но всемирно известный специалист в области визуализации профессор Альберто Каиро считает, что можно было бы улучшить даже превосходную карту Университета Джона Хопкинса: ведь в районе Европы круги представляют количество случаев для каждой страны, а в районе США каждый круг соответствует округу – и люди могут сделать на этой основе неправильные выводы.
«Это замечательная карта, – сказал Каиро, возглавляющий кафедру визуальной журналистики в Школе коммуникаций Университета Майами. – Но не лучше ли было бы, если бы данные были представлены более последовательно? Например – везде представлять данные по стране, а при увеличении карты давать данные по округам?»
Во время 12-го вебинара организованной GIJN серии, посвященной журналистским расследованиям о пандемии, журналистка-расследовательница Даниэль Айвори и эксперт по работе с данными в области здравоохранения Аманда Макулец присоединились к Каиро и поделились идеями о том, как журналистам выбирать и представлять данные и созданную на их основе инфографику. В вебинаре участвовали 266 журналистов из 46 стран мира.
Видеозапись этой онлайн-сессии в русском переводе вы можете найти на нашей Фейсбук-странице.
https://www.facebook.com/gijnInRussian/videos/1671821286315361/
Спикеры сошлись на том, что журналисты после тщательной проверки информации должны не только отображать данные наиболее подходящим и понятным способом, но также четко объяснять инфографику и данные и открыто сообщать, если с данными связана какая-то неопределенность.
По словам Каиро, визуализация данных стала во всем мире одним из наиболее эффективных форматов, позволяющих представить информацию и помочь людям понять, что происходит во время пандемии.
«По-моему, совершенно ясно, что наиболее сложная часть освещения кризиса, вызванного пандемией, связана с качеством данных, а не с их визуализацией, – сказал Каиро, чья последняя книга называется «Как лгут графики» (How Charts Lie — Getting Smarter about Visual Information – более подробно об этом можно прочитать в статье на IJNet). – Хорошая новость в том, что визуализация становится очень популярной. Но я также вижу много ошибок в визуализированных данных о пандемии».
Макулец, эксперт по работе с данными в области здравоохранения и операционный директор Общества визуализации данных (Data Visualization Society), напомнила, что журналисты должны понимать, как были собраны данные о COVID-19, прежде чем решиться использовать эту информацию в инфографике.
Например, она указала на десять различных ситуаций – от использования палочек для тестирования на коронавирус до ввода результатов в электронные таблицы, – где возможна человеческая ошибка и разрыв во времени сбора данных – до того, как эти данные появятся в национальных базах данных.
Журналистка The New York Times Айвори рассказала, как трудно было сопоставлять данные о COVID-19, потому что представители системы здравоохранения в разных штатах и округах часто ссылаются на различные базы данных или используют различные определения категорий, которые кладутся в основу анализа.
Недавно Айвори и ее коллеги продемонстрировали, что более трети смертей от COVID-19 в США связаны с приютами и другими учреждениями, где осуществляется долгосрочный уход за пожилыми людьми, включая дома престарелых.
«Нам удалось собрать данные практически из каждого штата, и мы все еще работаем над этим — практически круглосуточно», — сказал Айвори. «Около 70% данных мы находим вручную, с помощью звонков или захододв на веб-сайты штатов, а большая часть остальной информации получена с помощью [автоматического] скрейпинга. Надеюсь, мы сможем наладить этот процесс на постоянной основе, чтобы собрать еще больше. Но мы очень осторожны, и всегда открыто заявляем о том, что мы чего-то не знаем».
Айвори сказала, что телефонные звонки чиновникам из отделов здравоохранения остаются лучшим способом разобраться в явно запутанных или противоречивых данных, которые поступают из регионов.
Из приведенных в трех докладах советов о том, как сделать визуализацию данных COVID-19 правильно.
Мы обобщили рекомендации трех специалистов, участвовавших в вебинаре, и предлагаем вам десять советов, которые помогут правильно подойти к созданию визуализации данных о COVID-19.
1. Объясните, как читать график, до того как объясните, как понимать данные. К недавнему графику, отражающему количество исчезнувших из-за пандемии рабочих мест, The New York Times добавила четкие, написанные простым языком пояснения, например, «Каждый круг в графике представляет область занятости. Чем больше круг, тем больше людей выполняют эту работу».
2. Пишите текст, сопровождающий график, одновременно с созданием самого графика: это помогает структурировать информацию как вам самим, так и вашим читателям.
3. Сортируйте данные интуитивно понятным способом, например, по хронологии или разбивая на сопоставимые группы.
4. Если вы или ваша аудитория плохо знакомы с визуализацией данных, начните с простого, например, с карт, столбцовых диаграмм или линейных графиков. Вы можете использовать такие инструменты, как Datawrapper, Flourish и iNZight. Используйте также созданные экспертами онлайн-учебники, например, это руководство, написанное Каиро.
5. Не ограничивайте себя использованием только простых инструментов и графиков. Время от времени бросайте вызов своей аудитории, представляя им данные по-новому, создавая новые типы визуализаций.
6. Не старайтесь визуализировать слишком много данных, лучше сократите их количество, если кажется, что их черезчур много. Определитесь с ключевыми моментами и придерживайтесь их.
7. Не существует плохих форматов визуализации, но некоторые из них подходят для определенных наборов данных и аудитории больше, чем другие. Графики, которые выглядят особенно нелогично, могут даже нуждаться в дополнительном графике для объяснения непонятных моментов. Например, параллельно с картограммами – которые искажают области карты в зависимости от их отношения к переменной – должны быть представлены обычные карты этой местности.
8. Используйте линейные шкалы для чисел, а нелинейные – включая логарифмические шкалы – для демонстрации скорости изменения. Объясняйте нелинейные графики четко и понятно, поскольку читателям трудно в них разобраться.
9. По возможности, отражайте в визуализации неопределенность в представленных данных, например, пределы погрешности или доверительные интервалы. О неопределенности, которую нельзя измерить, – связанной, например, с тем, как собирались данные, – можно написать в сопроводительном тексте.
10. Забудьте традиционную мантру дизайнеров «показывай, а не рассказывай». По словам Каиро, визуальные журналисты должны «и показывать, и рассказывать». Когда-то многие дизайнеры рассматривали сопроводительный текст как второстепенную по важности добавку к графикам, а сейчас он считается критически важным: он позволяет еще раз подчеркнуть основные выводы и помогает читателям понять инфографику.
GIJN благодарит за перевод этой статьи на русский наших коллег из Международной журналистской сети IJNet.
Рован Филп (Rowan Philp) — лауреат многих журналистских наград, работавший более чем в двух десятках стран. В течение 15 лет Филп был главным репортером и главой лондонского бюро Sunday Times в Южной Африке. Сейчас он живет и работает в Бостоне.