Как использовать ChatGPT для расследований. Изображение: Shutterstock
ChatGPT как инструмент для быстрого поиска: Советы расследователям
ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ
С появлением новых инструментов генеративного ИИ журналисты-расследователи наблюдают, как много появляется этических проблем и возможных ошибок в противовес новым возможностям ИИ. Это вызывает путаницу.
Первые примеры использования ИИ в журналистике касались самых разных задач – от программирования до составления информационных справок или создания графиков. Каждую неделю появляются новые бесплатные или платные инструменты ИИ, которые можно применить в журналистике. С другой стороны, есть много примеров, когда инструменты генеративного ИИ выдавали не самые надёжные доказательства или подтверждения, поскольку подвержены предубеждениям и систематическим ошибкам. (Подробнее об этических аспектах и расширенных возможностях применения этих платформ читайте в недавнем материале GIJN «Новые инструменты на основе ИИ и больших языковых моделей для журналистов: Что нужно знать»).
В рамках Конференции журналистов и редакторов-расследователей 2024 года на одном из семинаров репортёрам посоветовали, как избежать многих опасностей и путаницы, не чураясь освоения этой новой технологии – просто используя ИИ-чатбот ChatGPT в качестве более узконаправленного инструмента поиска.
Джереми Джоджола – репортёр-расследователь телеканала KUSA-TV в Денвере, штат Колорадо, получивший в 2020 году медаль Дона Боллеса от IRE за репортажи об экстремистских группах, выступающих за превосходство белой расы, говорит, что поиск контактов и быстрый анализ документов с помощью этой модели может не только сэкономить время в начале расследования, но и помочь наладить общение с важными источниками, о которых иначе вы могли бы не знать.
По его словам, главное – использовать такие большие языковые модели (БЯМ или LLM – от англ. Large language model – прим. ред.), как ChatGPT, только в начале расследовательського проекта и лишь для того, чтобы помочь сориентироваться вам, журналисту, – а не для информирования аудитории.
«Это не источник, на который можно ссылаться, а лишь отправная точка. По нашим этическим и юридическим стандартам очень важно, чтобы ничего из выдачи ИИ не попадало в наши материалы», – предупредил Джоджола. «Я никогда не использую ответы ChatGPT для контента – ни для текстов, ни для написания сценария. Все сокровища в ваших материалах вы добываете репортажной работой. А программа может лишь предоставить вам карту, которая укажет направление к этим сокровищам. Это потрясающий инструмент, даже если вы его используете просто как расширенный поиск Google».
ChatGPT + Поиск Google = быстрее и результативнее
ChatGPT как большая языковая модель в своих ответах в основном опирается на огромные массивы обучающих данных, а не на индексацию веб-страниц, поэтому поисковые системы, такие как Google, по-прежнему остаются более точными, полными и актуальными для общих запросов – особенно при использовании поисковых операторов.
Но некоторые журналисты, например Джоджола, утверждают, что перебирать результаты выдачи Google, где будут доминировать сайты с накрученным SEO-оптимизацией рейтингом, может быть настолько сложно, что это отбивает у коллег желание искать новые источники или выявлять тенденции, и что им не хватает функций быстрого анализа документов.
Поэтому он использует ChatGPT – и особенно платную версию GPT-4, которая также может искать информацию в интернете, – чтобы быстро находить контакты, зацепки и новые темы. Бесплатная версия GPT 3.5 от OpenAI не подключена напрямую к интернету, а обучена давать текстовые ответы на основе «огромного количества написанных людьми в интернете текстов, в том числе разговоров», что помогает объяснить как её ошибки, так и её человекоподобный диалог. Её данные не актуальны. Модель GPT-4 (стоит 20 долларов в месяц), которая также может принимать в качестве подсказок изображения и скриншоты, обучена на гораздо большем количестве гигабайт данных, а также имеет доступ в интернет и, следовательно, содержит актуальную информацию.
Несмотря на ошибки, Джоджола считает, что различные чат-боты от OpenAI полезны для упорядочивания данных, и что их быстрый формат ответов на поисковые запросы и лаконичные резюме может привести к увеличению, а не уменьшению числа контактов репортёров с новыми источниками.
В качестве примера для семинара он ввёл в чат GPT-4 следующее: «Я репортёр. Мне нужно найти авторитетного эксперта, который мог бы рассказать о реинтродукции волков в Колорадо. Дай мне список из нескольких имен, организаций, с которыми они связаны, и их контакты». Помимо официальных лиц в государственных органах и некоммерческих организациях, инструмент нашёл в интернете контакты отставного биолога, занимавшего министерские должности и руководившего попытками восстановления популяции волков в Скалистых горах, а также основателя «Лаборатории сосуществования хищников».
«Как можно сразу не позвонить таким интересным людям?» – сказал Джоджола, усмехаясь. «На самом деле реинтродукция волков – это большая история в Колорадо про конфликт между городскими и сельскими местностями. Если у вас один день на материал, ChatGPT за пять секунд предоставит вам список нужных экспертов и их номера телефонов, а поиск в Google занял бы минут 40».
Он отметил, что преимущества платной версии GPT-4 заключаются в большем количестве загружаемых документов, более актуальных данных и контекстных «дискуссиях» – когда интерфейс чата даёт ответы в контексте предыдущих вопросов, – но бесплатная версия остаётся эффективной для многих быстрых поисков.
Поскольку его цель – экономия времени и быстрая фильтрация, Джоджола не тратит время на точную формулировку запросов. Вместо этого он концентрируется на том, что, где и когда нужно искать, и просто формулирует запросы «так, как я бы разговаривал с человеком, только более властно».
Несколько практических примеров использования ChatGPT для быстрого поиска
- Быстрый поиск незаметных публичных документов. Помимо тех немногих документов, которые замечают и присылают источники, обращая на них внимание, журналисты получают постоянный поток отчётов, аудиторских проверок и копий государственных контрактов, которые могут содержать или не содержать доказательства неэффективности, системных ошибок, коррупции или злоупотреблений. Джоджола рекомендует загружать объёмные документы в ChatGPT вместе с простым запросом, например: «Дай мне краткую информацию об этом государственном контракте и о том, сколько организация получит за услуги. Укажи имена людей в этом контракте и номера страниц, где они фигурируют». (Пример, который он использовал, – госконтракт на систему считывания номерных знаков – в течение нескольких секунд чат выдал корректные суммы госрасходов, условия закупки и несколько имён с номерами страниц). При этом журналистам советуют не загружать конфиденциальные или частные документы. Существуют и более сложные инструменты для разбора документов, в том числе с оптическим распознаванием текста – например, Google Pinpoint, – но Джоджола считает, что ChatGPT обеспечивает полезный и быстрый начальный фильтр.
- Резюмирование общественных проблем. Годовые отчёты или стенограммы публичных слушаний по проектам нормативных актов, посвящённых общественным проблемам, часто содержат десятки страниц мелким шрифтом, которые мало у кого из журналистов есть время прочитать. На семинаре Джоджола загрузил 40-страничный годовой отчёт и попросил ChatGPT только перечислить и обобщить поднятые проблемы. «Удивительно, как быстро программа может его обработать», – заметил он. Повторюсь: инструмент может упустить нюансы и допустить ошибки, но он даёт почти мгновенное описание характера и объёма проблем, поднятых на общественных слушаниях, что может послужить толчком к более глубокому изучению и созданию потенциально интересного материала.
- Быстрый поиск контактов для описания общей картины. По мнению Джоджолы, ChatGPT может побудить репортёров начать обзванивать новые источники, просто выдав за несколько секунд полдюжины имён, должностей и номеров телефонов экспертов на одной странице. Затем можно выбрать, к кому обратиться за описанием в общих чертах – возможно, к учёному – и задать эксперту интересующий вопрос, без необходимости листать разные сайты и ходить по десяткам ссылок. Например: на простой запрос «Дай мне контактные данные, включая номера телефонов, организаций, которые помогают жертвам домашнего насилия в Южной Африке» ChatGPT выдаёт гораздо более чёткий, одностраничный список контактов, чем поиск в Google по ключевой фразе «поддержка в случаях домашнего насилия ‘Южная Африка’ контакты site:za», который предлагает много страниц местных и международных сайтов. При использовании больших языковых моделей первоначальный список источников для «первого звонка» становится очевидным. (Инструмент искусственного интеллекта также включил в список контакты, связанные с «гендерным насилием», которое в Южной Африке имеет другую направленность и может быть более релевантным для данной истории).
- Упорядочивание официальных контактов. Джоджола продемонстрировал, как ChatGPT автоматически находит и упорядочивает по алфавиту большие наборы публичных контактных данных за считанные мгновения, по такому запросу: «Дай мне номера телефонов и адреса электронной почты членов законодательного собрания штата Колорадо, а точнее демократов из Палаты представителей». «Это значительно упрощает сбор данных и получение электронной почты, вместо того чтобы заходить на страничку каждого депутата», – пояснил он.
- Простой пересказ технических данных – например, отчётов о вскрытии. Во многих небольших новостных редакциях ситуация такова, что если источник не подскажет вам, где искать, то можно легко пропустить тревожные сигналы в технических документах, поскольку часто не хватает времени на их анализ или нет коллег-специалистов, у которых можно спросить. По словам Джоджолы, отчёты судмедэкспертов – хороший пример того, как загрузив их в инструмент с искусственным интеллектом можно быстро найти новые пути для расследования. Конечно, объяснения ChatGPT по поводу медицинского заключения затем нужно перепроверить у конкретных судмедэкспертов. «Многие из новостных журналистов не очень понимают отчёты о вскрытии – там много медицинских терминов и многобуквенные названия химических веществ», – отметил он. Затем Джоджола рассказал, как запрос по реальному отчёту о вскрытии жертвы полицейской стрельбы раскрыл неизвестные подробности дела: «Дай мне краткий обзор этого отчёта о вскрытии. Расскажи простым языком, какие вещества были в организме покойного».
- Быстрое и корректное сравнение. Иногда журналистам трудно сразу понять, является ли цифра, которую они видят в пресс-релизе или годовом отчёте, необычно высокой или низкой, и стоит ли она внимания. Помимо сравнений с другими периодами, инструменты искусственного интеллекта могут сразу же предоставить вам географические ориентиры для сравнительного исследования. Достаточно простого запроса вроде «Назови мне города в Африке, население которых схоже с населением Кигали в Руанде». (ChatGPT сразу же ответил, что население Блантайра, Малави, Фритауна, Сьерра-Леоне, и Момбасы тоже составляет 1,2 миллиона человек). «Городские журналисты любят сравнивать свои населённые пункты с другими по таким критериям как преступность, рост населения, транспортные проблемы», – говорит Джоджола. «Опять же, эти цифры из ИИ не будут опубликованы [в материалах], пока я их трижды не перепроверю, но теперь я сразу могу понять, что не так».
Тем не менее Джоджола признаёт, что иногда его поиски в ChatGPT заводят не туда. «На днях я запросил научное исследование о вспышках гнева у водителей, и модель выдала, казалось бы, замечательное исследование, а когда я попросил источник, она меня направила в юридическую фирму, занимающуюся тяжбами о нанесении вреда здоровью, что не очень хорошо», – вспоминает он.
Но поскольку это был единственный гуглоподобный поиск, который нужно было перепроверить, такие ошибки, по его словам, не играют особой роли. «Всё же она мне показала исследование о вспышках гнева у водителей, проведённое Национальным институтом здравоохранения, более надёжным источником, поэтому я начал с него», – отметил он.
«Не стоит бояться технологий, они уже здесь», – заключил он. «Просто нужно придерживаться своих стандартов и своего процесса. Ссылайтесь на корректные надёжные источники. Вы же не станете цитировать поиск Google – точно так же и с ChatGPT».
Этот перевод выполнен профессиональным переводчиком A.Talker и отредактирован редакторами GIJN.
Рован Филп – старший репортёр GIJN. Ранее работал в южноафриканской газете Sunday Times, где в качестве иностранного корреспондента он освещал новости, политику, коррупцию и конфликты в более чем двух десятках стран.