Как использовать ChatGPT для расследований. Изображение: Shutterstock

Истории

Темы

ChatGPT как инструмент для быстрого поиска: Советы расследователям

ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ

С появлением новых инструментов генеративного ИИ журналисты-расследователи наблюдают, как много появляется этических проблем и возможных ошибок в противовес новым возможностям ИИ. Это вызывает путаницу.

Первые примеры использования ИИ в журналистике касались самых разных задач – от программирования до составления информационных справок или создания графиков. Каждую неделю появляются новые бесплатные или платные инструменты ИИ, которые можно применить в журналистике. С другой стороны, есть много примеров, когда инструменты генеративного ИИ выдавали не самые надёжные доказательства или подтверждения, поскольку подвержены предубеждениям и систематическим ошибкам. (Подробнее об этических аспектах и расширенных возможностях применения этих платформ читайте в недавнем материале GIJN «Новые инструменты на основе ИИ и больших языковых моделей для журналистов: Что нужно знать»).

В рамках Конференции журналистов и редакторов-расследователей 2024 года на одном из семинаров репортёрам посоветовали, как избежать многих опасностей и путаницы, не чураясь освоения этой новой технологии – просто используя ИИ-чатбот ChatGPT в качестве более узконаправленного инструмента поиска.

Джереми Джоджола – репортёр-расследователь телеканала KUSA-TV в Денвере, штат Колорадо, получивший в 2020 году медаль Дона Боллеса от IRE за репортажи об экстремистских группах, выступающих за превосходство белой расы, говорит, что поиск контактов и быстрый анализ документов с помощью этой модели может не только сэкономить время в начале расследования, но и помочь наладить общение с важными источниками, о которых иначе вы могли бы не знать.

По его словам, главное – использовать такие большие языковые модели (БЯМ или LLM – от англ. Large language model – прим. ред.), как ChatGPT, только в начале расследовательського проекта и лишь для того, чтобы помочь сориентироваться вам, журналисту, – а не для информирования аудитории.

«Это не источник, на который можно ссылаться, а лишь отправная точка. По нашим этическим и юридическим стандартам очень важно, чтобы ничего из выдачи ИИ не попадало в наши материалы», – предупредил Джоджола. «Я никогда не использую ответы ChatGPT для контента – ни для текстов, ни для написания сценария. Все сокровища в ваших материалах вы добываете репортажной работой. А программа может лишь предоставить вам карту, которая укажет направление к этим сокровищам. Это потрясающий инструмент, даже если вы его используете просто как расширенный поиск Google».

ChatGPT + Поиск Google = быстрее и результативнее

ChatGPT как большая языковая модель в своих ответах в основном опирается на огромные массивы обучающих данных, а не на индексацию веб-страниц, поэтому поисковые системы, такие как Google, по-прежнему остаются более точными, полными и актуальными для общих запросов – особенно при использовании поисковых операторов.

Но некоторые журналисты, например Джоджола, утверждают, что перебирать результаты выдачи Google, где будут доминировать сайты с накрученным SEO-оптимизацией рейтингом, может быть настолько сложно, что это отбивает у коллег желание искать новые источники или выявлять тенденции, и что им не хватает функций быстрого анализа документов.

Поэтому он использует ChatGPT – и особенно платную версию GPT-4, которая также может искать информацию в интернете, – чтобы быстро находить контакты, зацепки и новые темы. Бесплатная версия GPT 3.5 от OpenAI не подключена напрямую к интернету, а обучена давать текстовые ответы на основе «огромного количества написанных людьми в интернете текстов, в том числе разговоров», что помогает объяснить как её ошибки, так и её человекоподобный диалог. Её данные не актуальны. Модель GPT-4 (стоит 20 долларов в месяц), которая также может принимать в качестве подсказок изображения и скриншоты, обучена на гораздо большем количестве гигабайт данных, а также имеет доступ в интернет и, следовательно, содержит актуальную информацию.

Несмотря на ошибки, Джоджола считает, что различные чат-боты от OpenAI полезны для упорядочивания данных, и что их быстрый формат ответов на поисковые запросы и лаконичные резюме может привести к увеличению, а не уменьшению числа контактов репортёров с новыми источниками.

В качестве примера для семинара он ввёл в чат GPT-4 следующее: «Я репортёр. Мне нужно найти авторитетного эксперта, который мог бы рассказать о реинтродукции волков в Колорадо. Дай мне список из нескольких имен, организаций, с которыми они связаны, и их контакты». Помимо официальных лиц в государственных органах и некоммерческих организациях, инструмент нашёл в интернете контакты отставного биолога, занимавшего министерские должности и руководившего попытками восстановления популяции волков в Скалистых горах, а также основателя «Лаборатории сосуществования хищников».

Докладчик IRE24 Джереми Джоджола – журналист-расследователь, получивший в 2020 году медаль Дона Боллеса. Изображение: скриншот

«Как можно сразу не позвонить таким интересным людям?» – сказал Джоджола, усмехаясь. «На самом деле реинтродукция волков – это большая история в Колорадо про конфликт между городскими и сельскими местностями. Если у вас один день на материал, ChatGPT за пять секунд предоставит вам список нужных экспертов и их номера телефонов, а поиск в Google занял бы минут 40».

Он отметил, что преимущества платной версии GPT-4 заключаются в большем количестве загружаемых документов, более актуальных данных и контекстных «дискуссиях» – когда интерфейс чата даёт ответы в контексте предыдущих вопросов, – но бесплатная версия остаётся эффективной для многих быстрых поисков.

Поскольку его цель – экономия времени и быстрая фильтрация, Джоджола не тратит время на точную формулировку запросов. Вместо этого он концентрируется на том, что, где и когда нужно искать, и просто формулирует запросы «так, как я бы разговаривал с человеком, только более властно».

Несколько практических примеров использования ChatGPT для быстрого поиска

  • Быстрый поиск незаметных публичных документов. Помимо тех немногих документов, которые замечают и присылают источники, обращая на них внимание, журналисты получают постоянный поток отчётов, аудиторских проверок и копий государственных контрактов, которые могут содержать или не содержать доказательства неэффективности, системных ошибок, коррупции или злоупотреблений. Джоджола рекомендует загружать объёмные документы в ChatGPT вместе с простым запросом, например: «Дай мне краткую информацию об этом государственном контракте и о том, сколько организация получит за услуги. Укажи имена людей в этом контракте и номера страниц, где они фигурируют». (Пример, который он использовал, – госконтракт на систему считывания номерных знаков – в течение нескольких секунд чат выдал корректные суммы госрасходов, условия закупки и несколько имён с номерами страниц). При этом журналистам советуют не загружать конфиденциальные или частные документы. Существуют и более сложные инструменты для разбора документов, в том числе с оптическим распознаванием текста – например, Google Pinpoint, – но Джоджола считает, что ChatGPT обеспечивает полезный и быстрый начальный фильтр.
  • Резюмирование общественных проблем. Годовые отчёты или стенограммы публичных слушаний по проектам нормативных актов, посвящённых общественным проблемам, часто содержат десятки страниц мелким шрифтом, которые мало у кого из журналистов есть время прочитать. На семинаре Джоджола загрузил 40-страничный годовой отчёт и попросил ChatGPT только перечислить и обобщить поднятые проблемы. «Удивительно, как быстро программа может его обработать», – заметил он. Повторюсь: инструмент может упустить нюансы и допустить ошибки, но он даёт почти мгновенное описание характера и объёма проблем, поднятых на общественных слушаниях, что может послужить толчком к более глубокому изучению и созданию потенциально интересного материала.

ChapGPT может быть чрезвычайно полезным инструментом для быстрого поиска ключевых контактов или экспертных источников в интернете. Изображение: Shutterstock

  • Быстрый поиск контактов для описания общей картины. По мнению Джоджолы, ChatGPT может побудить репортёров начать обзванивать новые источники, просто выдав за несколько секунд полдюжины имён, должностей и номеров телефонов экспертов на одной странице. Затем можно выбрать, к кому обратиться за описанием в общих чертах – возможно, к учёному – и задать эксперту интересующий вопрос, без необходимости листать разные сайты и ходить по десяткам ссылок. Например: на простой запрос «Дай мне контактные данные, включая номера телефонов, организаций, которые помогают жертвам домашнего насилия в Южной Африке» ChatGPT выдаёт гораздо более чёткий, одностраничный список контактов, чем поиск в Google по ключевой фразе «поддержка в случаях домашнего насилия ‘Южная Африка’ контакты site:za», который предлагает много страниц местных и международных сайтов. При использовании больших языковых моделей первоначальный список источников для «первого звонка» становится очевидным. (Инструмент искусственного интеллекта также включил в список контакты, связанные с «гендерным насилием», которое в Южной Африке имеет другую направленность и может быть более релевантным для данной истории).
  • Упорядочивание официальных контактов. Джоджола продемонстрировал, как ChatGPT автоматически находит и упорядочивает по алфавиту большие наборы публичных контактных данных за считанные мгновения, по такому запросу: «Дай мне номера телефонов и адреса электронной почты членов законодательного собрания штата Колорадо, а точнее демократов из Палаты представителей». «Это значительно упрощает сбор данных и получение электронной почты, вместо того чтобы заходить на страничку каждого депутата», – пояснил он.
  • Простой пересказ технических данных – например, отчётов о вскрытии. Во многих небольших новостных редакциях ситуация такова, что если источник не подскажет вам, где искать, то можно легко пропустить тревожные сигналы в технических документах, поскольку часто не хватает времени на их анализ или нет коллег-специалистов, у которых можно спросить. По словам Джоджолы, отчёты судмедэкспертов – хороший пример того, как загрузив их в инструмент с искусственным интеллектом можно быстро найти новые пути для расследования. Конечно, объяснения ChatGPT по поводу медицинского заключения затем нужно перепроверить у конкретных судмедэкспертов. «Многие из новостных журналистов не очень понимают отчёты о вскрытии – там много медицинских терминов и многобуквенные названия химических веществ», – отметил он. Затем Джоджола рассказал, как запрос по реальному отчёту о вскрытии жертвы полицейской стрельбы раскрыл неизвестные подробности дела: «Дай мне краткий обзор этого отчёта о вскрытии. Расскажи простым языком, какие вещества были в организме покойного».
  • Быстрое и корректное сравнение. Иногда журналистам трудно сразу понять, является ли цифра, которую они видят в пресс-релизе или годовом отчёте, необычно высокой или низкой, и стоит ли она внимания. Помимо сравнений с другими периодами, инструменты искусственного интеллекта могут сразу же предоставить вам географические ориентиры для сравнительного исследования. Достаточно простого запроса вроде «Назови мне города в Африке, население которых схоже с населением Кигали в Руанде». (ChatGPT сразу же ответил, что население Блантайра, Малави, Фритауна, Сьерра-Леоне, и Момбасы тоже составляет 1,2 миллиона человек). «Городские журналисты любят сравнивать свои населённые пункты с другими по таким критериям как преступность, рост населения, транспортные проблемы», – говорит Джоджола. «Опять же, эти цифры из ИИ не будут опубликованы [в материалах], пока я их трижды не перепроверю, но теперь я сразу могу понять, что не так».

Тем не менее Джоджола признаёт, что иногда его поиски в ChatGPT заводят не туда. «На днях я запросил научное исследование о вспышках гнева у водителей, и модель выдала, казалось бы, замечательное исследование, а когда я попросил источник, она меня направила в юридическую фирму, занимающуюся тяжбами о нанесении вреда здоровью, что не очень хорошо», – вспоминает он.

Но поскольку это был единственный гуглоподобный поиск, который нужно было перепроверить, такие ошибки, по его словам, не играют особой роли. «Всё же она мне показала исследование о вспышках гнева у водителей, проведённое Национальным институтом здравоохранения, более надёжным источником, поэтому я начал с него», – отметил он.

«Не стоит бояться технологий, они уже здесь», – заключил он. «Просто нужно придерживаться своих стандартов и своего процесса. Ссылайтесь на корректные надёжные источники. Вы же не станете цитировать поиск Google – точно так же и с ChatGPT».

Этот перевод выполнен профессиональным переводчиком A.Talker и отредактирован редакторами GIJN.


Роуэн Филп, старший репортер GIJNРован Филп – старший репортёр GIJN. Ранее работал в южноафриканской газете Sunday Times, где в качестве иностранного корреспондента он освещал новости, политику, коррупцию и конфликты в более чем двух десятках стран.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

Журналистика данных Советы и инструменты

Новые инструменты на основе ИИ и больших языковых моделей для журналистов: Что нужно знать

Докладчики NICAR 2024 рассказали, какие чат-боты LLM и инструменты ИИ помогли в их расследованиях – особенно в работе с программным кодом и поиске разрозненных источников данных.

Советы и инструменты

Инструментарий GIJN: Попробуйте новые бесплатные инструменты для онлайн-расследований

Инновационные онлайн-инструменты для проверки фактов и изображений, защиты от вредоносного программного обеспечения и подготовки информационных справок по теме, которыми делились с участниками конференции NICAR 2024 года.

Ресурс Советы

Новейшие инструменты для расследований в Telegram

Журналистка-расследовательница Джейн Литвиненко предлагает в совершенстве освоить навыки поиска и анализа данных в Telegram, используя постоянно пополняющийся список инструментов и поисковых систем.

Советы Советы и инструменты

Топ-10 инструментов 2023 года по версии GIJN

10 полезных и удобных в использовании инструментов, о которых репортёры GIJN узнали на конференциях NICAR23, IRE23 и 13-й Глобальной конференции журналистов-расследователей (GIJC23) в Швеции.