

Як використовувати ChatGPT у ваших розслідуваннях. Зображення: Shutterstock
ChatGPT як інструмент для прискорення пошуку: Поради розслідувачам
Read this article in
З появою нових інструментів генеративного штучного інтелекту журналісти-розслідувачі спостерігають, як багато з’являється етичних проблем та можливих помилок на противагу новим можливостям ШІ. Це спричиняє плутанину.
Перші приклади використання ШІ у журналістиці стосувалися найрізноманітніших завдань – від програмування до складання інформаційних довідок чи створення графіків. Щотижня з’являються нові безкоштовні чи платні інструменти ШІ, які можна застосувати у журналістиці. З іншого боку, є багато прикладів, коли інструменти генеративного ШІ видавали не надто надійні докази чи підтвердження, оскільки вони схильні до упереджень і систематичних помилок. (Докладніше про етичні аспекти та розширені можливості застосування цих платформ читайте у свіжому матеріалі GIJN «Нові інструменти на основі ШІ та великих мовних моделей для журналістів: Що потрібно знати»).
У рамках Конференції журналістів та редакторів-розслідувачів 2024 року на одному з семінарів репортерам порадили, як уникнути багатьох небезпек та плутанини, не цураючись освоєння цієї нової технології – просто використовуючи ШІ-чатбот ChatGPT як більш вузькоспрямований інструмент пошуку.
Джеремі Джоджола – репортер-розслідувач телеканалу KUSA-TV у Денвері, штат Колорадо, який отримав у 2020 році медаль Дона Боллеса від IRE за репортажі про екстремістські групи, які виступають за перевагу білої раси, каже, що пошук контактів та швидкий аналіз документів за допомогою ШІ може не лише заощадити час на початку розслідування, але й допомогти налагодити спілкування з важливими джерелами, про які ви інакше ви не дізналися б.
За словами Джоджоли, головне – використовувати такі великі мовні моделі (ВММ або LLM – від англ. Large language model – прим. ред), як ChatGPT, лише на початку розслідувального проекту й тільки для того, щоб допомогти зорієнтуватися вам, журналісту, – а не для інформування аудиторії.
«Це не джерело, на яке можна посилатися, а лише відправна точка. За нашими етичними та юридичними стандартами дуже важливо, щоб нічого з видачі ШІ не потрапляло до наших матеріалів», – попередив Джоджола. «Я ніколи не використовую відповіді ChatGPT для контенту – ні для текстів, ні для написання сценарію. Усі скарби у ваших матеріалах ви видобуваєте репортажною роботою. А програма може лише надати вам карту, яка вкаже напрямок до цих скарбів. Це чудовий інструмент, навіть якщо ви його використовуєте просто як розширений пошук Google».
ChatGPT + Пошук Google = швидше та результативніше
ChatGPT як велика мовна модель у своїх відповідях здебільшого спирається на величезні масиви навчальних даних, а не на індексацію веб-сторінок, тому пошукові системи, такі як Google, як і раніше, залишаються більш точними, повними та актуальними для загальних запитів – особливо за використання пошукових операторів.
Але деякі журналісти, наприклад Джоджола, стверджують, що перебирати результати видачі Google, де домінуватимуть сайти з накрученим SEO-оптимізацією рейтингом, може бути настільки складно, що це відбиває у колег бажання шукати нові джерела або виявляти тенденції, і що їм бракує функцій швидкого аналізу документів.
Тому він використовує ChatGPT – зокрема платну версію GPT-4, яка також може шукати інформацію в інтернеті – щоб швидко знаходити контакти, зачіпки та нові теми. Безкоштовна версія GPT 3.5 від OpenAI не підключена безпосередньо до інтернету, а навчена давати текстові відповіді на основі величезної кількості написаних людьми в інтернеті текстів, у тому числі розмов», що пояснює як її помилки, так і подібний до людського діалог. Її дані часто не є актуальними. Модель GPT-4 (коштує 20 доларів на місяць), яка також приймає в якості підказок зображення та скріншоти, навчалася на набагато більшій кількості гігабайт даних, а також має доступ до інтернету, а, отже, містить актуальнішу інформацію.
Незважаючи на помилки, Джоджола вважає, що різні чат-боти від OpenAI корисні для впорядкування даних, і що їхній швидкий формат відповідей на пошукові запити та лаконічні резюме може збільшити, а не зменшити кількість контактів репортерів з новими джерелами.
Для прикладу, під час семінару він увів у чат GPT-4 такий запит: «Я репортер. Мені потрібно знайти авторитетного експерта, який міг би розповісти про реінтродукцію вовків у Колорадо. Дай мені список із кількох імен, організацій, з якими вони пов’язані, та їхні контакти». Крім офіційних осіб у державних органах та некомерційних організаціях, інструмент знайшов в інтернеті контакти біолога у відставці, який обіймав міністерські посади та керував спробами відновлення популяції вовків у Скелястих горах, а також засновника «Лабораторії співіснування хижаків».

Доповідач IRE24 Джеремі Джоджола – журналіст-розслідувач, який отримав 2020 року медаль Дона Боллеса. Зображення: скріншот
«Як можна не подзвонити одразу таким цікавим людям?» – сказав Джоджола, посміхаючись. «Насправді реінтродукція вовків – це велика історія у Колорадо про конфлікт між міськими та сільськими жителями. Якщо у вас один день на матеріал, ChatGPT за п’ять секунд надасть вам список потрібних експертів та їхні номери телефонів, а пошук Google зайняв би хвилин 40».
Він зазначив, що переваги платної версії GPT-4 полягають у більшій кількості документів, що завантажуються, більш актуальних даних і контекстних «дискусіях» – коли інтерфейс чату дає відповіді в контексті попередніх питань, – але безкоштовна версія залишається ефективною для багатьох швидких пошуків.
Оскільки його мета – економія часу та швидка фільтрація, Джоджола не марнує час на точне формулювання запитів. Натомість він фокусується на тому, що, де і коли потрібно шукати, і просто формулює запити «таким чином, як я розмовляв би з людиною, тільки більш владно».
Декілька практичних прикладів використання ChatGPT для швидкого пошуку
- Швидкий пошук у непомітних публічних документах. Крім тих небагатьох документів, які помічають та надсилають джерела, звертаючи на них вашу увагу, журналісти отримують постійний потік звітів, аудиторських перевірок та копій державних контрактів, які можуть містити або не містити докази неефективності, системних помилок, корупції чи несправедливості. Джоджола рекомендує завантажувати об’ємні документи в ChatGPT разом із простим запитом, наприклад: «Дай мені коротку інформацію про цей державний контракт і скільки організація отримає за послуги. Укажи імена людей у цьому контракті та номери сторінок, де вони фігурують». (Приклад, який він навів – держконтракт на систему зчитування номерних знаків – протягом кількох секунд чат видав коректні суми держвидатків, умови закупівлі та кілька імен із номерами сторінок). Водночас журналістам радять не завантажувати конфіденційні чи приватні документи. Існують і більш складні інструменти для аналізу документів, зокрема з оптичним розпізнаванням тексту – наприклад, Google Pinpoint, але Джоджола вважає, що ChatGPT забезпечує корисний і швидкий початковий фільтр.
- Резюмування суспільних проблем. Річні звіти або публічні обговорення законопроєктів та нормативних актів, присвячені суспільним проблемам, часто містять десятки сторінок дрібним шрифтом, які мало хто з журналістів має час прочитати. На семінарі Джоджола завантажив 40-сторінковий річний звіт і попросив ChatGPT лише перерахувати та узагальнити порушені проблеми. «Вражає, як швидко програма може його обробити», – зауважив він. Повторюся: інструмент може упустити нюанси й припуститися помилок, але він дає майже миттєвий опис характеру та обсягу проблем, порушених на громадських слуханнях, що може послужити поштовхом до більш глибокого вивчення та створення потенційно цікавого матеріалу.

ChapGPT може бути надзвичайно корисним інструментом швидкого пошуку ключових контактів або експертних джерел в інтернеті. Зображення: Shutterstock
- Швидкий пошук контактів для опису загальної картини. На думку Джоджоли, ChatGPT може спонукати репортерів почати обдзвонювати нові джерела, просто видавши за кілька секунд півдюжини імен, посад та номерів телефонів експертів на одній сторінці. Потім можна вибрати, до кого звернутися по узагальнену картину – можливо, до вченого – і поставити запропонованому експертові питання, що вас цікавлять, й для цього не треба гортати різні сайти й ходити по десятках посилань. Наприклад: на запит «Дай мені контактні дані, зокрема номери телефонів, організацій, які допомагають жертвам домашнього насильства в Південній Африці» ChatGPT видає значно чіткіший список контактів на одну сторінку, ніж пошук у Google за ключовою фразою «підтримка у випадках домашнього насильства ‘Південна Африка’ контакти site:za», який видає багато сторінок місцевих та міжнародних сайтів. Використання великих мовних моделей стає очевидним вибором, коли необхідно отримати початковий список джерел для першого дзвінка. (Інструмент штучного інтелекту також включив до списку контакти, пов’язані з «насильством за гендерною ознакою», яке в Південній Африці має інший фокус і може бути більш релевантним для цієї історії).
- Упорядкування офіційних контактів. Джоджола продемонстрував, як ChatGPT автоматично знаходить і впорядковує за алфавітом великі набори публічних контактних даних за лічені миті, у відповідь на такий запит: «Дай мені номери телефонів та адреси електронної пошти членів законодавчих зборів штату Колорадо, а точніше – демократів з Палати представників». «Це значно спрощує збір даних та отримання адрес електронної пошти, замість того, щоб заходити на сторінку кожного депутата», – пояснив він.
- Зрозумілий переказ технічних даних чи текстів зі специфічною термінологією – наприклад, звітів про розтин. У багатьох невеликих редакціях новин ситуація така: якщо джерело не підкаже вам, де шукати, то можна легко пропустити тривожні сигнали в технічних документах, оскільки часто бракує часу на їхній аналіз чи колег-фахівців, у яких можна запитати. За словами Джоджоли, звіти судмедекспертів – гарний приклад. Якщо завантаживши їх в інструмент зі штучним інтелектом, можна швидко знайти нові напрямки розслідування. Звичайно, пояснення ChatGPT з приводу медичного висновку потім потрібно перевіряти ще раз у судмедекспертів. «Багато хто з новинних журналістів не дуже розуміє звіти про розтин – там чимало медичних термінів та багатолітерні назви хімічних речовин», – зазначив він. Потім Джоджола розповів, як запит щодо реального звіту про розтин жертви поліцейської стрілянини розкрив невідомі подробиці справи: «Дай мені короткий огляд цієї звіту про розтин. Розкажи простою мовою, які речовини були в організмі покійного».
- Швидке та коректне порівняння. Іноді журналістам важко відразу зрозуміти, чи є цифра, яку вони бачать у прес-релізі чи річному звіті, незвичайно високою чи низькою, і чи варта вона уваги. Крім порівнянь з іншими періодами, інструменти штучного інтелекту можуть відразу надати вам географічні орієнтири для порівняльного дослідження. Досить простого запиту на кшталт «Назви мені міста в Африці, кількість населення яких схожа на населення Кігалі в Руанді». (ChatGPT відразу ж відповів, що населення Блантайра, Малаві, Фрітауна, Сьєрра-Леоне та Момбаси теж становить 1,2 мільйона осіб). «Міські журналісти люблять порівнювати свої населені пункти з іншими за такими критеріями як злочинність, зростання населення, транспортні проблеми», – каже Джоджола. «Знову ж таки, ці цифри з ШІ не будуть опубліковані [у матеріалах], доки я їх тричі не перевірю, але тепер я одразу можу зрозуміти, що не так».
Тим не менш, Джоджола визнає, що іноді його пошуки в ChatGPT заводять не туди. «Днями я попросив наукове дослідження про спалахи гніву у водіїв, і модель видала, здавалося б, чудове дослідження, проте, коли я попросив джерело, вона мене направила до юридичної фірми, яка займається позовами про завдання шкоди здоров’ю, що не дуже добре», – згадує він.
Але оскільки це був єдиний гуглоподібний пошук, який потрібно було перевіряти ще раз, такі помилки, за його словами, не відіграють особливої ролі. «Все ж вона мені показала дослідження про спалахи гніву у водіїв, проведене Національним інститутом охорони здоров’я, надійнішим джерелом, тому я почав із нього», – зазначив він.
«Не варто боятися технологій, вони вже тут», – сказав він. «Просто потрібно дотримуватися своїх стандартів та процесів. Посилайтеся на надійні джерела. Ви ж ніколи не цитуватимете пошук Google – так само й з ChatGPT».
Рован Філп – старший репортер GIJN. Раніше працював у південноафриканській газеті Sunday Times іноземним кореспондентом і висвітлював новини, політику, корупцію та конфлікти у більш ніж двох десятках країн.