Как определить, какое фото реальное, а какое — сгенерировано ИИ. Скриншот с вебинара Хэнка ван Эсса.

Истории

Темы

Как отличить настоящее изображение от ИИ-подделки: Конспект вебинара Хенка ван Эсса

20 секунд аудио из лекции коллеги на YouTube — это всё, что нужно, чтобы создать убедительный клон его голоса. Вы сможете настроить систему так, чтобы заставить знакомого произнести любую фразу и «сознаться» в поступках, которых тот никогда не совершал.

Сегодня, чтобы разрушить чью-то репутацию или подделать доказательства, вам понадобится только смартфон и пара минут свободного времени. Это ставит перед журналистами и исследователями сложный вызов.

Как отличить сгенерированный контент от настоящего, какие инструменты могут пригодиться в фактчеке и какие — проверят материал на синтетику — об этом на вебинаре Глобальной сети журналистов-расследователей (GIJN) рассказал Хенк ван Эсс, эксперт в области OSINT и цифровой верификации. Мы записали главное.

Проблемы современного фактчека

Доступность и дешевизна ИИ

«Низкая стоимость технологий — одна из главных причин того, почему мы столкнулись с серьёзной проблемой верификации», — считает ван Эсс.

«Инструменты стали намного проще и дешевле… Я взял голос коллеги и использовал программу, с которой можно заставить человека сказать всё, что угодно. Мне потребовалось всего 20 секунд записи с YouTube, чтобы заставить его „совершать“ ужасные вещи», — описывает Хенк.
Для распознавания фейков Хенк рекомендует использовать плагины для Chrome. Один из инструментов для первичной проверки — Haya Audio Detection Tool. Если детектор показывает 99% вероятности фейка, это сигнал для глубокого расследования. Если же результат близок к нулю, эксперт советует взять другой фрагмент записи для повторной проверки.

Микроправки в реальных фото

Хенк подчёркивает, что детектор — не детектив, но при этом для проверки информации нужны оба: и инструмент, и человек. Даже очень хорошие решения могут упускать логику кадра, окружающий контекст или технические нюансы съёмки.

Ещё одна проблема проверки фактовмикроправки в реальных фото. Ван Эсс приводит пример — снимок мусорки, где в настоящую фотографию просто добавили коробку с именем «Ян Мейер». На самом деле её там не было. Это случайный предмет, который добавили в кадр, чтобы заставить исследователя идти по ложному следу.

Микроправки в реальном снимке: в отснятый кадр добавлен случайный предмет. Иллюстрация: скриншот с вебинара Хенка ван Эсса.

Заметить такой подвох поможет физика. Ван Эсс советует проверять каждый объект внутри снимка. Сперва представить, как ситуация на кадре выглядела бы вживую. Затем проверить детали: читаемость текста, разрешение снимка коробки и «натуральность» теней, что она отбрасывает, — в таких нюансах ИИ часто допускает ошибки.

Кроме того, иногда ИИ выдаёт результат, который слишком хорош, чтобы быть правдой. Хенк называет это «голливудским гламуром». Даже в самых опасных ситуациях волосы человека на видео будут выглядеть идеально уложенными. Такие ошибки чаще всего допускает Sora (генератор видео от OpenAI), замечает ван Эсс.

Настоящее фото с искусственным пальцем в руке. Снимок экрана вебинара Хенка ван Эсса.

Но важно также помнить, что реальность часто подбрасывает сюрпризы, — настолько нереалистичные ситуации, что их проще принять за работу ИИ. Ван Эсс приводит пример с коллегой, который сфотографировался с накладным фальшивым пальцем. На таком фото нет следов ИИ, но ситуация выглядит абсолютно неправдоподобно.

Ещё Хенк вспоминает победителя World Press Photo 2013 года — снимок Пола Хансена «Похороны в Газе». На фото траурная процессия с телами детей, погибших при обстреле.

Иллюстрация: скриншот c сайта World Press Photo, победитель 2013 года — снимок Пола Хансена (Швеция) «Похороны в Газе».

Хенк устроил голосование во время вебинара, спросив зрителей, реальное ли это фото. И многие посчитали снимок фейком из-за неправдоподобного освещения. На самом деле, фото было настоящим, но с обработкой в Photoshop. Автор усилил тени и изменил тон кожи, из-за чего его путают с контентом от ИИ.

Технические сбои. Как их не спутать с дипфейком? 

Ещё одна ловушка, в которую могут попасться инструменты и зрители, — плохое качество видео. Хенк приводит в пример ролик с премьер-министром Израиля. На видео кольцо на руке Биньямина Нетаньяху исчезает, а затем снова появляется в кадре.

Иллюстрация: Скриншот с YouTube-канала The Indian Express.

Несколько ИИ-детекторов поспешили заявить, что это дипфейк. Но на самом деле видео не обрабатывали.

У некоторых старых iPhone существует небольшая техническая проблема при «раздельной синхронизации». Во время съёмки они могут автоматически переключаться с широкого угла на более узкий или наоборот. Такие технические ограничения камеры могут создавать визуальные артефакты, которые принимают за работу ИИ.

Чтобы понять природу ошибки, говорит Хенк, нужно не просто смотреть на картинку, а провести глубокую проверку: найти материал в лучшем качестве, изучить метаданные и выяснить, на какое именно устройство велась съёмка. Если разрешение фото слишком низкое, можно использовать ИИ, чтобы «дорисовать» изображение при отдалении зума. Искусственный интеллект предложит логичное продолжение картинки. И хотя оно будет частично фейковым, такой снимок можно использовать для обратного поиска изображений, к примеру, через Google Images. Вы берёте «дорисованное» фото и загружаете его в поисковик, чтобы он нашёл реальные фотографии похожих мест.

Как использовать ИИ в поиске зацепок?

В диалоге с чат-ботом Хенк рекомендует не использовать эпитеты, но быть прямолинейным и лаконичным. Вместо того, чтобы детально описывать свои сомнения, лучше просто загрузить документ, объяснить его суть и кратко отметить, что он подозрителен.

ChatGPT может увидеть, если в тексте нет никакой практической пользы, автор оставил в отчёте технический мусор, лишние ремарки или куски черновиков, которых не должно быть в официальной бумаге.

Gemini даёт ещё больше информации, потому что лучше распознаёт структуру. Он может прямо указать, что часть текста — это просто шаблон. Это означает, что перед вами не история болезни от специалиста, а болванка из интернета, которую автор не заполнил реальными данными.

Самая «холодная» и точная модель — Claude. Называет вещи своими именами. В примере Хенка она определила, что целый абзац в рамке — это примечание, которое добавил ИИ-ассистент. Вместо реального диагноза в документ вставили общую справку о травме головы.

Такой подробный разбор функций текста помогает не просто получить ответ «да» или «нет», а найти конкретную зацепку, которая доказывает: документ был небрежно «собран» из случайных кусков текста, а не составлен профессионалом.

Хенк советует использовать ИИ, чтобы генерировать наводки, но не работать с ним как с экспертом, который даст ответы. У вас должен быть очень нейтральный вопрос, и вы должны выбрать правильную модель.

Сформулировать такой промпт непросто, подчёркивает спикер. Большинство людей вводят какое-нибудь прилагательное или просьбу. Если вы будете слишком сильно подбивать контекст — подводить ИИ к «желаемому» ответу — чат-бот станет вашим лучшим другом и начнёт подтверждать ваши догадки, даже если они ошибочны.

Чтобы этого избежать, можно попросить ИИ отредактировать ваш вопрос: «Можешь перефразировать мой вопрос в нейтральный?».

Подборка ИИ-детекторов Хенка ван Эсса

Проверка визуального контента

Hive — расширение для Chrome. Оно оценивает вероятность того, что материал был сгенерирован ИИ. Инструмент бесплатный и работает со всеми видами контента. Разработчики заявляют, что при проверке изображений и видео детектор также определяет, какая модель его сгенерировала.

Хенк отмечает, что Hive работает как «черный ящик» — выдает цифры (например, вероятность ИИ — 5.2%), но не объясняет, почему пришёл к такому выводу.

Hive можно добавить в Chrome и закрепите в меню расширений. Чтобы его использовать, нажмите на значок инструмента на странице, которую вы хотите проверить. Вы также можете проверять текстовые файлы, для этого загрузите их в поле Hive.

Sightengine может проверять фото и видео. Чтобы получить бесплатный доступ, нужна регистрация. У инструмента есть ограничение по размеру файлов — до 50 МВ. Платный доступ стоит 29$ в месяц.

Image Whisperer — разработанный самим Хенком ван Эссом инструмент для комплексной проверки фото. По словам Хенка технология объединяет функции детектора и методы «детективной» работы. Он не просто выдаёт сухую цифру, а проводит исследование по нескольким направлениям сразу:

  • Сверяется с базой данных подделок. Проверяет, не попадалось ли это фото раньше в списках уже разоблачённых фейков.
  • Ищет «цифровой след» нейросетей.
  • Изучает пиксели на применение к ним монтажа, склейки или изменений освещения, которые не заметны глазу.
  • Проверяет физику кадра: ищет логические ошибки ИИ, например, ненатуральные тени или анатомические дефекты.

После анализа программа объединяет все улики в вердикт с цветовой кодировкой и подробно объясняет своё решение. В день можно отправлять до двух фото бесплатно. Для лимита в десять фото — подписка 3,5$ в месяц. Для ста фото – 26,39$ в месяц.

Проверка текста

Если вам нужен детектор для проверки текста, может подойти GPT-Zero. Но эксперт предупреждает о его противоречивости. Во время вебинара он наглядно показал его ошибку. Хенк загрузил текст обычного приглашения на эту встречу, который написал человек. В одной попытке сервис назвал его «полностью человеческим», а в другой — отметил как созданный ChatGPT. Спикер напоминает, что результаты нужно перепроверять, а не слепо им верить.

GPT-Zero заточен искать в текстах след от ChatGPT, Gemini, Claude и Llama. Два ключевых фактора, на которые реагирует механизм:

  1. Насколько текст предсказуемый. Вероятнее всего, чем выше этот показатель, тем больше шансов, что текст синтетический;
  2. Оценивает вариативность длины и стиля предложений. А тут наоборот, чем ниже показатель, тем больше вероятность «сгенерированности» у текста.

Инструмент можно добавить в Google Docs, Canvas и в виде расширения для Chrome. Модель полностью поддерживает английский, немецкий, португальский, французский и испанский языки.

При регистрации пользователь получает бесплатный доступ для проверки текста до 10 тысяч слов. Затем нужна платная подписка: для лимита в 300 тысяч слов в месяц – 23,99$, а для 500 тысяч – подписка на 45,99$ в месяц.

Работа с картами

Чтобы упростить анализ спутниковых карт, ван Эсс предлагает использовать связку специальных сервисов и ИИ.

Инструменты для работы с местностью:

  • Wayback Machine: даёт возможность заглянуть в историю локации. Вы выбираете место, а система показывает, как менялась область за последние несколько лет.
  • Google Earth: Хенк использует этот ресурс как источник самых свежих данных. Если в других архивах, например, в Wayback Machine, нет снимков за последние 2-3 дня, он обращается к Google Earth. Бесплатный доступ позволяет изучать свежую информацию и импортировать данные до 1 ГБ. За 75$ в месяц вы получите ИИ ассистента и разрешение на импорт до 10 ГБ данных.

Чтобы изучать спутниковые таймлапсы, Хенк советует использовать нейросети. Вместо ручного просмотра вы можете загрузить видео с изменениями локации в Gemini и дать команду: «В верхнем углу видна дата, она меняется. Опиши подробно, что изменилось в каждый период».

Хенк рассказывает, что сначала опасался галлюцинаций ИИ, но практика показала, что метод работает надёжно. ИИ выдаёт данные, их можно экспортировать в таблицы, что позволяет быстро структурировать информацию.

Эта статья изначально была опубликована на сайте «Соль», Press Club Belarus, и перепечатывается здесь с разрешения.


Тимофей Черненко — беларусский журналист из Варшавы (Польша), освещающий темы медиа, технологий и аудитории в проекте «Соль». С 2023 года участвует в независимых медиапроектах, занимается исследованиями,  редакционной работой, развивает партнёрства и сообщества.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

Преподавание и обучение

Как отслеживать людей и компании в LinkedIn: Воркшоп GIJN с Хенком ван Эссом

GIJN приглашает принять участие в практическом занятии с гуру онлайн-поиска Хенком ван Эссом, которое поможет журналистам всего мира ориентироваться в сети LinkedIn.

GIJC25 Поиск по открытым источникам Примеры из практики Советы и инструменты

Как украинские журналисты расследуют военные преступления на оккупированных территориях

Не имея доступа к оккупированным территориям, украинские редакции вынуждены изобретать новые нестандартные тактики для репортажей о войне: OSINT, спутниковые снимки, перехваченные разговоры, данные украинских правоохранителей, свидетельства очевидцев и работу на местах событий после деоккупации, чтобы документировать военные преступления.

Mr Nobody Against Putin BBC documentary

Новости и аналитика

«Мистер Никто против Путина»: уроки фильма-лауреата «Оскара» о работе под прикрытием

Редакторка отдела документалистики Storyville на канале BBC Люси Кон рассказывает об уроках и этических дилеммах, вставших перед съёмочной группой в ходе создания фильма о милитаризации учеников российских школ.

Журналистика данных

Инструменты и методы очистки данных без программирования

Понимание, организация и проверка данных напрямую влияют на точность материалов. Новые инструменты делают очистку данных доступной для журналистов даже без знания программирования.