Визуальный поиск с помощью технологии распознавания лиц. Изображение: Скриншот, Twitter @OSINT_Tactical

Ресурс

» Путеводитель

Методы Хенка ван Эсса: Простые способы распознавания лиц

ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ

Примечание автора. Я добавил скриншоты, чтобы показать, как выглядели эти примеры во время поиска. Однако учтите, что эти результаты могут меняться со временем.

В случае чрезвычайных ситуаций, проявления коррупции или социальной несправедливости, технология распознавания лиц способна выявлять скрытую правду. Тем не менее, риск получения ложной информации всё же есть. Для обеспечения точности и объективности данных необходимо провести тщательную валидацию, верификацию и перекрёстную проверку. Кроме того, этот метод имеет этические и юридические последствия.

Технология распознавания лиц помогла установить, что военный видеоролик был создан российской пропагандой, а также идентифицировать лиц, стоящих за известным венесуэльским сайтом, который распространял фейки. Благодаря этой технологии, команда Bellingcat определила сепаратистов, причастных к крушению авиалайнера рейса MH17, и показала, как определить геолокацию старых фотографий.

Классические поисковые системы плохо справляются с этой задачей, балансируя между возможностью поиска изображений и соображениями конфиденциальности. Для эффективного распознавания лиц требуются специализированные инструменты.

Какие существуют варианты и какие функциональные возможности они предлагают? Помимо этого, важно знать об этических аспектах, связанных с данной технологией. Мы рассмотрим возможности отслеживания людей в толпе, поиска похожих фотографий и сопоставления старых и новых изображений. Каждый метод сопровождается примерами и ссылками на соответствующие инструменты. Кроме того, вы узнаете о юридических нюансах и лучших практиках.

Отслеживание людей в толпе

Этот вид технологии распознавания лиц используется для мониторинга отдельных людей в толпе. Даже не зная имени человека, инструмент может идентифицировать и отследить движения и действия конкретных лиц в реальном времени. Это особенно полезно во время протестов или массовых публичных собраний, где важно отслеживать действия определённых лиц в целях проведения расследования.

В контексте расследовательской журналистики такой метод отслеживания людей позволяет получить ценные сведения о динамике и влиянии участников каких-либо встреч, конференций или общественных форумов, например, акций протеста и демонстраций. Понимание того, насколько часто тот или иной человек участвует в подобных мероприятиях, может пролить свет на уровень его вовлечённости, его роль в группе и потенциальное влияние на процесс принятия решений.

Пример

Отслеживание перемещений лиц, участвовавших в штурме Капитолия США 6 января 2021 года, позволило понять последовательность событий, выявить связи и собрать кусочки пазла воедино. Несмотря на то, что этот метод не позволяет прямо установить личности, он помогает отследить перемещения и действия конкретных людей, проливая свет на их роль в произошедшем.

Газета Washington Post создала видеохронику беспорядков в Капитолии, используя несколько часов видеоматериалов, часть из которых была получена эксклюзивно. На ней показано, как участники беспорядков ворвались в здание Капитолия, заставив законодателей эвакуироваться. Для идентификации некоторых участников и оценки того, насколько близко они подходили к законодателям, Post использовала систему распознавания лиц. На графике показан хаос и насилие в тот день. Информация из открытых источников оставалась наиболее важным методом расследования беспорядков в Капитолии.

С помощью videoindexer.ai можно было отследить людей, участвовавших в штурме Капитолия США 6 января 2021 года. Изображение: Скриншот

Инструменты

Azure AI Video Indexer от Microsoft (бесплатно для 40 часов) и различные профессиональные программы.

Принцип работы

Чтобы начать работать с Video Indexer, загрузите видео на сайт. Обработка каждой минуты займёт около двух минут. После завершения обработки вы сможете извлечь много интересной информации. Например, инструмент верифицирует места, упомянутые в ролике, и транскрибирует текст.

Если нажать кнопку «Play next», то будет показан каждый раз, когда говорит тот или иной человек:

Изображение: Скриншот, Azure AI Video Indexer

Также вы увидите полную расшифровку видеозаписи:

Изображение: Скриншот, Azure AI Video Indexer

Вы можете скачать стенограмму и затем использовать специальные инструменты, такие как Wordtune или ChatGPT, для подведения итогов беседы.

Изображение: Скриншот, WordTune

Поиск похожих фотографий одного и того же человека

Поиск по базам изображений помогает в идентификации неизвестных лиц. Если у вас есть несколько фотографий человека, вы сможете получить более подробную информацию о его личности, действиях и связях. Анализ фото- и видеоматериалов позволяет построить временную шкалу, реконструировать события и получить полное представление о контексте истории.

Пример

Изображение: Ekanskie Vestia, Knack

Бельгийские фактчекеры из Knack использовали инструмент распознавания лиц PimEyes, чтобы найти мужчину в военной форме (в жёлтым квадрате), который был назван различными американскими и британскими СМИ российским генералом-майором в отставке, призванным на службу для участия в войне в Украине. Инструмент не дал результатов, но позволил идентифицировать двух других людей на фотографии. Дальнейшее расследование показало, что на самом деле этот человек — бывший российский пограничник.

Инструменты

PimEyes (платный), Facecheck (медленный), поиск лиц в VK или TikTok (напичканы рекламой).

Все упомянутые сервисы недостаточно прозрачны в отношении своих методов и местоположения. Отсутствие открытости вызывает опасения в отношении конфиденциальности и безопасности данных. Пользователи могут не знать, как обрабатываются, хранятся и распространяются загруженные ими фотографии или личная информация. Поэтому следует проявлять осторожность при использовании подобных сервисов, особенно если речь идёт о конфиденциальных данных или персональной информации.

Как это работает

Все четыре сервиса предлагают загрузить фотографию. Здесь я выбрал фото Рамзана Кадырова, главы Чеченской Республики.

Изображение: Скриншот, FaceCheck

Изображение: Скриншот, FaceCheck

PimEyes требует активировать подписку и взимает плату за доступ к исходным фотографиям после трёх бесплатных попыток. Варианты оплаты включают ежемесячные, ежегодные или единовременные платежи.

Сравнение старых фотографий с новыми

Технология распознавания лиц также может использоваться для сравнения старых фотографий с новыми. Так вы сможете выяснить, изображён ли на них один и тот же человек. Это особенно полезно при расследовании дел, связанных с пропавшими без вести или скрывающимися от правосудия лицами, когда внешность человека могла измениться с течением времени. Сравнив свежие фотографии со снимками прошлых лет, журналисты могут подтвердить, действительно ли это тот же самый человек, который был изображен на более раннем снимке.

Изображение: Скриншот, PimEyes

Пример

Милица Войинович (KRIK) и Стеван Дойчинович (OCCRP/KRIK), работая над материалом «Мертвец в Парагвае, скорее всего, был сербским контрабандистом», с помощью технологии распознавания лиц узнали, что мёртвый мужчина, найденный в Парагвае, мог быть контрабандистом из Сербии.

Инструменты

Betaface (бесплатно), Kairos (платно)

Как это работает

Изображение: Скриншот, OCCRP

В программе Betaface загрузите две фотографии, на которых, по вашему мнению, изображён один и тот же человек. После этого щёлкните на второе лицо и выберите пункт Compare Faces (Сравнить лица). Совпадения фотографий оцениваются от 0% до 100%. Перепроверять стоит только те, что выше 80%.

Профессиональные решения для визуального распознавания

Face API от Azure, Rekognition от Amazon, Vision AI от Google Cloud (США), Face++ и Tencent Cloud (Китай) предлагают расширенные возможности для распознавания изображений и лиц. Они позволяют разработчикам интегрировать в свои приложения мощные функции визуального распознавания.

Последствия

Технология распознавания лиц сопряжена с рядом проблем, включая вопросы конфиденциальности, точности и потенциального неправомерного использования. Такие инструменты могут собирать персональные данные без согласия пользователя, что приводит к проблемам конфиденциальности и защиты данных. В Европейском союзе большинство упомянутых инструментов противоречат Общему регламенту по защите данных, принятому в этом регионе, как утверждают некоторые консультанты в сфере IT.

Некоторые этические и правовые проблемы:

  1. Проблемы конфиденциальности: Средства распознавания лиц часто собирают и анализируют персональные данные без согласия человека.
  2. Достоверность и надёжность: Технологии распознавания лиц не всегда достоверны и надёжны, особенно когда речь идёт о женщинах и цветных людях. Ложная идентификация может иметь серьёзные последствия. Необходимо знать об ограничениях технологии и убедиться в том, что при идентификации людей они не полагаются исключительно на распознавание лиц.
  3. Возможность неправомерного использования: Журналисты должны знать о возможности злоупотреблений и следить за тем, чтобы использовать эту технологию этично и ответственно.

Когда использовать эти инструменты?

Ниже приведены четыре сценария.

  • Раскрытие скрытых истин: Ответственно, в рамках правовых и этических норм, используя эти инструменты, репортёры раскрывают тайные нарушения или проливают свет на важнейшие проблемы. Пример: Развенчание военной пропаганды.
  • Разоблачение схем и связей: Журналисты могут выявить потенциально незаконные модели поведения, связи и сети. Это может помочь просветить общественность относительно глубинной динамики событий, раскрыть скрытые цели или выявить системные проблемы, требующие внимания общественности и тщательного изучения. Пример: Штурм Капитолия США.
  • Подотчётность и привлечение власти к ответственности: Средства распознавания лиц могут использоваться в целях привлечения к ответственности, предоставляя доказательства причастности конкретных лиц к преступной деятельности или другим правонарушениям. Пример: Документирование отношений между политиками и преступниками, изображёнными на одной и той же фотографии.
  • Общественные интересы и прозрачность: При ответственном подходе и соблюдении правовых и этических норм репортёры могут использовать эти инструменты для раскрытия важной информации, которая способствует общественному обсуждению, взаимопониманию и прозрачности действий лиц во власти. Пример: Проверка фактов о мистификациях в социальных сетях.

Как всегда, проконсультируйтесь со своим редактором или работодателем о том, как вы планируете использовать систему распознавания лиц в вашем проекте, и обсудите, что подходит для вашей конкретной ситуации и региона.

GIJN приветствует репосты этой статьи для некоммерческого использования, но мы просим вас соблюдать наши правила перепечатки


Уроженец Нидерландов Хенк ван Эсс преподает методику проведения интернет-исследований, принципы работы в социальных сетях, мультимедиа/кросс-медиа. Ветеран своего дела, он объездил Европу в качестве приглашённого лектора и ведущего семинаров по проведению интернет-исследований. В числе его проектов: «Фактчекинг в сети» (CSI Internet), Руководство по журналистике данных, выступления в качестве эксперта по социальным сетям и интернет-исследованиям.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

Советы Советы и инструменты

Четыре важных совета по использованию Wayback Machine

Wayback Machine от Internet Archive – виртуальная машина времени. Сервис уже 27 лет сохраняет архив почти всей публично доступной Сети. О фишках Wayback Machine рассказал журналист ProPublica Крэйг Сильверман.

Новости и аналитика

Как с помощью открытых данных удалось идентифицировать участников штурма Капитолия

Команда Bellingcat поделилась инструментами, с помощью которых в считанные часы после штурма Капитолия собрала огромную коллекцию данных для идентификации преступников и жертв.

Журналистика данных

Инструментарий GIJN: спутниковые данные, поиск по логинам и распознавание лиц

Анализ спутниковых изображений в инфракрасном спектре, противоречивая практика применения технологии распознавания лиц, отправка запросов к NASA о предоставлении спутниковых данных, новый инструмент поиска документов от Google и кое-что ещё.

Ресурс Ресурс Советы

Бесплатные инновационные инструменты для извлечения данных, не требующие навыков программирования

Новейшие бесплатные инструменты извлечения данных и оптического распознавания символов (OCR), которые журналисты могут использовать для преобразования громоздких документов в таблицы с возможностью поиска.