Пол Майерс, искусный онлайн-сыщик, выступил на очередном вебинаре для GIJN. Фото: Нина Вейман-Шульц

Истории

Темы

Мастер-класс GIJN с Полом Майерсом: Советы по поиску в Интернете на темы пандемии и не только

ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ

В конце мая 2020 года один из старших советников британского правительства публично заявил, что еще в 2019 году направлял письменное предупреждение об опасности коронавируса.

Подтверждением тому как будто бы была публикация в блоге этого советника 4 марта 2019 года, где даже было слово «коронавирус».

Но расследование BBC выявило, что в исходном посте не было ни слова «коронавирус», ни вообще какого-либо предупреждения как минимум до 9 апреля 2020 года, когда пандемия уже шла полным ходом.

Пол Майерс, ведущий эксперт BBC по поиску в Интернете, рассказал про эффективные приёмы и инструменты, с помощью которых журналисты могут погрузиться в цифровое прошлое, например, сайт Wayback Machine как раз помог подтвердить изменение записи в блоге советника задним числом. А благодаря Google Street View журналисты могут «погулять» по нужному району в прошлом.

На онлайновом мастер-классе, в котором участвовало более 700 журналистов из 94 стран, Майерс описал доступные инструменты, синтаксические приемы и методы поиска, которые позволяют найти трудноуловимые материалы, изображения и посты в социальных сетях, связанные с пандемией COVID-19. Это мероприятие стало десятым вебинаром GIJN из цикла «Расследуем пандемию».

В отличие от большинства наших вебинаров о пандемии, которые выкладываются на канале GIJN в YouTube, этот вебинар не записывался, чтобы не нарушать авторских прав. Но мы собрали некоторые эффективные и простые полезные советы —малоизвестные синтаксические приёмы для обычного поиска в Google и Twitter без использования сложных или платных поисковых инструментов. (О них можно больше прочитать в архиве GIJN или на собственном вебсайте Майерса Research Clinic).

Многие ли журналисты, например, знают, что если одно слово в запросе взять в кавычки — или добавить минус перед нежелательным словом, то можно убрать из выдачи кучу ненужных результатов? Или что оператор «OR» может помешать вам случайно испортить поисковый запрос? Или префикс «site:», который ограничивает поиск только по нужному домену?

Майерс, возглавляющий сейчас проект поддержки расследований в Академии BBC, предложил журналистам подумать, как на самом деле люди используют социальные сети. В Instagram очень слабые возможности поиска, но, например, молодёжь любит тэгать своё местоположение больше, чем в других соцсетях — а значит, журналистам, которые хотят найти людей на месте событий, полезно заглядывать в Instagram. Также он посоветовал коллегам искать разные сообщества, выбирая в облаке слов хэштеги, которые используются искомой группой людей.

Майерс за 90-минутный урок упомянул более десятка инструментов — а в предыдущих презентациях для GIJN описывал и того больше. Он подчеркнул, что развитие «поискового мышления» крайне важно для успешного сбора данных в Интернете.

«Большинство людей пишут поисковые запросы в Google естественным языком, как будто обращаясь к человеку,» — говорит он. «Иногда срабатывает. Но иногда он может неправильно понять запрос. По-моему, намного лучше управлять запросом с помощью логики и специальных инструментов.

Google не знает, что нам нужно. Для эффективного поиска требуется стратегия и подходящие ключевые слова. Искать легко, а находить сложно. С каждым запросом обязательно смотрите, сколько в выдаче результатов. Если их слишком много, стоит сильнее детализировать.»

Для иллюстрации этой логики, Майерс привёл пример сравнения знаменитых убийств. Ввод поисковых запросов «Кеннеди» и «Леннон» (имеются в виду Джон Кеннеди и Джон Леннон) выдаст кучу всевозможных результатов, даже сайт британской футбольной сборной. Но стоит добавить слово «Цезарь» — и внезапно поиск сузится только до описания убийств, потому что, как объяснил Майерс: «зачем ещё эти три слова могут оказаться на одной странице? Логика направляет наш поиск — и сразу у нас результат другого качества.»

Если вы ищете отдельных людей в социальных сетях, то по логике, подростка легче найти на платформе вроде TikTok или Instagram, а не LinkedIn, а вот руководителя крупной компании — наоборот. В Twitter более эффективно искать слова с учетом ограничения на размер символов, например, «info», а не «information».

Вот короткий обзор всей массы советов, которыми поделился Майерс:

Советы по использованию поисковых серверов

  • Помните, что Google видит не всё в сети, и делает у себя копии того, что видит. Есть страницы, доступные только подписчикам, а на других обход поисковыми серверами закрыт в файле robots.txt;
  • В поисковом запросе не просто пишите, что вам хочется найти. Подумайте, какие слова скорее всего окажутся на искомой странице или в публикации;
  • Сузьте поиск с помощью кавычек вокруг отдельных слов и выражений (тогда Google не ищет синонимы) или добавив знак минус перед термином, который может увести поиск в ненужные направления;
  • Можно добавить гибкости, не повредив запросу, просто используя оператор OR между вариантами;
  • При необходимости можно сузить поиск до отдельного домена, с помощью префикса site: (без пробела за ним);

  • Посмотрите вкладки и инструменты поиска Google, там есть расширенные функции, в том числе поиск по диапазону дат;
  • Сперва определите точно присутствующие на искомой странице слова, а затем возможные слова;
  • Ищите удалённые страницы — особенно посты в соцсетях — на archive.org и archive.is:

  • Оператор ext:pdf ищет по файлам PDF. При поиске удалённых документов смотрите кэшированные версии. Если вы знаете несколько слов, которые были в документе, добавьте их в кавычках в запрос к Google и посмотрите, есть ли тот же документ в других источниках.
  • Bing может кое-что может делать лучше, чем Google. По словам Майерса, он «даёт обзор с высоты птичьего полёта, позволяет видеть через забор». На этом сервере можно искать по IP-адресу, а не по доменному имени, что, как говорит Майерс, «полезно, если на одном сервере висит 50 разных доменных имён. Сейчас есть удивительные инструменты для поиска с помощью Google.»

Советы по поиску в социальных сетях

  • Хотя можно искать и не встроенными средствами соцсетей, начните всё же с их внутреннего поиска, в котором прямой доступ к базам данных и более актуальные результаты;
  • При поиске отдельных людей постарайтесь выяснить их адрес электронной почты. Структура адреса может о многом рассказать, но кроме того, email может быть уникальным идентификатором, часто используется как логин, и по нему легко искать в базах данных физических лиц, вроде Pipl.com.
  • Введите название компании на сайт email-format.com, и скорее всего, вы увидите корпоративный формат электронной почты вашего фигуранта. Дальше уже можно подобрать адрес электронной почты по его имени;
  • Используя координаты широты и долготы, автоматически генерируемые онлайн-картами, можно увидеть, что публикуют на конкретную тему жители конкретного района. Скопируйте координаты в Twitter и добавьте к ним (без пробела) префикс ”geocode:”. Затем в конце строки укажите радиус поиска, например, 1km (один километр).

  • По YouTube стоит искать с помощью Google, указав site:youtube.com, или просто на вкладке «видео»;
  • Нужно запомнить порой странные особенности каждой из платформ. Например, для успешного поиска в Instagram лучше соединять сложные слова подчеркиваниями, а не дефисами. И хотя изображения из Instagram скопировать нельзя, в них содержатся метаданные, которые можно использовать для дальнейшего поиска;
  • Picbabun— один из сайтов для эффективного поиска по Instagram. Позволяет копировать изображения из Instagram и открывать в полном размере;
  • Echosec— дружелюбный для журналистов сайт — поможет найти посты, отправленные в Instagram через Twitter, у которого лучше поисковые возможности;
  • В Twitter стоит искать сообщества, находя соответствующие этим группам хэштеги. Определить эти хэштеги можно по облакам слов на hashtagify.me. Например, поиск тегов, используемых бортпроводниками, приводит нас к тэгу #crewlife, который они активно используют. Если этот тэг ввести в Twitter, то можно увидеть все посты бортпроводников;

  • Префикс “intitle:” находит слова в заголовках постов в соцсетях;
  • Если у вас есть подозрение, что кто-то задним числом отредактировал пост в Facebook, нажмите на три точки в правом верхнем углу публикации, посмотрите историю изменений — появятся предыдущие версии;
  • Если вы подозреваете, что весь пост был опубликован задним числом, наведите курсор на маленький значок часов возле публикации в Facebook, появится дата добавления:

  • Посты в Twitter со ссылками на другие сайты можно находить по префиксу “url:” — так можно найти продавцов масок на сайте Amazon, например, с помощью запроса url:amazon;
  • Followerwonk позволяет искать по биографиям людей в Twitter, и находит взаимных подписчиков двух разных аккаунтов;
  • В Facebook поиск неудобный, но он работает по любым ключевым словам, в том числе можно искать по названиям компаний: так можно искать человека, не зная его имени;
  • Facebook также определяет слова и цифры в загружаемых изображениях, так что потенциально можно найти даже номера автомобилей;

  • Надёжный расширенный поиск по Facebook есть на сайтах FBsearch и Graph.tips;
  • Если вы ограничили поиск фильтрами «самое актуальное», попросите у Google не фильтровать дальнейшую выдачу, чтобы не искажать результаты. Чтобы решить эту проблему в Facebook, создайте учетную запись без друзей и биографической информации, очистите cookies — и скорее всего, выдача будет сравнительно объективной;
  • Ещё очень продвинутый — но платный — поисковый сайт, это Social Links, он работает с программой Maltego. Как говорит Майерс: «Он стоит денег. Но я с ним сделал так много всего. Можно делать поиск с распознаванием лиц по разным соцсетям; искать публикации с тэгами или фото с тэгами. [Многие журналисты] были разочарованы решением Facebook убрать доступ к функции поиска по графам. Но теперь всё, что раньше позволял делать поиск по графам, можно делать с запущенной на Maltego программой Social Links.»

Рован Филп (Rowan Philp) – лауреат многих журналистских наград, работавший более чем в двух десятках стран. В течение 15 лет Филп был главным репортером и главой лондонского бюро Sunday Times в Южной Африке. Сейчас он живет и работает в Бостоне.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

Facebook, Google digital ad libraries

Путеводитель Методология Советы и инструменты

Руководство по расследованиям с использованием библиотек цифровой рекламы

Эксперт по цифровым расследованиям Крэйг Сильверман подготовил краткое руководство по использованию библиотек цифровой рекламы для анализа кампаний влияния в Интернете.

Советы и инструменты

Инструментарий GIJN: Попробуйте новые бесплатные инструменты для онлайн-расследований

Инновационные онлайн-инструменты для проверки фактов и изображений, защиты от вредоносного программного обеспечения и подготовки информационных справок по теме, которыми делились с участниками конференции NICAR 2024 года.

осада Мариуполя, разрушения Мариуполя, вторжение России в Украину, Human Rights Watch

Исследования Методология Примеры из практики Советы и инструменты

Как Россия разрушала Мариуполь: Дистанционное расследование

На примере документирования разрушений и потерь в Мариуполе команда Human Rights Watch поделилась собственной методикой онлайн-расследования злоупотреблений и зверств, которые могут быть квалифицированы как военные преступления.

Советы и инструменты

Репортажи о России из-за рубежа: От расследования событий в Украине до применения искусственного интеллекта

Cпециальная корреспондентка «Медузы» и «Новой газеты» Елена Костюченко, сооснователь и главный редактор расследовательского медиа «Важные истории» Роман Анин, основатель и главный редактор Insider Роман Доброхотов поделились советами о том, как искать темы для историй, работать с источниками в России и использовать инструменты и методы поиска в открытых источниках для ведения репортажей из-за рубежа.