Пол Майерс, искусный онлайн-сыщик, выступил на очередном вебинаре для GIJN. Фото: Нина Вейман-Шульц
Мастер-класс GIJN с Полом Майерсом: Советы по поиску в Интернете на темы пандемии и не только
ЧИТАЙТЕ ЭТУ СТАТЬЮ НА ДРУГИХ ЯЗЫКАХ
В конце мая 2020 года один из старших советников британского правительства публично заявил, что еще в 2019 году направлял письменное предупреждение об опасности коронавируса.
Подтверждением тому как будто бы была публикация в блоге этого советника 4 марта 2019 года, где даже было слово «коронавирус».
Но расследование BBC выявило, что в исходном посте не было ни слова «коронавирус», ни вообще какого-либо предупреждения как минимум до 9 апреля 2020 года, когда пандемия уже шла полным ходом.
Пол Майерс, ведущий эксперт BBC по поиску в Интернете, рассказал про эффективные приёмы и инструменты, с помощью которых журналисты могут погрузиться в цифровое прошлое, например, сайт Wayback Machine как раз помог подтвердить изменение записи в блоге советника задним числом. А благодаря Google Street View журналисты могут «погулять» по нужному району в прошлом.
На онлайновом мастер-классе, в котором участвовало более 700 журналистов из 94 стран, Майерс описал доступные инструменты, синтаксические приемы и методы поиска, которые позволяют найти трудноуловимые материалы, изображения и посты в социальных сетях, связанные с пандемией COVID-19. Это мероприятие стало десятым вебинаром GIJN из цикла «Расследуем пандемию».
В отличие от большинства наших вебинаров о пандемии, которые выкладываются на канале GIJN в YouTube, этот вебинар не записывался, чтобы не нарушать авторских прав. Но мы собрали некоторые эффективные и простые полезные советы —малоизвестные синтаксические приёмы для обычного поиска в Google и Twitter без использования сложных или платных поисковых инструментов. (О них можно больше прочитать в архиве GIJN или на собственном вебсайте Майерса Research Clinic).
Многие ли журналисты, например, знают, что если одно слово в запросе взять в кавычки — или добавить минус перед нежелательным словом, то можно убрать из выдачи кучу ненужных результатов? Или что оператор «OR» может помешать вам случайно испортить поисковый запрос? Или префикс «site:», который ограничивает поиск только по нужному домену?
Майерс, возглавляющий сейчас проект поддержки расследований в Академии BBC, предложил журналистам подумать, как на самом деле люди используют социальные сети. В Instagram очень слабые возможности поиска, но, например, молодёжь любит тэгать своё местоположение больше, чем в других соцсетях — а значит, журналистам, которые хотят найти людей на месте событий, полезно заглядывать в Instagram. Также он посоветовал коллегам искать разные сообщества, выбирая в облаке слов хэштеги, которые используются искомой группой людей.
Майерс за 90-минутный урок упомянул более десятка инструментов — а в предыдущих презентациях для GIJN описывал и того больше. Он подчеркнул, что развитие «поискового мышления» крайне важно для успешного сбора данных в Интернете.
«Большинство людей пишут поисковые запросы в Google естественным языком, как будто обращаясь к человеку,» — говорит он. «Иногда срабатывает. Но иногда он может неправильно понять запрос. По-моему, намного лучше управлять запросом с помощью логики и специальных инструментов.
Google не знает, что нам нужно. Для эффективного поиска требуется стратегия и подходящие ключевые слова. Искать легко, а находить сложно. С каждым запросом обязательно смотрите, сколько в выдаче результатов. Если их слишком много, стоит сильнее детализировать.»
Для иллюстрации этой логики, Майерс привёл пример сравнения знаменитых убийств. Ввод поисковых запросов «Кеннеди» и «Леннон» (имеются в виду Джон Кеннеди и Джон Леннон) выдаст кучу всевозможных результатов, даже сайт британской футбольной сборной. Но стоит добавить слово «Цезарь» — и внезапно поиск сузится только до описания убийств, потому что, как объяснил Майерс: «зачем ещё эти три слова могут оказаться на одной странице? Логика направляет наш поиск — и сразу у нас результат другого качества.»
Если вы ищете отдельных людей в социальных сетях, то по логике, подростка легче найти на платформе вроде TikTok или Instagram, а не LinkedIn, а вот руководителя крупной компании — наоборот. В Twitter более эффективно искать слова с учетом ограничения на размер символов, например, «info», а не «information».
Вот короткий обзор всей массы советов, которыми поделился Майерс:
Советы по использованию поисковых серверов
- Помните, что Google видит не всё в сети, и делает у себя копии того, что видит. Есть страницы, доступные только подписчикам, а на других обход поисковыми серверами закрыт в файле robots.txt;
- В поисковом запросе не просто пишите, что вам хочется найти. Подумайте, какие слова скорее всего окажутся на искомой странице или в публикации;
- Сузьте поиск с помощью кавычек вокруг отдельных слов и выражений (тогда Google не ищет синонимы) или добавив знак минус перед термином, который может увести поиск в ненужные направления;
- Можно добавить гибкости, не повредив запросу, просто используя оператор OR между вариантами;
- При необходимости можно сузить поиск до отдельного домена, с помощью префикса site: (без пробела за ним);
- Посмотрите вкладки и инструменты поиска Google, там есть расширенные функции, в том числе поиск по диапазону дат;
- Сперва определите точно присутствующие на искомой странице слова, а затем возможные слова;
- Ищите удалённые страницы — особенно посты в соцсетях — на archive.org и archive.is:
- Оператор ext:pdf ищет по файлам PDF. При поиске удалённых документов смотрите кэшированные версии. Если вы знаете несколько слов, которые были в документе, добавьте их в кавычках в запрос к Google и посмотрите, есть ли тот же документ в других источниках.
- Bing может кое-что может делать лучше, чем Google. По словам Майерса, он «даёт обзор с высоты птичьего полёта, позволяет видеть через забор». На этом сервере можно искать по IP-адресу, а не по доменному имени, что, как говорит Майерс, «полезно, если на одном сервере висит 50 разных доменных имён. Сейчас есть удивительные инструменты для поиска с помощью Google.»
Советы по поиску в социальных сетях
- Хотя можно искать и не встроенными средствами соцсетей, начните всё же с их внутреннего поиска, в котором прямой доступ к базам данных и более актуальные результаты;
- При поиске отдельных людей постарайтесь выяснить их адрес электронной почты. Структура адреса может о многом рассказать, но кроме того, email может быть уникальным идентификатором, часто используется как логин, и по нему легко искать в базах данных физических лиц, вроде Pipl.com.
- Введите название компании на сайт email-format.com, и скорее всего, вы увидите корпоративный формат электронной почты вашего фигуранта. Дальше уже можно подобрать адрес электронной почты по его имени;
- Используя координаты широты и долготы, автоматически генерируемые онлайн-картами, можно увидеть, что публикуют на конкретную тему жители конкретного района. Скопируйте координаты в Twitter и добавьте к ним (без пробела) префикс ”geocode:”. Затем в конце строки укажите радиус поиска, например, 1km (один километр).
- По YouTube стоит искать с помощью Google, указав site:youtube.com, или просто на вкладке «видео»;
- Нужно запомнить порой странные особенности каждой из платформ. Например, для успешного поиска в Instagram лучше соединять сложные слова подчеркиваниями, а не дефисами. И хотя изображения из Instagram скопировать нельзя, в них содержатся метаданные, которые можно использовать для дальнейшего поиска;
- Picbabun— один из сайтов для эффективного поиска по Instagram. Позволяет копировать изображения из Instagram и открывать в полном размере;
- Echosec— дружелюбный для журналистов сайт — поможет найти посты, отправленные в Instagram через Twitter, у которого лучше поисковые возможности;
- В Twitter стоит искать сообщества, находя соответствующие этим группам хэштеги. Определить эти хэштеги можно по облакам слов на hashtagify.me. Например, поиск тегов, используемых бортпроводниками, приводит нас к тэгу #crewlife, который они активно используют. Если этот тэг ввести в Twitter, то можно увидеть все посты бортпроводников;
- Префикс “intitle:” находит слова в заголовках постов в соцсетях;
- Если у вас есть подозрение, что кто-то задним числом отредактировал пост в Facebook, нажмите на три точки в правом верхнем углу публикации, посмотрите историю изменений — появятся предыдущие версии;
- Если вы подозреваете, что весь пост был опубликован задним числом, наведите курсор на маленький значок часов возле публикации в Facebook, появится дата добавления:
- Посты в Twitter со ссылками на другие сайты можно находить по префиксу “url:” — так можно найти продавцов масок на сайте Amazon, например, с помощью запроса url:amazon;
- Followerwonk позволяет искать по биографиям людей в Twitter, и находит взаимных подписчиков двух разных аккаунтов;
- В Facebook поиск неудобный, но он работает по любым ключевым словам, в том числе можно искать по названиям компаний: так можно искать человека, не зная его имени;
- Facebook также определяет слова и цифры в загружаемых изображениях, так что потенциально можно найти даже номера автомобилей;
- Надёжный расширенный поиск по Facebook есть на сайтах FBsearch и Graph.tips;
- Если вы ограничили поиск фильтрами «самое актуальное», попросите у Google не фильтровать дальнейшую выдачу, чтобы не искажать результаты. Чтобы решить эту проблему в Facebook, создайте учетную запись без друзей и биографической информации, очистите cookies — и скорее всего, выдача будет сравнительно объективной;
- Ещё очень продвинутый — но платный — поисковый сайт, это Social Links, он работает с программой Maltego. Как говорит Майерс: «Он стоит денег. Но я с ним сделал так много всего. Можно делать поиск с распознаванием лиц по разным соцсетям; искать публикации с тэгами или фото с тэгами. [Многие журналисты] были разочарованы решением Facebook убрать доступ к функции поиска по графам. Но теперь всё, что раньше позволял делать поиск по графам, можно делать с запущенной на Maltego программой Social Links.»
Рован Филп (Rowan Philp) – лауреат многих журналистских наград, работавший более чем в двух десятках стран. В течение 15 лет Филп был главным репортером и главой лондонского бюро Sunday Times в Южной Африке. Сейчас он живет и работает в Бостоне.