Image: Shutterstock

Истории

Глубинная сеть Deep Web: как найти информацию, которую не видит Google

English

Альбрехт Уде

Как быстро найти нужную вам информацию? Конечно же, зайти в одну из поисковых систем. Но как искать данные, которые поисковик не индексирует? Секретами поиска в глубинной сети на 11-й Глобальной конференции журналистов-расследователей в Гамбурге поделился журналист и исследователь из Берлина Альбрехт Уде (Albrecht Ude). Он проводит тренинги о поиске в интернете, конфиденциальности и безопасности в сети для журналистов и издательств, а также является членом немецкой ассоциации журналистов-расследователей Netzwerk Recherche.

Хотите получить больше инструментов и методов поиска в сети? Посмотрите соответствующий раздел GIJN на русском.

Все данные в интернете Уде условно разделяет на две части: «поверхностный интернет» (то есть, то, что можно найти через поисковые системы) и deep web (это бОльшая часть данных в интернете, которая невидима для поисковиков). В частности, это часть данных из социальных сетей, закрытые форумы, запароленные сайты и миллионы баз данных. Чаще всего через поисковые системы можно найти лишь стартовые страницы таких баз данных, но не их контент. По мнению Уде, через поисковики можно найти лишь около 4% информации, тогда как оставшиеся 96% — подводная часть айсберга — это данные из скрытого глубинного интернета.

Советы для поиска информации в Deep Web

Меняйте ракурс поиска в обычном поисковике.  Подумайте не только о самом предмете поиска, но и о том, где такой контент может находиться и к каким категориям данных он относится. Если вы ищите в интернете контакты человека, подумайте, в каких базах данных может быть информация о нем. Необходимо понять, кто может быть заинтересован в создании и наполнении базы с нужными вам данными. Например, если вам нужны контакты архитектора из Гамбурга, можно искать в Google не только его имя, но и базу данных всех архитекторов Гамбурга. При поиске баз данных, добавьте в поисковый запрос фразу database OR directory OR catalogue OR list. Но помните, что таким образом стоит искать только саму базу данных, а не конкретную информацию из нее. Для поиска списков с англоязычными базами данных, введите в поиск фразу “a * z database”. Проверяйте раздел «Ссылки» под статьями в Wikipedia – там можно найти перечни некоторых нужных вам баз данных. Помните, что некоторые категории в Wikipedia тоже ведут к информации о базах данных. Например: https://en.wikipedia.org/wiki/Category:Databases , https://en.wikipedia.org/wiki/Category:Digital_libraries , https://en.wikipedia.org/wiki/Category:Scholarly_databases. Помните о городских и университетских библиотеках: они могут иметь доступ к различным научным базам данных по подписке. А еще в библиотеках можно получить доступ к научным работам и проверить на плагиат диссертации интересующих вас людей.

Полезные сайты для поиска в Deep Web

Startpage.com – поисковая система, которая использует данные поиска Google, но не передает поисковику информацию о пользователе. bibliothek.uni-regensburg.de/dbinfo — большой каталог баз данных на разные темы. Archive.is – сервис, позволяющий заархивировать страницу в интернете по состоянию на определенный момент. Полезно регулярно делать такой бекап в ходе расследования, чтобы иметь доказательства на случай удаления страницы. Iana.org – сайт, на котором можно проверить владельца домена. Worldcat.org – крупнейший каталог книг, их авторов и издателей. Cve.mitre.org – база утечек данных в интернете. Ted.europa.eu – Tenders electronic daily – крупнейшая база тендеров Европейского Союза. Doaj.org – база данных научных изданий.

Нужно больше советов для расследований? Заходите в ресурсный центр GIJN на русском.

Катерина Каплюк — журналистка-расследовательница из Украины. Работала в различных изданиях, таких как «Украинская правда», «Forbes Украина», Kyiv Post, Deutsche Welle, Радио Свобода. Победительница национальных и международных конкурсов журналистских расследований, член команды Yanukovych Leaks, завоевавшей награду «Проливая свет» в 2015. Владеет английским и немецким языками.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

FreeKyrgyz11, Болот Темиров, Кыргызстан, журналистские расследования

Свобода прессы Советы и инструменты

Как Temirov Live разоблачает коррупцию в Кыргызстане, несмотря на депортацию и аресты

Известный в Кыргызстане журналист-расследователь и основатель Youtube-канала Temirov Live Болот Темиров становился объектом травли, нападений и слежки, его арестовывали и даже насильно депортировали из родной страны, но это не помешало ему продолжать свою работу и проливать свет на коррупционные схемы высокопоставленных чиновников.

Советы и инструменты

Советы по геймификации вашего следующего расследования

Советы редакциям и удачные примеры использования игры, как способа усилить влияние истории и эмпатию аудитории даёт шведская журналистка Анна Тулин, авторка исследования по геймификации журналистики в рамках научного проекта Лондонской школы экономики.

Журналистика данных Награды Новости и аналитика

Интервью с исполнительной директоркой Sigma Awards Марианной Бушар

О роли премии Sigma Awards для журналистского сообщества, критериях отбора победителей, эволюции журналистики данных, текущих тенденциях и эффективных стратегиях для тех, кто работает с данными.

Советы Журналистика данных

Веб-скрейпинг без программирования с помощью Data Miner: Пошаговая инструкция

Расширение для браузера Data Miner извлекает данные с веб-страниц и сохраняет их в формате Excel, CSV или JSON. Редакторка турецкой редакции GIJN Пинар Даг предлагает пошаговую инструкцию по использованию этого инструмента.