Image: Shutterstock

Истории

Глубинная сеть Deep Web: как найти информацию, которую не видит Google

English

Альбрехт Уде

Как быстро найти нужную вам информацию? Конечно же, зайти в одну из поисковых систем. Но как искать данные, которые поисковик не индексирует? Секретами поиска в глубинной сети на 11-й Глобальной конференции журналистов-расследователей в Гамбурге поделился журналист и исследователь из Берлина Альбрехт Уде (Albrecht Ude). Он проводит тренинги о поиске в интернете, конфиденциальности и безопасности в сети для журналистов и издательств, а также является членом немецкой ассоциации журналистов-расследователей Netzwerk Recherche.

Хотите получить больше инструментов и методов поиска в сети? Посмотрите соответствующий раздел GIJN на русском.

Все данные в интернете Уде условно разделяет на две части: «поверхностный интернет» (то есть, то, что можно найти через поисковые системы) и deep web (это бОльшая часть данных в интернете, которая невидима для поисковиков). В частности, это часть данных из социальных сетей, закрытые форумы, запароленные сайты и миллионы баз данных. Чаще всего через поисковые системы можно найти лишь стартовые страницы таких баз данных, но не их контент. По мнению Уде, через поисковики можно найти лишь около 4% информации, тогда как оставшиеся 96% — подводная часть айсберга — это данные из скрытого глубинного интернета.

Советы для поиска информации в Deep Web

Меняйте ракурс поиска в обычном поисковике.  Подумайте не только о самом предмете поиска, но и о том, где такой контент может находиться и к каким категориям данных он относится. Если вы ищите в интернете контакты человека, подумайте, в каких базах данных может быть информация о нем. Необходимо понять, кто может быть заинтересован в создании и наполнении базы с нужными вам данными. Например, если вам нужны контакты архитектора из Гамбурга, можно искать в Google не только его имя, но и базу данных всех архитекторов Гамбурга. При поиске баз данных, добавьте в поисковый запрос фразу database OR directory OR catalogue OR list. Но помните, что таким образом стоит искать только саму базу данных, а не конкретную информацию из нее. Для поиска списков с англоязычными базами данных, введите в поиск фразу “a * z database”. Проверяйте раздел «Ссылки» под статьями в Wikipedia – там можно найти перечни некоторых нужных вам баз данных. Помните, что некоторые категории в Wikipedia тоже ведут к информации о базах данных. Например: https://en.wikipedia.org/wiki/Category:Databases , https://en.wikipedia.org/wiki/Category:Digital_libraries , https://en.wikipedia.org/wiki/Category:Scholarly_databases. Помните о городских и университетских библиотеках: они могут иметь доступ к различным научным базам данных по подписке. А еще в библиотеках можно получить доступ к научным работам и проверить на плагиат диссертации интересующих вас людей.

Полезные сайты для поиска в Deep Web

Startpage.com – поисковая система, которая использует данные поиска Google, но не передает поисковику информацию о пользователе. bibliothek.uni-regensburg.de/dbinfo — большой каталог баз данных на разные темы. Archive.is – сервис, позволяющий заархивировать страницу в интернете по состоянию на определенный момент. Полезно регулярно делать такой бекап в ходе расследования, чтобы иметь доказательства на случай удаления страницы. Iana.org – сайт, на котором можно проверить владельца домена. Worldcat.org – крупнейший каталог книг, их авторов и издателей. Cve.mitre.org – база утечек данных в интернете. Ted.europa.eu – Tenders electronic daily – крупнейшая база тендеров Европейского Союза. Doaj.org – база данных научных изданий.

Нужно больше советов для расследований? Заходите в ресурсный центр GIJN на русском.

Катерина Каплюк — журналистка-расследовательница из Украины. Работала в различных изданиях, таких как «Украинская правда», «Forbes Украина», Kyiv Post, Deutsche Welle, Радио Свобода. Победительница национальных и международных конкурсов журналистских расследований, член команды Yanukovych Leaks, завоевавшей награду «Проливая свет» в 2015. Владеет английским и немецким языками.

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0

Перепечатывайте наши статьи бесплатно по лицензии Creative Commons

Перепостить эту статью

Это произведение защищено лицензией Международная лицензия Creative Commons Attribution-NoDerivatives 4.0


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Читать дальше

Харон, Важные истории, потери на войне

Журналистика данных Методология

Как нейросеть помогает независимым журналистам собирать данные о потерях России на войне c Украиной

В третью годовщину полномасштабной войны российское независимое медиа в изгнании «Важные истории» выпустило проект «Харон» — базу данных о российских потерях, в основе которой обученная журналистами нейросеть.

Советы и инструменты

Как бесплатно получить доступ к качественным спутниковым снимкам практически любой точки Земли

Конспект вебинара GIJN, где три эксперта объяснили, как репортёры могут получить постоянный бесплатный доступ к спутниковым снимкам высокого качества и поделились идеями применения спутниковых снимков в расследованиях.

Інноваційна база даних Open Source Munitions Portal (OSMP) ідентифікує та показує залишки вибухових пристроїв у зонах конфлікту разом із описом та публікаціями про шкоду, завдану цивільному населенню.

База данных Журналистика данных Советы и инструменты

Новые инструменты и советы для расследования обстрелов мирных жителей

Инновационная база данных Open Source Munitions Portal помогает журналистам идентифицировать фрагменты боеприпасов, найденные в зоне конфликта, чтобы использовать их в качестве доказательств в материалах об ответственности сторон.

Новини та аналітика Новости и аналитика Примеры из практики

Обход санкций, отмывание репутации и тайные дети Путина: Лучшие расследования 2024 года

Несмотря на угрозы, запреты и блокировки, журналисты-расследователи региона продолжают разоблачать коррупцию и другие незаконные деяния. Всё чаще наши коллеги объединяются в трансграничные партнёрства, чтобы сделать свою работу не только безопаснее, но и эффективнее.