Історії

» Поради » Путівник

•

Теми

» Методологія » Поради та інструменти

Як перетворити нечитабельний текст на доказ: Поради Хенка ван Есса

- Хенк ван Есс • 5 Листопад 2025 р.

Read this article in

Вам знайоме відчуття, коли дивишся на ключовий доказ — розмитий номерний знак, пікселізований документ із нерозбірливими іменами чи зернистий скриншот, що приховує важливу інформацію за щільною вуаллю пікселів?

Якщо ви такого не відчували — вам поталанило. У своїх розслідуваннях я постійно стикаюся з цією проблемою: треба витягти текст із відео, розшифрувати числа зі скриншоту в соцмережах або прочитати спотворені рядки в документах. Поки всі навколо живуть своє життя, я граю в гру «вгадай піксель». Проте не скаржуся: спроможність перетворювати нерозбірливі символи на зрозумілу інформацію — неймовірна.

Настав час створити посібник із перетворення розмитої нісенітниці на щось осмислене. Інструменти та методи, описані в цій статті, — не з теорії, а з практики. Це дієві прийоми, які можна застосовувати до власноруч знайдених нечитабельних доказів. В OSINT часто саме ті кілька пікселів дають можливість вийти з глухого кута та зробити прорив.

Справжня робота відбувається у вас у голові. Її суть — розуміти, які інструменти поєднати, як перевірити результати й коли варто (а коли — ні) їм довіряти. Адже, зрештою, різниця між аматором і професійним розслідувачем полягає в наявності системи, яка працює завжди — навіть, коли пікселі опираються.

Розмитий номерний знак

Ті, хто проводить розслідування на основі відкритих джерел, мають свої улюблені інструменти. Попросіть у будь-якого фахівця поради — і він скаже: «Просто використовуй Topaz Gigapixel Pro» або «Спробуй будь-який інструмент Neural Single Image Deblurring на основі Gyro» — ось перелік цих інструментів. Проте рішення далеко не завжди знаходиться у вашому улюбленому додатку. Часто воно полягає в тому, щоб визнати: вам відомо не все.

Під час сесії у Лондоні я показав цей розмитий номерний знак 50 працівникам BBC Verify. Більшість із них могли без проблем назвати три інструменти, які мали б допомогти відновити різкість зображення. Справа у тому, що всі вони виявилися неефективними. Які варіанти лишилися у вас тепер?

Розмитий номерний знак. Фото надане Хенком ван Ессом.

Мій улюблений прийом у 2025 році — завантажити свої провальні спроби в чат-бот, ніби це цифрова терапевтична сесія: «Я пробував Topaz, Remini, DeblurGAN v2, ImageJ+ DeconvolutionLab2». Потім спостерігаю, як чат-бот пропонує мені спробувати «BeFunky Image Editor». Серйозно? До цього я жодного разу не чув про BeFunky. Проте цей безкоштовний інструмент з назвою, яка більше нагадує відкинутий «Нетфліксом» фільм, виявився кращим, ніж просунуте програмне забезпечення за 200 баксів. У цей момент я відчуваю максимальну розгубленість: «Мабуть, я знаю не все». І, чесно кажучи, саме у такі моменти відбуваються справжні прориви.

Зображення надане Хенком ван Ессом

Цей інструмент відтоді жодного разу не давав таких добрих результатів, проте коли я включив його до переліку інструментів, які вже випробував, то отримав нові рекомендації. Часом, коли ділишся своїми невдачами, отримуєш найцінніші поради.

Коли вдалося прочитати текст, потрібно знайти контекст. Коли я досліджував номерний знак червоного Chevrolet Camaro, на якому їздив нідердандський злочинець, у мене не було проблем із прочитанням цифр — вони виникли зі зворотним пошуком зображень. Іноді Google просто не розпізнає обрізану деталь фотографії.

Іноді Google просто не розпізнає обрізану деталь фотографії. Світлина надана Хенком ван Ессом.

Цю проблему можна вирішити: замість зворотного пошуку фотографії у Google Images, введіть у пошуковий рядок видиму частину тексту й здійсніть пошук за фото. У результаті я отримав фотографії туристів у Ірані, які їздили на тому ж червоному Chevrolet Camaro. Як виявилося, злочинець брав машину в оренду (читайте історію повністю тут).

Червоне авто допомогло знайти злочинця. Фото надане Хенком ван Ессом.

Відкритий ноутбук

Ловіть професійну пораду, яка звучить практично неправдоподібно: якщо ваш текст не повністю безнадійний, просто попросіть ШІ прочитати його для вас. Ніяких модних інструментів, ніякої магічної обробки зображень — просто завантажте його у чат-бот і запитайте: «Що тут написано?» Зараз мій фаворит — Gemini Pro 2.5, який, мабуть, вирішив стати найкваліфікованішим коректором у світі.

Що написано на моніторі комп’ютера. Фото надане Хенком ван Ессом.

Поки ви мружитеся у спробах розібрати це «а» чи сумний смайлик, чат-бот вже розшифрував і переклав нечитабельний текст:

Фото надане Хенком ван Ессом.

170 нечитабельних слів

Подивіться на цю фотографію. Я багато подорожую, тож не можу возити за собою монітори. Натомість для роботи я використовую окуляри віртуальної реальності. Скільки слів ви можете розібрати на цьому скриншоті, який я навмисне по максимуму розмив?

Окуляри віртуальної реальності. Фото надане Хенком ван Ессом.

Поки ви продовжуєте мружитися, я завантажив зображення у Gemini 2.5 Pro. Він зміг прочитати близько 170 слів із фото та точно резюмував те, чим я займався.

Розшифровка тексту, що не читається. Фото надане Хенком ван Ессом.

Геолокація за допомогою тексту

Нещодавно я два тижні працював у Берліні. Мені подобається проводити короткі вступні лекції з OSINT для студентів — вони чудово демонструють, наскільки ефективними можуть бути методи онлайн-розслідувань. Це пізнавально, трохи лякає й гарантовано змушує кожного негайно перевірити налаштування приватності.

Давайте проаналізуємо цю фотографію. Запитання: «Де і коли вона зроблена?»

Геолокація за допомогою тексту. Фото надане Хенком ван Ессом.

Завдяки знаку «Паркування велосипедів заборонено» зрозуміло, що можна виключити Мальту, Кіпр, Іспанію, Люксембург та Велику Британію. Це робить Нідерланди, Данію та Фінляндію — найімовірнішими кандидатами. Пояснення просте: знак «Паркування велосипедів заборонено» поширений у країнах, де всі їздять на велосипедах. Такі знаки навряд чи встановлюватимуть там, де велосипедистів майже немає. Вони потрібні в місцях, де їх так багато, що доводиться постійно нагадувати: тут паркуватися не можна. Це ніби ви побачили знак «Купання заборонено» на пляжі, а не посеред Сахари. У першому випадку це турбота про громадську безпеку, у другому — міраж. Ви бачите текст, який з’являється двічі — слово «essen» або закінчуються на «essen», — і зелений логотип з кількома словами на ньому. У цьому випадку ШІ впорався з розшифровкою не краще за нас:

Тут ШІ не впорався з розшифровкою нечіткого тексту. Фото надане Хенком ван Ессом.

Чи зможе BeFunky знову допомогти? Він покращив якість тексту настільки, що я зміг прочитати слова «samen redden». Це означає, що текст написаний нідерландською мовою, і йдеться про «samen redden [щось]». У перекладі — «разом збережемо [щось]».

Розшифровка тексту, що не читається. Фото надане Хенком ван Ессом.

Що потрібно зберегти? Це наклейка на вікні магазину чи ресторану, тож там навряд чи буде написано «разом зберегти… комунізм». Можливо, там написано «разом зберегти… капіталізм»?

Ні, забудьте, це занадто. Напевно, там написано щось мотивуюче, наприклад, «разом зберегти… енергію» чи «разом зберегти… китів», чи «разом заощадити… на парковці». Або, можливо… Зачекайте, здається, я знову мудрую. Не треба вигадувати. Почніть шукати.

Ми можемо припустити, що після «разом зберегти» стоїть одне або два слова — ймовірно, не більше семи символів, якщо розмір шрифту такий самий, як у першому рядку. Тепер найцікавіше: яким чином пояснити Google цю неймовірно специфічну оцінку кількості слів, засновану на аналізі шрифту, щоб не звучати при цьому як конспіролог, який випив забагато кави? У цьому місці звичайні пошукові запити перетинаються із судовою-медичною типографікою (ми поговоримо про це у другій частині статті) — і одразу виникають сумніви щодо правильності вибору професії.

Як сказати Google, що ви не знаєте правильних слів?

Замініть невідомі елементи зірочкою: