Os repórteres receberam dicas sobre as melhores ferramentas e as mais recentes técnicas de reconhecimento facial para ajudar suas investigações, em um painel na GIJC23. Imagem: Wiktoria Gruca para GIJN
Além do reconhecimento facial: técnicas de pesquisa de última geração
O jornalismo investigativo prospera com uma mistura de ferramentas de alta tecnologia e técnicas de pesquisa tradicionais, e no cenário em rápida evolução do campo, ter as melhores ferramentas e técnicas pode ajudar redações e repórteres a se manterem à frente e contarem histórias impactantes.
Em um painel sobre técnicas de pesquisa de última geração na 13ª Conferência Global de Jornalismo Investigativo (#GIJC23) e moderado por Syed Nazakat, CEO do dataLEADS, Karina Shedrofsky, chefe de pesquisa do OCCRP e Jelena Cosic, gerente de treinamento do ICIJ, discutiram as investigações recentes em que trabalharam e seus métodos e ferramentas favoritos, de serviços de reconhecimento facial à categorização de documentos.
Além do reconhecimento facial
Shedrofsky citou um de seus projetos mais recentes – investigar um suposto golpe de criptomoedas entre professores na Rússia – para demonstrar como ela usa uma de suas ferramentas favoritas. Ela tinha uma fotografia de um sujeito em potencial, mas nada mais, então ela começou com PimEyes, um serviço de busca reversa de imagens com capacidade de reconhecimento facial.
O PimEyes retornou muitos resultados e links, incluindo o nome de um indivíduo — e outra fotografia, possivelmente da mesma pessoa. Então, ela recorreu ao Rekognition, da Amazon, que compara rostos para determinar se duas imagens são realmente a mesma pessoa — o que confirmou uma correspondência de 98%. Mas Shedrofsky ressaltou a importância de verificar os resultados do reconhecimento facial – mesmo aqueles com taxas de confiança muito altas – porque às vezes esses serviços podem falhar.
Quando, em outro caso, o PimEyes não produziu resultados, ela recorreu ao search4faces, um serviço que indexa o VK (VKontakte), uma popular plataforma de mídia social russa. Aqui, ela encontrou o que precisava.
Como terceiro exemplo, ela citou uma história sobre um empresário que supostamente estava atuando como um laranja para um oligarca russo sancionado. Um repórter pediu ajuda a Shedrofsky para provar a identidade do filho do empresário – quando o repórter falou com o filho, ele negou que o homem em questão fosse seu pai.
O que Shedrofsky sabia que eram seus nomes completos, a data de nascimento do filho e o local de trabalho do filho — um banco estatal majoritariamente russo. Desta vez, ela usou o Pipl, uma ferramenta muito boa em combinar a presença física de uma pessoa com sua presença online; inserir um e-mail ou um número de telefone pode retornar as contas de mídia social ou endereço físico de uma pessoa.
Como o filho tem um nome bastante comum, a pesquisa retornou muitos resultados, mas um deles tinha um e-mail com o domínio do banco. Depois, ela encontrou uma conta no Facebook que pensava pertencer a ele, mas era uma conta privada, sem informações. Isso parecia um beco sem saída, mas ela conhecia um truque importante: em contas privadas do Facebook, você ainda pode pesquisar clicando nos três pontos horizontais “(…)” no canto direito da página de perfil — qualquer coisa postada publicamente em uma linha do tempo é pesquisável.
Shedrofsky procurou aniversários, nomes relevantes, qualquer coisa que viesse à mente. Ela viu que esse perfil havia recebido mensagens de aniversário na data que sabia ser o aniversário do filho.
Naquele momento, ela estava bastante confiante de que esse era o perfil correto. Procurando pela palavra “amor”, ela descobriu o nome de sua esposa. Ela então fez pesquisas personalizadas no Google com os nomes e sobrenomes deles, e encontrou o site da empresa de fotografia que filmou casamento deles – e para sua agradável surpresa, que a empresa havia postado o álbum de casamento inteiro online. Quando encontrou uma foto no álbum de casamento do homem que suspeitava ser o pai, ela usou o PimEyes — que encontrou uma correspondência.
Shedrofsky disse que suas ferramentas favoritas ultimamente – além da base de dados Aleph, do OCCRP – são OpenCorporates, e aplicativos de informações de contato como Truecaller e Rocketreach.
Técnicas antigas, ferramentas de ponta
Cosic, do Consórcio Internacional de Jornalistas Investigativos, disse que ela usa uma combinação de técnicas da “velha guarda” com ferramentas modernas. Ela apresentou um dos projetos mais recentes do ICIJ: Deforestation Inc., uma investigação transfronteiriça que expôs empresas classificadas, com a ajuda de certificações ambientais, como “sustentáveis”, mas que são acusadas de terem contribuído para a destruição da floresta e de cometer violações dos direitos humanos. Este não foi um projeto fácil e eles tiveram que criar seu próprio banco de dados usando uma variedade de fontes.
- Organismos de certificação e auditores.
- Lista de violações por país da Regulamentação da Madeira da União Européia (EUTR).
- Relatórios sobre violações ambientais de ONGs e relatórios por país.
- Dados comerciais do ImportGenius.
- Leis de acesso à informação, documentos corporativos, materiais de marketing e documentos judiciais.
- Acesso aos dados das empresas-matriz através do Orbis e do Factiva.
Todos estes conjuntos de dados tiveram de ser harmonizados para que as informações pudessem ser acessadas a partir de uma única base de dados principal. Cosic destacou a importância de identificar a metodologia de pesquisa antes de iniciar investigações desse tipo.
Cosic disse que sua ferramenta favorita é o ICIJ’s Datashare — que executa a tecnologia OCR (reconhecimento ótico de caracteres) em documentos para torná-los pesquisáveis. Também detecta e filtra automaticamente documentos por pessoas, organizações e localizações, tornando as pesquisas mais eficientes.
‘Mais Arte do que Ciência’
Shedrofsky e Cosic reconheceram os muitos desafios do jornalismo investigativo, com a primeira observando que o campo é “mais arte do que ciência” e está em constante mudança. “Manter-se a par da evolução dos crimes é um desafio contínuo”, advertiu Shedrofsky.
Por sua vez, Cosic destacou as dificuldades para obter informações da China, as limitações impostas pelo GDPR — o regulamento de proteção de dados da UE — e a necessidade de navegar pelas complexidades de dados offshore e de registros de domínios.
Mas, apontou a dupla, há maneiras de se manter à frente. Aqui estão algumas de suas dicas para jornalistas investigativos:
- As planilhas são suas melhores amigas — use-as para organizar seus dados.
- Procure orientação de especialistas em dados para um gerenciamento de dados eficaz.
- Rotule e organize os documentos baixados em pastas.
- Explore as extensões do Chrome para capturar páginas da Web inteiras e use as extensões do Wayback Machine para preservar o histórico de pesquisa.
- Estruture e etiquete documentos para uma categorização eficaz.
- Colabore com segurança usando plataformas de código aberto duplamente criptografadas.
- Reconheça o valor de diversas habilidades e formações no jornalismo investigativo.