Paramètres d'accessibilité

taille du texte

Options de couleurs

monochrome couleurs discrètes sombre

Outils de lecture

isolement règle

Articles

Thématiques

Les outils préférés du journaliste d’investigation Roman Anin 

Lire cet article en

Image reproduite avec l’autorisation de Roman Anin.

Dans le cadre de notre série Mes outils préférés, nous avons échangé avec Roman Anin, 33 ans, le fondateur et rédacteur en chef d’IStories, un média russe d’investigation en ligne à but non lucratif.

Lancé cette année et basé à Moscou, IStories – abréviation de l’anglais « Important Stories » (« Enquêtes essentielles »)  – compte 13 employés. Ses premières enquêtes ont traité de sujets aussi variés que la persécution de l’opposant au régime de Poutine, Alexei Navalny, le népotisme qui a cours sur le marché de la gestion des déchets dans le pays et les doutes qui entourent un test de dépistage des anticorps contre le coronavirus.

Celui qui est né et a grandi en Moldavie se voit d’abord joueur de football professionnel. Mais à 17 ans, lorsque sa famille déménage en Russie, il quitte l’équipe junior dont il fait partie. Soucieux de conserver un lien avec ce sport, il étudie le journalisme à l’Université d’État de Moscou – dans l’espoir de devenir commentateur sportif – avant de rejoindre le célèbre journal moscovite Novaya Gazeta en tant que journaliste sportif en 2006. 

Novaya Gazeta, un média dont six employés ont été assassinés depuis l’an 2000, est depuis longtemps emprunt d’une forte culture de l’enquête. Ainsi, plutôt que de simplement couvrir les derniers résultats sportifs, Roman Anin s’est vite retrouvé à creuser des sujets de corruption dans le football, y compris le trucage de matchs.

Roman Anin.

En août 2008, alors que la plupart de ses collègues sont en vacances, éclate le conflit d’Ossétie du Sud. Novaya Gazeta l’envoie en reportage au front. À son retour, il rejoint la cellule d’investigation du journal. Il y restera jusqu’au début de cette année. Dans ce rôle, il couvre la fraude mise au jour par l’avocat et contrôleur des impôts Sergei Magnitsky ; les révélations des « Panama Papers » concernant Sergey Roldugin, violoncelliste milliardaire et ami de longue date de Vladimir Poutine ; une affaire de corruption impliquant les contrats de construction aux Jeux olympiques d’hiver de 2014 à Sotchi ; et Aslan Gagiyev, qui est soupçonné d’être l’architecte d’une brigade criminelle responsable de nombreux meurtres. Certaines de ces enquêtes sont réalisées en collaboration avec l’Organized Crime and Corruption Reporting Project (OCCRP), un consortium international dont il est membre depuis 2009.

Les reportages de Roman Anin ont été récompensés de nombreux prix, dont le Prix Knight du journalisme international en 2013 pour son travail sur l’affaire Magnitsky et trois des prix les plus prestigieux du journalisme d’investigation russe : le prix Artem Borovik, le prix Youlian Semenov et le prix Andrey Sakharov. Il a également reçu le prix Knight Trailblazer 2020 du Centre international des journalistes pour avoir lancé IStories. Ses reportages sur l’affaire Magnitsky ont été à l’origine d’enquêtes criminelles dans plusieurs pays, tandis que ses reportages sur les jeux de Sotchi ont conduit le président russe de l’époque, Dmitri Medvedev, à demander l’ouverture d’une enquête. Cela dit, et comme on pourrait s’y attendre dans un pays classé 149ème sur 180 dans le Classement mondial de la liberté de la presse 2020 dressé par Reporters sans frontières, en règle générale les autorités russes n’apprécient guère son travail d’enquête. (Pour sa part, Roman Anin reconnaît que la Russie n’est « pas le pays le plus sûr » pour les journalistes mais ajoute que la situation est encore pire ailleurs.)

Il a passé l’année universitaire 2018-19 à l’Université de Stanford, en tant que boursier John S. Knight. Il y a pris des cours de code informatique et de psychologie – deux domaines utiles au journaliste qu’il est – et y a conçu IStories.

Voici les outils qu’il utilise le plus fréquemment pour enquêter :

VeraCrypt

« VeraCrypt vous permet de créer des dossiers cryptés où conserver des données en toute sécurité. Avant VeraCrypt, j’utilisais TrueCrypt, que j’ai découvert grâce à Julian Assange alors que je travaillais sur « Cablegate », la fuite de câbles diplomatiques des États-Unis. 

Je me suis rendu à Londres pour obtenir de WikiLeaks les câbles de l’ambassade états-unienne en Russie. Pour transporter les données, je ne pouvais pas les conserver comme n’importe quel fichier sur mon ordinateur portable, voire en ligne ; il me fallait les sauvegarder de manière plus sûre. Pour ce faire, j’ai placé les données dans des dossiers cryptés. Si quelqu’un avait eu accès à mon ordinateur portable, il n’y aurait pas trouvé les dossiers sensibles ; même s’il avait réussi à les localiser, il n’aurait pas pu les déchiffrer. 

J’utilise désormais VeraCrypt – un outil open source – qui fait le même travail. Vous pouvez créer des dossiers cryptés sur votre ordinateur puis, si vous le souhaitez, les sauvegarder en ligne. Cet outil vous permet également de camoufler vos dossiers cryptés, de telle sorte qu’ils n’aient pas l’apparence de bases de données, mais plutôt d’applications ou de films. 

J’utilise VeraCrypt au quotidien pour crypter tout mon travail d’enquête. »

LastPass

« LastPass stocke vos mots de passe cryptés. Il vous permet également de synchroniser vos différents appareils électroniques afin que chacun d’entre eux conserve vos mots de passe en toute sécurité. Vous accédez ensuite à tous vos mots de passe sur LastPass grâce à un mot de passe principal. Cet outil permet l’emploi de nombreux mots de passe à la fois complexes et temporaires, sans que vous ayez à les mémoriser. Je m’en sers tous les jours.

Je sais l’importance de la sécurité informatique pour avoir moi-même fait l’objet d’un piratage. Cette intrusion était très élaborée : les pirates ont bloqué ma carte SIM puis en ont créé un double ; ils ont ensuite demandé qu’un nouveau mot de passe d’accès à mon compte Gmail soit envoyé à mon numéro de téléphone et l’ont reçu sur la carte SIM qu’ils avaient préalablement émise. Dans les pays corrompus et autoritaires comme la Russie, je recommande donc de ne jamais utiliser un numéro de téléphone comme outil de récupération de mots de passe, voire même comme le second élément, au-delà du mot de passe, dans une authentification d’identité en deux étapes. (J’utilise plutôt Google Authenticator comme deuxième élément.)

Ce qui m’est arrivé est pourtant rare. Dans la majorité des cas, les piratages aboutissent car leurs cibles utilisent des mots de passe de faible qualité et, pire encore, utilisent le même mot de passe à travers différents comptes. LastPass vous aide à éviter cet écueil. Vous vous demandez peut-être : ‘Si LastPass est piraté, tous mes mots de passe seront-ils compromis ?’ La réponse est non. Le serveur de LastPass a en effet déjà fait l’objet d’un piratage, mais aucun des mots de passe n’a été compromis, LastPass ne stockant pas les mots de passe, seulement les versions « hachées » de ces mots de passe, qui sont indéchiffrables. »

OpenRefine

« OpenRefine vous permet de nettoyer des données désordonnées, ce qui peut être très difficile. J’utilise Python dans la majorité des cas, mais pour les personnes qui ne savent pas programmer, OpenRefine est vraiment un excellent outil.

Imaginez que vous ayez une feuille de calcul, contenant des millions de lignes de données, sur des contrats publics. Bien sûr, dans une telle quantité de données, il y aura des erreurs, par exemple les noms des fournisseurs seront erronés, ou les dates auront été interverties, ou certaines lignes manqueront, ou certains des prix apparaîtront sous différents formats. Comment dans ces conditions calculer la valeur totale de ces contrats ? Comment en calculer la valeur moyenne ? Il vous faut d’abord mettre de l’ordre dans toutes ces données : ce formatage unique, c’est ce que nous appelons le nettoyage des données. OpenRefine vous permet de le faire facilement.

 J’ai fait usage d’OpenRefine dans le cadre de mon enquête sur la gestion des déchets, car j’avais des milliers de lignes de données sur différentes décharges dans différentes régions. Je voulais localiser les décharges les plus importantes.

J’ai d’abord utilisé le programme Tabula, qui m’a permis d’extraire des tableaux issus de fichiers PDF accessibles au public et de les transposer dans Excel, puis j’ai placé ces tableaux Excel dans OpenRefine. Sans OpenRefine, cette tâche aurait été pratiquement impossible à réaliser. J’aurais dû parcourir chaque ligne de la feuille de calcul manuellement, afin de vérifier si tout était bien au même format. 

Avant cet outil, je pouvais passer des mois rien qu’à nettoyer des données. »

L’équipe d’IStories. Image reproduite avec l’autorisation de Roman Anin.

Code

« Je code en utilisant les langages Python et JavaScript. J’utilise Python principalement pour la collecte et l’analyse de données, ainsi que pour l’automatisation de certaines tâches ; j’utilise JavaScript – en particulier la bibliothèque D3 de JavaScript – pour la visualisation des données.

L’une de nos premières enquêtes à IStories concernait les marchés publics. J’ai décidé d’analyser combien d’argent l’État a dépensé sur le récent référendum constitutionnel, et l’usage qui en était fait.

J’avais compilé 400 000 contrats accessibles au public ; sans codage, cette masse de données aurait été impossible à traiter. Il me fallait les analyser, identifier lesquels représentaient les sommes d’argent les plus importantes, les trier, trouver des éléments les reliant. L’analyse des données via Python nous a permis de publier l’une des enquêtes les plus lues sur notre site web. J’ai ainsi découvert que l’État avait beaucoup dépensé pour obtenir des millions de masques et d’équipements de protection à destination des agents des bureaux de vote, alors même que les médecins souffraient d’une pénurie de ces mêmes équipements pendant la pandémie de coronavirus. C’est révélateur des priorités du gouvernement.

J’ai passé environ une semaine sur cette enquête, ce qui aurait été impossible sans codage. Comment aurais-je pu analyser 400 000 contrats en si peu de temps ?

Cette enquête m’a donné l’idée de coder avec Python une application toute simple qui récupère les informations publiées chaque jour sur le site officiel des marchés publics fédéraux et combine ces données avec les informations du registre des sociétés du pays. L’application effectue ensuite une analyse superficielle mais très utile des fournisseurs mentionnés dans ces contrats : quand l’entreprise a-t-elle été créée ? Combien de personnes y travaillent ? Quel est son chiffre d’affaires ? À qui appartient-elle, etc. ? Les réponses sont ensuite automatiquement compilées dans un fichier HTML, envoyé quotidiennement à moi-même et à mes journalistes. Cela nous fait gagner beaucoup de temps.

Autrefois, je vérifiais de temps en temps la base de données des marchés publics, quand j’avais un peu de temps libre. Maintenant, tout se fait automatiquement. Il ne me faut que quelques secondes pour lire la newsletter. »

La base de données des tribunaux de commerce russes

« La Russie dispose probablement de la meilleure base de données publique au monde en ce qui concerne les tribunaux de commerce. L’accès y est totalement gratuit, et, chose rare, on peut y effectuer des recherches par mots-clés. Dans la plupart des bases de données judiciaires, vous ne pouvez rechercher que les noms des parties. Mais celle-ci vous permet de rechercher n’importe quel mot-clé dans toutes les décisions rendues par les tribunaux de commerce russes, puis vous donne les résultats au format PDF. 

La base de données ne recherche pas dans les pièces des dossiers judiciaires ni dans les transcriptions des audiences ; seules les jugements rendus sont accessibles. Mais ces jugements, qui résument l’affaire et fournissent la décision finale des juges, constituent en soi une ressource très utile.

 Lorsque j’enquête sur une entreprise, je recherche son nom dans cette base de données pour voir si elle a été impliquée dans des litiges devant les tribunaux.

Une fois, sur un coup de tête, j’ai décidé de rechercher dans la base de données les mots ‘fraude’, ‘milliards’ et ‘Gazprom’, pour voir si le géant gazier russe Gazprom avait été impliqué dans des cas de fraude concernant des milliards de roubles. J’ai trouvé un cas dans lequel des agents du fisc avaient poursuivi l’une des filiales de Gazprom pour avoir acheté du matériel à un prix artificiellement majoré via une société offshore. J’ai fini par écrire un article à ce sujet. »

La base de données UN Comtrade et Import Genius

« L’une des bases de données accessibles en ligne que je préfère est la base de données Comtrade des Nations Unies. On y accède aux données sur les flux d’import-export entre différents pays. Facile d’emploi, on peut y effectuer des recherches par pays importateur et exportateur, par produit échangé et par période.

Après que la Russie a imposé des sanctions à différents pays européens – la Russie a cessé d’acheter certains produits des pays qui avaient préalablement imposé des sanctions envers elle – les journalistes ont voulu savoir comment cela affecterait les importations du pays. UN Comtrade vous donne accès à cette information : il vous suffit de rechercher la Russie comme pays importateur et le reste du monde comme exportateur. S’affiche alors la quantité de chaque produit importé, et son coût. Ceci n’est qu’un exemple de la façon dont la base de données peut être mise à profit. Je l’utilise beaucoup, notamment pour savoir où la Russie exporte ses armes, du moins de manière officielle. (Le commerce non officiel ne figure pas sur la base de données.) 

La dernière fois que je l’ai utilisée, c’était après l’énorme explosion de nitrate d’ammonium à Beyrouth, la capitale du Liban, le 4 août. Selon les informations déjà sorties dans la presse, le navire transportant ce produit était en route vers le Mozambique lorsqu’il a été arrêté à Beyrouth. Je me suis demandé à qui le Mozambique avait acheté ces explosifs et j’ai constaté que la majorité de ses importations d’ammonium étaient d’origine ukrainienne. Nous avons donc pensé que l’enquête pourrait nous mener en Ukraine. En fait, elle nous a conduit à la Géorgie, un autre exportateur de nitrate d’ammonium au Mozambique. La base de données n’a pas révélé l’origine de cette cargaison en particulier, mais nous a fourni des informations plus générales sur les importations mozambicaines de ce produit.

Pour en savoir plus sur une cargaison spécifique, vous pouvez utiliser une autre base de données, que j’aime beaucoup mais qui coûte très cher : Import Genius. On ne peut y accéder sans abonnement. [Les tarifs mensuels vont de 99 $ à 399 $, à compter d’octobre 2020.]

Import Genius vous informe sur des cargaisons spécifiques et identifie les exportateurs et les importateurs. Vous pouvez rechercher le nom de la société qui vous intéresse ou son numéro d’enregistrement commercial. »

Lectures complémentaires

La série « Mes outils préférés » de GIJN

Notre centre de ressources : les outils de recherche en ligne

Vous ne tuez pas le message : les journalistes d’investigation contre-attaquent


Olivier Holmey est un journaliste et traducteur franco-britannique basé à Londres. Il a entre autres écrit pour The Times, The Independent, Private Eye, NiemanLab, The Africa Report et Jeune Afrique.

Ce travail est sous licence (Creative Commons) Licence Creative Commons Attribution-NonCommercial 4.0 International

Republier gratuitement nos articles, en ligne ou en version imprimée, sous une licence Creative Commons.

Republier cet article

Ce travail est sous licence (Creative Commons) Licence Creative Commons Attribution-NonCommercial 4.0 International


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Lire la suite

data journalism missing piece mistake

Actualités et analyses Climat Data journalisme

Leçons apprises : 10 erreurs courantes dans le data-journalisme

Riches retours d’expériences. GIJN a demandé à des data-journalistes à travers le monde quelles étaient les lacunes en matière de data-journalisme qu’ils constataient et quels étaient les sujets peu couverts que les salles de presse pouvaient aborder.

Student journalist, talking notes

Actualités et analyses Débuter dans le journalisme d'investigation

Conseils et ressources pour les étudiants en journalisme d’investigation

Vous souhaitez vous lancer dans le journalisme d’investigation ? Que vous soyez étudiant ou autodidacte, voici dix conseils que GIJN a recueilli auprès de journalistes d’investigation du monde entier ayant également la casquette d’enseignants dans des formations à l’enquête et au data-journalisme reconnues. L’article comprend aussi des ressources clés pour qui veut devenir un journaliste d’enquête.