{"id":2095820,"date":"2025-02-27T11:43:15","date_gmt":"2025-02-27T16:43:15","guid":{"rendered":"https:\/\/gijn.org\/?p=2095820"},"modified":"2025-02-27T12:10:17","modified_gmt":"2025-02-27T17:10:17","slug":"introduction-journalisme-investigation-data-journalisme-ddj-donnees","status":"publish","type":"post","link":"https:\/\/gijn.org\/fr\/ressource\/introduction-journalisme-investigation-data-journalisme-ddj-donnees\/","title":{"rendered":"Introduction au journalisme d\u2019investigation : le data-journalisme"},"content":{"rendered":"<p>L\u2019utilisation des donn\u00e9es par les journalistes n\u2019a rien de nouveau. Mais au cours des derni\u00e8res d\u00e9cennies, elle a bien \u00e9volu\u00e9. Dans les ann\u00e9es\u00a060, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.nytimes.com\/2023\/11\/08\/business\/media\/philip-meyer-dead.html\">Philip Meyer<\/a> a commenc\u00e9 \u00e0 utiliser des ordinateurs afin de traiter des donn\u00e9es pour divers projets alors qu\u2019il travaillait pour Detroit Free Press. Il a \u00e9galement commenc\u00e9 \u00e0 int\u00e9grer dans ses enqu\u00eates des m\u00e9thodes de recherche utilis\u00e9es en sciences sociales comme il l\u2019a expliqu\u00e9 plus tard dans son livre \u201c<a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.goodreads.com\/book\/show\/19754256-precision-journalism\">Precision Journalism: A Reporter\u2019s Introduction to Social Science Methods<\/a>\u201d publi\u00e9 en\u00a01973.<\/p>\n<aside>Si une organisation ou un organisme public publie un chiffre (comme une statistique), il est possible d\u2019acc\u00e9der \u00e0 un ensemble de donn\u00e9es en demandant \u00e0 consulter les donn\u00e9es qui l\u2019\u00e9tayent.<\/aside>\n<p>Au fil du temps, de plus en plus de journalistes ont suivi l\u2019exemple de Meyer. En\u00a01989, avec le soutien de l\u2019\u00c9cole de journalisme du Missouri aux \u00c9tats-Unis, l\u2019organisation <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.ire.org\/\">Investigative Reporters and Editors<\/a> (IRE) a lanc\u00e9 le programme <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.ire.org\/about-ire\/\">National Institute for Computer-Assisted Reporting<\/a>. Les journalistes ont alors commenc\u00e9 \u00e0 \u00eatre form\u00e9s sur les diverses m\u00e9thodes d\u2019exploitation des donn\u00e9es dans des enqu\u00eates ou m\u00eame sur la r\u00e9alisation d\u2019enqu\u00eates \u00e0 partir de donn\u00e9es.<\/p>\n<p>Au cours des d\u00e9cennies qui ont suivi, alors que l\u2019utilisation d\u2019Internet se r\u00e9pandait et que des volumes croissants de donn\u00e9es devenaient disponibles, les journalistes ont commenc\u00e9 \u00e0 utiliser le terme \u201cdata-journalisme\u201d pour qualifier les enqu\u00eates dans le cadre desquelles la collecte et l\u2019analyse de donn\u00e9es occupaient une partie importante du processus, afin de mettre en \u00e9vidence des probl\u00e8mes syst\u00e9miques et d\u2019identifier des tendances, ainsi que des valeurs aberrantes, tout en enqu\u00eatant sur des sujets d\u2019int\u00e9r\u00eat public.<\/p>\n<p>Le journalisme assist\u00e9 par ordinateur est donc devenu une pratique courante, comme le <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/datajournalism.com\/read\/longreads\/the-history-of-data-journalism\">fait remarquer<\/a> Brant Houston, ancien directeur ex\u00e9cutif de l\u2019organisation IRE : Dans le monde entier, que ce soit individuellement ou dans le cadre d\u2019organisations r\u00e9gionales ou m\u00eame internationales, les journalistes ont commenc\u00e9 \u00e0 faire appel \u00e0 cette pratique pour mener leurs enqu\u00eates. Dans le m\u00eame temps, des universit\u00e9s et des organisations dans le monde entier, telles que le R\u00e9seau international de journalisme d\u2019investigation, ont commenc\u00e9 \u00e0 proposer des formations sur le data-journalisme.<\/p>\n<p>Aujourd\u2019hui, 60\u00a0ans apr\u00e8s les exp\u00e9riences men\u00e9es par Meyer avec des ordinateurs, de nombreuses enqu\u00eates r\u00e9sultent du traitement de volumes importants d\u2019enregistrements et d\u2019analyses informatiques des donn\u00e9es, auxquels s\u2019ajoutent des techniques d\u2019enqu\u00eate traditionnelles, telles que des entretiens avec des sources humaines, des enqu\u00eates sur le terrain et la consultation d\u2019archives et de documents publics, pour produire des enqu\u00eates d\u2019int\u00e9r\u00eat public.<\/p>\n<h4>O\u00f9 trouver des donn\u00e9es<\/h4>\n<p>Les donn\u00e9es sont omnipr\u00e9sentes. Gr\u00e2ce aux avanc\u00e9es technologiques des derni\u00e8res d\u00e9cennies, il est d\u00e9sormais possible de stocker et de traiter plus d\u2019informations que jamais auparavant. Les donn\u00e9es peuvent \u00e9galement se pr\u00e9senter sous forme agr\u00e9g\u00e9e ou granulaire. Les journalistes pr\u00e9f\u00e8rent bien \u00e9videmment utiliser des donn\u00e9es granulaires qu\u2019ils peuvent analyser sous tous les angles. Et pourtant, ce n\u2019est pas toujours le cas.<\/p>\n<p>N\u00e9anmoins, de nombreux gouvernements mettent certaines donn\u00e9es \u00e0 la disposition du public. Voici quelques sources de donn\u00e9es disponibles, parmi d\u2019autres\u00a0:<\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Registres des entreprises<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Dossiers judiciaires<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Registres de la propri\u00e9t\u00e9 fonci\u00e8re et intellectuelle<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Gazettes officielles. Elles sont publiques dans la plupart des administrations.<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Extractions de bases de donn\u00e9es publiques de sites web gouvernementaux ou d\u2019ONG. (Veillez toutefois \u00e0 consulter les lois de l\u2019administration ou des entreprises qui h\u00e9bergent les donn\u00e9es, car certaines imposent des restrictions ou des conditions sp\u00e9ciales en mati\u00e8re d\u2019exportation.)<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Concessions mini\u00e8res. M\u00eame les pays opaques, tels que la <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/drclicences.cami.cd\/EN\/\">RDC<\/a> et le Burkina Faso publient des informations sur les mines via des syst\u00e8mes qui g\u00e8rent les restrictions et les droits fonciers.<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Mises \u00e0 jour fournies par des fonctionnaires et des agents des forces de l\u2019ordre via leurs r\u00e9seaux sociaux, sites web et des voies officielles, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/x.com\/DCI_Kenya\/status\/1099963556500516865\">comme l\u2019exemple indiqu\u00e9 dans ce lien<\/a>.<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Organisations internationales comme les Nations Unies<\/li>\n<\/ul>\n<p>Si une organisation ou un organisme public publie un chiffre (comme une statistique), il est possible d\u2019acc\u00e9der \u00e0 un ensemble de donn\u00e9es en demandant \u00e0 consulter les donn\u00e9es qui l\u2019\u00e9tayent.<\/p>\n<p>Voici quelques exemples d\u2019ensembles de donn\u00e9es accessibles au public\u00a0:<\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.gov.uk\/guidance\/hm-land-registry-overseas-companies-that-own-property-in-england-and-wales%23access-the-data\">Registre foncier du Royaume-Uni\u00a0<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/carbonplan.org\/research\/offsets-db\">Base de donn\u00e9es de compensations et cr\u00e9dits carbone<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/trade.cites.org\/en\/cites_trade\/download?filters%5Btime_range_start%5D=1975&amp;filters%5Btime_range_end%5D=2019&amp;filters%5Bexporters_ids%5D%5B%5D=all_exp&amp;filters%5Bimporters_ids%5D%5B%5D=all_imp&amp;filters%5Bsources_ids%5D%5B%5D=all_sou&amp;filters%5Bpurposes_\">Base de donn\u00e9es sur le commerce CITES<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/drclicences.cami.cd\/EN\/\">Cadastre minier de la RDC<\/a> (registre)<\/li>\n<\/ul>\n<div id=\"attachment_1894062\" style=\"width: 781px\" class=\"wp-caption alignnone\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/carbonplan.org\/about\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1894062\" class=\"wp-image-1894062 size-large\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.29.00-771x340.png\" sizes=\"auto, (max-width: 771px) 100vw, 771px\" srcset=\"https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.29.00-771x340.png 771w, https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.29.00-336x148.png 336w, https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.29.00-768x339.png 768w, https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.29.00-1536x677.png 1536w, https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.29.00-2048x903.png 2048w\" alt=\"\" width=\"771\" height=\"340\" aria-describedby=\"caption-attachment-1894062\" \/><\/a><p id=\"caption-attachment-1894062\" class=\"wp-caption-text\">La base de donn\u00e9es OffsetsDB de Carbonplan a pour objectif de simplifier les compensations et cr\u00e9dits carbone, et elle collecte des donn\u00e9es provenant de cinq registres de compensation parmi les plus importants. Image : Capture d\u2019\u00e9cran, OffsetsDB<\/p><\/div>\n<h4>Le processus<\/h4>\n<p>Le data-journalisme ne se limite pas \u00e0 la g\u00e9n\u00e9ration de graphiques et d\u2019infographies. Il ne consiste pas non plus uniquement \u00e0 traiter des donn\u00e9es structur\u00e9es dans des feuilles de calcul. Il exploite des donn\u00e9es pour mettre au jour des informations dissimul\u00e9es et \u00e9tayer les enqu\u00eates afin de cr\u00e9er des r\u00e9cits \u00e0 fort impact.<\/p>\n<p><b>Pour utiliser efficacement des donn\u00e9es dans vos enqu\u00eates, posez-vous d\u2019abord les questions suivantes\u00a0:<\/b><\/p>\n<ol>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Quelle est la nature de la source des donn\u00e9es\u00a0: o\u00f9 et comment sont-elles stock\u00e9es\u00a0?<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Les donn\u00e9es sont-elles structur\u00e9es ou non structur\u00e9es\u00a0?<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Quel est le sujet principal de l\u2019enqu\u00eate et dans quel format sera-t-il pr\u00e9sent\u00e9\u00a0?<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Quelle est la capacit\u00e9 de mon \u00e9quipe\u00a0?<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Quelles donn\u00e9es sont disponibles\u00a0? S\u2019il n\u2019existe pas de donn\u00e9es, puis-je les g\u00e9n\u00e9rer\u00a0?<\/li>\n<\/ol>\n<p><b>Ensuite, ne perdez pas de temps\u00a0:\u00a0<\/b><\/p>\n<ul>\n<li><b>1. Procurez-vous les donn\u00e9es<\/b>. Lorsque vous \u00eates certain qu\u2019une id\u00e9e vaut la peine d\u2019\u00eatre approfondie, l\u2019\u00e9tape suivante consiste \u00e0 obtenir les donn\u00e9es. Les journalistes se procurent des donn\u00e9es en exploitant une fuite d\u2019un ensemble de donn\u00e9es ou de documents, en soumettant des demandes en vertu de la loi sur la libert\u00e9 de l\u2019information (Freedom of Information Act, FOIA), aupr\u00e8s de sources humaines, en programmant l\u2019exportation de donn\u00e9es \u00e0 partir de documents ou de pages web ou en proc\u00e9dant \u00e0 des extractions \u00e0 partir de fichiers PDF et d\u2019autres documents image. Ils les transforment ensuite en donn\u00e9es structur\u00e9es faciles \u00e0 analyser.<\/li>\n<\/ul>\n<p>Il arrive parfois que les journalistes doivent cr\u00e9er leur propre ensemble de donn\u00e9es s\u2019il n\u2019existe pas d\u00e9j\u00e0 dans un format structur\u00e9, et ce, via des documents ou d\u2019autres sources, par exemple.<\/p>\n<ul>\n<li><b>2. Comprenez la nature des donn\u00e9es.<\/b> Demandez qui les a cr\u00e9\u00e9es. Autrement dit, identifiez la source des donn\u00e9es, validez ses r\u00e9f\u00e9rences et \u00e9valuez sa cr\u00e9dibilit\u00e9. Lisez la documentation qui accompagne la source de donn\u00e9es pour comprendre comment ces derni\u00e8res ont \u00e9t\u00e9 collect\u00e9es. D\u00e9terminez \u00e9galement si les donn\u00e9es proviennent d\u2019un ensemble de donn\u00e9es principal ou secondaire cr\u00e9\u00e9 \u00e0 partir d\u2019autres sources de donn\u00e9es. Identifiez le contenu des donn\u00e9es (\u00e9tudiez les variables, ce qu\u2019elles repr\u00e9sentent et le format dans lequel elles sont stock\u00e9es). D\u00e9terminez si les donn\u00e9es auxquelles vous avez acc\u00e8s repr\u00e9sentent l\u2019ensemble complet de donn\u00e9es ou uniquement une portion.<\/li>\n<\/ul>\n<p>Essayez ensuite de d\u00e9finir les questions auxquelles les donn\u00e9es apportent des r\u00e9ponses. Identifiez les informations manquantes susceptibles d\u2019\u00eatre compl\u00e9t\u00e9es par des sources de donn\u00e9es suppl\u00e9mentaires. Renseignez-vous pour savoir s\u2019il existe un autre ensemble de donn\u00e9es qui vous permettrait d\u2019am\u00e9liorer celui dont vous disposez ou auquel vous pourriez le comparer.<\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><b>3. V\u00e9rifiez les donn\u00e9es.<\/b> Assurez-vous que les donn\u00e9es dont vous disposez sont authentiques et peuvent \u00eatre valid\u00e9es. Vous pouvez v\u00e9rifier des donn\u00e9es en les recoupant avec d\u2019autres ensembles de donn\u00e9es, en consultant d\u2019autres documents et en discutant avec des experts. Plus tard, alors que l\u2019enqu\u00eate progresse, les journalistes doivent contacter les personnes ou entit\u00e9s mentionn\u00e9es dans les ensembles de donn\u00e9es pour leur demander leur avis et v\u00e9rifier les donn\u00e9es.<\/li>\n<\/ul>\n<p>Les probl\u00e8mes auxquels vous risquez de vous heurter en travaillant avec des donn\u00e9es sont li\u00e9s \u00e0 leur exactitude, leur exhaustivit\u00e9 et leur coh\u00e9rence. Vous devez imp\u00e9rativement vous assurer qu\u2019aucun probl\u00e8me n\u2019affecte les donn\u00e9es et qu\u2019elles sont authentiques, \u00e0 jour ou compl\u00e8tes. Votre enqu\u00eate risquerait sinon de reposer sur un ch\u00e2teau de cartes.<\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><b>4. Documentez et prot\u00e9gez les donn\u00e9es.<\/b> Si vous finissez par restructurer les donn\u00e9es, n\u2019oubliez pas de cr\u00e9er un fichier LISEZMOI, \u00e0 savoir un document d\u2019instructions, sur les donn\u00e9es et la m\u00e9thodologie que vous avez appliqu\u00e9e. Consignez vos processus au fur et \u00e0 mesure que vous traitez les donn\u00e9es. Cela vous permettra de limiter les erreurs. Conservez un exemplaire des donn\u00e9es d\u2019origine pour pouvoir remonter \u00e0 la source en cas d\u2019erreur.<\/li>\n<\/ul>\n<p>Identifiez \u00e9galement les personnes qui interviennent dans le traitement des donn\u00e9es. Selon le caract\u00e8re confidentiel des donn\u00e9es, vous devez d\u00e9signer des personnes autoris\u00e9es \u00e0 y acc\u00e9der et imposer des restrictions de partage. Vous pouvez stocker les donn\u00e9es dans des dossiers, sur Google Drive, sur une cl\u00e9 USB (si elles ne peuvent pas \u00eatre stock\u00e9es sur Internet en raison de leur caract\u00e8re confidentiel), dans des bases de donn\u00e9es, notamment des bases de donn\u00e9es SQL que vous pouvez partager, ou utiliser des outils avanc\u00e9s comme <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/aleph.occrp.org\/\">Aleph<\/a>, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/datashare.icij.org\/\">Datashare<\/a>, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/nina.elclip.org\/login\">NINA<\/a>, etc.<\/p>\n<div id=\"attachment_1893941\" style=\"width: 781px\" class=\"wp-caption alignnone\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/nina.elclip.org\/login\"><img loading=\"lazy\" decoding=\"async\" aria-describedby=\"caption-attachment-1893941\" class=\"wp-image-1893941 size-large\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.32.16-771x341.png\" sizes=\"auto, (max-width: 771px) 100vw, 771px\" srcset=\"https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.32.16-771x341.png 771w, https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.32.16-336x148.png 336w, https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.32.16-768x339.png 768w, https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.32.16-1536x679.png 1536w, https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Screenshot-2024-11-20-at-12.32.16-2048x905.png 2048w\" alt=\"\" width=\"771\" height=\"341\" aria-describedby=\"caption-attachment-1893941\" \/><\/a><p id=\"caption-attachment-1893941\" class=\"wp-caption-text\">NINA, plateforme de donn\u00e9es du Centre latino-am\u00e9ricain de journalisme d\u2019investigation (CLIP). Elle connecte des bases de donn\u00e9es ouvertes pour simplifier la recherche de connexions entre des entreprises et des personnes engag\u00e9es sous contrat par des gouvernements d\u2019Am\u00e9rique latine. Image\u00a0: Capture d\u2019\u00e9cran, NINA<\/p><\/div>\n<p>Pour faciliter la collaboration, le projet Organized Crime and Corruption Reporting Project (OCCRP) et le Consortium international des journalistes d\u2019investigation (ICIJ) partagent habituellement des donn\u00e9es avec tous les journalistes travaillant sur un projet. Toutefois, ces organisations imposent des protocoles stricts d\u00e9terminant qui peut acc\u00e9der \u00e0 un ensemble de donn\u00e9es afin d\u2019\u00e9viter d\u2019exposer les sources ou les journalistes \u00e0 des risques, tout en garantissant aux personnes autoris\u00e9es un acc\u00e8s \u00e0 toutes les informations et au contexte n\u00e9cessaires pour comprendre parfaitement les ensembles de donn\u00e9es. Autrement dit, partagez les donn\u00e9es uniquement avec des personnes qui doivent pouvoir y acc\u00e9der.<\/p>\n<ul>\n<li><b>5. Analysez les donn\u00e9es pour en extraire des informations.<\/b> Lorsque vous avez compris les donn\u00e9es et que vous les avez partag\u00e9es avec vos collaborateurs, c\u2019est le moment de voir ce qu\u2019elles peuvent vous offrir. Traitez toujours les donn\u00e9es comme s\u2019il s\u2019agissait de sources humaines, en les interviewant. Demandez-vous quelles sont les questions auxquelles les donn\u00e9es peuvent apporter une r\u00e9ponse et documentez le processus vous permettant d\u2019obtenir ces r\u00e9ponses\u00a0:<\/li>\n<\/ul>\n<p>Tenez un journal de donn\u00e9es des \u00e9tapes qui vous ont permis d\u2019obtenir une valeur ou une information. Cela vous sera utile \u00e0 l\u2019\u00e9tape de fact-checking ou si des r\u00e9dacteurs en chef, ou des avocats, vous posent des questions.<\/p>\n<p>Faites \u00e9galement appel \u00e0 des processus d\u2019auto-r\u00e9f\u00e9rencement et reproductibles pour r\u00e9pondre \u00e0 des questions ult\u00e9rieurement. Il peut s\u2019agir de formules Excel vous \u00e9vitant d\u2019avoir \u00e0 copier et coller des donn\u00e9es, de codes de programmation, d\u2019un r\u00e9f\u00e9rentiel GitHub ou d\u2019autres m\u00e9thodes permettant d\u2019assurer le suivi du travail effectu\u00e9.<\/p>\n<p>Consignez vos conclusions de telle sorte que vous et les autres membres de l\u2019\u00e9quipe puissiez les comprendre facilement. D\u00e9veloppez des m\u00e9thodes syst\u00e9matiques de stockage de vos calculs, via des feuilles de calcul, des tableaux de bord, du code Python ou une page wiki, par exemple.<\/p>\n<p>Dans le cadre de l\u2019analyse, il est possible de recouper les informations avec d\u2019autres ensembles de donn\u00e9es. Par exemple, pendant la collaboration entre l\u2019ICIJ et plus de 150\u00a0partenaires m\u00e9dias, le recoupement de donn\u00e9es provenant d\u2019entit\u00e9s enregistr\u00e9es dans des juridictions offshore publi\u00e9es dans les <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.icij.org\/investigations\/pandora-papers\/\">Pandora Papers<\/a> avec des donn\u00e9es provenant de registres fonciers au Royaume-Uni, en France et aux \u00c9tats-Unis (Californie, Miami et d\u2019autres \u00c9tats) a permis de d\u00e9couvrir de nombreuses propri\u00e9t\u00e9s appartenant secr\u00e8tement \u00e0 des personnalit\u00e9s politiques et publiques.<\/p>\n<ul>\n<li><strong>6.<\/strong> <b>V\u00e9rifiez vos conclusions en continuant \u00e0 enqu\u00eater.<\/b> Pour que les conclusions soient fond\u00e9es, vous devez v\u00e9rifier l\u2019analyse des donn\u00e9es. Vous devez les r\u00e9viser en les comparant aux lois et r\u00e9glementations disponibles ou m\u00eame \u00e0 d\u2019anciennes \u00e9tudes et enqu\u00eates. Discutez avec des experts et v\u00e9rifiez votre analyse avec vos coll\u00e8gues.<\/li>\n<\/ul>\n<p><b>Posez-vous ensuite les questions suivantes\u00a0:<\/b><\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Est-ce que les donn\u00e9es exposent des malversations (blanchiment d\u2019argent, corruption, fraude fiscale, infractions environnementales ou d\u2019autres crimes)\u00a0?<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Est-ce que la validit\u00e9 des donn\u00e9es fait le moindre doute\u00a0?<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Est-ce que les donn\u00e9es contiennent de nouvelles informations\u00a0?<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Est-ce que les donn\u00e9es permettent de mieux comprendre un probl\u00e8me syst\u00e9mique\u00a0?<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Existe-t-il dans les donn\u00e9es une valeur aberrante surprenante qui pourrait faire l\u2019objet d\u2019une enqu\u00eate importante\u00a0?<\/li>\n<\/ul>\n<p>Pour terminer, et comme on le dit, \u201csi vous torturez les donn\u00e9es assez longtemps, elles vous diront \u00e9ventuellement tout ce que vous voulez\u201d. Il est possible de manipuler des statistiques pour soutenir n\u2019importe quelle conclusion. Nous d\u00e9conseillons fortement cette pratique.<\/p>\n<ol start=\"7\">\n<li>\u00a0 <b>Pr\u00e9parez-vous \u00e0 la publication. <\/b>Une fois l\u2019analyse termin\u00e9e, pr\u00e9voyez du temps pour v\u00e9rifier les faits r\u00e9sultant du travail r\u00e9alis\u00e9 avec les donn\u00e9es, \u00e9crivez l\u2019article et v\u00e9rifiez que les donn\u00e9es sont pr\u00e9sent\u00e9es dans le contexte adapt\u00e9. Tout comme avec les autres enqu\u00eates, planifiez un examen juridique et allouez du temps pour la production. Pr\u00e9voyez-vous de publier une visualisation ou une pr\u00e9sentation interactive de votre enqu\u00eate\u00a0? Pr\u00e9cisez-le \u00e9galement dans votre plan.<\/li>\n<\/ol>\n<h4>Des donn\u00e9es \u00e0 l\u2019enqu\u00eate<\/h4>\n<p>Une enqu\u00eate data peut d\u00e9marrer de la m\u00eame fa\u00e7on que toute autre enqu\u00eate, notamment au cours de recherches men\u00e9es dans le cadre d\u2019une enqu\u00eate diff\u00e9rente, d\u2019une fuite ou m\u00eame d\u2019un simple constat. Parfois, certains probl\u00e8mes d\u2019int\u00e9r\u00eat public entra\u00eenent \u00e9galement la g\u00e9n\u00e9ration de donn\u00e9es pouvant servir de base \u00e0 des enqu\u00eates.<\/p>\n<p>Dans ces cas, ce sont souvent les donn\u00e9es qui alimentent les enqu\u00eates.<\/p>\n<p>Toutefois, m\u00eame si en combinant les enqu\u00eates data et le journalisme traditionnel il est possible de produire d\u2019excellents r\u00e9sultats, il ne faut pas oublier le facteur humain et l\u2019int\u00e9r\u00eat public. Quel int\u00e9r\u00eat l\u2019enqu\u00eate pr\u00e9sente-t-elle pour le public\u00a0? Quel probl\u00e8me syst\u00e9mique d\u00e9voile-t-elle\u00a0? Qui est affect\u00e9 par ce probl\u00e8me\u00a0?<\/p>\n<p><b>Des donn\u00e9es \u00e0 l\u2019enqu\u00eate\u00a0: liste de v\u00e9rification<\/b><\/p>\n<ul>\n<li><b>1. Identifiez l\u2019angle de votre enqu\u00eate. <\/b>Apr\u00e8s avoir analys\u00e9 les donn\u00e9es, vous risquez d\u2019\u00eatre d\u00e9pass\u00e9 par les r\u00e9sultats qui peuvent pr\u00e9senter une profusion de pistes int\u00e9ressantes. C\u2019est en r\u00e9fl\u00e9chissant au pitch que vous pourrez identifier le meilleur angle. Si vous \u00eates toujours incertain, discutez avec vos coll\u00e8gues et vos r\u00e9dacteurs en chef. Un regard neuf, \u00e9galement source de commentaires int\u00e9ressants, pourra vous aider \u00e0 choisir le meilleur angle ou \u00e0 en cr\u00e9er un nouveau.<\/li>\n<li><b>2. Story-board et planification d\u2019enqu\u00eate. <\/b>N\u2019oubliez pas que les lecteurs ne raffolent pas toujours des donn\u00e9es brutes. Ainsi, pour que les donn\u00e9es soient comprises, pr\u00e9parez soigneusement une narration et une pr\u00e9sentation visuelle cr\u00e9atives. En \u00e9tablissant des correspondances entre les conclusions dans un story-board, vous pouvez organiser et d\u00e9finir les aspects d\u2019une enqu\u00eate bien ficel\u00e9e, \u00e0 savoir les participants, le conflit, l\u2019intrigue, la structure, etc. Quelle question int\u00e9ressante \u00e9merge de vos principales conclusions ? Pr\u00e9sentez-la clairement.<\/li>\n<li><b>3. R\u00e9digez le pitch.<\/b> Pr\u00e9sentez l\u2019encha\u00eenement des donn\u00e9es pour que les lecteurs, notamment les r\u00e9dacteurs en chef, le comprennent et soient sur la m\u00eame longueur d\u2019onde.<\/li>\n<li><b>4. Pr\u00e9parez votre enqu\u00eate \u00e0 partir des donn\u00e9es<\/b>. N\u2019oubliez pas que les enqu\u00eates data percutantes sont le fruit d\u2019enqu\u00eates bien men\u00e9es. Voici un exemple qui illustre une enqu\u00eate r\u00e9alis\u00e9e \u00e0 partir de donn\u00e9es : Imaginez que vous analysez des projets immobiliers dans votre pays en vous int\u00e9ressant particuli\u00e8rement \u00e0 l\u2019investissement du gouvernement et aux entreprises sous-trait\u00e9es pour la construction des logements. Alors que vous visitez les sites des projets immobiliers, en vous fiant aux donn\u00e9es disponibles, vous constatez qu\u2019il n\u2019existe aucun b\u00e2timent. Dans ce cas, c\u2019est le d\u00e9calage entre ce qu\u2019indiquent les donn\u00e9es et ce qui se passe sur le terrain qui devient un sujet d\u2019enqu\u00eate.<\/li>\n<li><b>5. \u00c9crivez l\u2019article. <\/b>La plus grande difficult\u00e9 que pr\u00e9sentent les enqu\u00eates data est que vous devez communiquer les conclusions via des r\u00e9cits coh\u00e9rents et int\u00e9ressants. Pour vous faciliter la t\u00e2che, vous pouvez exposer les grandes lignes de l\u2019enqu\u00eate ou la pr\u00e9senter sous forme de diagramme avant de commencer \u00e0 \u00e9crire.<\/li>\n<li><b>6. Clarifications, visualisations et t\u00e9l\u00e9chargements de donn\u00e9es :<\/b> Avant de publier votre enqu\u00eate, demandez-vous si certaines donn\u00e9es peuvent \u00eatre mises \u00e0 la disposition du public ou communiqu\u00e9es aux lecteurs pour leur permettre de mieux comprendre le sujet trait\u00e9. Vous pouvez les pr\u00e9senter via un graphique interactif \u00e0 partir duquel les lecteurs ont \u00e9ventuellement la possibilit\u00e9 de t\u00e9l\u00e9charger les donn\u00e9es. Pensez \u00e9galement \u00e0 r\u00e9diger un document annexe sur votre m\u00e9thodologie, qui explique la nature des donn\u00e9es et la fa\u00e7on dont elles ont \u00e9t\u00e9 trait\u00e9es.<\/li>\n<\/ul>\n<p>N\u2019oubliez pas que les lecteurs ne raffolent pas toujours des donn\u00e9es brutes. Ainsi, pour que les donn\u00e9es soient comprises, pr\u00e9parez soigneusement une narration et une pr\u00e9sentation visuelle cr\u00e9atives.<\/p>\n<p>Les enqu\u00eates data ont l\u2019avantage de vous permettre de communiquer les donn\u00e9es par divers moyens. Les r\u00e9sultats peuvent notamment \u00eatre pr\u00e9sent\u00e9s sous la forme d\u2019un tweet, d\u2019une publication TikTok ou via une infographie ou une vid\u00e9o. Les r\u00e9dactions font souvent appel \u00e0 plusieurs m\u00e9thodes pour les associer aux enqu\u00eates imprim\u00e9es ou vid\u00e9o.<\/p>\n<p>Les visualisations des donn\u00e9es peuvent faciliter le d\u00e9roulement de l\u2019enqu\u00eate et \u00e9galement constituer le produit final.<\/p>\n<p>Pour terminer, optimisez ce processus en impliquant des graphistes et d\u2019autres \u00e9quipes \u00e0 un stade pr\u00e9coce. S\u2019ils interviennent plus tard, ils n\u2019auront pas suffisamment de temps pour pr\u00e9senter au mieux les donn\u00e9es visuelles.<\/p>\n<h4><b>Autres points \u00e0 prendre en compte<\/b><\/h4>\n<p><b>Fact-checking<\/b><\/p>\n<p>Lorsque vous travaillez avec des donn\u00e9es, r\u00e9servez du temps pour le fact-checking\u00a0:<\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Si des donn\u00e9es ont \u00e9t\u00e9 saisies manuellement dans une feuille de calcul, v\u00e9rifiez qu\u2019elles sont correctes. Si vous disposez de suffisamment de ressources, demandez \u00e0 des personnes n\u2019ayant pas particip\u00e9 au traitement des donn\u00e9es de v\u00e9rifier les donn\u00e9es saisies. Selon leur complexit\u00e9, vous pouvez pr\u00e9voir deux \u00e0 trois phases de v\u00e9rification.<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Si quelqu\u2019un a analys\u00e9 les donn\u00e9es, r\u00e9analysez-les pour vous assurer que vous obtenez les m\u00eames r\u00e9sultats. Dans ce cas, c\u2019est une autre personne qui doit les r\u00e9analyser et proc\u00e9der au fact-checking.<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Pr\u00e9voyez du temps pour v\u00e9rifier la pr\u00e9sentation des r\u00e9sultats de l\u2019analyse dans l\u2019enqu\u00eate, et dans le contexte voulu. V\u00e9rifiez \u00e9galement les visualisations et les \u00e9l\u00e9ments interactifs pour vous assurer qu\u2019ils refl\u00e8tent les informations et les r\u00e9sultats de l\u2019analyse des donn\u00e9es.<\/li>\n<\/ul>\n<p>N\u2019oubliez pas qu\u2019en garantissant la fiabilit\u00e9 \u00e0 toute \u00e9preuve des donn\u00e9es, vous garantissez \u00e9galement celle de l\u2019enqu\u00eate publi\u00e9e.<\/p>\n<h4><b>Travail collaboratif avec les donn\u00e9es<\/b><\/h4>\n<p>Toute op\u00e9ration impliquant des donn\u00e9es peut n\u00e9cessiter un ou une data-journaliste ou une \u00e9quipe charg\u00e9e du traitement des donn\u00e9es. Dans bien des cas, le travail effectu\u00e9 sur un ensemble de donn\u00e9es demande l\u2019intervention de plusieurs personnes, selon l\u2019ampleur des donn\u00e9es et les ressources de l\u2019organisation.<\/p>\n<p>Lorsque vous communiquez des donn\u00e9es \u00e0 d\u2019autres organisations ou m\u00eame \u00e0 vos coll\u00e8gues en interne, n\u2019oubliez pas d\u2019en indiquer la provenance et les limites en expliquant comment elles ont \u00e9t\u00e9 analys\u00e9es.<\/p>\n<p>Les \u00e9quipes charg\u00e9es du traitement des donn\u00e9es peuvent \u00e9galement pr\u00e9senter des comp\u00e9tences mixtes et compter, au sein d\u2019une m\u00eame \u00e9quipe, des experts en mati\u00e8re de recherche et d\u2019analyse des donn\u00e9es, ainsi que des d\u00e9veloppeurs. Lorsque l\u2019\u00e9chelle des donn\u00e9es, ainsi que leur structure et leur format, sont complexes, l\u2019intervention d\u2019une \u00e9quipe multidisciplinaire peut \u00eatre tr\u00e8s b\u00e9n\u00e9fique et contribuer favorablement \u00e0 l\u2019avancement du travail.<\/p>\n<p>Les enqu\u00eates impliquant l\u2019utilisation d\u2019ensembles volumineux de donn\u00e9es peuvent donc n\u00e9cessiter un travail d\u2019\u00e9quipe qui regroupe des reporters, des data-journalistes, des chercheurs, des personnes charg\u00e9es du fact-checking, des producteurs en ligne, des r\u00e9dacteurs en chef et des intervenants sans formation journalistique.<\/p>\n<p>Par exemple, les ing\u00e9nieurs peuvent d\u00e9velopper des outils qui r\u00e9pondent aux besoins des journalistes, ainsi que des mod\u00e8les d\u2019apprentissage automatique qui passent au crible des millions d\u2019enregistrements, utiliser la technologie au service des journalistes et faciliter le traitement de millions d\u2019enregistrements.<\/p>\n<p>Les donn\u00e9es peuvent \u00e9galement avoir un impact consid\u00e9rable dans le cadre de collaborations internationales, car elles permettent de connecter les journalistes de diff\u00e9rents pays pendant qu\u2019ils travaillent ensemble.<\/p>\n<p>Toutefois, il est parfois n\u00e9cessaire de solliciter l\u2019aide d\u2019organisations qui int\u00e8grent des \u00e9quipes plus importantes et plus exp\u00e9riment\u00e9es de sp\u00e9cialistes du traitement des donn\u00e9es. C\u2019est pourquoi les journalistes ou les \u00e9quipes peuvent envisager de collaborer avec des organisations comme <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.icij.org\/\">ICIJ<\/a>, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.occrp.org\/en\">OCCRP<\/a>, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/pulitzercenter.org\/\">Pulitzer Center<\/a> ou <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.lighthousereports.com\/\">Lighthouse Reports<\/a>, ou travailler en partenariat avec une universit\u00e9 dot\u00e9e d\u2019un d\u00e9partement des sciences informatiques. En effet, dans ces organisations, les \u00e9quipes d\u00e9di\u00e9es aux donn\u00e9es sont plus importantes que celles de la plupart des r\u00e9dactions qui ne comptent qu\u2019un ou deux sp\u00e9cialistes des donn\u00e9es.<\/p>\n<aside>Lorsque vous communiquez des donn\u00e9es \u00e0 d\u2019autres organisations ou m\u00eame \u00e0 vos coll\u00e8gues en interne, n\u2019oubliez pas d\u2019en indiquer la provenance et les limites en expliquant comment elles ont \u00e9t\u00e9 analys\u00e9es.<\/aside>\n<p>Enfin, lorsque vous collaborez avec des \u00e9quipes interdisciplinaires, il est essentiel que ces derni\u00e8res communiquent entre elles tout au long du processus, pour s\u2019assurer que tout le monde est sur la m\u00eame longueur d\u2019onde et comprend bien les objectifs du projet, ainsi que les moyens d\u2019y parvenir.<\/p>\n<p><b>Bo\u00eete \u00e0 outils<\/b><\/p>\n<p>Novice en mati\u00e8re de donn\u00e9es\u00a0? Voici certains cours et outils susceptibles de vous int\u00e9resser\u00a0:<\/p>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Pour bien ma\u00eetriser les feuilles de calcul, consultez la ressource <a href=\"https:\/\/gijn.org\/resource\/guide-basics-google-sheets-journalists\/\">Basics of Google Sheets<\/a> de Mark Horvit. <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.coursera.org\/\">Coursera<\/a> ou <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.edx.org\/\">edX<\/a> proposent \u00e9galement des formations vid\u00e9o gratuites sur Excel, ou vous pouvez consulter la page suivante\u00a0: <a href=\"https:\/\/gijn.org\/stories\/eight-simple-ways-to-let-the-spreadsheet-do-the-math-so-you-can-focus-on-the-story\/\">Let the Sheet Do the Math so You Can Focus on the Story<\/a> de Brant Houston.<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">The Data Journalism Handbook <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/datajournalism.com\/read\/handbook\/one\">1<\/a> et <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/datajournalism.com\/read\/handbook\/two\">2<\/a> publi\u00e9s par le European Journalism Centre.<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.python.org\/\">Python<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.r-project.org\/\">R<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.postgresql.org\/\">SQL<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/openrefine.org\/\">Open Refine<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Outils de traitement de documents PDF tels que<\/li>\n<\/ul>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"2\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/tabula.technology\/\">Tabula<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"2\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/rs1.es\/tutorials\/2021\/10\/30\/poppler-pdf-tools.html\">Poppler<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"2\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/azhar-sayyad.medium.com\/a-step-by-step-guide-to-parsing-pdfs-using-the-pdfplumber-library-in-python-c12d94ae9f07\">pdfplumber\/pdfminer\u00a0<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"2\">Outils de traitement de fichiers, d\u2019exploration et de collaboration :<\/li>\n<\/ul>\n<ul>\n<li style=\"font-weight: 400;\" aria-level=\"3\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/aleph.occrp.org\/\">Aleph<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"3\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/datashare.icij.org\/\">Datashare<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"3\"><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/nina.elclip.org\/login\">Nina<\/a><\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">Utilisation de la ligne de commande. Utilisez la ressource <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.youtube.com\/@MissingSemester\">Missing Semester at MIT<\/a> pour comprendre les notions de base de la ligne de commande. Un coll\u00e8gue, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.occrp.org\/en\/staff\/eric-barrett\">Eric Barrett<\/a>, a recommand\u00e9 cette ressource \u00e0 des coll\u00e8gues du projet OCCRP qui commen\u00e7aient \u00e0 travailler avec la ligne de commande.<\/li>\n<li style=\"font-weight: 400;\" aria-level=\"1\">L\u2019universit\u00e9 Columbia propose \u00e9galement un r\u00e9capitulatif des <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/data.journalism.columbia.edu\/tools\">ressources dans le domaine du data-journalisme<\/a>. Le <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/journalismcourses.org\/course-library\/\">Knight Center for Journalism in the Americas<\/a>, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/datajournalism.com\/search\/courses\">Datajournalism.com<\/a> et <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.ire.org\/training\/bootcamps\/\">l\u2019IRE<\/a> proposent des cours et des ressources qui expliquent comment utiliser certains outils et langages de programmation.<\/li>\n<\/ul>\n<p>Vous pouvez \u00e9galement vous former durant des conf\u00e9rences sur le journalisme d\u2019investigation organis\u00e9es de par le monde, notamment les conf\u00e9rences <a rel=\"noopener\" target=\"_blank\" href=\"http:\/\/www.gijc25.org\">GIJ<\/a>C de GIJN, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/dataharvest.eu\/\">Dataharvest<\/a>, la <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/aijc.africa\/\">conf\u00e9rence africaine sur le journalisme d\u2019investigation (AIJC)<\/a>, la conf\u00e9rence latino-am\u00e9ricaine <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/colpin.ipys.org\/\">COLPIN<\/a>, la conf\u00e9rence du <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/arij24.arij.net\/en.html\">forum annuel d\u2019ARIJ<\/a> ou le programme <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.ire.org\/training\/conferences\/\">NICAR de l\u2019organisation IRE<\/a>, entre autres.<\/p>\n<h4>\u00c9tudes de cas<\/h4>\n<p><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/africauncensored.online\/category\/captured\/\"><b>Captured<\/b><\/a><b> \u2014 Africa Uncensored<\/b><\/p>\n<p>Cette s\u00e9rie a explor\u00e9 des cas de corruption au Kenya li\u00e9s \u00e0 \u201cdes acquisitions frauduleuses et \u00e0 des appels d\u2019offres douteux au sein du gouvernement et des agences gouvernementales\u201d. Le projet a pass\u00e9 en revue des informations sur des acquisitions publiques et a examin\u00e9 de pr\u00e8s des connexions impliquant des fonctionnaires ou d\u2019autres parties prenantes qui, via plusieurs entreprises, ont b\u00e9n\u00e9fici\u00e9 d\u2019avantages durant les processus d\u2019appels d\u2019offres.<\/p>\n<p><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.financeuncovered.org\/investigations\/english-limited-partnerships-formations-agencies\"><b>Agents of Secrecy<\/b><\/a><b> \u2014 Finance Uncovered, BBC, Seychelles Broadcasting Corporation<\/b><\/p>\n<p>Cette enqu\u00eate est le fruit d\u2019une collaboration entre des journalistes qui ont <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/find-and-update.company-information.service.gov.uk\/\">analys\u00e9 des donn\u00e9es publiques sur des entreprises au Royaume-Uni<\/a>, ainsi que des milliers de documents divulgu\u00e9s, pour retrouver la trace \u201cdes cerveaux et sbires associ\u00e9s \u00e0 certaines des agences de secrets professionnels affili\u00e9es \u00e0 la Russie parmi les plus actives\u201d. L\u2019enqu\u00eate s\u2019est int\u00e9ress\u00e9e \u00e0 l\u2019exploitation d\u2019entreprises anonymes au Royaume-Uni par des responsables d\u2019op\u00e9rations de blanchiment de capitaux de diverses r\u00e9gions de l\u2019ex-Union sovi\u00e9tique.<\/p>\n<p><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.lighthousereports.com\/methodology\/suspicion-machine\/\"><b>Inside the Suspicion Machine<\/b><\/a><b> \u2014 Lighthouse Reports, WIRED, Vers Beton, Open Rotterdam<\/b><\/p>\n<p>\u201cPendant deux\u00a0ans, Lighthouse Reports a recherch\u00e9 activement la trinit\u00e9 de la redevabilit\u00e9 algorithmique, \u00e0 savoir les donn\u00e9es d\u2019entra\u00eenement, le fichier de mod\u00e8le et le code d\u2019un syst\u00e8me utilis\u00e9 par une agence gouvernementale pour automatiser l\u2019\u00e9valuation des risques pour les citoyens souhaitant b\u00e9n\u00e9ficier de services gouvernementaux.\u201d Apr\u00e8s avoir obtenu ce qu\u2019elle recherchait, l\u2019\u00e9quipe a analys\u00e9 l\u2019algorithme d\u2019\u00e9valuation des risques et d\u00e9couvert qu\u2019il ciblait les personnes en fonction de leur langue maternelle, de leur sexe et de leurs choix vestimentaires.<\/p>\n<p><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.icij.org\/investigations\/pandora-papers\/about-pandora-papers-leak-dataset\/%C2%A0\"><b>Pandora Papers<\/b><\/a><b> \u2013 ICIJ et 150\u00a0partenaires m\u00e9dias<\/b><\/p>\n<p>Pendant pr\u00e8s de deux\u00a0ans, des reporters se sont plong\u00e9s dans plus de 11,5\u00a0millions d\u2019enregistrements aux formats vari\u00e9s li\u00e9s \u00e0 14\u00a0fournisseurs de services offshore, pour publier des enqu\u00eates exposant un \u201csyst\u00e8me financier fictif au service des personnes les plus riches et les plus puissantes au monde\u201d, tout en citant des noms. Ils ont proc\u00e9d\u00e9 en combinant des techniques d\u2019enqu\u00eate traditionnelles et une analyse avanc\u00e9e des donn\u00e9es. L\u2019\u00e9quipe a utilis\u00e9 <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/datashare.icij.org\/\">Datashare<\/a> pour traiter et partager les fichiers en toute s\u00e9curit\u00e9 avec plus de 600\u00a0reporters de par le monde. Elle a fait appel \u00e0 divers outils et approches pour analyser les donn\u00e9es, notamment l\u2019apprentissage automatique, des langages de programmation comme Python, le traitement manuel des donn\u00e9es et des bases de donn\u00e9es graphes (<a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/neo4j.com\/\">neo4j<\/a> et <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.google.com\/search?q=linkurious&amp;oq=linkurious&amp;gs_lcrp=EgZjaHJvbWUyBggAEEUYOdIBCDQ1MThqMGo0qAIAsAIA&amp;sourceid=chrome&amp;ie=UTF-8\">Linkurious<\/a>).<\/p>\n<hr \/>\n<p><b><i><\/i><\/b><b><i><a href=\"https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Purity-Mukami.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft wp-image-1893971 size-thumbnail\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Purity-Mukami-140x140.jpg\" alt=\"\" width=\"140\" height=\"140\" \/><\/a>Purity Mukami<\/i><\/b> <i>est une statisticienne devenue data-journaliste. Pendant sept\u00a0ans, gr\u00e2ce \u00e0 ses comp\u00e9tences en mati\u00e8re de donn\u00e9es, elle a contribu\u00e9 \u00e0 des enqu\u00eates et des projets tels que FinCENFiles, Pandora Papers, Agent of Secrecy et Captured, entre autres. Elle a travaill\u00e9 pour Africa Uncensored, BBC Africa Eye, Finance Uncovered, et occupe actuellement le poste de data-journaliste pour l\u2019Afrique dans le cadre du projet OCCRP. Elle a collabor\u00e9 avec diverses autres organisations enqu\u00eatant sur la corruption, suivant la piste de l\u2019argent et d\u00e9tectant les instances de d\u00e9sinformation pendant les \u00e9lections.<\/i><\/p>\n<p><b><i><\/i><\/b><b><i><a href=\"https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Emilia-Diaz-Struck.jpg\"><img loading=\"lazy\" decoding=\"async\" class=\"alignleft size-thumbnail wp-image-1893994\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Emilia-Diaz-Struck-140x140.jpg\" alt=\"\" width=\"140\" height=\"140\" srcset=\"https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Emilia-Diaz-Struck-140x140.jpg 140w, https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Emilia-Diaz-Struck-336x336.jpg 336w, https:\/\/gijn.org\/wp-content\/uploads\/2024\/11\/Emilia-Diaz-Struck.jpg 427w\" sizes=\"auto, (max-width: 140px) 100vw, 140px\" \/><\/a>Emilia D\u00edaz-Struck <\/i><\/b><i>est directrice ex\u00e9cutive du R\u00e9seau international de journalisme d\u2019investigation. Elle \u00e9tait auparavant r\u00e9dactrice en chef des donn\u00e9es et de la recherche et coordinatrice pour l\u2019Am\u00e9rique latine au Consortium international des journalistes d\u2019investigation (ICIJ). Pendant plus d\u2019une d\u00e9cennie, Mme D\u00edaz-Struck a particip\u00e9 \u00e0 plus de 20\u00a0collaborations d\u2019enqu\u00eate prim\u00e9es par l\u2019ICIJ, notamment\u00a0: Offshore Leaks, Implant Files, FinCEN Files, Pandora Papers et les Panama Papers, r\u00e9compens\u00e9s par un prix Pulitzer. Elle a \u00e9t\u00e9 pionni\u00e8re en mati\u00e8re de data-journalisme et de collaborations d\u2019investigation dans son pays natal, le Venezuela, et a servi de mentor \u00e0 des centaines de reporters latino-am\u00e9ricains. Emilia a enseign\u00e9 des s\u00e9minaires d\u2019\u00e9t\u00e9 sur le data-journalisme et les collaborations transfrontali\u00e8res d\u2019investigation \u00e0 l\u2019universit\u00e9 Columbia de New York. Elle a \u00e9t\u00e9 professeure \u00e0 l\u2019Universit\u00e9 centrale du Venezuela et collaboratrice du Washington Post, du magazine Poder y Negocios, des m\u00e9dias v\u00e9n\u00e9zu\u00e9liens El Universal, El Mundo et Armando.info, qu\u2019elle a cofond\u00e9.<\/i><\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>\u00c0 mesure que l&rsquo;utilisation de l&rsquo;Internet s&rsquo;est r\u00e9pandue et que des quantit\u00e9s croissantes de donn\u00e9es sont apparues, le terme \u00ab\u00a0journalisme de donn\u00e9es\u00a0\u00bb est apparu pour d\u00e9crire les enqu\u00eates aliment\u00e9es par des donn\u00e9es et des analyses.<\/p>\n","protected":false},"author":3031173,"featured_media":1894019,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_price":"","_stock":"","_tribe_ticket_header":"","_tribe_default_ticket_provider":"","_tribe_ticket_capacity":"0","_ticket_start_date":"","_ticket_end_date":"","_tribe_ticket_show_description":"","_tribe_ticket_show_not_going":false,"_tribe_ticket_use_global_stock":"","_tribe_ticket_global_stock_level":"","_global_stock_mode":"","_global_stock_cap":"","_tribe_rsvp_for_event":"","_tribe_ticket_going_count":"","_tribe_ticket_not_going_count":"","_tribe_tickets_list":"[]","_tribe_ticket_has_attendee_info_fields":false,"republication-tracker-tool-hide-widget":false,"footnotes":"","_tec_slr_enabled":"","_tec_slr_layout":""},"categories":[23095,23094,23092],"tags":[22912,24658,21250],"gijn_topic":[18641,18634,25118],"series":[],"gijn_language":[],"gijn_region":[],"class_list":["post-2095820","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-chapitre","category-guide-fr","category-ressource","tag-apprendre-le-journalisme-dinvestigation","tag-data-journalism-fr","tag-data-journalisme-fr","gijn_topic-nouvelles-et-analyses","gijn_topic-journalisme-de-donnees","gijn_topic-debuter-dans-le-journalisme-dinvestigation"],"acf":[],"ticketed":false,"_links":{"self":[{"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/posts\/2095820","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/users\/3031173"}],"replies":[{"embeddable":true,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/comments?post=2095820"}],"version-history":[{"count":6,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/posts\/2095820\/revisions"}],"predecessor-version":[{"id":2095830,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/posts\/2095820\/revisions\/2095830"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/media\/1894019"}],"wp:attachment":[{"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/media?parent=2095820"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/categories?post=2095820"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/tags?post=2095820"},{"taxonomy":"gijn_topic","embeddable":true,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/gijn_topic?post=2095820"},{"taxonomy":"series","embeddable":true,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/series?post=2095820"},{"taxonomy":"gijn_language","embeddable":true,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/gijn_language?post=2095820"},{"taxonomy":"gijn_region","embeddable":true,"href":"https:\/\/gijn.org\/fr\/wp-json\/wp\/v2\/gijn_region?post=2095820"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}