आलेख

विषय

खोजी पत्रकारिता: मुश्किल सूचनाएं निकालने के उपकरण

इस लेख को पढ़ें

आधुनिक तकनीक के विकास ने पत्रकारों को काफी शक्तिशाली उपकरण प्रदान किए हैं। खोजी या वाचडॉग पत्रकारों के पास अब जांच के लिए काफी अधिसंरचना उपलब्ध है। जिन विषयों पर डेटा मिलना काफी मुश्किल हो, वैसे मामलों के विश्वस्तरीय डेटासेट भी आप निकाल सकते हैं। विभिन्न किस्म के सोफ्टवेयर तथा ओपनसोर्स टूल्स भी मौजूद हैं। बारहवीं ग्लोबल इन्वेस्टिगेटिव जर्नलिज्म कॉन्फ्रेंस में इन पर चर्चा हुई। दुनिया भर के पत्रकारों को इन तकनीकों का उपयोग करने की सलाह दी गई।

जीआइजेसी-21 में एक ‘लाइटनिंग राउंड‘ सत्र रखा गया। ऐसे सत्र में वक्ताओं को पांच या दस मिनट के भीतर प्रस्तुति का अवसर मिलता है। इसके पैनल में शामिल पत्रकारों और संपादकों को पांच-पांच मिनट का समय दिया गया। विषय था- ‘जिन विषयों पर तथ्य जुटाना मुश्किल हो, वैसे मामलों की रिपोर्टिंग के लिए नए आइडिया।‘ यानी, मुश्किल तथ्य जुटाने कैसे जुटाएं पत्रकार?

पैनल के दिग्गज पत्रकारों के सुझाव यहां प्रस्तुत हैं:

चेहरे की पहचान (फेसियल रिकॉग्निशन)

चेहरे की पहचान करने वाला एक उपयोगी टूल है:  ‘फाइंड क्लोन’ (Findclone)। इसके जरिए आप किसी कानून प्रवर्तन एजेंसियों के भीतर मौजूद नव-नाजी चरमपंथियों की पहचान कर सकते हैं। स्वतंत्र पत्रकार सेबेस्टियन बॉर्डन ने इस टूल की जानकारी दी। उन्होंने कहा कि यह टूल रसियन फेसबुक ‘वीके‘ (VKontakte) की किसी प्रोफाइल फोटो से मैच करने वाली पांच फोटो दिखा सकता है। किसी फोटो को इसमें डालकर सर्च करें, तो पता चल सकता है कि यह किसकी प्रोफाइल फोटो है। यह डिलीट किए जा चुके एकाउंट्स के फोटो भी ढूंढ सकता है।

खोजी गैर-लाभकारी संगठन ‘बेलिंगकैट‘ के अनुसार ‘वीके‘ पर मौजूद किसी व्यक्ति की तलाश में ‘फाइंड क्लोन‘ काफी उपयोगी है। लेकिन चेहरे की पहचान करने वाले ऐसे सॉफ्टवेयर से जुड़े महत्वपूर्ण नैतिक पहलुओं पर भी पत्रकारों को विचार करना चाहिए। ऐसे सिस्टम का नापाक उद्देश्यों के तहत दुरूपयोग नहीं होना चाहिए।

क्राउड सोर्सिंग (नागरिकों से तथ्य मंगाना)

इमेज: स्क्रीनशॉट

जिन विषयों पर तथ्य जुटाना मुश्किल हो, उनके लिए क्राउड सोर्सिंग भी एक अच्छा तरीका है। ‘क्राउड न्यूजरूम‘ (CrowdNewsroom) जैसे टूल के जरिए क्राउडसोर्सिंग करके डेटा और साक्ष्य जुटाने का प्रयास करें। ‘क्राउड न्यूजरूम‘ (स्विटजरलैंड) के निदेशक मार्क एंगेलहार्ड्ट ने इसकी जानकारी दी। उनके अनुसार यह टूल पत्रकारों को आम नागरिकों से तथ्य मंगाने का अवसर देता है। इसका उपयोग बेहद आसान है। इसमें ड्रैग-एंड-ड्रॉप संपादन टूल के साथ डेटा स्टोरी बनाने, आई हुई जानकारी का विश्लेषण और सत्यापन करने की सुविधा है। नागरिक अपने डेटा या व्यक्तिगत स्टोरीज को इसमें साझा कर सकते हैं।

करेक्टिव (Correctiv) नामक मीडिया संगठन ने कई जांच के लिए ‘क्राउड न्यूजरूम‘ का इस्तेमाल किया। इसमें एक यूरोपीय राजनीतिक दल के पोस्टर अभियान में खर्च हुई राशि की जांच भी गई। इसमें 3500 लोगों से डेटा मिला।

मार्क एंगेलहार्ड्ट ने कहा- “क्राउड सोर्सिंग की यह विधि जनता से सूचना जुटाने पर निर्भर करती है। इसलिए ऐसे किसी अभियान में गैरसरकारी संगठनों और मीडिया संगठनों के साथ ही सामाजिक संगठनों का सहयोग लेने तथा ऑफलाइन प्रचार की भी आवश्यकता होती है।“

डेटाबेस का उपयोग करें

अब दुनिया के महत्वपूर्ण विषयों से जुड़े डेटा का खजाना कई तरह के ‘डेटाबेस‘ में उपलब्ध है। पत्रकारों को ऐसे टूल्स की जानकारी हो, तो मुश्किल डेटा भी आसानी से मिल सकते हैं। ऐसा ही एक टूल है: एलेफ (Aleph)। यह खोजी पत्रकारिता के लिए दुनिया भर की महत्वपूर्ण शोध सामग्री का आर्काइव या भंडार है। यह ओर्गेनाइज्ड क्राइम एंड करप्शन रिपोर्टिंग प्रोजेक्ट (OCCRP) द्वारा संचालित है।

ओसीसीआरपी के डेटा संपादक जेन स्ट्रोजिक ने ‘एलेफ‘ के बारे में बताया। उन्होंने कहा कि यह खोजी अनुसंधान के लिए एक इंटरैक्टिव ग्लोबल आर्काइव है। यानी दुनिया भर की सूचनाओं का ऐसा भंडार, जिसके साथ आप दोतरफा संवाद कर सकते हैं। उन्होंने कहा- “पत्रकारिता में डेटा-आधारित जांच किसी आइसबर्ग (हिमखंड) जैसी होती है। इसमें काम का बड़ा हिस्सा पानी के नीचे होता है। जैसे, सूचना जुटाना, उनकी छंटाई और जांच करके भरोसेमंद जानकारी के रूप में बदलना। आमतौर पर पाठकों को आपकी इतनी मेहनत का पता नहीं चल पाता है। लेकिन ‘एलेफ‘ के संग्रह में कई विशेषताएं हैं, जिनसे पत्रकारों डेटा जुटाने और उसके प्रसंस्करण के थकाने वाले काम में मदद मिल सकती है।“

जेन स्ट्रोजिक ने कहा कि ‘एलेफ‘ में फिलहाल 309 सार्वजनिक डेटासेट का भंडार है। इसमें 200 डेटा स्क्रैपर और 150 मिलियन से अधिक संस्थाओं के डेटा शामिल हैं। इस डेटा प्लेटफॉर्म में पत्रकार अपने सहयोगियों के साथ अपनी जांच और डेटा को सुरक्षित रूप से साझा कर सकते हैं। इसमें किसी भी प्रकार की फाइल को अपलोड करने, विभिन्न स्क्रिप्ट में खोज करने और डेटा को क्लिक करने योग्य ग्राफिक्स में बदलने की सुविधा देता है, जिसमें आगे का कनेक्शन भी दिख सकता है।

‘माइन एलर्ट्स‘ #MineAlerts tool एक अन्य उपयोगी टूल है। इसे पर्यावरण की जांच करने वाली गैर-लाभकारी संस्था ‘ऑक्सपेकर्स‘ (Oxpeckers) ने विकसित किया है। इसके जरिए आप दक्षिणी अफ्रीका में खनन हेतु आवेदनों और नियमों के अनुपालन का पता लगा सकते हैं। पत्रकारों को इससे जानकारी मिल सकती है कि कोयला उद्योग किस तरह काम कर रहा है।

इमेज: स्क्रीनशॉट

‘ऑक्सपेकर्स‘ की पत्रकार और डेटा मैनेजर एंडिसवा माटिकिन्का ने ‘माइन एलर्ट्स‘ टूल की जानकारी दी। इसके तहत जियो-पत्रकारिता टूल के साथ एक डिजिटल डेटाबेस को जोड़ा गया है। इसमें माइनिंग लाइसेंस के लिए आए आवेदनों और कार्यरत खदानों से जुड़े दस्तावेज भी शामिल हैं। खदान के आसपास पानी के उपयोग संबंधी महत्वपूर्ण मुद्दे की जानकारी भी इसमें शामिल है।

ऑफशोर लीक्स डेटाबेस (Offshore Leaks Database) भी सूचनाओं का एक बड़ा खजाना है। इसमें ऐसी कंपनियों का डेटा मिलता है, जो अन्य देशों में रहकर काम करती हैं। अपने देश के कानूनों और टैक्स प्रणाली से बचने के लिए ऑफशोर कंपनियां ऐसा करती हैं। इंटरनेशनल कंसोर्टियम ऑफ इंवेस्टिगेटिव जर्नलिस्ट्स (आईसीआईजे)  के डेटा जर्नलिस्ट डेल्फिन रॉयटर  ने इसकी जानकारी दी। उन्होंने कहा कि इस ‘फ्री एवं ओपनसोर्स’ डेटाबेस में अब तक आठ लाख कंपनियों का डेटा मौजूद है। पेंडोरा पेपर्स के डेटा जुड़ने के बाद यह संख्या बढ़ जाएगी।

डेल्फिन रॉयटर ने ‘ऑफशोर लीक्स डेटाबेस‘ टूल का उपयोग करने के संबंध में कई सुझाव दिए:

  • अपनी खोज (सर्च) में आप वैकल्पिक वर्तनी आजमाएं। कोई नाम नहीं मिले, तो अलग तरह से लिखकर देखें। जैसे किसी कंपनी के नाम के अंत में ‘लिमिटेड‘ लिखने से न मिले, तो इसे संक्षेप में ‘एलटीडी‘ लिखकर देखें। ‘कारपोरेशन‘ न मिले तो इसे भी शाॅर्ट में लिखकर सर्च करें। नामों के साथ उद्धरण चिह्नों का प्रयोग करें।
  • डेटाबेस के ‘पावर प्लेयर्स‘ खंड में हरेक डेटा के साथ उसके स्रोत और तारीख की जानकारी दी गई है। उस पर ध्यान दें। उसमें ‘पनामा पेपर्स‘ और ‘पैराडाइज पेपर्स‘ जैसे बड़े खुलासे शामिल हैं। यह भी याद रखें कि उस डेटाबेस में प्रस्तुत डेटा उस जांच के समय का एक स्नैपशॉट है। उसके बाद के उसमें कोई बदलाव संभव है। इसलिए ताजा डेटा के लिए अपडेटेड कॉरपोरेट रजिस्ट्रियों की भी जांच करनी चाहिए।
  • डेटाबेस में नाम, पते और देश के आधार पर खोज की सुविधा है। सही परिणामों के लिए ‘अधिकार क्षेत्र‘ (ज्यूरिडिक्शन) श्रेणी के तहत ट्रस्टों और अपतटीय (ऑफशोर) कंपनियों को खोजना उपयोगी है।

देश-केंद्रित संसाधनों का पता लगाएं

यूक्रेन के मीडिया संगठन बिहुस डॉट इन्फो (Bihus.info) के आईटी विशेषज्ञ दिमित्री चैपलिंस्की ने भी महत्वपूर्ण जानकारी दी। उन्होंने कहा कि कई देशों के डेटा संबंधी कुछ खास संसाधन होते हैं। आपको जिस देश में रिपोर्टिंग करनी है, वहां के ऐसे विशेष डेटाबेस और टूल्स का पता लगाएं।

दिमित्री चैपलिंस्की ने बताया कि यूक्रेन और कजाकिस्तान जैसे देशों के नए रिकॉर्ड डेटाबेस उपलब्ध हैं। इन देशों की सार्वजनिक रजिस्ट्रियों, संपत्ति प्रकटीकरण दस्तावेजों, सार्वजनिक खरीद डेटा और अन्य सार्वजनिक रिकॉर्ड की तलाश करने वाले पत्रकारों को दो ओपनसोर्स डेटाबेस की जांच करनी चाहिए। इन्हें नियमित रूप से अपडेट किया जाता है। इनमें पहला है: ‘रिंग‘ (Ring), जो यूक्रेन में 29 मिलियन सार्वजनिक रिकॉर्ड के साथ 20 से अधिक डेटाबेस का एक दस्तावेज खोज इंजन है। रिंग में यूक्रेनी, अंग्रेजी और रूसी भाषा में सर्च किया जा सकता है। दूसरा है: ‘ओपन बेस‘ (Open Base) जो कजाकिस्तान के लिए लगभग एक दर्जन डेटा स्रोतों के साथ एक डेटा भंडार है।

प्रतिदिन उपयोग लायक पांच रिपोर्टिंग टूल्स

नए टूल काफी रोमांचक होते हैं। उनका सही उपयोग करना आपको सीखना होगा। ‘अल-जजीरा मीडिया नेटवर्क‘ के डेटा संपादक मोहम्मद हद्दाद  ने पांच रिपोर्टिंग टूल्स की जानकारी दी। वह इनका प्रतिदिन उपयोग करते हैं।

मैपबॉक्स (Mapbox) और मैपबॉक्स स्क्रॉलीटेलिंग फीचर (Scrollytelling feature) – किसी स्टोरी में यदि भूगोल या भौगोलिक संरचना के उपयोग करने का यह अच्छा उपकरण है। मोहम्मद हद्दाद ने कहा कि यह मेरा पसंदीदा मैपिंग टूल है। इसके जरिए आप अपने पाठकों को दुनिया भर की यात्रा पर ले जा सकते हैं। हम अपने पाठकों को नील नदी तक ले गए। हमने भारत और चीन के बीच विवादित सीमा क्षेत्र को भी इसके जरिए दिखाया।

निवो (Nivo) – यह एक शानदार डेटा विजुअलाइजेशन टूल है। इसमें विस्तृत डेटा विजुअलाइजेशन सेट करने के लिए बेहद कम कोड की आवश्यकता होती है। ‘अल जजीरा‘ ने निवो का इस्तेमाल करके एक महत्वपूर्ण विश्लेषण किया। विषय था- ‘प्रमुख मुद्दों पर संयुक्त राष्ट्र में विभिन्न देशों द्वारा 1946 से अब तक मतदान का विश्लेषण‘

एएमपी स्टोरीज (AMP Stories)- यह मोबाइल आधारित पहला वेब स्टोरीटेलिंग प्लेटफॉर्म है। यह बेहद आसान है। यह चरित्र-आधारित सुविधाओं के लिए बहुत अच्छा है। यह मोबाइल फोन में बहुत अच्छा काम करता है, जहां से आपका अधिकांश ट्रैफिक आने की संभावना है। मोहम्मद हद्दाद ने कहा कि हमने ‘100 फेसेस ऑफ रोहिंग्या‘ के लिए एएमपी स्टोरीज का इस्तेमाल किया। हमने संयुक्त राज्य अमेरिका, फिलिस्तीन और म्यांमार में अश्वेत लोगों की हत्या संबंधी रिपोर्टिंग में भी इसका उपयोग किया।

चार्टबीट (Chartbeat) – आपकी न्यूज स्टोरी आपके पाठकों पर कैसा असर डाल रही है, यह समझने के लिए कि चार्टबीट के रीयल-टाइम एनालिटिक्स का उपयोग करें। मोहम्मद हद्दाद ने कहा कि इससे हमें सोशल मीडिया में अपने प्रदर्शन की पूरी जानकारी मिल जाती है। इससे हमें पता चलता है कि हमारी स्टोरी को सोशल मीडिया में कहां और कितना साझा किया गया है।

आर कोडिंग और आर स्टूडियो (R Studio) – मोहम्मद हद्दाद ने कहा कि यह मेरा पसंदीदा उपकरण है। सबसे अच्छा उपकरण वह है जिसे आप प्रोग्रामिंग भाषा में बना सकते हैं। हमारी टीम डेटा एकत्र करने से लेकर संपादन तक इसका उपयोग करती है। आप इस उपकरण जरिए लगभग सब कुछ कर सकते हैं।

अल जजीरा के मोहम्मद हद्दाद ने ‘निवो‘ डेटा विजुअलाइजेशन टूल का इस्तेमाल करके 1946 से अब तक संयुक्त राष्ट्र में मतदान के पैटर्न पर नजर रखने का इंटरैक्टिव प्रोजेक्ट बनाया। इमेज: स्क्रीनशॉट

जाहिर है कि इस सत्र में बताए गए ‘टूल्स‘ खोजी पत्रकारों के लिए काफी उपयोगी हैं। इन सभी उपकरणों में एक विशेषता यह है कि इनमें बड़ी मात्रा में सूचना के प्रबंधन की क्षमता है। इनका उपयोग विभिन्न भाषाओं, लिपियों, विविध प्रकार की फाइलों और फोटो की ऑनलाइन खोज तथा अन्य कार्यों में करना संभव है।

अतिरिक्त संसाधन

Tips for Investigating When Governments Shield Crime and Corruption

Investigative Tools That Reporters Love

10 Investigative Tools You Probably Haven’t Heard Of


रोवन फिलिप जीआईजेएन में रिपोर्टर हैं। पहले वह संडे टाइम्स (दक्षिण अफ्रीका) के मुख्य संवाददाता थे। एक विदेशी संवाददाता के रूप में उन्होंने दुनिया भर के दो दर्जन से अधिक देशों से समाचार, राजनीति, भ्रष्टाचार और संघर्ष पर रिपोर्टिंग की है। उन्होंने यूके, यूएस और अफ्रीका में न्यूजरूम के लिए असाइनमेंट संपादक के रूप में भी काम किया है।

क्रिएटिव कॉमन्स लाइसेंस के तहत हमारे लेखों को निःशुल्क, ऑनलाइन या प्रिंट माध्यम में पुनः प्रकाशित किया जा सकता है।

आलेख पुनर्प्रकाशित करें


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

अगला पढ़ें

Investigating AI Audio Deepfakes

टिपशीट

फर्जी एआई ऑडियो की जांच कैसे करें

एडवांस्ड स्पीच डीपफेक के द्वारा बिल्कुल असली लगने वाले नकली ऑडियो बनाए जा सकते हैं। उसकी सच्चाई को उस व्यक्ति के नजदीकी दोस्त भी नहीं पहचान सकेंगे। ऐसे ऑडियो क्लिप की जांच के लिए विशेषज्ञ और नए उपकरणों की आवश्यकता होती है। अक्सर पत्रकार किसी नेता के बारे में अपने ज्ञान, रिकॉर्डिंग की खराब गुणवत्ता, संदर्भ या सामान्य सामान्य ज्ञान के आधार पर किसी ऑडियो क्लिप में किए गए फर्जीवाड़े को तुरंत पहचान लेते हैं।

ऐप्स की ‘प्राइवेसी पॉलिसी’ को कैसे समझें?

आम तौर पर अधिकांश प्राइवेसी पॉलिसी में एक पूर्व-अनुमानित संरचना का पालन किया जाता है। इसलिए आप उनकी तह तक जाने की कला सीख सकते हैं। उसके मुख्य हिस्सों का पता लगा सकते हैं। लंबा दस्तावेज होने के बावजूद केवल महत्वपूर्ण जानकारी को निकालने के लिए झपट्टा मार सकते हैं। आप कुछ सूचनाओं के संग्रह के आधार पर उससे बाहर निकलने या विकल्प चुनने के अवसर का लाभ उठा सकते हैं। अधिक गहराई तक जाने और अधिक व्यक्तिगत प्रकटीकरण से जुड़े बिंदुओं को भी बेहद कम समय में आसानी से समझ सकते हैं।

दीर्घकालिक खोजी रिपोर्टिंग को जारी रखने या रोकने का निर्णय कैसे लें?

संपादकों के अनुसार न्यूनतम स्टोरीज प्रकाशित करने का भी काफी महत्व है। ऐसी स्टोरी आने के बाद विस्सल-ब्लोअर सामने आते हैं। किसी संगठन के भीतर के लोग आकर कोई बड़ी जानकारी देते हैं। संपादकों के अनुसार ऐसी खबरें प्रकाशित करने के दौरान पारदर्शिता महत्वपूर्ण है। पाठकों को स्पष्ट रूप से बताना सुनिश्चित करें कि क्या साबित किया जा सकता है और क्या नहीं।

Data mining workshop scraping website GIJC23

टिपशीट

‘डेटा माइनर’ के जरिए वेबसाइटों से उपयोगी डेटा कैसे निकालें?

Data Miner डाटा निकालने का एक निःशुल्क उपकरण और ब्राउज़र एक्सटेंशन है। यह आपको वेब पेजों को खंगालने और सुरक्षित डेटा को शीघ्रता से एकत्र करने में सक्षम बनाता है। यह स्वचालित रूप से वेब पेजों से डेटा एकत्र करके एक्सेल, सीएसवी, या जेएसओएन प्रारूपों में सेव करता है।