खोजी पत्रकारिता: मुश्किल सूचनाएं निकालने के उपकरण और डेटासेट

Print More

आधुनिक तकनीक के विकास ने पत्रकारों को काफी शक्तिशाली उपकरण प्रदान किए हैं। खोजी या वाचडॉग पत्रकारों के पास अब जांच के लिए काफी अधिसंरचना उपलब्ध है। जिन विषयों पर डेटा मिलना काफी मुश्किल हो, वैसे मामलों के विश्वस्तरीय डेटासेट भी आप निकाल सकते हैं। विभिन्न किस्म के सोफ्टवेयर तथा ओपनसोर्स टूल्स भी मौजूद हैं। बारहवीं ग्लोबल इन्वेस्टिगेटिव जर्नलिज्म कॉन्फ्रेंस में इन पर चर्चा हुई। दुनिया भर के पत्रकारों को इन तकनीकों का उपयोग करने की सलाह दी गई।

जीआइजेसी-21 में एक ‘लाइटनिंग राउंड‘ सत्र रखा गया। ऐसे सत्र में वक्ताओं को पांच या दस मिनट के भीतर प्रस्तुति का अवसर मिलता है। इसके पैनल में शामिल पत्रकारों और संपादकों को पांच-पांच मिनट का समय दिया गया। विषय था- ‘जिन विषयों पर तथ्य जुटाना मुश्किल हो, वैसे मामलों की रिपोर्टिंग के लिए नए आइडिया।‘ यानी, मुश्किल तथ्य जुटाने कैसे जुटाएं पत्रकार?

पैनल के दिग्गज पत्रकारों के सुझाव यहां प्रस्तुत हैं:

चेहरे की पहचान (फेसियल रिकॉग्निशन)

चेहरे की पहचान करने वाला एक उपयोगी टूल है:  ‘फाइंड क्लोन’ (Findclone)। इसके जरिए आप किसी कानून प्रवर्तन एजेंसियों के भीतर मौजूद नव-नाजी चरमपंथियों की पहचान कर सकते हैं। स्वतंत्र पत्रकार सेबेस्टियन बॉर्डन ने इस टूल की जानकारी दी। उन्होंने कहा कि यह टूल रसियन फेसबुक ‘वीके‘ (VKontakte) की किसी प्रोफाइल फोटो से मैच करने वाली पांच फोटो दिखा सकता है। किसी फोटो को इसमें डालकर सर्च करें, तो पता चल सकता है कि यह किसकी प्रोफाइल फोटो है। यह डिलीट किए जा चुके एकाउंट्स के फोटो भी ढूंढ सकता है।

खोजी गैर-लाभकारी संगठन ‘बेलिंगकैट‘ के अनुसार ‘वीके‘ पर मौजूद किसी व्यक्ति की तलाश में ‘फाइंड क्लोन‘ काफी उपयोगी है। लेकिन चेहरे की पहचान करने वाले ऐसे सॉफ्टवेयर से जुड़े महत्वपूर्ण नैतिक पहलुओं पर भी पत्रकारों को विचार करना चाहिए। ऐसे सिस्टम का नापाक उद्देश्यों के तहत दुरूपयोग नहीं होना चाहिए।

क्राउड सोर्सिंग (नागरिकों से तथ्य मंगाना)

इमेज: स्क्रीनशॉट

जिन विषयों पर तथ्य जुटाना मुश्किल हो, उनके लिए क्राउड सोर्सिंग भी एक अच्छा तरीका है। ‘क्राउड न्यूजरूम‘ (CrowdNewsroom) जैसे टूल के जरिए क्राउडसोर्सिंग करके डेटा और साक्ष्य जुटाने का प्रयास करें। ‘क्राउड न्यूजरूम‘ (स्विटजरलैंड) के निदेशक मार्क एंगेलहार्ड्ट ने इसकी जानकारी दी। उनके अनुसार यह टूल पत्रकारों को आम नागरिकों से तथ्य मंगाने का अवसर देता है। इसका उपयोग बेहद आसान है। इसमें ड्रैग-एंड-ड्रॉप संपादन टूल के साथ डेटा स्टोरी बनाने, आई हुई जानकारी का विश्लेषण और सत्यापन करने की सुविधा है। नागरिक अपने डेटा या व्यक्तिगत स्टोरीज को इसमें साझा कर सकते हैं।

करेक्टिव (Correctiv) नामक मीडिया संगठन ने कई जांच के लिए ‘क्राउड न्यूजरूम‘ का इस्तेमाल किया। इसमें एक यूरोपीय राजनीतिक दल के पोस्टर अभियान में खर्च हुई राशि की जांच भी गई। इसमें 3500 लोगों से डेटा मिला।

मार्क एंगेलहार्ड्ट ने कहा- “क्राउड सोर्सिंग की यह विधि जनता से सूचना जुटाने पर निर्भर करती है। इसलिए ऐसे किसी अभियान में गैरसरकारी संगठनों और मीडिया संगठनों के साथ ही सामाजिक संगठनों का सहयोग लेने तथा ऑफलाइन प्रचार की भी आवश्यकता होती है।“

डेटाबेस का उपयोग करें

अब दुनिया के महत्वपूर्ण विषयों से जुड़े डेटा का खजाना कई तरह के ‘डेटाबेस‘ में उपलब्ध है। पत्रकारों को ऐसे टूल्स की जानकारी हो, तो मुश्किल डेटा भी आसानी से मिल सकते हैं। ऐसा ही एक टूल है: एलेफ (Aleph)। यह खोजी पत्रकारिता के लिए दुनिया भर की महत्वपूर्ण शोध सामग्री का आर्काइव या भंडार है। यह ओर्गेनाइज्ड क्राइम एंड करप्शन रिपोर्टिंग प्रोजेक्ट (OCCRP) द्वारा संचालित है।

ओसीसीआरपी के डेटा संपादक जेन स्ट्रोजिक ने ‘एलेफ‘ के बारे में बताया। उन्होंने कहा कि यह खोजी अनुसंधान के लिए एक इंटरैक्टिव ग्लोबल आर्काइव है। यानी दुनिया भर की सूचनाओं का ऐसा भंडार, जिसके साथ आप दोतरफा संवाद कर सकते हैं। उन्होंने कहा- “पत्रकारिता में डेटा-आधारित जांच किसी आइसबर्ग (हिमखंड) जैसी होती है। इसमें काम का बड़ा हिस्सा पानी के नीचे होता है। जैसे, सूचना जुटाना, उनकी छंटाई और जांच करके भरोसेमंद जानकारी के रूप में बदलना। आमतौर पर पाठकों को आपकी इतनी मेहनत का पता नहीं चल पाता है। लेकिन ‘एलेफ‘ के संग्रह में कई विशेषताएं हैं, जिनसे पत्रकारों डेटा जुटाने और उसके प्रसंस्करण के थकाने वाले काम में मदद मिल सकती है।“

जेन स्ट्रोजिक ने कहा कि ‘एलेफ‘ में फिलहाल 309 सार्वजनिक डेटासेट का भंडार है। इसमें 200 डेटा स्क्रैपर और 150 मिलियन से अधिक संस्थाओं के डेटा शामिल हैं। इस डेटा प्लेटफॉर्म में पत्रकार अपने सहयोगियों के साथ अपनी जांच और डेटा को सुरक्षित रूप से साझा कर सकते हैं। इसमें किसी भी प्रकार की फाइल को अपलोड करने, विभिन्न स्क्रिप्ट में खोज करने और डेटा को क्लिक करने योग्य ग्राफिक्स में बदलने की सुविधा देता है, जिसमें आगे का कनेक्शन भी दिख सकता है।

‘माइन एलर्ट्स‘ #MineAlerts tool एक अन्य उपयोगी टूल है। इसे पर्यावरण की जांच करने वाली गैर-लाभकारी संस्था ‘ऑक्सपेकर्स‘ (Oxpeckers) ने विकसित किया है। इसके जरिए आप दक्षिणी अफ्रीका में खनन हेतु आवेदनों और नियमों के अनुपालन का पता लगा सकते हैं। पत्रकारों को इससे जानकारी मिल सकती है कि कोयला उद्योग किस तरह काम कर रहा है।

इमेज: स्क्रीनशॉट

‘ऑक्सपेकर्स‘ की पत्रकार और डेटा मैनेजर एंडिसवा माटिकिन्का ने ‘माइन एलर्ट्स‘ टूल की जानकारी दी। इसके तहत जियो-पत्रकारिता टूल के साथ एक डिजिटल डेटाबेस को जोड़ा गया है। इसमें माइनिंग लाइसेंस के लिए आए आवेदनों और कार्यरत खदानों से जुड़े दस्तावेज भी शामिल हैं। खदान के आसपास पानी के उपयोग संबंधी महत्वपूर्ण मुद्दे की जानकारी भी इसमें शामिल है।

ऑफशोर लीक्स डेटाबेस (Offshore Leaks Database) भी सूचनाओं का एक बड़ा खजाना है। इसमें ऐसी कंपनियों का डेटा मिलता है, जो अन्य देशों में रहकर काम करती हैं। अपने देश के कानूनों और टैक्स प्रणाली से बचने के लिए ऑफशोर कंपनियां ऐसा करती हैं। इंटरनेशनल कंसोर्टियम ऑफ इंवेस्टिगेटिव जर्नलिस्ट्स (आईसीआईजे)  के डेटा जर्नलिस्ट डेल्फिन रॉयटर  ने इसकी जानकारी दी। उन्होंने कहा कि इस ‘फ्री एवं ओपनसोर्स’ डेटाबेस में अब तक आठ लाख कंपनियों का डेटा मौजूद है। पेंडोरा पेपर्स के डेटा जुड़ने के बाद यह संख्या बढ़ जाएगी।

डेल्फिन रॉयटर ने ‘ऑफशोर लीक्स डेटाबेस‘ टूल का उपयोग करने के संबंध में कई सुझाव दिए:

  • अपनी खोज (सर्च) में आप वैकल्पिक वर्तनी आजमाएं। कोई नाम नहीं मिले, तो अलग तरह से लिखकर देखें। जैसे किसी कंपनी के नाम के अंत में ‘लिमिटेड‘ लिखने से न मिले, तो इसे संक्षेप में ‘एलटीडी‘ लिखकर देखें। ‘कारपोरेशन‘ न मिले तो इसे भी शाॅर्ट में लिखकर सर्च करें। नामों के साथ उद्धरण चिह्नों का प्रयोग करें।
  • डेटाबेस के ‘पावर प्लेयर्स‘ खंड में हरेक डेटा के साथ उसके स्रोत और तारीख की जानकारी दी गई है। उस पर ध्यान दें। उसमें ‘पनामा पेपर्स‘ और ‘पैराडाइज पेपर्स‘ जैसे बड़े खुलासे शामिल हैं। यह भी याद रखें कि उस डेटाबेस में प्रस्तुत डेटा उस जांच के समय का एक स्नैपशॉट है। उसके बाद के उसमें कोई बदलाव संभव है। इसलिए ताजा डेटा के लिए अपडेटेड कॉरपोरेट रजिस्ट्रियों की भी जांच करनी चाहिए।
  • डेटाबेस में नाम, पते और देश के आधार पर खोज की सुविधा है। सही परिणामों के लिए ‘अधिकार क्षेत्र‘ (ज्यूरिडिक्शन) श्रेणी के तहत ट्रस्टों और अपतटीय (ऑफशोर) कंपनियों को खोजना उपयोगी है।

देश-केंद्रित संसाधनों का पता लगाएं

यूक्रेन के मीडिया संगठन बिहुस डॉट इन्फो (Bihus.info) के आईटी विशेषज्ञ दिमित्री चैपलिंस्की ने भी महत्वपूर्ण जानकारी दी। उन्होंने कहा कि कई देशों के डेटा संबंधी कुछ खास संसाधन होते हैं। आपको जिस देश में रिपोर्टिंग करनी है, वहां के ऐसे विशेष डेटाबेस और टूल्स का पता लगाएं।

दिमित्री चैपलिंस्की ने बताया कि यूक्रेन और कजाकिस्तान जैसे देशों के नए रिकॉर्ड डेटाबेस उपलब्ध हैं। इन देशों की सार्वजनिक रजिस्ट्रियों, संपत्ति प्रकटीकरण दस्तावेजों, सार्वजनिक खरीद डेटा और अन्य सार्वजनिक रिकॉर्ड की तलाश करने वाले पत्रकारों को दो ओपनसोर्स डेटाबेस की जांच करनी चाहिए। इन्हें नियमित रूप से अपडेट किया जाता है। इनमें पहला है: ‘रिंग‘ (Ring), जो यूक्रेन में 29 मिलियन सार्वजनिक रिकॉर्ड के साथ 20 से अधिक डेटाबेस का एक दस्तावेज खोज इंजन है। रिंग में यूक्रेनी, अंग्रेजी और रूसी भाषा में सर्च किया जा सकता है। दूसरा है: ‘ओपन बेस‘ (Open Base) जो कजाकिस्तान के लिए लगभग एक दर्जन डेटा स्रोतों के साथ एक डेटा भंडार है।

प्रतिदिन उपयोग लायक पांच रिपोर्टिंग टूल्स

नए टूल काफी रोमांचक होते हैं। उनका सही उपयोग करना आपको सीखना होगा। ‘अल-जजीरा मीडिया नेटवर्क‘ के डेटा संपादक मोहम्मद हद्दाद  ने पांच रिपोर्टिंग टूल्स की जानकारी दी। वह इनका प्रतिदिन उपयोग करते हैं।

मैपबॉक्स (Mapbox) और मैपबॉक्स स्क्रॉलीटेलिंग फीचर (Scrollytelling feature) – किसी स्टोरी में यदि भूगोल या भौगोलिक संरचना के उपयोग करने का यह अच्छा उपकरण है। मोहम्मद हद्दाद ने कहा कि यह मेरा पसंदीदा मैपिंग टूल है। इसके जरिए आप अपने पाठकों को दुनिया भर की यात्रा पर ले जा सकते हैं। हम अपने पाठकों को नील नदी तक ले गए। हमने भारत और चीन के बीच विवादित सीमा क्षेत्र को भी इसके जरिए दिखाया।

निवो (Nivo) – यह एक शानदार डेटा विजुअलाइजेशन टूल है। इसमें विस्तृत डेटा विजुअलाइजेशन सेट करने के लिए बेहद कम कोड की आवश्यकता होती है। ‘अल जजीरा‘ ने निवो का इस्तेमाल करके एक महत्वपूर्ण विश्लेषण किया। विषय था- ‘प्रमुख मुद्दों पर संयुक्त राष्ट्र में विभिन्न देशों द्वारा 1946 से अब तक मतदान का विश्लेषण‘

एएमपी स्टोरीज (AMP Stories)- यह मोबाइल आधारित पहला वेब स्टोरीटेलिंग प्लेटफॉर्म है। यह बेहद आसान है। यह चरित्र-आधारित सुविधाओं के लिए बहुत अच्छा है। यह मोबाइल फोन में बहुत अच्छा काम करता है, जहां से आपका अधिकांश ट्रैफिक आने की संभावना है। मोहम्मद हद्दाद ने कहा कि हमने ‘100 फेसेस ऑफ रोहिंग्या‘ के लिए एएमपी स्टोरीज का इस्तेमाल किया। हमने संयुक्त राज्य अमेरिका, फिलिस्तीन और म्यांमार में अश्वेत लोगों की हत्या संबंधी रिपोर्टिंग में भी इसका उपयोग किया।

चार्टबीट (Chartbeat) – आपकी न्यूज स्टोरी आपके पाठकों पर कैसा असर डाल रही है, यह समझने के लिए कि चार्टबीट के रीयल-टाइम एनालिटिक्स का उपयोग करें। मोहम्मद हद्दाद ने कहा कि इससे हमें सोशल मीडिया में अपने प्रदर्शन की पूरी जानकारी मिल जाती है। इससे हमें पता चलता है कि हमारी स्टोरी को सोशल मीडिया में कहां और कितना साझा किया गया है।

आर कोडिंग और आर स्टूडियो (R Studio) – मोहम्मद हद्दाद ने कहा कि यह मेरा पसंदीदा उपकरण है। सबसे अच्छा उपकरण वह है जिसे आप प्रोग्रामिंग भाषा में बना सकते हैं। हमारी टीम डेटा एकत्र करने से लेकर संपादन तक इसका उपयोग करती है। आप इस उपकरण जरिए लगभग सब कुछ कर सकते हैं।

अल जजीरा के मोहम्मद हद्दाद ने ‘निवो‘ डेटा विजुअलाइजेशन टूल का इस्तेमाल करके 1946 से अब तक संयुक्त राष्ट्र में मतदान के पैटर्न पर नजर रखने का इंटरैक्टिव प्रोजेक्ट बनाया। इमेज: स्क्रीनशॉट

जाहिर है कि इस सत्र में बताए गए ‘टूल्स‘ खोजी पत्रकारों के लिए काफी उपयोगी हैं। इन सभी उपकरणों में एक विशेषता यह है कि इनमें बड़ी मात्रा में सूचना के प्रबंधन की क्षमता है। इनका उपयोग विभिन्न भाषाओं, लिपियों, विविध प्रकार की फाइलों और फोटो की ऑनलाइन खोज तथा अन्य कार्यों में करना संभव है।

अतिरिक्त संसाधन

Tips for Investigating When Governments Shield Crime and Corruption

Investigative Tools That Reporters Love

10 Investigative Tools You Probably Haven’t Heard Of


रोवन फिलिप जीआईजेएन में रिपोर्टर हैं। पहले वह संडे टाइम्स (दक्षिण अफ्रीका) के मुख्य संवाददाता थे। एक विदेशी संवाददाता के रूप में उन्होंने दुनिया भर के दो दर्जन से अधिक देशों से समाचार, राजनीति, भ्रष्टाचार और संघर्ष पर रिपोर्टिंग की है। उन्होंने यूके, यूएस और अफ्रीका में न्यूजरूम के लिए असाइनमेंट संपादक के रूप में भी काम किया है।

Leave a Reply

Your email address will not be published. Required fields are marked *