Image: Shutterstock

संसाधन

» टिपशीट

विषय

डेटा जर्नलिज्म: संपादकों के लिए टिप्स

इस लेख को पढ़ें

फोटो: शटरस्टॉक

“एक बड़ी बात जो मैं संपादकों से सुनती रही हूं, वह है : ‘हे भगवान, यह तो आंकड़ों की पत्रकारिता है। मैंने तो यह काम कभी किया नहीं। यह भी नहीं जानता कि करना क्या है। खबर बनाने में बहुत लंबा समय लगेगा।'” डेटा पत्रकारिता प्रशिक्षक मैरी-जो वेब्स्टर की यह टिप्पणी एक आम दुविधा को दर्शाती है। खासकर छोटे न्यूज़ रूम में, जहां कुछ युवा पत्रकारों के पास आंकड़ों का कौशल तो होता है, लेकिन असाइनमेंट डेस्क पर उनका साबका “खड़ी लाइन और पड़ी लाइन के खौफ” से पड़ जाता है।

फोटो: मैरी-जो वेब्स्टर 2015 से मिनियापोलिस स्टार ट्रिब्यून में डेटा संपादक हैं।

मिनियापोलिस स्टार ट्रिब्यून (मिनेसोटा, अमेरिका का उत्तरी राज्य) की डेटा एडिटर वेब्स्टर ने एक ऐसी गाइड तैयार की है जिसका मकसद संपादकों को इस दिशा में आगे बढ़ने का आसान रास्ता दिखाने का है। गाइड का पहला प्रस्थान बिंदु यह है कि डेटा-संचालित कवरेज का दायरा बढ़ाने के लिए उन्हें किसी उन्नत कौशल की आवश्यकता नहीं है। दूसरा, कुछ आसान तकनीकें अपने ही ढंग की खबरों की एक नई दुनिया खोल सकती हैं। तीसरी, और सबसे खास बात यह कि डरने की कोई जरूरत नहीं है। बकौल मैरी-जो वेब्स्टर, लोगों के बयानों का उपयोग करना अगर आप जानते हैं तो डेटा स्रोतों से अपना काम निकालना आपके लिए मुश्किल नहीं होगा।

वेब्स्टर यह स्वीकार करती हैं कि “‘क्यों?’ वाले सवालों के लिए डेटा कुछ खास कारगर नहीं होते।” साथ ही वे यह भी कहती हैं कि डेटा कौशल से वंचित संपादक लगभग हर मामले में पारंपरिक स्रोत वाले अपने नजरिये को लागू कर सकते हैं। इसके लिए उन्हें सिर्फ इतना करना होगा कि खबर में डेटा का इस्तेमाल उसी तरह करें, जैसे लोगों के बयान का करते हैं। (संपादक जानते है कि बहुत सारे बयानों को एक साथ नत्थी नहीं करना है। वे सही हैं या नहीं, इसकी ठीक से जांच कर लेनी है। और किसी की बात जहां उलझी हुई सी लगे, वहां उसे सुलझा कर पेश करना है। ये सारे काम उन्हें ठीक इसी तरह आंकड़ों के साथ भी करने होंगे।)

इन्वेस्टिगेटिव रिपोर्टर्स एंड एडिटर्ज़ (Investigative Reporters & Editors) नामक संस्था द्वारा आयोजित  NICAR22 डेटा पत्रकारिता सम्मेलन के एक सत्र में वेब्स्टर ने आंकड़ों के उपयोग की करामात के इर्दगिर्द छाए “रहस्य” के पार जाने और इनको अनोखे, दोस्ताना स्रोतों की तरह अंगीकार करने का एक कदम-ब-कदम खाका खींचा। निकार (एनआईसीएआर) का मतलब है नेशनल इंस्टीट्यूट फॉर कंप्यूटर-असिस्टेड रिपोर्टिंग ( National Institute for Computer-Assisted Reporting)। यह आईआरई का केंद्र है और इसको 1989 में शुरू किया गया था। दुनिया में डेटा पत्रकारिता का श्रीगणेश करने में इसने एक अहम भूमिका निभाई है।

तस्वीर: स्क्रीनशॉट

वेब्स्टर ने कहा- “जरूरत इस बात की है कि हर संपादक सोचे : ‘अरे, शायद यहां एक डेटा लगाने की गुंजाइश है।” उन्होंने यह भी बताया कि इस खास मामले में नौसिखिया संपादकों का आंकड़ों से अपरिचय खबर के लिए  फायदेमंद हो सकता है। कारण यह कि आंकड़ों से उनके ही जितने अनजान आम दर्शकों/पाठकों के सामने खबर के सही होने का सबूत कैसे पेश किया जाना चाहिए, यह बात वे अच्छी तरह जानते हैं।

वे कहती हैं कि कोई भी संपादक आंकड़ों को खबर के लिए तीन तरह से मूल्यवान मान सकता है:

  1. अपने रिपोर्टरों और फोटोग्राफरों को कहां लगाया जाए, इसके लिए एक दिशा निर्देशक के रूप में। वेब्स्टर का कहना है कि बुनियादी डेटा- जैसे एक खास इलाके में कोविड-19 के संक्रमणों में आए उछाल, या दंगों में क्षतिग्रस्त हुई अल्पसंख्यक-स्वामित्व वाली दुकानों के अनुपात से जुड़े नगरपालिका के आंकड़े- रिपोर्टरों की तैनाती के लिहाज से असाइनमेंट संपादकों के लिए काफी अच्छे गाइड हो सकते हैं, हालांकि इनका उपयोग कम ही हो पाता है। “‘हमें किसका इंटरव्यू करना चाहिए? शहर के किस हिस्से पर अपना ध्यान केंद्रित करना चाहिए?’ – एक खबर के लिए डेटा अगर इतनी भी मदद कर पाता है तो यह बहुत अच्छी बात है।”
  2. परंपरागत रिपोर्ट के रूप में पेश की जाने वाली खोजबीन की रीढ़ के रूप में। वेब्स्टर ने कहा- “आंकड़ों का यह वह प्रकार है जो बाकी हर तरह की पारंपरिक रिपोर्टिंग को बांधे रखता है।” एक उदाहरण के रूप में, उन्होंने 2018 में स्टार ट्रिब्यून की यौन उत्पीड़न संबंधी न्यायिक जांच के सबूतों की ओर इशारा किया। इसमें एक स्व-निर्मित डेटासेट के जरिये यह साबित किया जा सका था कि राज्य में पुलिस और अभियोजकों ने यौन उत्पीड़न के मामलों को या तो खराब तरीके से हैंडल किया था, या फिर यह काम वे बिल्कुल नहीं कर पाए थे।
  3. संदर्भ के लिए – जहां डेटा समस्या को पारिभाषित करता है, या मुद्दे को समझने में पाठकों की मदद करता है। उन्होंने बताया कि “यह शायद आंकड़ों का सबसे आम इस्तेमाल है। खबर संभवतः डेटा के बिना भी जा सकती है, लेकिन डेटा के जरिये आपको कुछ और भी हासिल होता है। मसलन, कुछ उदाहरण, कुछ ब्यौरे।” आगे वेब्स्टर ने बताया कि ‘कौन’, ‘क्या’, ‘कब’ और ‘कहाँ’ वाले सवालों के लिए डेटा बहुत अच्छी भूमिका निभाता है। इस भूमिका में विज़ुअलाइज़ेशन खास तौर पर महत्वपूर्ण हो जाता है। उदाहरण के लिए, शहर के अलग-अलग इलाकों में अलग-अलग तरह की आपातकालीन सेवाओं में लगने वाले समय की सूची, यहां तक कि इसके लिए ग्राफों का इस्तेमाल भी नीतिगत विफलता को ठीक से नहीं दर्शा पाता। इसमें अल्पसंख्यक समुदायों के खिलाफ भेदभाव मौजूद हो सकता है, जिसको ठीक से प्रदर्शित करने के लिए शहर के नक्शे पर आंकड़ों की अलग-अलग रेंज के लिए भिन्न-भिन्न रंगों का उपयोग पाठकों को एक ही नजर में समझा सकता है कि हकीकत में हो क्या रहा है।

खबर के लिए असाइनमेंट देने की प्रक्रिया

वेब्स्टर अपनी गाइड में कई वैकल्पिक उपायों का खाका खींचती हैं- अपने खुद के सर्वेक्षण से लेकर रिपोर्टरों की ओर से सूचना के अधिकार के तहत अर्जी डलवाने तक। लेकिन निकार के सत्र में उन्होंने एक और भी महत्वपूर्ण कदम को रेखांकित किया।

डेटा से जुड़ी संभावनाओं पर पहले ही बातचीत कर लें – खबर का आइडिया रखे जाने के साथ ही। वेब्स्टर कहती हैं- “यह खास तौर पर जरूरी है कि जब बीट रिपोर्टरों की मीटिंग चल रही हो और किन खबरों पर काम किया जाए, इस बारे में विचार-मंथन चल रहा हो, तभी आंकड़ों में मौजूद संभावनाओं पर चर्चा कर ली जाए। साथ ही इस पर भी, कि किस-किस तरह के डेटा देखे जाने चाहिए। कुछ खबरें स्वाभाविक रूप से आंकड़ों की मांग करती हुई सी लगती हैं। बाकी के बारे में आपको लगता है कि जैसी सूचनाओं की जरूरत आपको है, वे सीधे आपको कहीं मिल ही नहीं सकतीं।” वेब्स्टर ने इन मंथन सत्रों के दौरान खबरों की ऐसी कई किस्मों की पहचान कराई, जो हमेशा जरूरी डेटा की खोज और उसके विश्लेषण की मांग रिपोर्टरों के सामने रखती हैं:

  • ऐसी खबरें, जिनमें किसी चीज की माप निकालने की जरूरत होती है। अगर आपको लगे कि आपका पाठक यह जानना चाहेगा कि कोई खास मुद्दा कितना बड़ा है, तो अपने रिपोर्टरों से आंकड़ों की तह में जाने के लिए कहें। तब भी, जब खबरों से जुड़ी मीटिंग में ऐसे सवाल उठें कि “अमुक परिघटना अन्य जगहों की तुलना में हमारे यहां कितनी महत्वपूर्ण है? या, समय के साथ यह किस तरह बदली है? या फिर, सबसे ज्यादा यह कहाँ देखी जाती है?” उदाहरण के लिए, स्टार ट्रिब्यून की एक डेटा स्टोरी में पाया गया कि उपनगरों में पैदल चलने वालों को कार दुर्घटनाओं में लगी चोटें अधिक गंभीर थीं, और ऐसी 3,000 से ज्यादा दुर्घटनाओं में केवल 25 कार चालकों पर आपराधिक धाराएं लगाई जा सकी थीं। रिपोर्टर ने पुलिस रिपोर्ट कोड से इन चालकों के नाम निकाले, फिर अदालती दस्तावेजों में इनकी तलाश की और पैदल यात्रियों के साथ होने वाली दुर्घटनाओं का एक इन-हाउस डेटाबेस बनाया।
  • रिपोर्टर जिस एक चौंकाने वाले आंकड़े का जिक्र करते हैं, उसके पीछे मौजूद बड़ी खबर। उदाहरण के लिए, यदि एक रिपोर्टर को किसी स्रोत से जानकारी मिलती है कि इमारतों में आग लगने की घटनाएं पिछले साल की तुलना में 25 फीसदी बढ़ गई हैं, तो संपादक उसे ऐसे आंकड़ों की तलाश में जाने के लिए कह सकते हैं जो इस तरह के सवालों के जवाब देते हों : “क्या ये घटनाएं मुख्यतः घरों में आग लगने की थीं? क्या ऐसी घटनाओं में हुई तेज वृद्धि के पीछे लोगों का धूम्रपान करना या स्पेस हीटर लगाने जैसा कोई कारण मौजूद था? ”
  • ऐसी खबरें, जो यह जांचती हैं कि जनता से किया गया कोई वादा पूरा किया गया या नहीं, या फिर यह कि कोई कार्यक्रम कारगर हो पाया या नहीं। इसकी व्याख्या वेब्स्टर ने इस तरह की कि “पैसा किसी काम के लिए खर्च किया गया था। यह दिखाने के लिए डेटा मौजूद होना चाहिए कि पैसे को जहां पहुंचना चाहिए था वहां पहुंचा या नहीं, या फिर इसे बुद्धिमानी से खर्च किया गया या नहीं।”
  • क्या यह वास्तव में सच है?” और किसने क्या कहाटाइप की खबरें। डेटा लोकप्रिय मिथकों या सिद्धांतों के सही या गलत होने का परीक्षण कर सकता है। “उदाहरण के लिए, हमने पूछा, ‘क्या यह दावा सही है कि श्वेत और अश्वेत बच्चों को साथ-साथ पढ़ाने के लिए मिनियापोलिस और सेंट पॉल में 90 के दशक में किए गए व्यापक स्कूली प्रयासों के बाद उन्हें अभी फिर से अलग-अलग कर दिया गया है?” वेब्स्टर कहती हैं और आगे बताती हैं- “जवाब निकला : हाँ, स्कूलों ने वाकई ऐसा किया है।”
  • हाल-फिलहाल चल रही गंभीर खबरें। वेब्स्टर ने कहा, “जब आपके पास कोई ऐसा मुद्दा होता है जो हर समय खुद को दोहराता हुआ सा लगता है, तो किसी बिंदु पर आपको पीछे हटकर उससे जुड़ी बड़ी तस्वीर की कहानी कहनी होती है।” आगे यह कि “इस दिशा में आगे बढ़ने के क्रम में रीयल-टाइम डेटा हासिल करने में आपको नाकों चने चबाने पड़ सकते हैं, लेकिन एक बार यह हाथ लग जाए तो एक ही खबर को रोज दोहराते रहने की मजबूरी से जान छुड़ाने में आपको काफी मदद मिल सकती है।”

वेब्स्टर ने संपादकों को आगाह किया कि वे रिपोर्टरों से प्रतीकात्मक सांख्यिकी की तरह “सिर्फ एक खबर या ग्राफिक में डालने के लिए” एकाध आंकड़ा उठा लाने को न कहें। उन्होंने कहा- “बेहतर होगा कि उनसे यह पूछें : ‘डेटा से हमें ऐसे कौन से सवाल मिल सकते हैं जो कहीं और से शायद न मिल सकें?’, या फिर यह कि जो बातें लोग हमें बता रहे हैं, उनकी पुष्टि के लिए क्या कुछ आंकड़े जुटाए जा सकते हैं?”

चेकलिस्ट : क्या किसी डेटा-संचालित खबर पर समय लगाना ठीक रहेगा?

“कई संपादकों को यह कहना अच्छा लगता है: ‘ओह, लेकिन इसमें तो बहुत ज्यादा वक्त लगेगा!’” वेब्स्टर ने डेटा आधारित खबरों के लिए अक्सर ज्यादा रिपोर्टिंग की जरूरत का संदर्भ देते हुए कहा। “लेकिन क्या पता, खबर सचमुच इसके लायक हो। इस बारे में आश्वस्त होने के लिए कुछ सवालों पर विचार करना चाहिए।”

  • क्या यह ‘वॉचडॉग स्टोरी’ है? ऐसी खबर, जिसमें बड़ा प्रभाव डालने या कोई बदलाव शुरू करने की संभावना हो?
  • क्या हम अभी फटाफट एक खबर कर सकते हैं, और उसका डेटा-चालित अंश बाद में चला सकते हैं?
  • खबर की मुख्य सूचना और दस्तावेजों तक पहुंच बनाने के लिए संभावित समय सीमा क्या है?
  • क्या यह आपके रिपोर्टर की बीट का एक महत्वपूर्ण मुद्दा है?
  • क्या इस खबर में एक मध्यम आकार वाले या बड़े उद्यम का एक टुकड़ा बन सकने की संभावना मौजूद है?
  • क्या पहले से ही कोई और इस खबर का विश्लेषण कर रहा है – ताकि आपका कुछ समय बच सके?

 डेटा आ चुका है। अब क्या?

  • जैसे ही डेटा आना शुरू होता है, संपादकों को उसके सत्यापन और बुलेट-प्रूफिंग की प्रक्रिया शुरू कर देनी चाहिए। इसके लिए खबर फाइल होने का इंतजार नहीं करना चाहिए।
  • आंकड़ों के जो हिस्से जरूरत से ज्यादा सच्चे लगें, उनकी जांच तीन बार करें।
  • हर डेटासेट को एक व्हिसलब्लोअर की तरह लें : “हम इसके बारे में क्या जानते हैं? कैसे पता करें कि यह भरोसेमंद है या नहीं? यह हमारे पास आया कैसे?”
  • पूछें कि क्या डेटा निष्कर्ष पारंपरिक रिपोर्टिंग से मिल रहे साक्ष्य से भिन्न हैं। डेटा गलत हो सकता है।
  • “स्टार” नतीजे की पहचान करें : सबसे न्यूजी चीज क्या निकल रही है।
  • डेटा एनालिसिस रिपोर्टर से कहें कि आपको एक सामान्य व्यक्ति मानकर अपने निष्कर्षों को सरल ढंग से वह आपको समझाए।

संख्याओं के साथ संपादन से जुड़े कुछ टिप्स:

  • संख्याओं और अनुपातों के बारे में अपने ज्ञान को ताज़ा करें, और इसके लिए अच्छी गाइड्स का सहारा लें। मसलन, सारा कोहेन की “नंबर्स इन द न्यूजरूम” गाइड।
  • संख्याओं के साथ वैसा ही बरताव करें, जैसा खबर में बयानों के साथ करते हैं – कभी भी उनका गुच्छा न बनने दें, जहां जरूरत हो सिर्फ वहीं इनको लगाएं, और जहां जरूरी समझें वहां इनकी व्याख्या भी करें।
  • वह करें जो आप अपने रिपोर्टरों से करने के लिए कहते हैं : जो संख्याएं आपके सामने रखी जा रही हैं, उनके बारे में बेवकूफी वाले सवाल पूछने से न डरें।
  • दशमलव से बचें – खासकर उन चीजों के लिए, जिन्हें बांटा नहीं जा सकता। जैसे व्यक्तियों के लिए।
  • अपने पाठकों को हिसाब-किताब के लिए मजबूर न करें।
  • जहां भी संभव हो, परिचित ब्यौरों के जरिये बात समझाएं।
  • संख्याओं के उन रूपों का उपयोग करें जो लोगों की समझ में आ सकें – जैसे “0.07%” के बजाय “10,000 में से 7″। या एक समूचे देश पर आने वाले खर्च के आंकड़े के बजाय ‘प्रति व्यक्ति खर्च’ का उपयोग करें।
  • जब सूची में बहुत अधिक संख्याएं हों तो बार ग्राफ़ जैसे विज़ुअलाइज़ेशन का उपयोग करें।
  • एक “स्टार” संख्या चुनें, और खबर की शुरुआत में ही उस पर ध्यान केंद्रित करें।

वेब्स्टर ने समझाया कि “डेटा पत्रकारिता की तुलना पारंपरिक पत्रकारिता के साथ करने से इसकी शक्ल न्यूज़रूम के एक कोने में चल रहे जादुई काम जैसी नहीं रह जाती। बल्कि यह कुछ ऐसी चीज बन जाती है, जिसको पत्रकार पहले से जानते हैं।” यह भी कि “रिपोर्टर जिन इंसानी स्रोतों का हवाला देते हैं, उनके बारे में कोई नतीजा कैसे निकाला जाए, यह बात संपादकों पहले से पता होती है। आंकड़ों के साथ भी मामला बिल्कुल वैसा ही है।”

अतिरिक्त संसाधन

GIJN’s Top 10 Data Journalism Projects of 2021

Data Journalism Training, Books, Websites, and Conferences

12 Tips for Getting Started With Data Journalism


रोवन फिलिप GIJN के लिए कार्यरत रिपोर्टर हैं। रोवन पहले दक्षिण अफ्रीका के अखबार संडे टाइम्स के चीफ रिपोर्टर हुआ करते थे। विदेश संवाददाता के रूप में उन्होंने पूरी दुनिया के दो दर्जन से अधिक देशों से समाचार, राजनीति, भ्रष्टाचार और टकरावों पर रिपोर्टिंग की है।

क्रिएटिव कॉमन्स लाइसेंस के तहत हमारे लेखों को निःशुल्क, ऑनलाइन या प्रिंट माध्यम में पुनः प्रकाशित किया जा सकता है।

आलेख पुनर्प्रकाशित करें


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

अगला पढ़ें

क्रियाविधि डेटा पत्रकारिता समाचार और विश्लेषण

सरकारी डेटा न मिले, तो घृणा आधारित अपराधों की रिपोर्टिंग कैसे करें?

क्राउड-सोर्सिंग पर आधारित ऐसी परियोजनाओं में कई तरह की चुनौतियां भी होती हैं। सूचनाओं एवं डेटा की गुणवत्ता सुनिश्चित करना एक बड़ा काम है। प्रविष्टियों का दोहराव, रोकना तथा हर रिपोर्ट का सत्यापन करना भी आसान नहीं है। परिणामों की व्याख्या में भी किसी पूर्वाग्रह से बचना एक बड़ी चुनौती है। ऐसे जोखिम के प्रति सचेत रहते हुए यह कोशिश करने लायक है।

embracing failure open source reporting

क्रियाविधि

ओपन सोर्स रिपोर्टिंग में अपनी गलतियों से सीखें

ओपन सोर्स क्षेत्र में काम करने का मतलब डेटा के अंतहीन समुद्र में गोते लगाना है। आप सामग्री के समुद्र में नेविगेट करना, हर चीज़ को सत्यापित करना और गुत्थियों को एक साथ जोड़कर हल करना सीखते हैं। हालांकि, ऐसे भी दिन आएंगे जब आप असफल होंगे।

इमेज: मैसूर में एक मतदाता सहायता केंद्र पर जानकारी लेते हुए भारतीय नागरिक, अप्रैल 2024, इमेज - शटरस्टॉक

भारतीय चुनावों में फ़ैक्ट चेकिंग के सबक

लोकतंत्र के मूल्यों को बनाए रखने के लिए तथ्यों के आधार पर मतदाताओं को निर्णय लेने का अवसर मिलना आवश्यक है। इसके लिए ‘शक्ति‘ – इंडिया इलेक्शन फैक्ट चेकिंग कलेक्टिव का निर्माण किया गया। इस प्रोजेक्ट में गूगल न्यूज इनीशिएटिव की मदद मिली। इस पहल का नेतृत्व डेटालीड्स ने किया। इसके साझेदारों में मिस-इनफॉर्मेशन कॉम्बैट एलायंस (एमसीए), बूम, द क्विंट, विश्वास न्यूज, फैक्टली, न्यूजचेकर तथा अन्य प्रमुख फैक्ट चेकिंग (तथ्य-जांच) संगठन शामिल थे। इंडिया टुडे और प्रेस ट्रस्ट ऑफ इंडिया (पीटीआई) जैसे मीडिया संस्थानों ने भी इसमें भागीदारी निभाई।

Recorder panel at IJF24

रिकॉर्डर : रोमानिया में स्वतंत्र मीडिया का अनोखा राजस्व मॉडल

रिकॉर्डर को वर्ष 2017 में एक विज्ञापन राजस्व मॉडल की योजना के साथ लॉन्च किया गया था। अब इसकी 90 प्रतिशत आय दर्शकों से आती है। यह रोमानिया का एक स्वतंत्र खोजी मीडिया संगठन है। वीडियो और वृत्तचित्रों में इसकी विशेषज्ञता है।