Image: Shutterstock

आलेख

विषय

सरकारी डेटा न मिले, तो घृणा आधारित अपराधों की रिपोर्टिंग कैसे करें?

इस लेख को पढ़ें

फोटो: महिलाओं पर हिंसा के खिलाफ कोलकाता में एक रैली। इमेज: शटरस्टॉक

भारत में अपराध संबंधी आंकड़ों के रखरखाव का दायित्व ‘नेशनल क्राइम रिकॉर्ड ब्यूरो‘ (एनसीआरबी) पर है। गृह मंत्रालय के अंतर्गत वर्ष 1986 में इसकी स्थापना हुई थी। यह देश में अपराध संबंधी आँकड़े संग्रहित और प्रकाशित करता है। इसने वर्ष 2017 में धार्मिक मामलों के कारण हत्या और किसानों की आत्महत्या जैसे आंकड़े जुटाना बंद कर दिया। इसके कारण पत्रकारों के पास यह पता लगाने का कोई रास्ता नहीं रह गया कि ऐसे मामले बढ़ रहे हैं, अथवा नहीं। हालांकि मीडिया में आने वाली खबरें बताती हैं कि ऐसे मामलों में उछाल आया है।

इमेज: स्क्रीनशॉट

इसी तरह, घृणा अपराध (हेट क्राइम) पर भी आधिकारिक तौर पर नजर नहीं रखी जा रही है। हिन्दुस्तान टाइम्स ने वर्ष 2017 में घृणा/नफरत के शिकार लोगों के मामलों का दस्तावेज बनाने के लिए एक ‘नफरत ट्रैकर‘ (हेट ट्रैकर) शुरू किया था। लेकिन सरकारी दबाव में इसे रोकना पड़ा। संपादक बॉबी घोष को पद छोड़ने के लिए कहा गया। कुछ ऐसा ही हश्र एक अन्य प्रयास का भी हुआ। ऑनलाइन वेबसाइट ‘इंडिया स्पेंड‘ द्वारा बनाए गए ‘हेट ट्रैकर‘ को भी बंद करना पड़ा। इसके संपादक समर हलर्नकर ने भी इस्तीफा दे दिया।

यह आलेख ‘रॉयटर्स इंस्टीट्यूट फॉर द स्टडी ऑफ जर्नलिज्म‘ में मेरी फैलोशिप परियोजना के अनुभवों पर आधारित है। मैंने संचार शोधकर्ता डॉ. सिल्विया माजो-वाजक्वेज के मार्गदर्शन में यह काम किया। अपराध के जिन मामलों पर सरकारी डेटा उपलब्ध हो, उन पर पत्रकार किस तरह जांच और रिपोर्टिंग करें? ऐसे मामलों पर डेटा एकत्र करने, उनकी जांच करने और खबर बनाने संबंधी विषयों की जानकारी यहां प्रस्तुत है।

डेटा कैसे निकालें?

सबसे पहले मैंने घृणा अपराध (हेट क्राइम) को इस तरह परिभाषित किया- “किसी धर्म, जाति, पृष्ठभूमि, लिंग, शारीरिक या मानसिक अक्षमता, अथवा यौन रूचि के प्रति पूर्वाग्रह के कारण होने वाले अपराध।“

इसके बाद मैंने पहली जनवरी 2014 से 31 दिसंबर 2020 तक के अंग्रेजी समाचार मीडिया में प्रकाशित घृणा अपराधों की खबरें जुटाईं। हर खबर का लिंक कॉपी किया। हर मामले का संक्षिप्त विवरण एक स्प्रेडशीट में दर्ज किया।

इसमें मैंने दंगों के मामलों को अलग रखा, क्योंकि इन्हें पूरी तरह से सूचीबद्ध करने के लिए मेरे पास पर्याप्त समय और संसाधनों का अभाव था। इसमें मैंने सोशल मीडिया रिपोर्ट्स को भी शामिल नहीं किया, क्योंकि वैसी खबरों को सत्यापित करना मेरे लिए संभव नहीं था। मैंने क्षेत्रीय भाषा के मीडिया की खबरों को भी शामिल नहीं किया क्योंकि अन्य भाषाओं की खबरों का सटीक अनुवाद करने के लिए संसाधन नहीं थे।

इस तरह, अंग्रेजी मीडिया में घृणा अपराध संबंधी 212 घटनाओं का विवरण एक गूगल शीट में तैयार हुआ। मैंने हर मामले में तारीख, हिंसा के प्रकार, लिंग, पीड़ितों और अपराधियों का सामाजिक-आर्थिक विवरण, उनका धर्म, जाति, राजनीति और पुलिस की प्रतिक्रिया जैसे विवरणों को सूचीबद्ध किया। फिर मैंने इन अपराधों का पैटर्न और रुझान समझने के लिए डेटा का विश्लेषण किया। पूरी रिपोर्ट डाउनलोड करें ।

एक और बात स्पष्ट करना जरूरी है। इस रिपोर्ट में हम ऐसा कोई दावा नहीं कर रहे कि यह कोई प्रतिनिधि डेटा है। किसी भी डेटा को प्रतिनिधि डेटा तब कहा जाता है, जब वह संपूर्ण डेटाबेस पर आधारित हो। अथवा जिसमें सभी ज्ञात घटनाओं के नमूने लिए गए हों। इसके बजाय हमने सिर्फ उपलब्ध स्रोतों पर निर्भर रहते हुए यह स्टडी की है। इसमें केवल अंग्रेजी समाचार मीडिया में आई खबरों को शामिल किया गया है। इसलिए संपूर्ण भारत में घृणा अपराधों की व्यापकता और विशेषताओं की बेहतर समझ के लिए एक व्यापक डेटाबेस के आधार पर स्वतंत्र स्टडी करना उपयोगी होगा।

मुझे इस स्टडी में डॉ. सिल्विया माजो-वाजक्वेज जैसी संचार शोधकर्ता का मार्गदर्शन मिला। लेकिन कोई जरूरी नहीं कि ऐसी स्टडी करने वाले हर पत्रकार को वैसा मार्गदर्शन मिल जाए। इसलिए जो पत्रकार ऐसे मामलों पर स्टडी करना चाहते हों, उनके लिए मेरे अनुभवों के आधार पर यहां कुछ सुझाव प्रस्तुत हैं। यदि आप अपराधों के सरकारी आंकड़ों तथा हकीकत को समझने के लिए अपना स्वयं का डेटाबेस बनाने की योजना बना रहे हैं, तो यह आलेख आपके लिए उपयोगी होगा।

1. अपनी डेटा शीट व्यावहारिक बनाएं

मैंने स्टडी की शुरुआत में हर मामले की सभी जानकारी को डेटा शीट में जोड़ने की भरपूर मेहनत की। जैसे, पीड़ित के पेशे को रिकॉर्ड करते हुए आईटी प्रोफेशनल, किसान, छात्र, दुकानदार जैसी हर श्रेणी को लिख लिया। इस तरह लगभग 40 श्रेणियां बन गईं। इसके कारण यह आकलन कर पाना मुश्किल हो गया कि किस सामाजिक-आर्थिक समूह के पीड़ित ज्यादा हैं। लेकिन बाद में डॉ. सिल्विया माजो-वाजक्वेज की मदद से मैंने पीड़ितों के पेशे को सिर्फ पाँच श्रेणी में सीमित कर दिया- ब्लू-कॉलर कर्मचारी, सफेद-कॉलर कर्मचारी, छात्र, धार्मिक कार्यकर्ता, और अन्य। इसके बाद यह आकलन करना आसान हो गया कि घृणा अपराध का निशाना किस समूह को बनाए जाने की संभावना अधिक है।

इमेज: स्क्रीनशॉट

 

2. पूर्व धारणाओं को बदलने के लिए तैयार रहें

आपका डेटाबेस आपकी पूर्वकल्पित धारणाओं से विपरीत हो सकता है। लेकिन आप अपनी पूर्व धारणाओं या पूर्वाग्रह के आधार पर किसी भी डेटा को न तो छोड़ सकते हैं, और न ही शामिल कर सकते हैं। मतलब यह है कि आपकी पूर्व धारणा चाहे जो भी हो, आपके पास जो तथ्य आएंगे, उन्हीं के आधार पर विश्लेषण करना होगा।

3. अशुद्धियों से बचें

आपको रिपोर्ट में शब्दों और वर्तनी की अशुद्धियों से बचने की भरपूर कोशिश करनी चाहिए। यह मामूली समस्या लग सकती है। लेकिन एक या दो शब्दों की स्पेलिंग गलत होने से उस वर्कशीट को इंटरनेट में सर्च करना मुश्किल हो जाएगा। जैसे, क्षेत्र के अंतर्गत यदि आप किसी राज्य की स्पेलिंग गलत लिख दें, तो यह हो सकता है कि वह सर्च रिजल्ट में न दिखाई दे। कॉपी एडिटिंग नीरस या अरुचिकर काम लगता है। लेकिन इसी प्रक्रिया में हम लोगों ने आसानी से डेटा का विश्लेषण कर लिया।

4. ऐसे कॉलम हटाएं जिनमें पर्याप्त डेटा नहीं है

प्रारंभ में हमने डेटा शीट में ‘पीड़ित की राष्ट्रीयता‘ दर्ज करने के लिए भी कॉलम रखा था। लेकिन रिकॉर्ड से पता चला कि अधिकांश पीड़ित भारतीय थे। इसलिए ‘राष्ट्रीयता‘ कॉलम रखने से कोई फायदा नहीं था। इसी तरह कुछ अन्य कॉलम थे, जैसे- ‘पीड़ित की यौन अभिरूचि‘ और ‘अपराध के मूकदर्शक‘ – लेकिन इन दोनों मामले में जानकारी इतनी कम उपलब्ध थी कि ऐसे कॉलम का भी कोई मतलब नहीं रह गया। इसलिए ऐसे कॉलम को हमने हटा दिया। बेहतर होगा कि आप उस डेटा पर ध्यान दें, जो आपके सेट में उपलब्ध है।

5. फुटनोट में आवश्यक सूचनाएं दें

किसी भी स्टडी और डेटाबेस हरेक शब्द का पूरा विवरण देना संभव नहीं होता। लेकिन जिन संगठनों, घटनाओं, जगहों तथा प्रसंगों का उल्लेख आता हो, उनके बारे में फुटनोट आवश्यक सूचनाएं देना उपयोगी होता है। किसी संस्था के नाम का संक्षिप्त रूप हो या किसी प्रसंग का वर्णन करना हो, उसकी जानकारी या उसका लिंक फुटनोट के रूप में डाल दें। ऐसा करने पर डेटासेट का उपयोग करने वाला कोई भी व्यक्ति आपके फिल्टर को तोड़े बगैर या आपके डेटा सेट को अव्यवस्थित किए बगैर समझ लेगा।

6. सीधे सवाल हों, हर संभावना को ध्यान में रखें

किसी डेटाबेस में हाँ/नहीं वाले प्रारूप में कॉलम बनाकर आप आसानी से महत्वपूर्ण नतीजे निकाल सकते हैं।  ऐसा करते समय आपको हर तरह की संभावना को भी ध्यान में रखना होगा। जैसे, कोई अपराध होने पर सामान्यतः हम सिर्फ किसी आरोपी के खिलाफ पुलिस में रिपोर्ट दर्ज होने की कल्पना करते हैं। लेकिन हमने अपने डेटाबेस में आरोपी और पीड़ित, दोनों पक्ष के लिए कॉलम बनाया। क्या पुलिस ने प्राथमिकी दर्ज की? ऐसे सवालों के जवाब दर्ज करने पर चौंकाने वाले परिणाम देखने को मिले। पुलिस ने 13 प्रतिशत मामलों में आरोपी के साथ ही पीड़ित के खिलाफ भी प्राथमिकी दर्ज की।

इमेज: स्क्रीनशॉट

इन विषयों का सच सामने लाएं

सरकार जिन मामलों की सूचनाएं जनता से छुपा रही हैं, उनका सच सामने लाना खोजी पत्रकारों का दायित्व है। ऐसे मामलों की सूची लंबी होती जाती है। स्वतंत्र खोजी पत्रकारों को पता लगाना चाहिए कि कोविड-19 से कितने स्वास्थ्य कार्यकर्ता संक्रमित हुए? महामारी के दौरान क्षेत्रों में कितने आगंनबाड़ी सामाजिक कार्यकर्ताओं को रोजगार से वंचित होना पड़ा? कोरोना के कारण स्कूल छोड़ने वाले बच्चों की संख्या कितनी है? कितने छोटे बड़े व्यवसाय बंद हो गए। ऐसे विषयों पर डेटा एकत्र करना उपयोगी होगा। सूचना का अधिकार कार्यकर्ताओं पर हमलों की संख्या का पता लगाना भी एक जरूरी काम है। ऐसे विभिन्न विषयों पर खोजी पत्रकारिता के लिए सावधानीपूर्वक निगरानी और डेटा की आवश्यकता है। ऐसी खबरें आधिकारिक स्रोतों से नहीं मिल पाएंगी।

आधिकारिक डेटा के अभाव के कारण पैदा शून्य को भरने का काम भी हो रहा है। भारत में विभिन्न पत्रकारों, शिक्षाविदों और कार्यकर्ताओं ने कई महत्वपूर्ण मुद्दों पर डेटाबेस बनाना शुरू कर दिया है। जैसे, ‘आर्टिकल 14‘  (Article 14 ) ने ‘एक दशक का अंधकार डेटाबेस प्रोजेक्ट‘  शुरू किया। इसमें पिछले 10 वर्षों में दर्ज किए गए राजद्रोह के मामलों का दस्तावेजीकरण किया जा रहा है। सरकार द्वारा पत्रकारों और कार्यकर्ताओं पर देशद्रोह का आरोप लगाने और ‘राष्ट्र-विरोधी‘ का ठप्पा लगाने की प्रवृति बढ़ती जा रही है।

निष्कर्ष

मुझे उम्मीद है कि यह आलेख पत्रकारों को ऐसे डेटा निकालने में मदद करेगा। जिन सवालों पर डेटा चाहिए, उन्हें कैसे परिभाषित करें, डेटा कैसे एकत्र करें, कैसे रिपोर्ट करें और जरूरी सवालों का जवाब कैसे दें, यह समझना भी आसान होगा।

‘हेट क्राइम ट्रैकर‘ पर अब तक काम नहीं हुआ है। मैं इसे ऑनलाइन करना चाहती हूं। इसके लिए इच्छुक पत्रकारों को डेटा जुटाने और कैटलॉग करने के लिए आमंत्रित करती हूं। इसमें अभी केवल अंग्रेजी मीडिया संगठनों की रिपोर्ट है। हम क्षेत्रीय भाषा की रिपोर्ट को भी शामिल करके इसका विस्तार कर सकते हैं।

क्राउड-सोर्सिंग पर आधारित ऐसी परियोजनाओं में कई तरह की चुनौतियां भी होती हैं। सूचनाओं एवं डेटा की गुणवत्ता सुनिश्चित करना एक बड़ा काम है। प्रविष्टियों का दोहराव, रोकना तथा हर रिपोर्ट का सत्यापन करना भी आसान नहीं है। परिणामों की व्याख्या में भी किसी पूर्वाग्रह से बचना एक बड़ी चुनौती है। ऐसे जोखिम के प्रति सचेत रहते हुए यह कोशिश करने लायक है।

यह लेख मूल रूप से रॉयटर्स इंस्टीट्यूट  ने प्रकाशित किया था। जीआईजेएन ने लेखक की कुछ अतिरिक्त सामग्री जोड़ी है, जिसमें पूरा पेपर भी शामिल है।

अतिरिक्त संसाधन

Interpreting Data: Tips to Make Sure You Know How to Read the Numbers

How One Mexican Data Team Uncovered the Story of 4,000 Missing Women

How Bellingcat and Forensic Architecture Teamed Up with Colombia’s Cerosetenta to Map Police Violence


रेचल चित्रा एक फाइनेंस जर्नलिस्ट और टाइम्स ऑफ इंडिया की विशेष संवाददाता हैं। उनमें मानवीय विषयक खबरों को डेटा के माध्यम से प्रस्तुत करने का जुनून है। वह रॉयटर्स, न्यू इंडियन एक्सप्रेस और डेक्कन क्रॉनिकल में काम कर चुकी हैं। रॉयटर्स इंस्टीट्यूट के लिए उनकी परियोजना के तहत ‘भारत में मुसलमानों और दलितों की लिंचिंग और बलात्कार‘ के मामलों का दस्तावेजीकरण किया गया है।

क्रिएटिव कॉमन्स लाइसेंस के तहत हमारे लेखों को निःशुल्क, ऑनलाइन या प्रिंट माध्यम में पुनः प्रकाशित किया जा सकता है।

आलेख पुनर्प्रकाशित करें


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

अगला पढ़ें

केस स्टडी समाचार और विश्लेषण

पत्रकारिता की रक्षा: खोजी पत्रकारिता का भविष्य

जीआईजेएन कई स्तरों पर क्षमता निर्माण, प्रशिक्षण और उपकरण प्रदान करने के साथ ही खोजी पत्रकारों का नेटवर्क मजबूत करने पर काम करता है। हम दुनिया भर के पत्रकारों को सैटेलाइट इमेजरी और डिजिटल फोरेंसिक जैसी अत्याधुनिक तकनीकों की जानकारी देते हैं। हम स्थानीय और वंचित समुदायों को निगरानी पत्रकारिता क्षमता निर्माण करने में मदद करते हैं। हमारे हेल्प डेस्क ने पिछले एक साल में सहायता के लिए 2,400 अनुरोधों का जवाब दिया।

वहनीयता समाचार और विश्लेषण

स्वतंत्र पत्रकारिता के लिए स्वार्थ रहित फंडिंग की तलाश!

छोटे मीडिया संगठनों के लिए छोटे अनुदान भी काफी मायने रखते हैं। इसलिए गूगल और फेसबुक से मिले अनुदान को व्यापक रूप से स्वीकार किया जा रहा है। जो मीडिया संगठन अपनी चुनी हुई सरकारों से टैक्स माफी स्वीकार करने से हिचकिचाते हैं, वे भी गूगल और फेसबुक का धन खुशी-खुशी लेते हैं। जबकि इन दोनों के पीछे बड़े पैमाने पर लॉबिंग करने वाली ताकतों और प्रभावशाली वर्ग के हित जुड़े हैं।

समाचार और विश्लेषण

खोजी पत्रकारिता के इच्छुक युवाओं के लिए ज़रूरी टिप्स

1970 के दशक में अमेरिका के वाटरगेट कांड के बाद से खोजी पत्रकारिता का महत्व काफी बढ़ गया। हाल के दिनों में पेंडोरा पेपर्स जैसे बड़े खुलासे हुए। इस तरह देखें, तो खोजी पत्रकार लंबे समय से दुनिया भर में भ्रष्टाचार और गलत कामों को उजागर करने में सबसे आगे रहे हैं। वे किसी भी लोकतंत्र का एक अनिवार्य हिस्सा हैं। किसी निरंकुश और दमनकारी शासन में तो उनकी भूमिका और भी अधिक महत्वपूर्ण हैं।

Investigating AI Audio Deepfakes

टिपशीट

फर्जी एआई ऑडियो की जांच कैसे करें

एडवांस्ड स्पीच डीपफेक के द्वारा बिल्कुल असली लगने वाले नकली ऑडियो बनाए जा सकते हैं। उसकी सच्चाई को उस व्यक्ति के नजदीकी दोस्त भी नहीं पहचान सकेंगे। ऐसे ऑडियो क्लिप की जांच के लिए विशेषज्ञ और नए उपकरणों की आवश्यकता होती है। अक्सर पत्रकार किसी नेता के बारे में अपने ज्ञान, रिकॉर्डिंग की खराब गुणवत्ता, संदर्भ या सामान्य सामान्य ज्ञान के आधार पर किसी ऑडियो क्लिप में किए गए फर्जीवाड़े को तुरंत पहचान लेते हैं।