Image: Shutterstock

आलेख

•

विषय

» डेटा पत्रकारिता

डेटा जर्नलिज़्म: पत्रकारों के लिए ‘मानक विचलन’ से सबंधित 4 जरूरी बातें

द्वारा डेनिस-मैरी ऑर्डवे • 6 सितम्बर 2022

इस लेख को पढ़ें

इमेज: शटरस्टॉक

डेटा पत्रकारों को ‘अकादमिक शोध’ से महत्वपूर्ण खबरें मिलती हैं। ऐसे शोध दस्तावेज में ‘मानक विचलन’ शब्द का अक्सर उपयोग होता है। पत्रकारों को इसका अर्थ अच्छी तरह समझना चाहिए। तभी आप अपने पाठकों को इसके बारे में बेहतर जानकारी दे पाएंगे। इस आलेख में ‘मानक विचलन’ शब्द के बारे में विस्तार से बताया गया है। ‘मानक विचलन’ के संबंध में चार प्रमुख चीजें हैं, जिन्हें आपको जानना आवश्यक है।

1. ‘मानक विचलन’ (Standard Deviation) ऐसी संख्या है, जो बताती है कि डेटा में कितनी भिन्नता है।

संख्यात्मक या मात्रात्मक डेटा में इसका प्रयोग होता है। जैसे, जन्म-दर, तापमान की गणना, या छात्रों की परीक्षा के अंकों का विश्लेषण। ऐसे मामलों में शोधकर्ता आमतौर पर डेटा के ‘मानक विचलन’ की गणना करते हैं। इसमें बताते हैं कि डेटा कितना करीब या दूर है। अगर यह ‘उच्च मानक विचलन’ हो, तो इसका मतलब है कि डेटा अधिक फैला हुआ है। अगर ‘मानक विचलन’ निम्न हो, तो डेटा का औसत मूल्य उस डेटा क्लस्टर से ज्यादा करीब होगा।

‘ओहियो स्टेट यूनिवर्सिटी’ में सांख्यिकी विषय की प्रोफेसर डेबोरा जे. रुम्सी अपनी पुस्तक ‘स्टैटिस्टिक्स फॉर डमीज़’ में लिखती हैं – “मानक विचलन से हमें महत्वपूर्ण संदर्भ मिलता है। इसके बिना, हमें किसी डेटा का केवल एक हिस्सा मिल सकता है। सांख्यिकीविद किसी ऐसे व्यक्ति की कहानी सुनाना पसंद करते हैं, जिसका एक पैर बर्फ के पानी वाली बाल्टी में हो जबकि दूसरा पांव किसी उबलते पानी वाली बाल्टी में हो। वह व्यक्ति ऐसा कह सकता है कि औसतन उसे ठंडे और गर्म दोनों तरह के पानी के एहसास से बहुत अच्छा लगा! लेकिन उसके दोनों पैर के अलग-अलग दो तापमानों के बीच काफी फर्क होगा।”

प्रोफेसर डेबोरा जे. रुम्सी ने कुछ और दिलचस्प उदाहरण दिए। अपनी पुस्तक में वह लिखती हैं- “अगर आपको किसी क्षेत्र में मकानों की औसत कीमत बताई जाए, तब भी आपको उस खास मकान की कीमत का सही पता नहीं चल पाएगा, जो आपको पसंद है। यानी वह औसत मूल्य से कितना सस्ता या कितना महंगा है। इसी तरह, किसी कंपनी में औसत वेतन से कोई अंदाज लगाना मुश्किल होगा, यदि उसके न्यूनतम और अधिकतम वेतन के बीच का फासला बहुत अधिक हो।”

2. भविष्यवाणी करने, प्रवृत्तियों की जांच और शोध प्रश्न का उत्तर देने में ‘मानक विचलन‘ का उपयोग।

डेटासेट का ‘मानक विचलन‘ कई अकादमिक अध्ययनों में सीमित भूमिका निभाता है। वैज्ञानिक केवल उस ‘मानक विचलन’ के मान की तालिका या सूची बना सकते हैं, या अपने लेख के मुख्य भाग में उनका उल्लेख कर सकते हैं।

लेकिन कई बार शोधकर्ता अपने अध्ययन के लिए केंद्रीय प्रश्नों का उत्तर देने में मदद के लिए माप पर काफी भरोसा करते हैं। जैसे:

मौसम का अनुमान, मतदाता व्यवहार, टैक्स राजस्व, स्वास्थ्य देखभाल सामग्री का उपयोग इत्यादि मामलों में एकत्र किए गए डेटा के ‘मानक विचलन’ के आधार पर भविष्यवाणियां कर सकते हैं।
इक्विटी मार्केट के शोधकर्ता आमतौर पर शेयर बाजार की अस्थिरता को मापने के लिए स्टॉक की कीमतों के ‘मानक विचलन’ का उपयोग करते हैं। इसमें ‘उच्च मानक विचलन’ का मतलब है कि शेयर मार्केट में उच्च अस्थिरता का संकेत है।
छात्रों की परीक्षा के अंकों की जांच करने वाले शोधकर्ता ‘मानक विचलन’ का उपयोग करके बता सकते हैं कि अधिकांश छात्रों को औसत या उसके करीब अंक मिले या इसमें काफी भिन्नता है। इसके जरिए उन छात्रों के अनुपात का पता लगा सकते हैं जिन्हें अधिक सहायता की आवश्यकता है।

‘मानक विचलन’ की गणना कैसे करें? इसका संक्षिप्त विवरण यहां दिया गया है।

3. कुछ वैज्ञानिक ‘इंच’ या ‘पाउंड’ जैसी किसी माप इकाई के बजाय ‘मानक विचलन’ के रूप में अपने निष्कर्ष प्रस्तुत करते हैं.

जब डेटासेट में विभिन्न इकाइयों के साथ डेटा बिंदु होते हैं, तो वैज्ञानिकों को अक्सर तुलना करने और संबंधों की तलाश करने से पहले डेटा का मानकीकरण करने की आवश्यकता होती है। जैसे, संतरे के रस की खपत को ‘औंस’ या ‘ग्राम’ में मापा गया हो। इसके साथ ‘फ्लू टीकाकरण’ की दर के बीच संबंधों की जांच करना हो। प्रति एक लाख नागरिकों में हर महीने कितने टीके लगाए गए।

डेटा के मानकीकरण की प्रक्रिया में प्रत्येक संख्यात्मक डेटा बिंदु को डेटासेट के ‘मानक विचलन’ से विभाजित किया जाता है। ऐसा करने से माप की इकाइयों में परिवर्तन होता है। सामान्य इकाइयों जैसे औंस, इंच, पाउंड या किलोग्राम का उपयोग करके निष्कर्ष बताने के बजाय इन्हें ‘मानक विचलन’ के रूप में रिपोर्ट करना चाहिए।

हाइपोथेटिक या परिकल्पना के रूप में देखें। संतरे के रस की खपत और फ्लू टीकाकरण दरों पर शोध करने वाले वैज्ञानिक यह निष्कर्ष निकाल सकते हैं कि संतरे के रस की खपत में एक ‘मानक विचलन’ की वृद्धि होने पर टीकाकरण दरों में एक ‘मानक विचलन’ की कमी होगी।

डेटासेट का मानकीकरण करने से शोधकर्ताओं का काम आसान होता है। ‘हार्वर्ड मेडिकल स्कूल’ में न्यूरोलॉजी के एसोसिएट प्रोफेसर ब्रायन हीली के अनुसार सामान्य पाठकों को शोध के परिणाम समझने में कठिनाई हो सकती है। इसलिए पत्रकारों को ऐसे शोध पत्रों को बारीकी से पढ़ने के बाद आम पाठकों को समझाने लायक भाषा में लिखना चाहिए।

“जब तक आप वास्तव में कागज में बारीकी से नहीं देखते हैं, आपको पता नहीं चलेगा कि एक ‘मानक विचलन‘ का क्या अर्थ है।” ब्रायन हीली कहते हैं। वह ब्रिघम स्थित ‘पार्टनर्स मल्टीपल स्केलेरोसिस सेंटर’ और बोस्टन स्थित महिला अस्पताल में प्रमुख बायो स्टैटिस्टियन भी हैं।

वे कहते हैं- “किसी शोध के परिणाम जिन इकाइयों में दिखाए जा रहे हैं, उन इकाइयों को अच्छी तरह समझें। यदि रिपोर्ट में कोई संख्या दी गई है, तो आपको यह समझना होगा कि उस संख्या की व्याख्या कैसे करें। उन इकाइयों को जाने बिना आप यह नहीं समझ सकते कि संख्या की व्याख्या कैसे करें।”

4. ‘मानक विचलन’ के जरिए यह पुष्टि कर सकते हैं कि कोई डेटा बिंदु ‘बाहरी’ है अथवा नहीं।

बाहरी (आउटलाइअर) परिणाम ऐसे अत्यधिक उच्च या निम्न मान हैं जो सांख्यिकीय विश्लेषणों और विषम परिणामों को जटिल बना सकते हैं। कई शोधकर्ता किसी त्रुटि के कारण होने वाले आउटलाइअर्स को बदल या हटा देते हैं। जैसे, डेटा एकत्र करने या दर्ज करने में त्रुटि।

किसी डेटासेट में सभी डेटा के ग्राफ़ को देखने पर कुछ डेटा बिंदु बाहरी या आउटलाइअर प्रतीत होते हैं क्योंकि वे दूसरों से बहुत भिन्न होते हैं। डेटासेट का ‘मानक विचलन’ इस बात को ध्यान में रखता है कि व्यक्तिगत मान किसी औसत से कितनी दूर है। वैज्ञानिक अक्सर इसका उपयोग यह पता लगाने के लिए करते हैं कि क्या असामान्य डेटा बिंदु एक ‘बाहरी’ है। यह तरीका उन डेटासेट में अच्छी तरह काम करता है, जो एक घंटी के आकार के वक्र के पैटर्न का पालन करते हैं। इसमें अधिकांश डेटा का घंटी के केंद्र के पास अभिसरण होता है, जहां औसत मान स्थित होता है।

उस डेटासेट के लिए ‘मानक विचलन’ की गणना करने के बाद, आउटलाइअर्स को खोजना आसान है। घंटी के आकार के वक्र का अनुसरण करने वाले डेटा के लिए एक सामान्य नियम यह है कि लगभग 99.7 प्रतिशत डेटा औसत के तीन ‘मानक विचलन’ के भीतर होगा। इस सीमा से बाहर के डेटा को आमतौर पर आउटलाइअर माना जाता है।

किसी डेटासेट का ‘मानक विचलन’ आउटलाइअर्स द्वारा प्रभावित होता है। लेकिन पत्रकारों को यह नहीं समझना चाहिए कि कोई बड़ा ‘मानक विचलन’ किसी डेटा की गुणवत्ता की समस्याओं को इंगित करता है। ‘स्टैटिस्टिक्स फॉर डमीज़’ में प्रोफेसर डेबोरा जे. रुम्सी लिखती हैं- “एक बड़ा ‘मानक विचलन’ जरूरी नहीं कि एक बुरी चीज हो। यह सिर्फ अध्ययन किए जा रहे उस समूह में बड़ी मात्रा में भिन्नता को दर्शाता है।”

इस पोस्ट का मूल रूप से प्रकाशन ‘द जर्नलिस्ट्स रिसोर्स’ द्वारा किया गया। इसे ‘क्रिएटिव कॉमन्स लाइसेंस’ के तहत यहां पुनर्मुद्रित किया गया है। ‘द जर्नलिस्ट्स रिसोर्स’ इस टिपशीट को बनाने में मदद के लिए यूनिवर्सिटी ऑफ साउथ फ्लोरिडा के कॉलेज ऑफ पब्लिक हेल्थ में स्वास्थ्य अर्थशास्त्र के प्रोफेसर ट्रॉय क्वास्ट और हार्वर्ड मेडिकल स्कूल में न्यूरोलॉजी के एसोसिएट प्रोफेसर ब्रायन हीली का आभारी है।

अतिरिक्त संसाधन

5 Things Journalists Need to Know About Statistical Significance

New Data Tools and Tips for Investigating Climate Change

GIJN Resource Center: Data Journalism

डेनिस-मैरी ऑर्डवे ‘द जर्नलिस्ट्स रिसोर्स’ की प्रबंध संपादक हैं। उन्होंने यूएसए और मध्य अमेरिका में समाचार पत्रों और रेडियो स्टेशनों के लिए भी काम किया है। उनका लेखन यूएसए टुडे, द न्यूयॉर्क टाइम्स और द वाशिंगटन पोस्ट में प्रकाशित हुआ है। वह 2014-15 में ‘हार्वर्ड नीमन फैलो भी रह चुकी हैं।

यह कार्य लाइसेंस के अन्तर्गत है क्रिएटिव कॉमन्स एट्रिब्यूशन-नोडेरिवेटिव्स 4.0 अंतर्राष्ट्रीय लाइसेंस

क्रिएटिव कॉमन्स लाइसेंस के तहत हमारे लेखों को निःशुल्क, ऑनलाइन या प्रिंट माध्यम में पुनः प्रकाशित किया जा सकता है।

इससे जुड़े अन्य आलेख पढ़ें:

GIJN हिंदी standard deviation आउटलाइअर्स जीआईजेएन डेटा जर्नलिज़्म ब्रायन हीली मानक विचलन सांख्यिकी

आलेख पुनर्प्रकाशित करें

Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

<h2>डेटा जर्नलिज़्म: पत्रकारों के लिए &lsquo;मानक विचलन&rsquo; से सबंधित 4 जरूरी बातें</h2> द्वारा <a href="https://twitter.com/deniseordway?lang=en">डेनिस-मैरी ऑर्डवे</a> for Global Investigative Journalism Network &bull; 6 सितम्बर 2022 डेटा पत्रकारों को &lsquo;अकादमिक शोध&rsquo; से महत्वपूर्ण खबरें मिलती हैं। ऐसे शोध दस्तावेज में &lsquo;मानक विचलन&rsquo; शब्द का अक्सर उपयोग होता है। पत्रकारों को इसका अर्थ अच्छी तरह समझना चाहिए। तभी आप अपने पाठकों को इसके बारे में बेहतर जानकारी दे पाएंगे। इस आलेख में&nbsp; &lsquo;मानक विचलन&rsquo; शब्द के बारे में विस्तार से बताया गया है। &lsquo;मानक विचलन&rsquo; के संबंध में चार प्रमुख चीजें हैं, जिन्हें आपको जानना आवश्यक है।1. &lsquo;मानक विचलन&rsquo; (Standard Deviation) ऐसी संख्या है, जो बताती है कि डेटा में कितनी भिन्नता है।संख्यात्मक या मात्रात्मक डेटा में इसका प्रयोग होता है। जैसे, जन्म-दर, तापमान की गणना, या छात्रों की परीक्षा के अंकों का विश्लेषण। ऐसे मामलों में शोधकर्ता आमतौर पर डेटा के &lsquo;मानक विचलन&rsquo; की गणना करते हैं। इसमें बताते हैं कि<a href="https://www.ncbi.nlm.nih.gov/books/NBK574574/"> डेटा कितना करीब या दूर है</a>। अगर यह &lsquo;उच्च मानक विचलन&rsquo; हो, तो इसका मतलब है कि डेटा अधिक फैला हुआ है। अगर &lsquo;मानक विचलन&rsquo; निम्न हो, तो डेटा का औसत मूल्य उस डेटा क्लस्टर से ज्यादा करीब होगा।<aside class="module align-right half type-pull-quote">&ldquo;सांख्यिकीविद किसी ऐसे व्यक्ति की कहानी सुनाना पसंद करते हैं, जिसका एक पैर बर्फ के पानी वाली बाल्टी में हो जबकि दूसरा पांव किसी उबलते पानी वाली बाल्टी में।&rdquo; - सांख्यिकी प्रोफ़ेसर डेबोरा जे. रुम्सी</aside>&lsquo;ओहियो स्टेट यूनिवर्सिटी&rsquo; में सांख्यिकी विषय की प्रोफेसर <a href="https://stat.osu.edu/people/rumsey-johnson.1">डेबोरा जे. रुम्सी</a>&nbsp;अपनी पुस्तक <a href="https://www.dummies.com/article/academics-the-arts/math/statistics/finding-standard-deviation-in-a-statistical-sample-169326/">&lsquo;स्टैटिस्टिक्स फॉर डमीज़&rsquo;</a>&nbsp;में लिखती हैं - &ldquo;मानक विचलन से हमें महत्वपूर्ण संदर्भ मिलता है। इसके बिना, हमें किसी डेटा का केवल एक हिस्सा मिल सकता है। सांख्यिकीविद किसी ऐसे व्यक्ति की कहानी सुनाना पसंद करते हैं, जिसका एक पैर बर्फ के पानी वाली बाल्टी में हो जबकि दूसरा पांव किसी उबलते पानी वाली बाल्टी में हो। वह व्यक्ति ऐसा कह सकता है कि औसतन उसे ठंडे और गर्म दोनों तरह के पानी के एहसास से बहुत अच्छा लगा! लेकिन उसके दोनों पैर के अलग-अलग दो तापमानों के बीच काफी फर्क होगा।&rdquo;<img class="aligncenter size-full wp-image-573801" src="https://gijn.org/wp-content/uploads/2022/09/Deviation-JR-771x560-1.png" alt="" width="771" height="560">प्रोफेसर डेबोरा जे. रुम्सी ने कुछ और दिलचस्प उदाहरण दिए। अपनी पुस्तक में वह लिखती हैं- &ldquo;अगर आपको किसी क्षेत्र में मकानों की औसत कीमत बताई जाए, तब भी आपको उस खास मकान की कीमत का सही पता नहीं चल पाएगा, जो आपको पसंद है। यानी वह औसत मूल्य से कितना सस्ता या कितना महंगा है। इसी तरह, किसी कंपनी में औसत वेतन से कोई अंदाज लगाना मुश्किल होगा, यदि उसके न्यूनतम और अधिकतम वेतन के बीच का फासला बहुत अधिक हो।&rdquo;2. भविष्यवाणी करने, प्रवृत्तियों की जांच और शोध प्रश्न का उत्तर देने में &lsquo;मानक विचलन&lsquo; का उपयोग।डेटासेट का &lsquo;मानक विचलन&lsquo; कई अकादमिक अध्ययनों में सीमित भूमिका निभाता है। वैज्ञानिक केवल उस &lsquo;मानक विचलन&rsquo; के मान की तालिका या सूची बना सकते हैं, या अपने लेख के मुख्य भाग में उनका उल्लेख कर सकते हैं।लेकिन कई बार शोधकर्ता अपने अध्ययन के लिए केंद्रीय प्रश्नों का उत्तर देने में मदद के लिए माप पर काफी भरोसा करते हैं। जैसे:<ul>
<li>मौसम का अनुमान, मतदाता व्यवहार, टैक्स राजस्व, स्वास्थ्य देखभाल सामग्री का उपयोग इत्यादि मामलों में एकत्र किए गए डेटा के &lsquo;मानक विचलन&rsquo; के आधार पर भविष्यवाणियां कर सकते हैं।</li>
<li>इक्विटी मार्केट के शोधकर्ता आमतौर पर <a href="https://www.emerald.com/insight/content/doi/10.1108/SEF-09-2020-0389/full/html">शेयर बाजार की अस्थिरता को मापने के लिए स्टॉक की कीमतों के &lsquo;मानक विचलन&rsquo; का उपयोग</a> करते हैं। इसमें &lsquo;उच्च मानक विचलन&rsquo; का मतलब है कि शेयर मार्केट में उच्च अस्थिरता का संकेत है।</li>
<li>छात्रों की परीक्षा के अंकों की जांच करने वाले शोधकर्ता &lsquo;मानक विचलन&rsquo; का उपयोग करके बता सकते हैं कि अधिकांश छात्रों को औसत या उसके करीब अंक मिले या इसमें काफी भिन्नता है। इसके जरिए उन छात्रों के अनुपात का पता लगा सकते हैं जिन्हें अधिक सहायता की आवश्यकता है।</li>
</ul>&lsquo;मानक विचलन&rsquo; की गणना कैसे करें? इसका <a href="https://www.ncbi.nlm.nih.gov/books/NBK574574/">संक्षिप्त विवरण</a>&nbsp;यहां दिया गया है।3. कुछ वैज्ञानिक &lsquo;इंच&rsquo; या &lsquo;पाउंड&rsquo; जैसी किसी माप इकाई के बजाय &lsquo;मानक विचलन&rsquo; के रूप में अपने निष्कर्ष प्रस्तुत करते हैं.जब डेटासेट में विभिन्न इकाइयों के साथ डेटा बिंदु होते हैं, तो वैज्ञानिकों को अक्सर तुलना करने और संबंधों की तलाश करने से पहले डेटा का मानकीकरण करने की आवश्यकता होती है। जैसे, संतरे के रस की खपत को &lsquo;औंस&rsquo; या &lsquo;ग्राम&rsquo; में मापा गया हो। इसके साथ &lsquo;फ्लू टीकाकरण&rsquo; की दर के बीच संबंधों की जांच करना हो। प्रति एक लाख नागरिकों में हर महीने कितने टीके लगाए गए।डेटा के मानकीकरण की प्रक्रिया में प्रत्येक संख्यात्मक डेटा बिंदु को डेटासेट के &lsquo;मानक विचलन&rsquo; से विभाजित किया जाता है। ऐसा करने से माप की इकाइयों में परिवर्तन होता है। सामान्य इकाइयों जैसे औंस, इंच, पाउंड या किलोग्राम का उपयोग करके निष्कर्ष बताने के बजाय इन्हें &lsquo;मानक विचलन&rsquo; के रूप में रिपोर्ट करना चाहिए।<aside class="module align-right half type-pull-quote">&ldquo;यदि कोई संख्या रिपोर्ट की गई है, तो आपको यह समझना होगा कि उस संख्या की व्याख्या कैसे करें।&rdquo; - प्रोफेसर ब्रायन हीली, हार्वर्ड मेडिकल स्कूल</aside>हाइपोथेटिक या परिकल्पना के रूप में देखें। संतरे के रस की खपत और फ्लू टीकाकरण दरों पर शोध करने वाले वैज्ञानिक यह निष्कर्ष निकाल सकते हैं कि संतरे के रस की खपत में एक &lsquo;मानक विचलन&rsquo; की वृद्धि होने पर टीकाकरण दरों में एक &lsquo;मानक विचलन&rsquo; की कमी होगी।डेटासेट का मानकीकरण करने से शोधकर्ताओं का काम आसान होता है। &lsquo;हार्वर्ड मेडिकल स्कूल&rsquo; में न्यूरोलॉजी के एसोसिएट प्रोफेसर <a href="https://postgraduateeducation.hms.harvard.edu/faculty-staff/brian-healy-0">ब्रायन हीली</a>&nbsp;के अनुसार सामान्य पाठकों को शोध के परिणाम समझने में कठिनाई हो सकती है। इसलिए पत्रकारों को ऐसे शोध पत्रों को बारीकी से पढ़ने के बाद आम पाठकों को समझाने लायक भाषा में लिखना चाहिए।&ldquo;जब तक आप वास्तव में कागज में बारीकी से नहीं देखते हैं, आपको पता नहीं चलेगा कि एक &lsquo;मानक विचलन&lsquo; का क्या अर्थ है।&rdquo; ब्रायन हीली कहते हैं। वह ब्रिघम स्थित &lsquo;पार्टनर्स मल्टीपल स्केलेरोसिस सेंटर&rsquo; और बोस्टन स्थित महिला अस्पताल में प्रमुख बायो स्टैटिस्टियन भी हैं।वे कहते हैं- &ldquo;किसी शोध के परिणाम जिन इकाइयों में दिखाए जा रहे हैं, उन इकाइयों को अच्छी तरह समझें। यदि रिपोर्ट में कोई संख्या दी गई है, तो आपको यह समझना होगा कि उस संख्या की व्याख्या कैसे करें। उन इकाइयों को जाने बिना आप यह नहीं समझ सकते कि संख्या की व्याख्या कैसे करें।&rdquo;4. &lsquo;मानक विचलन&rsquo; के जरिए यह पुष्टि कर सकते हैं कि कोई डेटा बिंदु &lsquo;बाहरी&rsquo; है अथवा नहीं।बाहरी (आउटलाइअर) परिणाम ऐसे अत्यधिक उच्च या निम्न मान हैं जो <a href="https://scholarworks.umass.edu/cgi/viewcontent.cgi?article=1139&amp;context=pare">सांख्यिकीय विश्लेषणों और विषम परिणामों को जटिल</a> बना सकते हैं। कई शोधकर्ता किसी त्रुटि के कारण होने वाले आउटलाइअर्स को बदल या हटा देते हैं। जैसे, डेटा एकत्र करने या दर्ज करने में त्रुटि।किसी डेटासेट में सभी डेटा के ग्राफ़ को देखने पर कुछ डेटा बिंदु बाहरी या आउटलाइअर प्रतीत होते हैं क्योंकि वे दूसरों से बहुत भिन्न होते हैं। डेटासेट का &lsquo;मानक विचलन&rsquo; इस बात को ध्यान में रखता है कि व्यक्तिगत मान किसी औसत से कितनी दूर है। वैज्ञानिक अक्सर इसका उपयोग यह पता लगाने के लिए करते हैं कि क्या असामान्य डेटा बिंदु एक &lsquo;बाहरी&rsquo; है। यह तरीका उन डेटासेट में अच्छी तरह काम करता है, जो एक घंटी के आकार के वक्र के पैटर्न का पालन करते हैं। इसमें अधिकांश डेटा का घंटी के केंद्र के पास अभिसरण होता है, जहां औसत मान स्थित होता है।<aside class="module align-right half type-pull-quote">&lsquo;मानक विचलन&rsquo; आउटलाइअर्स द्वारा प्रभावित होता है। लेकिन पत्रकारों को यह नहीं समझना चाहिए कि कोई बड़ा &lsquo;मानक विचलन&rsquo; किसी डेटा की गुणवत्ता की समस्याओं को इंगित करता है।</aside>उस डेटासेट के लिए &lsquo;मानक विचलन&rsquo; की गणना करने के बाद, आउटलाइअर्स को खोजना आसान है। घंटी के आकार के वक्र का अनुसरण करने वाले डेटा के लिए <a href="http://faculty.washington.edu/tamre/GS105Lecture2.pdf">एक सामान्य नियम</a>&nbsp;यह है कि लगभग 99.7 प्रतिशत डेटा औसत के तीन &lsquo;मानक विचलन&rsquo; के भीतर होगा। इस सीमा से बाहर के डेटा को आमतौर पर आउटलाइअर माना जाता है।किसी डेटासेट का &lsquo;मानक विचलन&rsquo; आउटलाइअर्स द्वारा प्रभावित होता है। लेकिन पत्रकारों को यह नहीं समझना चाहिए कि कोई बड़ा &lsquo;मानक विचलन&rsquo; किसी डेटा की गुणवत्ता की समस्याओं को इंगित करता है। &lsquo;स्टैटिस्टिक्स फॉर डमीज़&rsquo; में प्रोफेसर डेबोरा जे. रुम्सी लिखती हैं- &ldquo;एक बड़ा &lsquo;मानक विचलन&rsquo; जरूरी नहीं कि एक बुरी चीज हो। यह सिर्फ अध्ययन किए जा रहे उस समूह में बड़ी मात्रा में भिन्नता को दर्शाता है।&rdquo;इस पोस्ट का <a href="https://journalistsresource.org/media/standard-deviation-data-journalists/">मूल रूप से प्रकाशन</a> &nbsp;<a href="https://journalistsresource.org/">&lsquo;द जर्नलिस्ट्स रिसोर्स&rsquo;</a> द्वारा किया गया। इसे <a href="https://creativecommons.org/licenses/by-nd/4.0/">&lsquo;क्रिएटिव कॉमन्स लाइसेंस&rsquo; </a>के तहत यहां पुनर्मुद्रित किया गया है। &lsquo;द जर्नलिस्ट्स रिसोर्स&rsquo; इस टिपशीट को बनाने में मदद के लिए यूनिवर्सिटी ऑफ साउथ फ्लोरिडा के कॉलेज ऑफ पब्लिक हेल्थ में स्वास्थ्य अर्थशास्त्र के प्रोफेसर <a href="https://health.usf.edu/publichealth/overviewcoph/faculty/troy-quast">ट्रॉय क्वास्ट</a>&nbsp;और हार्वर्ड मेडिकल स्कूल में न्यूरोलॉजी के एसोसिएट प्रोफेसर <a href="https://postgraduateeducation.hms.harvard.edu/faculty-staff/brian-healy-0">ब्रायन हीली</a>&nbsp;का आभारी है।<h4>अतिरिक्त संसाधन</h4><a href="https://gijn.org/2022/07/20/5-things-journalists-need-to-know-about-statistical-significance/">5 Things Journalists Need to Know About Statistical Significance</a><a href="https://gijn.org/2021/05/11/new-data-tools-and-tips-for-investigating-climate-change/">New Data Tools and Tips for Investigating Climate Change</a><a href="https://helpdesk.gijn.org/support/solutions/articles/14000036505-data-journalism">GIJN Resource Center: Data Journalism</a><hr><a href="https://twitter.com/deniseordway?lang=en"><img class="alignleft size-thumbnail wp-image-573810" src="https://gijn.org/wp-content/uploads/2022/09/Ordway-140x140.jpeg" alt="" width="140" height="140">डेनिस-मैरी ऑर्डवे</a> &lsquo;द जर्नलिस्ट्स रिसोर्स&rsquo; की प्रबंध संपादक हैं। उन्होंने यूएसए और मध्य अमेरिका में समाचार पत्रों और रेडियो स्टेशनों के लिए भी काम किया है। उनका लेखन यूएसए टुडे, द न्यूयॉर्क टाइम्स और द वाशिंगटन पोस्ट में प्रकाशित हुआ है। वह 2014-15 में &lsquo;हार्वर्ड नीमन फैलो भी रह चुकी हैं।
	This <a target="_blank" href="https://gijn.org/hi/aalekh/data-journalists-need-to-know-about-standard-deviation-hindi/">article</a> first appeared on <a target="_blank" href="https://gijn.org">Global Investigative Journalism Network</a> and is republished here under a Creative Commons license.
	<img id="republication-tracker-tool-source" src="https://gijn.org/?republication-pixel=true&amp;post=657947&amp;ga=UA-21528033-17">

अगला पढ़ें

डेटा पत्रकारिता रिपोर्टिंग टूल्स और टिप्स

पत्रकारों को ‘सांख्यिकीय महत्व’ पर ये 5 बातें अवश्य जानना चाहिए

द्वारा डेनिस-मैरी ऑर्डवे • 31 अगस्त 2022

अकादमिक पत्रिकाएं अक्सर ‘सांख्यिकीय महत्व’ वाले परिणामों के साथ अनुसंधान को प्राथमिकता देती हैं। इसलिए शोधकर्ता अक्सर उस दिशा में अपने प्रयास केंद्रित करते हैं। कई अध्ययनों से पता चलता है कि सांख्यिकीय रूप से महत्वपूर्ण निष्कर्षों वाले रिसर्च पेपर्स के प्रकाशित करने की अधिक संभावना रहती है।

A 2019 protest in southern Africa against gender-based violence. Image: Shutterstock

यौन अपराधियों को बचाने वाले सिस्टम पर कैसे रिपोर्टिंग करें

द्वारा सारा उलरिच • 24 जून 2025

अपनी जांच के लिए सबसे उपयोगी जानकारी कहां मिलेगी? इसके लिए आपको यह पता लगाना होगा कि कहां खोजना है। थॉम्पसन कहते हैं- “परिकल्पना के बारे में सोचें। जानकारी कहां से एकत्र की जाएगी? यह कहां होगी?“

जैसे, यौन हिंसा के अपराधों से जुड़ी जानकारी कहां मिलेगी? इसके लिए मेडिकल रिकॉर्ड, पुलिस रिपोर्ट, मानसिक स्वास्थ्य सहायता डेटा से जानकारी मिल सकती है। सोशल मीडिया में पीड़ितों ने अपनी कहानी सुनाई होगी। हम जानकारी के ऐसे स्रोतों का चयन करें, जिन्हें बुद्धिमानी से जुटाया गया है।

people walking along bridge across the Thames River in London

रिपोर्टिंग टूल्स और टिप्स सुरक्षा और बचाव

जासूसी का शिकार होने से कैसे बचें पत्रकार?

द्वारा लॉरा डिक्सन • 13 जून 2025

हमारे समूह के दो पत्रकारों के एक जोड़े के साथ भी दिलचस्प मामला हुआ। लंबे दुपट्टे वाला एक युवक उनका पीछा कर रहा था। जबकि ऐसा लग रहा था वह किसी काम से बैंक जा रहा है। एक और बात यह है कि यह एक बूढ़ा, गंदा स्पॉटर था जिसे किसी ब्लॉकबस्टर फिल्म में एमआई6 एजेंट के रूप में नहीं लिया गया होगा।

रिपोर्टिंग टूल्स और टिप्स

वेबसाइट सामग्री की जांच में उपयोगी है ‘इन्फॉरमेशन लॉन्ड्रोमैट’

23 जनवरी 2025

वेबसाइट विश्लेषण के लिए Information Laundromat सबसे नया, दिलचस्प और मुफ्त टूल है। जॉर्ज मार्शल फंड के अलायंस फॉर सिक्योरिंग डेमोक्रेसी – (एएसडी) ने यह टूल विकसित किया है। यह सामग्री और मेटाडेटा का विश्लेषण कर सकता है।

सुगमता सेटिंग्स

टेक्स्ट साइज

रंगों का चुनाव

पाठन टूल्स

अन्य

आलेख

विषय

डेटा जर्नलिज़्म: पत्रकारों के लिए ‘मानक विचलन’ से सबंधित 4 जरूरी बातें

इस लेख को पढ़ें

अतिरिक्त संसाधन

इससे जुड़े अन्य आलेख पढ़ें:

आलेख पुनर्प्रकाशित करें

अगला पढ़ें

डेटा पत्रकारिता रिपोर्टिंग टूल्स और टिप्स

पत्रकारों को ‘सांख्यिकीय महत्व’ पर ये 5 बातें अवश्य जानना चाहिए

यौन अपराधियों को बचाने वाले सिस्टम पर कैसे रिपोर्टिंग करें

रिपोर्टिंग टूल्स और टिप्स सुरक्षा और बचाव

जासूसी का शिकार होने से कैसे बचें पत्रकार?

रिपोर्टिंग टूल्स और टिप्स

वेबसाइट सामग्री की जांच में उपयोगी है ‘इन्फॉरमेशन लॉन्ड्रोमैट’

आलेख

विषय

डेटा जर्नलिज़्म: पत्रकारों के लिए ‘मानक विचलन’ से सबंधित 4 जरूरी बातें

इस लेख को पढ़ें

संबंधित संसाधन

डिजिटल खतरों की जांच : जीआईजेएन गाइड

खोजी पत्रकारिता गाइड

गूगल शीट्स का उपयोग कैसे करें पत्रकार

ग्लोबल वार्मिंग पर रिपोर्टिंग के लिए जीआईजेएन गाइड

शेयर

अतिरिक्त संसाधन

संबंधित संसाधन

डिजिटल खतरों की जांच : जीआईजेएन गाइड

खोजी पत्रकारिता गाइड

गूगल शीट्स का उपयोग कैसे करें पत्रकार

ग्लोबल वार्मिंग पर रिपोर्टिंग के लिए जीआईजेएन गाइड

संबंधित आलेख

पत्रकारों को ‘सांख्यिकीय महत्व’ पर ये 5 बातें अवश्य जानना चाहिए

यौन अपराधियों को बचाने वाले सिस्टम पर कैसे रिपोर्टिंग करें

जासूसी का शिकार होने से कैसे बचें पत्रकार?

वेबसाइट सामग्री की जांच में उपयोगी है ‘इन्फॉरमेशन लॉन्ड्रोमैट’

इससे जुड़े अन्य आलेख पढ़ें:

आलेख पुनर्प्रकाशित करें

अगला पढ़ें

डेटा पत्रकारिता रिपोर्टिंग टूल्स और टिप्स

पत्रकारों को ‘सांख्यिकीय महत्व’ पर ये 5 बातें अवश्य जानना चाहिए

यौन अपराधियों को बचाने वाले सिस्टम पर कैसे रिपोर्टिंग करें

रिपोर्टिंग टूल्स और टिप्स सुरक्षा और बचाव

जासूसी का शिकार होने से कैसे बचें पत्रकार?

रिपोर्टिंग टूल्स और टिप्स

वेबसाइट सामग्री की जांच में उपयोगी है ‘इन्फॉरमेशन लॉन्ड्रोमैट’