आलेख

विषय

न्यूजरूम में खबरें कैसे आर्टिफिशियल इंटेलिजेंस का उपयोग कर लिखी जा रहीं हैं

इस लेख को पढ़ें

फोटो: गर्ड ऑल्टमैन / क्रिएटिव कॉमन्स

दुनिया भर के विभिन्न मीडिया संस्थानों और समाचार एजेंसियों में अब कंप्यूटर का एक खास उपयोग हो रहा है। खेल, मौसम, स्टॉक एक्सचेंज की गतिविधियों, कॉरपोरेट कंपनियों के प्रदर्शन जैसे विषयों को कंप्यूटर के भरोसे छोड़ दिया गया है। हैरानी की बात है कि कई मामलों में पत्रकारों की अपेक्षा कंप्यूटर का काम अधिक व्यापक होता दिख रहा है। कई बार एक पत्रकार की खबर किसी एकल-स्रोत पर आधारित होती है। जबकि कंप्यूटर सॉफ़्टवेयर विभिन्न स्रोतों से डेटा आयात करके प्रवृत्तियों और पैटर्न को पहचान लेता है। साथ ही, कंप्यूटर अब भाषा प्रसंस्करण का उपयोग करके विशेषण और उपमाओं के साथ परिष्कृत वाक्यों का निर्माण करने में भी सक्षम हैं। रोबोट अब किसी फुटबॉल मैच में भीड़ की भावनाओं की रिपोर्ट भी कर सकता है।

यही कारण है कि कई पत्रकारों को अब डर है कि ‘आर्टिफिशियल इंटेलिजेंस’ (एआई) उनकी नौकरी छीन सकता है। लेकिन अगर पत्रकार इससे डरने के बजाय इसे अपनाते हैं, तो इससे पत्रकारिता को नया आयाम मिल सकता है। आर्टिफिशियल इंटेलिजेंस के जरिए हमें तेजी से बदलते समय में वैश्वीकृत और सूचना-समृद्ध दुनिया को बेहतर ढंग से कवर करना संभव हो सकता है।

इंटेलिजेंट मशीनों से पत्रकारों की रिपोर्टिंग बेहतर हो सकती है। उनकी रचनात्मकता और दर्शकों को जोड़ने की क्षमता बढ़ सकती हैं। इसके आधार पर किसी डेटा पैटर्न को समझने के लिए पूर्वानुमान का उपयोग किया जा सकता है। साथ ही, इन पैटर्न में बदलाव को भी समझना अब संभव है। ऐसे एल्गोरिदम को सीखना पत्रकारों के लिए काफी उपयोगी होगा। इससे उन्हें तीव्र गति से विभिन्न सामग्री को व्यवस्थित करने, क्रमबद्ध करने और रिपोर्टिंग में मदद मिलेगी। इस तरह पत्रकारों की उत्पादकता काफी बढ़ सकती है, जिसके बारे में कभी कल्पना तक नहीं की गई थी।

आर्टिफिशियल इंटेलिजेंस किस तरह पत्रकारों की मदद कर सकता है? यह एक इन्वेस्टिगेटिव स्टोरी में किसी लापता लिंक को खोजने के लिए डेटा को व्यवस्थित कर सकता है। यह विभिन्न प्रवृत्तियों की पहचान कर सकता है। यह लाखों डेटा बिंदुओं में से किसी खास बिंदु को खोज सकता है, जिससे किसी बड़े स्कूप या घोटाले का पता लगना संभव हो।

उदाहरण के लिए, आप सरकारी खरीद संबंधी डेटा को एक एल्गोरिदम में लगातार फीड कर सकते हैं। इसमें किसी एक ही पते पर बनी अनगिनत कंपनियों का डेटा निकल सकता है। इस से पत्रकारों को कई सुराग मिल सकते हैं। इसकी तह में जाने पर किसी भ्रष्टाचार का खुलासा हो सकता है।

बुद्धिमान कंप्यूटर बड़ी मात्रा में डेटा का विश्लेषण करके बेहद कम समय में जांच में सहायता कर सकता है। वह विभिन्न स्रोत से आए तथ्यों की जांच करके उनकी विश्वसनीयता का पता लगा सकता है। वर्ष 2017 की Tow Centre Report के अनुसार संयुक्त राज्य में कई मीडिया संस्थानों में तथ्य-जांच के लिए एआई का भरपूर उपयोग हो रहा है। रॉयटर्स का उदाहरण देखें। यहां सोशल मीडिया के ब्रेकिंग न्यूज पर नजर रखने के लिए  News Tracer  का उपयोग हो रहा है। इसके जरिए ट्वीट्स की सत्यता की जांच भी बेहद आसानी से कर ली जाती है।

ब्राजील में Serenata de Amor नामक पत्रकारों का एक समूह है। इसमें प्रौद्योगिकी के प्रति उत्साही नागरिक भी शामिल हैं। यह समूह ‘रोजी’ नामक एक रोबोट का उपयोग करता है। इसमें ब्राजील के सभी कांग्रेस सदस्यों को भुगतान की जाने वाली राशि और उसके बिल का विवरण दर्ज किया जाता है। यह विवरण को ट्रैक कर उन कारणों को उल्लेखित करता है जो संदेहास्पद होते हैं ।

एल्गोरिदम विभिन्न तरीकों से पत्रकारों की मदद कर रहा है। जैसे, वीडियो के मोटे कट बनाने से लेकर आवाज के पैटर्न को पहचानने और भीड़ में चेहरों की पहचान करने तक। उन्हें पाठकों के साथ चैट करने और प्रश्नों के उत्तर देने के लिए प्रोग्राम किया जा सकता है। यह प्रक्रिया एक पत्रकार के बिना पूरी नहीं हो सकती, जो एक लक्ष्य को ध्यान में रखते हुए डेटा के बारे में प्रासंगिक प्रश्न पूछता है। यह सिस्टम कैसे काम करता है, इसे पत्रकारों और संपादकों को तेजी से सीखना होगा। ऐसा करके वे अपनी पत्रकारिता को बढ़ाने में एआई का शानदार उपयोग कर सकते हैं।

दुनिया के अधिकांश पत्रकारों के पास अपनी परियोजनाओं के डिजाइन और निर्माण में मदद करने के लिए प्रोग्रामर या डेटा वैज्ञानिकों की टीम नहीं है। इसलिए आपसी सहयोग ही एकमात्र रास्ता है। छोटे न्यूजरूम और फ्रीलांसर अधिक स्थायी सहयोग बनाने में मदद करने के लिए सॉफ्टवेयर डेवलपर्स के साथ मिलकर संसाधनों की कमी को पूरा कर सकते हैं। वे कई ओपन-सोर्स सर्च और एनालिटिक्स टूल का सहारा ले सकते हैं।

पत्रकारों और तकनीकी विशेषज्ञों के बीच संवाद का अभाव है। दोनों पक्ष एक-दूसरे से बहुत कुछ सीखते हुए कुछ परीक्षण करके त्रुटियों का समाधान निकाल सकते हैं। तकनीकी विकास के साथ पत्रकारों के पास अब यह एक विस्तारित उपकरण है। पत्रकारों के पास अब समाज की बात सुनने और उनकी जरूरतों पहचानने की क्षमता काफी बढ़ गई है। इसका सदुपयोग करने के लिए गंभीर प्रयास करना होगा ताकि अवसर बर्बाद न हो।

नैतिक चुनौतियां

फोटो: आरएम मीडिया लिमिटेड / शेयरअलाइक

द गार्जियन के रीडर्स एडिटर पॉल चैडविक (Paul Chadwick) ने पत्रकारिता और आर्टिफिशियल इंटेलिजेंस के बीच संबंधों पर लिखा है। उन्होंने अखबार की आचार संहिता पर जोर देते हुए लिखा- “सोचने की क्षमता वाला सॉफ्टवेयर उपयोगी है। लेकिन कोई जरूरी नहीं कि वह जानकारी एकत्र या प्रोसेसिंग करने का काम नैतिक रूप से भी करे। हमें पत्रकारिता में आर्टिफिशियल इंटेलिजेंस का उपयोग करते समय देखना होगा कि यह नैतिक मूल्यों की कसौटी पर भी सही हों।“

पत्रकारों को यह पता होना चाहिए कि एल्गोरिदम झूठ भी बोल सकता है। कई मामलों में यह गुमराह भी कर सकता है। दरअसल, उसकी प्रोग्रामिंग तो मनुष्यों ने ही की है, जिनके पास पूर्वाग्रह हैं। कोई तार्किक पैटर्न किसी बात को गलत निष्कर्ष की ओर ले जा सकता है। इसलिए कंप्यूटर से मिले सहयोग के बावजूद पत्रकारों को हमेशा अपनी सदियों पुरानी सत्यापन तकनीकों का उपयोग करना होगा। उन्हें तथ्यों और स्रोत की क्रॉस-चेकिंग, दस्तावेजों का तुलनात्मक अध्ययन करके, उनके निष्कर्षों पर संदेह करने जैसी प्रक्रिया के बाद ही किसी रिपोर्ट को फाइनल करना चाहिए।

तकनीकी विकास के साथ अब पत्रकारों के पास एक विस्तृत टूलकिट है। लेकिन हमें यह भी पता होना चाहिए कि एल्गोरिदम पक्षपाती हो सकता है।

मशीनी इंटेलिजेंस के इस नए युग में पत्रकारिता के लिए पारदर्शिता भी काफी जरूरी है। ‘कोलंबिया जर्नलिज्म रिव्यू‘ के डिजिटल संपादक नौसिका रेनर कहते हैं: ”न्यूजरूम में एआई के प्रवेश में सबसे बड़ी बाधा पारदर्शिता है। पारदर्शिता, जो पत्रकारिता का एक बुनियादी मूल्य है, अक्सर आर्टिफिशियल इंटेलिजेंस के साथ होती है, जो आमतौर पर पर्दे के पीछे काम करती है।”

मीडिया को यदि विश्वसनीय बने रहना हो, तो अपने दर्शकों को यह बताना चाहिए कि तो वह कौन सा व्यक्तिगत डेटा एकत्र कर रहा है। नई तकनीक के शक्तिशाली नए खिलौनों के कारण मीडिया अब अपने दर्शकों के ‘स्वाद‘ के अनुरूप सामग्री देने में सक्षम है। लेकिन ‘जनहित‘ अब भी मीडिया के लिए सर्वोपरि है और इसी पर मीडिया का अस्तित्व टिका है। इसलिए, संपादकों के सामने यह चुनौती भी है कि पाठकों को जनहित की ऐसी जानकारी भी दे, जिसमें लोगों की उतनी दिलचस्पी नहीं।

इसी तरह, खोजी पत्रकारों को यह बताना चाहिए कि वे अपनी खबरों के लिए किसी पैटर्न या प्रक्रिया के सबूत खोजने के लिए एल्गोरिदम का उपयोग कैसे कर रहे हैं। ऐसा करके वे जोड़तोड़ करने वाले ऐसे लोगों से अलग हो सकते हैं, जो किसी वाणिज्यिक हित या राजनीतिक हथियार के रूप में उपयोग के लिए गुप्त रूप से डेटा एकत्र करते हैं। इसके अलावा, स्वस्थ पत्रकारिता को समाज के वंचित लोगों की खामोश आवाजों और कठिन मुद्दों को जीवंत रखना चाहिए। ऐसे विषयों पर भी काम करना चाहिए, जिनपर किसी ने जानकारी एकत्र नहीं की है या डेटा सेट नहीं बनाया है।

एआई ने पत्रकारिता को पहले की तुलना में काफी सक्षम बनाया है। लेकिन यह भी सच है कि इसने पत्रकारों के सामने सीखने और जवाबदेही की नई चुनौतियाँ भी खड़ी कर दी है। पत्रकारिता की स्पष्ट समझ के बगैर कोई भी तकनीक एक बेहतर सूचित समाज की ओर नहीं ले जाएगी। नैतिक मूल्यों को ध्यान में नहीं रखा जाए, तो पत्रकारिता का अंत हो सकता है। स्पष्ट उद्देश्यों, पारदर्शी प्रक्रियाओं और जनहित के बिना पत्रकारिता लोगों की विश्वसनीयता खो देगी।

पत्रकारिता में एआई का उपयोग कैसे किया जाता है

स्क्रीनशाट : एपी का वर्डस्मिथ एक्सप्लेनर वीडियो

स्वचालित पत्रकारिता:  डेटा से कहानियां तैयार करना। प्रारंभ में इसका उपयोग खेल और वित्तीय समाचारों पर रिपोर्टिंग में किया जाता था। यह पत्रकारों को नियमित कार्यों से मुक्त कर सकता है, दक्षता में सुधार और लागत में कटौती कर सकता है। वित्तीय डेटा को कहानियों में बदलने के लिए एपी द्वारा ‘वर्डस्मिथ‘ सॉफ्टवेयर का उपयोग किया जाता है। वाशिंगटन पोस्ट खेल आयोजनों और चुनावी दौड़ पर रिपोर्टिंग के लिए हेलियोग्राफ का उपयोग करता है।

वर्कफ्लो को व्यवस्थित करना: ब्रेकिंग न्यूज को ट्रैक करना, टैग और लिंक का उपयोग करके समाचारों को एकत्र और व्यवस्थित करना, टिप्पणियों को मॉडरेट करना और स्वचालित वॉयस ट्रांसक्रिप्शन का उपयोग करना। पाठकों की टिप्पणियों को मॉडरेट करने के लिए न्यूयॉर्क टाइम्स में पर्सपेक्टिव एपीआई टूल (Perspective API) का उपयोग किया जाता है। रॉयटर्स कनेक्ट प्लेटफॉर्म (Reuters Connect) पर दुनिया भर के मीडिया भागीदारों की सामग्री तथा रॉयटर्स के सारे कंटेंट को देखा जा सकता है।

सोशल मीडिया में आए समाचारों पर नजर रखना: वास्तविक समय और ऐतिहासिक डेटा का विश्लेषण करने में एआई का उपयोग हो रहा है। यह घटनाओं को प्रभावित करने वालों की पहचान करने और दर्शकों से जुड़ाव संबंधी काम भी करता है। सोशल मीडिया ट्रेंड पर नजर रखने और जुड़ाव बढ़ाने के लिए एपी द्वारा न्यूजविप (Newswhip)का उपयोग किया जाता है।

दर्शकों के साथ जुड़ाव: क्वार्ट्ज बॉट स्टूडियो (Quartz Bot studio) का चैटबॉट ऐप उपयोगकर्ताओं को घटनाओं, लोगों या स्थानों के बारे में सवाल करने की सुविधा देता है। उनके लिए प्रासंगिक सामग्री के साथ उत्तर भी देता है। ‘गार्जियन‘ सहित अन्य मीडिया संस्थानों द्वारा फेसबुक मैसेंजर के लिए बॉट का उपयोग किया जाता है। बीबीसी ने यूरोपीय संघ के जनमत संग्रह के कवरेज में बॉट्स का इस्तेमाल किया।

एफ्रीबॉट प्रोजेक्ट (AfriBOT) के अंतर्गत एक ओपन सोर्स न्यूजबॉट विकसित किया जा रहा है। यह यूरोपियन जर्नलिज्म सेंटर और द सोर्स (नामीबिया और जिम्बाब्वे) द्वारा इनोवेट अफ्रीका अनुदान विजेता संस्थान है। इसका मकसद अफ्रीकी समाचार संगठनों को व्यक्तिगत समाचार देने और मैसेजिंग प्लेटफॉर्म के माध्यम से दर्शकों के साथ अधिक प्रभावी ढंग से जुड़ने में मदद करना है।

चेकाडो का तथ्य-जांच करने वाले बॉट का शुभंकर

स्वचालित तथ्य-जांच:  आर्टिफिशियल इंटेलिजेंस के कारण पत्रकारों को सार्वजनिक बयानों या दावों की त्वरित तथ्य जाँच में काफी सुविधा होती है। अर्जेंटीना में चेक्वाडो द्वारा Chequeabot   का उपयोग किया जाता है। Full Fact UK  और इसके पार्टनर्स मिलकर एक ऑटोमेटेड फैक्ट-चेकिंग इंजन विकसित कर रहे हैं। यह इंजन उन दावों की पहचान करेगा जो पहले ही फैक्ट-चेक किए जा चुके हैं।यह प्राकृतिक भाषा प्रसंस्करण और संरचित डेटा का उपयोग करके स्वचालित रूप से नए दावों का पता लगाएगा और जांच करेगा। अमेरिका में ड्यूक रिपोर्टर लैब ने राजनीतिक घोषणाओं का सच जानने के लिए  ClaimBuster टूल विकसित किया। वर्ष 2017 में स्वचालित तथ्य-जांच परियोजनाओं के लिए एक हब भी लॉन्च किया। यूके में Factmata द्वारा एक स्वचालित तथ्य-जांच उपकरण विकसित किया जा रहा है। स्वचालित तथ्य-जांच (automated fact-checking) के बारे में और पढ़ें।

बड़े डेटाबेस का विश्लेषण करना: सॉफ्टवेयर द्वारा बडे़ डेटा से किसी खास पैटर्न, परिवर्तन या कुछ भी असामान्य चीजों की खोज की जाती है। Reuters’ Lynx Insight बड़े पैमाने पर डेटा सेट से गुजरने के बाद पत्रकारों को परिणाम और पृष्ठभूमि की जानकारी देता है। ओसीसीआरपी का Crime Pattern Recognition भ्रष्टाचार संबंधी दस्तावेजों के बड़े डेटाबेस का विश्लेषण करता है।

फोटो की पहचान करना: अब ऐसी तकनीक बेहद आसानी से उपलब्ध है, जो किसी फोटो में वस्तुओं, स्थानों, मानवीय चेहरों और यहां तक कि भावनाओं को भी पहचानती है। न्यूयॉर्क टाइम्स तस्वीरों में कांग्रेस सदस्यों की पहचान के लिए  Amazon’s Rekognition का उपयोग करता है। गूगल की Google’s Vision API तकनीक भी मुफ्त उपलब्ध है।

वीडियो निर्माण: अब कंप्यूटर तकनीक के जरिए समाचार लेखों से स्वचालित रूप से स्क्रिप्ट बनाना और वीडियो फुटेज के छोटे वीडियो टुकड़ों के मोटे कट तैयार करना भी संभव है। यूएसए टुडे, ब्लूमबर्ग और एनबीसी द्वारा  Wibbitz  सॉफ्टवेयर का उपयोग किया जाता है। स्टैनफोर्ड यूनिवर्सिटी के शोधकर्ता एक स्वचालित वीडियो संपादन उपकरण विकसित कर रहे हैं।


यह आलेख मूल रूप से स्वतंत्र पत्रकारिता पर ओपन सोसाइटी फाउंडेशन के कार्यक्रम के मीडियम पेज पर प्रकाशित हुआ था। इसे यहां अनुमति के साथ पुनर्मुद्रित किया गया है। ओएसएफ जीआइजेएन का एक अनुदानकर्ता है

मारिया टेरेसा रोन्डरो ने OSF Program on Independent Journalism में निदेशक के बतौर कार्य किया है। यह संस्थान खासतौर पर लोकतंत्र की ओर उन्मुख देशों में उच्च गुणवत्ता वाले मीडिया को बढ़ावा देने के लिए प्रयासरत है। इससे पहले वह कोलम्बिया की प्रमुख समाचार पत्रिका सेमाना से जुड़ी थीं।

क्रिएटिव कॉमन्स लाइसेंस के तहत हमारे लेखों को निःशुल्क, ऑनलाइन या प्रिंट माध्यम में पुनः प्रकाशित किया जा सकता है।

आलेख पुनर्प्रकाशित करें


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

अगला पढ़ें

Investigating AI Audio Deepfakes

टिपशीट

फर्जी एआई ऑडियो की जांच कैसे करें

एडवांस्ड स्पीच डीपफेक के द्वारा बिल्कुल असली लगने वाले नकली ऑडियो बनाए जा सकते हैं। उसकी सच्चाई को उस व्यक्ति के नजदीकी दोस्त भी नहीं पहचान सकेंगे। ऐसे ऑडियो क्लिप की जांच के लिए विशेषज्ञ और नए उपकरणों की आवश्यकता होती है। अक्सर पत्रकार किसी नेता के बारे में अपने ज्ञान, रिकॉर्डिंग की खराब गुणवत्ता, संदर्भ या सामान्य सामान्य ज्ञान के आधार पर किसी ऑडियो क्लिप में किए गए फर्जीवाड़े को तुरंत पहचान लेते हैं।

ऐप्स की ‘प्राइवेसी पॉलिसी’ को कैसे समझें?

आम तौर पर अधिकांश प्राइवेसी पॉलिसी में एक पूर्व-अनुमानित संरचना का पालन किया जाता है। इसलिए आप उनकी तह तक जाने की कला सीख सकते हैं। उसके मुख्य हिस्सों का पता लगा सकते हैं। लंबा दस्तावेज होने के बावजूद केवल महत्वपूर्ण जानकारी को निकालने के लिए झपट्टा मार सकते हैं। आप कुछ सूचनाओं के संग्रह के आधार पर उससे बाहर निकलने या विकल्प चुनने के अवसर का लाभ उठा सकते हैं। अधिक गहराई तक जाने और अधिक व्यक्तिगत प्रकटीकरण से जुड़े बिंदुओं को भी बेहद कम समय में आसानी से समझ सकते हैं।

दीर्घकालिक खोजी रिपोर्टिंग को जारी रखने या रोकने का निर्णय कैसे लें?

संपादकों के अनुसार न्यूनतम स्टोरीज प्रकाशित करने का भी काफी महत्व है। ऐसी स्टोरी आने के बाद विस्सल-ब्लोअर सामने आते हैं। किसी संगठन के भीतर के लोग आकर कोई बड़ी जानकारी देते हैं। संपादकों के अनुसार ऐसी खबरें प्रकाशित करने के दौरान पारदर्शिता महत्वपूर्ण है। पाठकों को स्पष्ट रूप से बताना सुनिश्चित करें कि क्या साबित किया जा सकता है और क्या नहीं।

Data mining workshop scraping website GIJC23

टिपशीट

‘डेटा माइनर’ के जरिए वेबसाइटों से उपयोगी डेटा कैसे निकालें?

Data Miner डाटा निकालने का एक निःशुल्क उपकरण और ब्राउज़र एक्सटेंशन है। यह आपको वेब पेजों को खंगालने और सुरक्षित डेटा को शीघ्रता से एकत्र करने में सक्षम बनाता है। यह स्वचालित रूप से वेब पेजों से डेटा एकत्र करके एक्सेल, सीएसवी, या जेएसओएन प्रारूपों में सेव करता है।