Image: Shutterstock
त्वरित खोज में उपयोगी है चैट-जीपीटी
आर्टिफिशिल इंटेलिजेंस (एआई) से पत्रकारों को काफी मदद मिली है। अब कई प्रकार के जेनेरिक एआई टूल्स उपलब्ध हैं जिनका खोजी पत्रकारिता में खूब उपयोग हो रहा है। लेकिन एआई से जुड़े कई नैतिक सवालों तथा त्रुटि के खतरों से खोजी पत्रकारों को जूझना पड़ रहा है। विभिन्न प्रकार के विकल्पों के कारण भी अक्सर भ्रम होता है।
एआई उपकरणों का पत्रकारिता का कई स्तर पर उपयोग होता है। इसमें प्रारंभिक सामान्य उपयोग के साथ ही डेटा कोड का उत्पादन, किसी विषय की ब्रीफिंग और चार्ट बनाने जैसे काम तक शामिल हैं। पत्रकारों के लिए उपयोगी कई नए एआई उपकरण हर हफ्ते सामने आते हैं। इनमें कुछ निशुल्क होते हैं जबकि कुछ उपकरणों के लिए भुगतान करना पड़ता है। हालांकि कई बार जेनरेटिव एआई उपकरण कोई उपयोगी साक्ष्य उपलब्ध नहीं करा पाते हैं। कई मामलों में पूर्वाग्रह और त्रुटिपूर्ण सामग्री मिलने का खतरा रहता है। ऐसे एआई प्लेटफार्मों से जुड़े नैतिक सवालों और उन्नत अनुप्रयोगों पर अधिक जानकारी के लिए जीआईजेएन का ये आलेख देखें।
कैलिफोर्निया में 20 से 23 जून 2024 तक खोजी पत्रकारों और संपादकों की 2024 Investigative Reporters and Editors कांफ्रेंस हुई। इसे ‘इन्वेस्टिगेटिव रिपोर्टर्स एंड एडिटर्स’ (आईआरई) ने आयोजित किया। इसमें यह बात सामने आई कि आर्टिफिशियल इंटेलिजेंस (एआई) की बढ़ती तकनीक को सीखते हुए पत्रकार इसके जोखिम और भ्रम से बच सकते हैं। एआई चैटबॉट चैट-जीपीटी का उपयोग किसी विषय पर केंद्रित खोज के लिए एक उपकरण के रूप में किया जा सकता है।
जेरेमी जोजोला एक खोजी रिपोर्टर हैं। वह डेनवर (कोलोराडो) में कुसा-टीवी से जुड़े हैं। श्वेत वर्चस्व वाले चरमपंथी समूहों पर रिपोर्टिंग के लिए उन्हें 2020 में आईआरई का ‘डॉन बोल्स मेडल‘ मिला था। कार्यशाला में जेरेमी जोजोला ने कहा कि इस लार्ज लैंगवेज मॉडल का उपयोग करके संपर्क नामों की खोज और दस्तावेज़ों के त्वरित विश्लेषण से आपका काफी समय बच सकता है। साथ ही, जांच की शुरुआत में ही महत्वपूर्ण मानवीय स्रोतों तक पहुंच संभव हो सकती है। इस नई तकनीक के बगैर ऐसे काम नहीं हो पाते। एलएलएम जैसे चैट-जीपीटी का उपयोग केवल रिपोर्टिंग प्रोजेक्ट की शुरुआत में करना चाहिए। एक पत्रकार के बतौर किसी विषय पर केवल अपनी समझ विकसित करने के लिए इसका उपयोग करें। इसके बारे में अपने पाठकों को बताने की आवश्यकता नहीं है।
जेरेमी जोजोला ने चेतावनी देते हुए कहा- “यह एक संदर्भ स्रोत नहीं है। यह सिर्फ एक शुरुआती बिंदु है। हमारे नैतिक और कानूनी मानकों के लिए यह महत्वपूर्ण विषय है कि इसमें से जो कुछ भी निकलता है, वह हमारी रिपोर्टिंग में नहीं जाता है। मैं कभी चैट-जीपीटी से मिली हुई सामग्री का उपयोग अपनी रिपोर्ट के रूप में नहीं करता। मैं उसे कॉपी या नकल या स्क्रिप्टिंग के लिए उपयोग नहीं करता। अच्छी रिपोर्टिंग की अपनी कला से आपको अपनी स्टोरी का खजाना मिलता है। लेकिन चैट-जीपीटी से आपको एक दिशा मिल सकती है जो आपको उस खजाने की ओर ले जाए। यह एक अद्भुत उपकरण है। भले ही इसे गूगल खोज के उन्नत रूप की तरह ही उपयोग किया जाए।’’
चैट–जीपीटी + गूगल सर्च = बेहतर एवं त्वरित परिणाम
एक बड़े भाषा मॉडल के रूप में चैटजीपीटी किसी विषय पर जवाब देने के लिए वेब पेज इंडेक्सिंग के बजाय प्रशिक्षण डेटा के विशाल भंडार का उपयोग करता है। इसलिए सामान्य प्रश्नों के लिए गूगल जैसे सर्च इंजन अब भी अधिक सटीक, व्यापक और अद्यतन हैं। खासकर जब बूलियन खोज युक्तियों के साथ इसका उपयोग किया जाता है।
जेरेमी जोजोला के अनुसार गूगल परिणाम और सर्च इंजन की रैंकिंग का प्रभाव काफी गहरा हो सकता है। इसके कारण पत्रकार किसी अपरिचित स्रोत पर विचार करने से परहेज कर सकते हैं। वे किन्हीं स्पष्ट रुझानों की पहचान करने से भी वंचित हो सकते हैं। उनके पास दस्तावेज़ों के लिए त्वरित विश्लेषण सुविधाओं का भी अभाव होता है।
यही कारण है कि जेरेमी जोजोला को चैट-जीपीटी का उपयोग करना ज्यादा पसंद है। वह भुगतान आधारित जीपीटी-4 संस्करण का उपयोग करते हैं। यह इंटरनेट पर त्वरित संपर्क, लीड और टेकअवे खोजने के लिए सर्च भी कर सकता है। इनके आधार पर आगे की जांच करना आसान होता है। ओपन-एआई का मुफ्त जीपीटी 3.5 संस्करण सीधे इंटरनेट से जुड़ा नहीं है। यह बातचीत सहित मनुष्यों द्वारा लिखे गए इंटरनेट से बड़ी मात्रा में डेटा के आधार पर लिखित उत्तर देने के लिए प्रशिक्षित किया गया है। यह इसकी त्रुटियों को समझाने में भी मदद करता है। यह इंसानों की तरह संवाद करता है। इसका डेटा अप-टू-डेट नहीं है। जीपीटी-4 मॉडल का उपयोग करने के लिए 20 डॉलर प्रति माह भुगतान करना पड़ता है। यह इनपुट संकेतों के रूप में चित्र और स्क्रीनशॉट भी ले सकता है। यह विभिन्न गीगाबाइट डेटा पर प्रशिक्षित है। यह लाइव इंटरनेट भी ब्राउज़ कर सकता है। इसलिए इसमें नवीनतम जानकारी शामिल है।
जेरेमी जोजोला के अनुसार कुछ कमियों के बावजूद ओपन-एआई के विभिन्न चैटबॉट किसी डेटा को व्यवस्थित करने में उपयोगी हैं। इसमें तेज़ी से एक नज़र में खोज के परिणाम मिलते हैं। इससे मिलने वाले जवाब के प्रारूप और संक्षिप्त सारांश के कारण नए मानव स्रोतों के संबंध में भी पत्रकारों को काफी जानकारी मिल सकती है।
कार्यशाला में उदाहरण के लिए उन्होंने एक प्रयोग किया। जीपीटी-4 चैट बॉक्स में लिखा- “मैं एक पत्रकार हूं। मुझे कुछ विशेषज्ञों की तलाश है जो कोलोराडो में भेड़ियों के पुनरुत्पादन के बारे में जानकारी दे सके। उनके नाम, संगठन और फोन नंबर की की सूची दें।“
जीपीटी-4 ने तत्काल इंटरनेट और उसके डेटाबेस की खोज करके ऐसे विशेषज्ञों, एजेंसियों और एनजीओ की सूची खोज निकाली। अमेरिका के एक सेवानिवृत्त सरकारी जीवविज्ञानी की भी जानकारी मिली, जिन्होंने रॉकी पर्वत में भेड़िया पुनर्प्राप्ति अभियान का नेतृत्व किया था। ‘कार्निवोर को-एक्जिस्टेंस लैब‘ के संस्थापक की भी जानकारी मिली।
जेरेमी जोजोला ने कहा- “ऐसे महत्वपूर्ण विशेषज्ञ से आप तुरंत बात करना चाहेंगे। कोलोराडो में भेड़ियों का पुनरुत्पादन एक बड़ी स्टोरी है। यह शहरी और ग्रामीण क्षेत्रों के बीच संघर्ष का एक बड़ा मुद्दा है। गूगल से 40 मिनट की सर्च के बजाय चैट-जीपीटी आपको पांच सेकंड में विशेषज्ञों और उनके फोन नंबर की एक सूची दे सकता है।”
भुगतान आधारित जीपीटी-4 संस्करण में कई लाभ हैं। इसमें आपको अधिक दस्तावेज़ अपलोड, अधिक अद्यतन डेटा की तलाश और इसके साथ प्रासंगिक चर्चा करने की सुविधा शामिल हैं। ऐसी चर्चा के दौरान इसका ‘चैट इंटरफ़ेस‘ आपको पूर्व प्रश्नों के संदर्भ में उत्तर देता है। हालांकि इसका निशुल्क संस्करण भी अनेक त्वरित खोजों के लिए काफी प्रभावी है।
आपका लक्ष्य समय की बचत और त्वरित फ़िल्टरिंग करना है। इसलिए जेरेमी जोजोला अपनी सर्च के लिए सटीक वाक्यांश पर सोचने में समय बर्बाद नहीं करते। उनका ध्यान क्या-कहां-कब की खोज पर रहता है। इसके लिए वह लिखते हैं कि “मैं ऐसे व्यक्ति से बात करना चाहता हूं जो संबसे अधिक जानकार है।“
चैट–जीपीटी में त्वरित–खोज
चैट-जीपीटी का त्वरित-खोज में व्यावहारिक उपयोग कैसे करें, इस संबंध में कार्यशाला में जानकारी दी गई। उनका विवरण यहां प्रस्तुत है।
- ‘अचिन्हित‘ (अन-फ्लैग्ड) सार्वजनिक दस्तावेज़ों की त्वरित खोज
कई दस्तावेजों को मानव स्रोतों द्वारा समाचार हेतु उपयोगी के बतौर चिन्हित किया जाता है। लेकिन इनके अलावा विभिन्न रिपोर्ट, ऑडिट और सार्वजनिक अनुबंध जैसे दस्तावेज भी मिलते है। ऐसे दस्तावेजों में आपको किसी कुप्रबंधन, प्रणालीगत त्रुटि, भ्रष्टाचार या शोषण के संकेत मिल सकते हैं। जेरेमी जोजोला के अनुसार ऐसे दस्तावेजों को चैट-जीपीटी पर अपलोड करके पूछना चाहिए- “मुझे इस सरकारी अनुबंध का सारांश दें। इन सेवाओं के लिए इकाई को कितना भुगतान किया जाएगा। मुझे इस अनुबंध में शामिल लोगों के नाम और पृष्ठ संख्या बताएं, जिनमें उनका उल्लेख है।“
उदाहरण के लिए जेरेमी जोजोला ने एक प्रयोग किया। लाइसेंस प्लेट पाठकों संबंधी एक सरकारी अनुबंध की जानकारी मांगी। चैट-जीपीटी ने कुछ ही सेकंड के भीतर उस दस्तावेज से वास्तविक सार्वजनिक लागत और शर्तों की जानकारी दे दी। पृष्ठ संख्या के अनुसार कई नाम भी बता दिए। जेरेमी जोजोला ने सुझाव दिया कि पत्रकार संवेदनशील या निजी दस्तावेज़ अपलोड करने से बचें। ‘डोक्यूमेंट पार्सिंग‘ यानी दस्तावेजों से उपयोगी जानकारी निकालने के लिए कई अधिक परिष्कृत उपकरण भी उपलब्ध हैं। उनमें ऑप्टिकल कैरेक्टर पहचान भी होती है। जैसे, गूगल पिनपॉइंट। लेकिन चैट-जीपीटी एक उपयोगी, तेज़ प्रारंभिक फ़िल्टर प्रदान करता है।
- जनहित के विषयों का सारांश
सरकारी नियमों पर वार्षिक रिपोर्ट और सार्वजनिक टिप्पणी के दस्तावेजों में जनहित के विषयों पर काफी जानकारी होती है। इन्हें पढ़ने के लिए बहुत कम पत्रकारों के पास समय होता है। जेरेमी जोजोला ने 40 पेज की एक वार्षिक रिपोर्ट अपलोड की। चैट-जीपीटी से उस रिपोर्ट में पेश किए गए जनहित के चिंताजनक विषयों की सूची बनाने और सारांश बताने के लिए कहा। आश्चर्यजनक है कि यह इतनी तेजी से स्कैन कर सकता है। इस टूल में कुछ बारीकियां छूट सकती हैं और त्रुटियां हो सकती हैं। लेकिन यह पत्रकारों को सार्वजनिक बैठकों में उठाई गई समस्याओं की प्रकृति और मात्रा का लगभग तत्काल संकेत दे सकता है। यह आपको गहन खोज करने और संभावित रूप से अप्रत्याशित कहानी की तलाश के लिए प्रेरित कर सकता है।
- प्रमुख विशेषज्ञों की जानकारी तत्काल निकालें
जेरेमी जोजोला ने कहा कि चैट-जीपीटी आपको ‘संभावित खबर‘ के लिए नए स्रोतों से संपर्क में मदद कर सकता है। कुछ ही सेकंड में आपको एक पेज में आधा दर्जन प्रमुख विशेषज्ञों के नाम, पदनाम और फोन नंबर दे सकता है। इसके बाद आप किसी प्रमुख स्रोत को चुन सकते हैं। उस लिस्ट में सुझाए गए किसी विशेषज्ञ से अपने मुद्दे पर पूछ सकते हैं। बिना स्क्रॉल किए और विभिन्न वेबसाइटों के दर्जनों लिंक पर क्लिक किए बिना आप यह काम आसानी से कर सकते हैं। अपने कीवर्ड द्वारा आपको प्रासंगिक वेबसाइटों की जानकारी भी मिल जाएगी। उदाहरण के लिए यह प्रयोग देखें। ‘दक्षिण अफ्रीका में घरेलू हिंसा के पीड़ितों की मदद करने वाले संगठनों का विवरण दें।‘ यह खोज करने पर गूगल कीवर्ड खोज की तुलना में चैट-जीपीटी में एक पेज में अधिक स्पष्ट जानकारी मिलती है। एलएलएम का उपयोग करने पर ‘प्रथम-कॉल‘ स्रोतों की प्रारंभिक सूची मिलती है। एआई टूल में ‘लिंग-आधारित हिंसा‘ संबंधी संपर्कों का मिश्रण भी शामिल है। इसका दक्षिण अफ्रीका पर एक अलग फोकस है। ऐसी जानकारी आपकी खबर के लिए अधिक प्रासंगिक हो सकती है।
- आधिकारिक संपर्कों को व्यवस्थित करना
चैट-जीपीटी स्वचालित तरीके से सार्वजनिक संपर्क विवरण के बड़े सेटों को स्रोत और वर्णानुक्रम में व्यवस्थित कर सकता है। आपको लिखना होगा- “मुझे कोलोराडो के विधानसभा सदस्यों, खासकर हाउस डेमोक्रेट्स के फोन नंबर और ईमेल पते का विवरण दें।“ ऐसा करने पर हरेक विधायक की साइटों पर जाने के बजाय उपयोगी डेटा पाना और ईमेल पते की जानकारी हासिल करना बहुत आसान हो जाता है।“
- तकनीकी निष्कर्षों की सरल व्याख्या
कई छोटे मीडिया संस्थानों में यदि कोई मानव स्रोत आपको यह नहीं बताए कि कहां गड़बड़ है, तो उस ओर ध्यान जाना मुश्किल होता है। कई तकनीकी या भारी-भरकम रिपोर्टों के गंभीर मामले आसानी से छूट सकते हैं। कारण यह कि उनके पास इसका विश्लेषण करने के लिए पर्याप्त समय नहीं होता है। उनके पास विशेषज्ञ सहयोगियों का भी अभाव होता है। जेरेमी जोजोला ने कहा कि ऐसे दस्तावेज़ों के लिए पोस्टमार्टम रिपोर्ट एक अच्छा उदाहरण है। यह विश्वसनीय एआई खोज टूल में त्वरित अपलोड और अनुवाद अनुरोध के बाद पूछताछ के नए रास्ते खोल सकती है। बेशक, मेडिकल खोज के बारे में चैट-जीपीटी की व्याख्या को फोरेंसिक स्रोतों के साथ दोबारा जांचा जाना चाहिए। बहुत से पत्रकारों के लिए किसी पोस्टमार्टम रिपोर्ट को समझना मुश्किल होता है। बहुत सारे चिकित्सा वाक्यांश और विष विज्ञान के शब्द और 12-अक्षर वाले रसायन को समझना मुश्किल है।
जेरेमी जोजोला ने एक और प्रयोग किया। पुलिस गोलीबारी के शिकार एक व्यक्ति की पोस्टमार्टम रिपोर्ट पर यह जानकारी मांगी- “मुझे इस पोस्टमार्टम रिपोर्ट का सारांश दीजिए। आम आदमी के शब्दों में बताएं कि मृतक के शरीर में कौन से पदार्थ थे।“
- तुलनात्मक अध्ययन को आसान बनाना
पत्रकारों को तत्काल यह समझना मुश्किल होता है कि प्रेस विज्ञप्ति या वार्षिक रिपोर्ट का डेटा असामान्य रूप से उच्च या निम्न है, या उसमें कोई कोई बड़ी खबर है। लेकिन एआई उपकरण आपको तुलनात्मक अनुसंधान के लिए तत्काल भौगोलिक लक्ष्य दे सकते हैं। जैसे- “मुझे अफ्रीका में ऐसे शहर बताएं जिनकी आबादी किगाली, रवांडा के समान है।“ यह पूछने पर चैट-जीपीटी ने तुरंत बताया कि ब्लैंटायर, मलावी; फ्रीटाउन, सिएरा लियोन और मोम्बासा, केन्या सबकी आबादी 1.2 मिलियन है।
अपराध, जनसंख्या वृद्धि, परिवहन जैसे विषयों पर पत्रकार अपने शहर की तुलना अन्य शहरों से करना चाहते हैं। एआई से आपको अजीब चीज़ों का तुरंत अंदाज़ा लग जाएगा। लेकिन उन संख्याओं या परिणामों को खुद अच्छी तरह से जांचने के बाद ही आपको अपनी खबर लिखनी चाहिए।
जेरेमी जोजोला ने यह भी बताया कि उनकी चैट-जीपीटी खोजें कई बार दिशा से भटक जाती हैं। उन्होंने रोड रेज (सड़क पर हिंसा) संबंधी एक वैज्ञानिक अध्ययन की मांग की। चैट-जीपीटी ने काफी बड़ा अध्ययन पेश किया। लेकिन इसका स्रोत पूछने पर पता चला कि यह एक व्यक्तिगत कानूनी फर्म से मिली जानकारी थी। यह उपयोगी जानकारी नहीं थी।
लेकिन चूंकि यह जांच की जाने वाली एकमात्र गूगल जैसी खोज थी, इसलिए ऐसी गलत दिशा भी वास्तव में कोई मायने नहीं रखतीं। जेरेमी जोजोला ने कहा- “इससे मुझे नेशनल इंस्टीट्यूट ऑफ हेल्थ द्वारा एक रोड रेज अध्ययन भी मिला। एक अधिक विश्वसनीय स्रोत था। इसलिए मैंने इसके साथ शुरुआत की।“
जेरेमी जोजोला ने कहा- “नई प्रौद्योगिकी से हमें डरना नहीं चाहिए। बस हमें अपने मानकों और प्रक्रिया पर टिके रहने की जरूरत है। आपको सही स्रोत उद्धृत करना होगा। आप कभी भी गूगल सर्च को स्रोत के रूप में उद्धृत नहीं कर सकते हैं। इसी तरह चैट-जीपीटी को भी आप स्रोत के रूप में उद्धृत नहीं करेंगे।“
रोवन फिलिप जीआईजेएन के वरिष्ठ पत्रकार हैं। वह पहले संडे टाइम्स (दक्षिण अफ्रीका) के मुख्य संवाददाता थे। एक विदेशी संवाददाता के रूप में उन्होंने दुनिया भर के दो दर्जन से अधिक देशों से समाचार, राजनीति, भ्रष्टाचार और संघर्ष पर रिपोर्टिंग की है।
अनुवाद- डॉ विष्णु राजगढ़िया