ছবি: শাটারস্টক
সাংবাদিকদের জন্য টুলস: স্প্রেডশিট সার্চ, ওয়েবসাইট পরিবর্তন ট্র্যাকিং ও পুরোনো অনুসন্ধানী তথ্য খোঁজার উপায়
আর্টিকেলটি পড়ুন এই ভাষায়:
জিআইজেএন টুলবক্সের এই নতুন পর্বে আমরা এমন তিনটি কার্যকর কিন্তু সহজে ব্যবহারযোগ্য অনুসন্ধানী টুল নিয়ে আলোচনা করেছি, যেগুলো বিশেষভাবে সাংবাদিকদের প্রয়োজনগুলো মাথায় রেখে তৈরি করা হয়েছে।
সম্প্রতি যুক্তরাষ্ট্রে অনুষ্ঠিত নিকার২৬ ডেটা সাংবাদিকতা সম্মেলনে এসব টুলগুলো দেখানো হয়।
মিনিংফুলি

স্প্রেডশিটে প্রাসঙ্গিক শব্দ বা বাক্যাংশ খুঁজতে মিনিংফুলি টুল ব্যবহার করা যায়। ছবি: নিকার২৬-এর স্ক্রিনশট
ধরুন, আপনি সরকারি তথ্য ভান্ডারের বিশাল একটি স্প্রেডশিট হাতে পেয়েছেন। আর সেখান থেকে কর্মী ছাঁটাইয়ের তথ্য খুঁজতে চান। সমস্যা হলো, সরকারি সংস্থাগুলো চাকরি থেকে বাদ দেওয়ার ক্ষেত্রে নানা ধরনের সমার্থক শব্দ, ঘুরিয়ে পেঁচিয়ে লেখা কথা, এমনকি ভুল বানানও ব্যবহার করে। একই সমস্যা দেখা যায় আরও অনেক অনুসন্ধানে। যেমন, কোনো চুক্তির তথ্য হয়তো “টেন্ডার” শব্দের আড়ালে আছে, কিংবা স্প্রেডশিটে দরপত্রসংক্রান্ত বর্ণনার মধ্যে লুকানো থাকতে পারে।
এসব ক্ষেত্রে সাধারণ কীওয়ার্ড বা ‘কন্ট্রোল-এফ’ সার্চ তেমন একটা কার্যকর না। আবার এআই চ্যাটবট ব্যবহার করলে ভুল তথ্য বা বিভ্রান্তিকর উত্তর তৈরির ঝুঁকিও থাকে। এই ধরনের বিশ্লেষণের জন্য কার্যকর “মধ্যবর্তী” সমাধান হতে পারে সাংবাদিকদের তৈরি ওপেন সোর্স টুল, যা ডেটা এন্ট্রির অর্থ বা প্রাসঙ্গিকতা শনাক্ত করতে সক্ষম।
শব্দের অর্থ ও প্রসঙ্গ বুঝে অনুসন্ধানের টুল হলো মিনিংফুলি। বিনামূল্যের এই টুলটি তৈরি করেছেন দ্য ওয়াশিংটন পোস্টের ডেটা প্রতিবেদক জেরেমি মেরিল। সাংবাদিকদের তৈরি আরেকটি বিনামূল্যের টুল সেমান্ট্রা—যা একই ধরনের কাজ করে।
সম্প্রতি অনুষ্ঠিত নিকার ডেটা সাংবাদিকতা সম্মেলনে মেরিল কর্মী ছাঁটাইসংক্রান্ত অনুসন্ধানের একটি উদাহরণ দেখান। তিনি একটি সিকিউরিটিজ ফাইলিংয়ের ডেটাসেট আপলোড করে টুলটির সার্চ বক্সে শুধু লেখেন: “হি গট ফায়ারড”।
এরপর টুলটি এমন কিছু ডেটা সেল খুঁজে বের করে, যেখানে লেখা ছিল: “[অমুক ব্যক্তি] কোনো বিদায়ী ভাতা পাবেন না এবং তার চাকুরির অবসানের তারিখ পর্যন্ত অর্জিত হয়নি এমন সমস্ত ইকুইটি বাজেয়াপ্ত করা হবে।” সেখানে “বহিষ্কৃত” বা “চাকরিচ্যুত” শব্দের সরাসরি কোনো উল্লেখ ছিল না, কিন্তু মিনিংফুলি বুঝতে পেরেছিল যে এই ব্যক্তিকে স্পষ্টতই চাকরি থেকে বরখাস্ত করা হয়েছে।
ট্রাম্প প্রশাসনের সময়ে যুক্তরাষ্ট্রের ফেডারেল সরকার কীভাবে কৃত্রিম বুদ্ধিমত্তা ব্যবহার করছে, সে বিষয়ে সাম্প্রতিক এক অনুসন্ধানেও মেরিল মিনিংফুলি ব্যবহার করেন। ওই অনুসন্ধানে সরকারের এআই ব্যবহারের ও প্রয়োগের প্রায় তিন হাজার ধরন উঠে আসে। যুক্তরাষ্ট্র সরকার তিমি শনাক্ত করতে এআই ব্যবহার করছে কি না, তা জানতে তিনি টুলটিতে “লুকিং ফর হোয়েলস” লিখে অনুসন্ধান করেন। এরপর মিনিংফুলি তিমি ও ডলফিন গণনার সঙ্গে সম্পর্কিত আটটি উদাহরণ খুঁজে বের করে। এর মধ্যে কিছু ছিল সরাসরি, যেমন “স্বয়ংক্রিয়ভাবে তিমির নিঃশ্বাস শনাক্তকরণ”, আবার কিছু ছিল অর্থগতভাবে সম্পর্কিত, যেমন “সামুদ্রিক স্তন্যপায়ী প্রাণী জরিপ”।
“আপনার কাছে যদি অনেক বেশি তথ্য সমৃদ্ধ একটি স্প্রেডশিট থাকে, এবং সেই লেখার ভেতরে কী থাকতে পারে সে বিষয়ে যদি আপনার কিছু ধারণা বা অনুমান থাকে, তাহলে মিনিংফুলি সেই কাজটি করতে আপনাকে সাহায্য করবে,” তিনি বলেন।
মেরিল স্বীকার করেন যে মিনিংফুলি কখনো কখনো ধীরগতিতে কাজ করতে পারে এবং এক লাখের বেশি সারির (রো) বিশাল ডেটাসেটের ক্ষেত্রে এটি খুববেশি কার্যকর নাও হতে পারে। তবু তিনি বলেন, ইনস্টল করার পর এটি ব্যবহার করা খুবই সহজ—ডেটা আপলোড করে দ্রুত সার্চ করা যায়, এবং টুলটি সম্পূর্ণ বিনামূল্যে পাওয়া যায়। নির্ধারিত ধাপগুলো অনুসরণের মাধ্যমে এই পেজ থেকে মিনিংফুলি ইনস্টল করতে পারেন।

জেরেমি মেরিল, দ্য ওয়াশিংটন পোস্টের একজন ডেটা প্রতিবেদক, ট্রাম্প প্রশাসনের কৃত্রিম বুদ্ধিমত্তা প্রযুক্তির ব্যাপক ব্যবহার অনুসন্ধানের বিষয়ে সহায়তা নিতে মিনিংফুলি টুল ব্যবহার করেন। ছবি: স্ক্রিনশট
ভিজুয়ালপিং — এবং ফ্রি জার্নালিস্ট প্ল্যান
অনুসন্ধানের সঙ্গে সম্পর্কিত ওয়েবসাইটে কোনো ধরনের পরিবর্তন যোগ করা হচ্ছে কিনা সে সম্পর্কিত স্বয়ংক্রিয় তথ্য পেতে বিশ্বজুড়ে শত শত প্রতিবেদক ও গবেষক ভিজুয়ালপিং টুলের বিনামূল্যের পাবলিক ভার্সন ব্যবহার করেছেন।
এআই-চালিত এই টুলটি সাংবাদিকদের জন্য সময় বাঁচানোর একটি মাধ্যম। এটি অনলাইন নজরদারির মতো কাজ করে: এটি নির্দিষ্ট ওয়েবসাইট পর্যবেক্ষণ করে এবং সেখানে কোনো পরিবর্তন বা আপডেট হলে নোটিফিকেশন পাঠায়—এর ফলে সহজেই চোখ এড়িয়ে যাওয়ার সুযোগ থাকে না।
এর চেয়েও ভালো বিষয় হলো, এই সহজ ব্যবহারযোগ্য সেবাটিতে এখন আরও উন্নত ফিচার যোগ হয়েছে—যেমন, একটি ওয়েবসাইটের নির্দিষ্ট অংশ মাত্র পর্যবেক্ষণ করার সুবিধা এবং সাইটের অন্য অংশে নতুন বিজ্ঞাপন বা নিয়মিত আপডেট থেকে আসা অপ্রয়োজনীয় অ্যালার্ট এড়ানোর ব্যবস্থা। পাশাপাশি, এটি সাংবাদিকদের জন্য একটি “ফ্রি জার্নালিস্ট প্ল্যানের”- প্রস্তাবও দেয়।
সাংবাদিকদের জন্য এই উন্নত সুবিধাটির বাণিজ্যিক মূল্য বছরে ১২০ ডলার। এতে প্রতি মাসে সর্বোচ্চ ১ হাজার বার পরীক্ষা করার সুযোগ পাওয়া যায়। যেখানে সাধারণ বিনামূল্যের ভার্সনে এই সংখ্যা ১৫০। পাশাপাশি একসঙ্গে ২৫টি ওয়েবপেজ পর্যবেক্ষণ করা যায়, যেখানে ফ্রি ভার্সনে সীমা মাত্র পাঁচটি।
আপনি যেকোনো পাবলিক সাইটের জন্য এবং যেকোনো ভাষায় অ্যালার্ট সেট করতে পারেন—যেমন কোনো রাজনীতিকের সামাজিক যোগাযোগমাধ্যমের পেজ বা সরকারি ক্রয়সংক্রান্ত ওয়েবসাইট।
এই পরিষেবার জার্নালিস্টিক প্রোগ্রামের ব্যবস্থাপক কাইলা ঝু। নিকার সম্মেলনে অংশগ্রহণকারীদের জানান, অনুসন্ধানী সাংবাদিকতার জন্য গুরুত্বপূর্ণ ব্যবহার হতে পারে বড় প্রযুক্তি কোম্পানিগুলোর পরিষেবার শর্তাবলির পাতায় যেকোনো পরিবর্তন নজরদারি করা। উদাহরণ হিসেবে তিনি এক্সএআইয়ের সেবার শর্তাবলি পাতার কথা উল্লেখ করেন। এর মাধ্যমে নতুন কোনো গোপনীয়তা বা ব্যবহারের ঝুঁকি আগেভাগেই শনাক্ত করা সম্ভব।

ওপেনএআইয়ের গোপনীয়তা নীতিতে হওয়া পরিবর্তনের ভিজুয়ালপিং বিশ্লেষণ। ছবি: ভিজুয়ালপিংয়ের স্ক্রিনশট
সাংবাদিক হিসেবে অ্যাকাউন্ট খোলার পর প্রথমে “নিউ জব” এ ক্লিক করতে হবে। এরপর টার্গেট ওয়েবপেজের ইউআরএল দিতে হবে, সার্চের মানদণ্ড নির্ধারণ করতে হবে এবং শেষ ধাপে পেজটি কত ঘন ঘন পরীক্ষা করা হবে, সেই সময়সীমা ঠিক করতে হবে।
অনুসন্ধানী কাজে টুলটি আরও কার্যকরভাবে ব্যবহার করার জন্য বিস্তারিত পরামর্শ তুলে ধরেন ঝু। এর মধ্যে কয়েকটি গুরুত্বপূর্ণ দিক হচ্ছে:
- “সাজেশন লিস্ট” থেকে সার্চ অপশন বেছে নেওয়া যায়। তবে ঝুর পরামর্শ হলো, সাংবাদিকদের উচিত নিজেদের প্রয়োজন অনুযায়ী এআইধাঁচের নির্দেশনা লিখে অনুসন্ধানের মানদণ্ড ঠিক করা। যেমন: “[কোম্পানি এক্স]-সম্পর্কিত নতুন কোনো নথি জমা হলে আমাকে জানাও” অথবা “[ব্যক্তি এক্স]-সম্পর্কিত আদালতের নথিতে পরিবর্তন এলে আমাকে জানাও।”
- সরকারি ক্রয়, আদালতের নথি বা পরিবেশবিষয়ক ওয়েবসাইটের মতো পরিচিত উৎসের পাশাপাশি, এটি উন্মুক্ত ডেটা পোর্টালের যেকোনো আপডেটও নজরদারি করতে পারে। প্রতিবেদন প্রকাশের আগমুহূর্তে তথ্য যাচাইয়ের জন্য যা বিশেষভাবে কাজে আসে।
- নির্দিষ্ট কোনো অনুসন্ধানী প্রকল্পে সহায়তার প্রয়োজন হলে ভিজুয়ালপিংয়ের সাংবাদিক সহায়তা দলের সঙ্গে যোগাযোগ করা যেতে পারে।
- টুলটির পরামর্শ ও ব্যবহারবিষয়ক নির্দেশনার পাতাটিও দেখে নেওয়ার পরামর্শ দেওয়া হয়েছে।
নতুন চালু হওয়া আর্কাইভডটআইআরইডটওআরজি সার্চ ইঞ্জিন
জিআইজেএনের সদস্য সংগঠন ইনভেস্টিগেটিভ রিপোর্টার্স অ্যান্ড এডিটরস (আইআরই) কয়েক দশক ধরে অনুসন্ধানী সাংবাদিকতার জন্য বিপুলসংখ্যক উপকরণ সংগ্রহ করেছে। এর মধ্যে রয়েছে ডিজিটাল পরামর্শপত্র, পুরস্কারের জন্য জমা দেওয়া প্রতিবেদন, সম্মেলনের অডিও রেকর্ডিংসহ নানা ধরনের তথ্যভান্ডার। এসব উপকরণ শুধু যুক্তরাষ্ট্র নয়, বিশ্বের বিভিন্ন দেশের অনুসন্ধানী সাংবাদিকদের জন্যও কার্যকর।
চলতি বছরের ফেব্রুয়ারিতে স্বেচ্ছাসেবক ও আইআরই কর্মীদের যৌথ আর্কাইভ প্রকল্পের অংশ হিসেবে একটি নতুন সার্চ ইঞ্জিন টুল চালু করা হয়। এই টুলটি কেবল অনলাইনে সংরক্ষিত তথ্য খুঁজে বের করেই থেমে থাকে না, বরং ভাষাগত অর্থ এবং এআই ফিচার ব্যবহার করে এ সম্পর্কিত আরো তথ্য খুঁজে দেয়। এর মাধ্যমে নতুন অনুসন্ধানের সূত্র, টুল ব্যবহারের ধারণা এবং চলমান অনুসন্ধানী প্রকল্পের জন্য সম্ভাব্য সহযোগীদের খুঁজে পাওয়াও সহজ হতে পারে।
যেমন, আইআরই রিসোর্স সেন্টারের সার্চ বক্সে আপনি যদি “অলিগার্কস” লিখে সার্চ করেন, তাহলে ২০১৯ সালের আইআরই প্যানেলের টিপশিট (পরামর্শপত্র) আসবে। যেটির শিরোনাম ছিল “ডার্টি মানি, ইউরোপিয়ান ব্যাংকস অ্যান্ড রাশিয়ান অর্গানাইজড ক্রাইম”। পাশাপাশি দেখাবে সুইডেনের এসভিটি নিউজের বাল্টিক অঞ্চলে অর্থপাচারবিষয়ক আইআরই পুরস্কার প্রতিযোগিতায় জমা দেওয়া প্রতিবেদন এবং সিএনএনের রুশ ট্রল ফ্যাক্টরি নিয়ে করা প্রতিবেদন। এরপর আপনি যদি ওই টিপশিটে ক্লিক করেন, তাহলে সার্চ ইঞ্জিনটি—যা কীওয়ার্ড অনুসন্ধানের সঙ্গে অর্থভিত্তিক অনুসন্ধান সুবিধাও যুক্ত করেছে—আরও পাঁচটি পরামর্শ দেবে। যেগুলো হয়তো আপনার মূল অনুসন্ধানের বেশ কাছাকাছি। এক্ষেত্রে, প্রস্তাবিত উপকরণের মধ্যে ছিল অর্গানাইজড ক্রাইম অ্যান্ড করাপশন প্রজেক্ট (ওসিসিআরপি)-এর একটি প্রতিযোগিতার আবেদনপত্রের লিংক। সেখানে বিস্তারিতভাবে ব্যাখ্যা করা হয়েছে, কীভাবে তারা পূর্ব ইউরোপের এমন ব্যবসায়িক প্রতিনিধিদের অনুসন্ধান করেছিল, যারা অর্থপাচারের যাবতীয় বিষয়গুলো সামাল দেয়। প্রাপ্ত এই ফলাফল থেকে আবার আরও কিছু সম্পর্কিত বিষয়ের পরামর্শ আসে। এর মধ্যে ছিল “ইনসাইড দ্য গ্লোবাল অফশোর মানি মেজ” শীর্ষক একটি আইআরই প্যানেলের সুস্পষ্ট অডিও রেকর্ডিং এবং আন্তসীমান্ত সংঘবদ্ধ অপরাধ নিয়ে একটি উপস্থাপনা, যেখানে বক্তাদের মধ্যে ছিলেন মেক্সিকোর সাংবাদিক হেসুস ইবারা এবং জিআইজেএনের প্রতিষ্ঠাতা পরিচালক ডেভিড ই. কাপলান।
নিকার সম্মেলনে এই উদ্যোগ চালুর ঘোষণা দিতে গিয়ে রয়টার্সের সম্পাদক এবং আর্কাইভডটআইআরইডটওআরজি উন্নয়ন দলের সদস্য বেন ওয়েলশ জানান, এই ডেটাবেজে ৩৩ হাজার ৪৪৯টি উপকরণ যুক্ত হয়েছে। এর বড় অংশজুড়ে রয়েছে আইআরই প্রতিযোগিতায় বছরের পর বছর ধরে জমা পড়া ২৫ হাজার প্রকল্প। তিনি বলেন, জমা পড়া প্রকল্পগুলোর সঙ্গে যুক্ত আবেদনপত্র প্রতিবেদকদের জন্য সম্ভাব্য তথ্যভান্ডার হিসেবে কাজ করতে পারে। কারণ সেখানে বিস্তারিতভাবে অনুসন্ধানের পদ্ধতি, মানবসোর্স কীভাবে তৈরি করা হয়েছিল, কারা এতে কাজ করেছেন, এবং জনস্বার্থসংশ্লিষ্ট গুরুত্বপূর্ণ বিষয় অনুসন্ধানে কী ধরনের চ্যালেঞ্জ ও সুযোগ সামনে এসেছিল—তা তুলে ধরা হয়েছে। অন্য দেশের সাংবাদিকেরাও নিজেদের অনুসন্ধানে এসব অভিজ্ঞতা কাজে লাগাতে পারেন।
এই আর্কাইভের সহ-উন্নয়নকারী এবং ডেটা সাংবাদিক ডেরেক উইলিস বলেন, “আমার অভিজ্ঞতা হলো, আইআরইর রিসোর্সগুলো আগে মূলত সম্মেলনের টিপশিটগুলো দেখতেই ব্যবহার করেছি। এখন আমার মনে হয়, প্রতিযোগিতায় জমা দেওয়া এন্ট্রিগুলোও নানা দিক থেকে ভীষণ মূল্যবান হতে পারে।”

আইআরইর নতুন রিসোর্স সেন্টারের আর্কাইভ সার্চ পেজের ফলাফল। ছবি: আইআরইর স্ক্রিনশট
ওয়েলশ আরও বলেন, “প্রায় চার ভাগের তিন ভাগ উপকরণের সঙ্গে কোনো না কোনো সংযুক্তি রয়েছে—হতে পারে পিডিএফ, অডিও ফাইল বা অন্য কোনো আকর্ষণীয় উপাদান। আমরা সবকিছুর জন্য একটি সমন্বিত সূচি তৈরির চেষ্টা করেছি। এটি হয়তো পুরোপুরি নিখুঁত নয়, তবে বেশিরভাগ উপকরণে শিরোনাম, বিভাগ, সংক্ষিপ্ত বিবরণ এবং অনেক ক্ষেত্রে লেখকের নামও যুক্ত করা হয়েছে।”
তিনি স্বীকার করেন, নতুন সাইটটিতে কিছু সীমাবদ্ধতা রয়েছে। এর মধ্যে প্রায় এক-চতুর্থাংশ ডেটাসেটে তারিখসংক্রান্ত তথ্য নেই। পাশাপাশি তিনি সাংবাদিকদের মনে করিয়ে দেন, ডেটাবেজে প্রবেশ করতে হলে আইআরই সদস্য হিসেবে লগইন করতে হবে। তবে তিনি বলেন, টিপশিট ও স্লাইডগুলো নিয়ে কাজের অনেক সুযোগ রয়েছে। বিশেষ করে অনুসন্ধানী সম্পাদকদের গুরুত্বপূর্ণ যোগাযোগের তথ্য সেখানে পাওয়া যেতে পারে। এছাড়া প্রতিযোগিতায় জমা দেওয়া এন্ট্রিগুলো, এমনকি সাইটে এলোমেলোভাবে ঘোরাঘুরিও, নতুন অনুসন্ধানী প্রতিবেদন তৈরির জন্য নতুন নতুন ধারণা প্রাপ্তির এক বিশাল ভান্ডার হয়ে উঠতে পারে।

রোয়ান ফিলিপ জিআইজেএনের গ্লোবাল রিপোর্টার এবং ইমপ্যাক্ট এডিটর। তিনি আগে দক্ষিণ আফ্রিকার সানডে টাইমসের প্রধান প্রতিবেদক ছিলেন। বিদেশি সংবাদদাতা হিসেবে তিনি বিশ্বের দুই ডজনেরও বেশি দেশ থেকে সংবাদ, রাজনীতি, দুর্নীতি এবং সংঘাত নিয়ে প্রতিবেদন করেছেন।