
সাংবাদিক হিসেবে নিজেই নিজের ডেটাসেট তৈরি করবেন যেভাবে
আর্টিকেলটি পড়ুন এই ভাষায়:
কর্তৃপক্ষের কাছ থেকে প্রয়োজনীয় ডেটাসেট না পেলে কিংবা এমন কোনো ডেটাসেট নেই বলে জানানো হলে, আপনি কী করবেন? সাংবাদিকদের জন্য প্রায়ই এটি সমস্যা হয়ে দাঁড়ায়, কারণ অনুসন্ধানী প্রতিবেদনের জন্য কার্যকর ডেটা অত্যন্ত গুরুত্বপূর্ণ। ডেটা ছাড়া, সাংবাদিকদের পক্ষে শক্তিশালী প্রতিষ্ঠানগুলোকে জবাবদিহি করা বা তাদের অপরাধ প্রমাণের কাজটি কঠিন হতে পারে।
১৩তম গ্লোবাল ইনভেস্টিগেটিভ জার্নালিজম কনফারেন্সের (#জিআইজেসি২৩) একটি সেশনে গোটা মিডিয়ার ডেটা সাংবাদিকতা বিষয়ক সম্পাদক হেলেনা বেংটসন এবং সেন্টার ফর পাবলিক ইন্টিগ্রিটির জেনিফার লাফলার ধারণা দেন, একেবারে গোড়া থেকে কীভাবে নিজস্ব ডেটাসেট তৈরি করতে হয়।
বেংটসন বলেছেন, ডেটার সংকট যে সবসময় নেতিবাচক, তা নয়; কখনও কখনও তা নতুন ডেটা তৈরির সম্ভাবনা বাড়িয়ে তোলে, যা ধরাবাঁধা সময় কিংবা প্রতিযোগিতার চাপ ছাড়াই সাংবাদিকেরা ব্যবহার করতে পারেন।
নিজস্ব ডেটা তৈরির যত ধাপ
- নথি থেকে ডেটা তৈরি: একজন সাংবাদিক হিসেবে আপনি সহজেই এজেন্সি বা সরকারি অফিসের বিভিন্ন নথি হাতে পেতে পারেন, আর তা থেকেই আপনার প্রয়োজনমাফিক ডেটা তৈরি করতে সক্ষম হবেন। বেংটসন বলেন, বেশিরভাগ সময় আপনি ওইসব নথি ব্যবহারের সুযোগ পাবেন, তবে মুশকিলটা হচ্ছে এগুলো সঠিক বিন্যাসে সাজানো থাকে না। সাংবাদিকেরা যখন এ ধরনের বিশৃঙ্খল ডেটাসেটগুলো হাতে পান, তখন তাদের প্রথম কাজটিই হচ্ছে একটি কাঠামো তৈরি করা। ডেটাসেট তৈরির ক্ষেত্রে, সাংবাদিকদের অবশ্যই ডেটাসেটের প্রতিটি অংশকে সতর্কতার সঙ্গে বিন্যাসের বিষয়টি নিশ্চিত করতে হবে, যেন প্রয়োজনের সময় সহজে তা থেকে তথ্য নেওয়া সম্ভব হয়।
- ব্যক্তি-সূত্র যখন ডেটার উৎস: দুর্দান্ত ডেটাসেট তৈরির আরেকটি কার্যকর উপায় হলো ব্যক্তি-সূত্র কাজে লাগানো। মিডিয়া আউটলেট আর সাংবাদিকেরা নির্দিষ্ট বিষয় ধরে বিভিন্ন জনকে প্রশ্ন করে তাদের থেকে প্রাপ্ত তথ্য নিয়ে ডেটা তৈরি করতে পারেন। সুইডেনের শহরগুলোতে সংগঠিত অপরাধের নিয়ে অনুসন্ধানের জন্য বিভিন্ন ঘটনা পর্যবেক্ষণ ও নথিভুক্ত করতে তার দলের সাংবাদিকদের মাঠ পর্যায়ে পাঠিয়েছিলেন বেংটসন। যে সব এলাকায় অপরাধ সংগঠিত হচ্ছিল, সাংবাদিকদের দলটি সে সব এলাকায় গিয়ে ক্ষুদ্র-ব্যবসায়ীদের সঙ্গে কথা বলেন। “প্রতিবেদকদের সবাইকে একটি ফর্ম পূরণ করতে বলা হয়, এবং ডেটা তৈরির জন্য তা একটি স্প্রেডশিটে লিপিবদ্ধ করা হয়,” বলেন তিনি। এর মাধ্যমে তারা অনেক তথ্য পেয়েছেন। ব্যক্তি-সূত্র ব্যবহার করে ডেটা প্রাপ্তির বিভিন্ন উপায়গুলোর মধ্যে রয়েছে সমীক্ষা, জরিপ, ক্রাউডসোর্সিং, স্যাম্পলিং, টেস্টিং এবং বড় ল্যাঙ্গুয়েজ মডেল (ব্যাপক পরিমাণে টেক্সট থেকে ডেটা তৈরির জন্য প্রশিক্ষিত এআই) ধরে স্ক্র্যাপিং।
- গবেষণা কিংবা পর্যবেক্ষণ: গবেষণা ও পর্যবেক্ষণের উত্তম চর্চা প্রয়োগের মাধ্যমে সুনির্দিষ্ট গবেষণা-পদ্ধতি তৈরি করে নিয়ে সাংবাদিকেরা ডেটা তৈরি করতে পারেন। এজন্য পরিসংখ্যানবিদদের সঙ্গে কাজ করাটা গুরুত্বপূর্ণ বলে মনে করেন বেংটসন; বিশেষ করে, যারা আপনার নির্বাচিত পদ্ধতিগুলো পরীক্ষা করতে পারেন। একটি রান টেস্ট (ব্যবহারের আগে পরিসংখ্যানগতভাবে ডেটা বিশ্লেষণ করে নেওয়া) আপনার পদ্ধতিটি সঠিক কিনা তা নিশ্চিত করার জন্য গুরুত্বপূর্ণ।
নিজেই নিজের ডেটা তৈরির সুবিধা ও অসুবিধা

জিআইজেসি২৩ একটি ডেটা সেশনে কথা বলছেন দ্য মার্কআপের অনুসন্ধানী প্রতিবেদক লাম থুই ভো । ছবি: উলফ ফ্রান্স, জিআইজেএন
জেনিফার লাফলারের মতে, একেবারে গোড়া থেকে নিজস্ব ডেটাসেট তৈরি করতে সময় ও প্রচেষ্টার প্রয়োজন এবং সাংবাদিকদের অবশ্যই এর জন্য যথেষ্ট সময় বরাদ্দ করতে হয়। “আপনাকে অবশ্যই নিশ্চিত করতে হবে যে আপনার ডেটাসেট সঠিক এবং সেখানে ধারাবাহিকতা নিশ্চিত করতে হবে,” বলেন তিনি। ডেটা যদি সর্বজনীনভাবে উপলব্ধ না হয়, বা একাধিক উৎস জুড়ে ছড়িয়ে ছিটিয়ে থাকে, সেক্ষেত্রে এটি বেশ চ্যালেঞ্জিং হতে পারে। কাজটি সময় নিয়ে করতে হয় এবং তাতে ধৈর্য, সতর্কতা ও দক্ষতা প্রয়োজন হয়।
ডেটাসেট তৈরির চ্যালেঞ্জ আছে ঠিক, কিন্তু পুঙ্খানুপুঙ্খভাবে সেটি করা গেলে রিপোর্টিংয়ে বাড়তি সুবিধা মেলে, কারণ বাইরের কারও সেই ডেটা ব্যবহারের সুযোগ থাকে না। তাছাড়া ডেটার ওপর সম্পূর্ণ নিয়ন্ত্রণ থাকে বলে, আপনি কোন তথ্যটি ব্যবহার করতে চান তা যেমন ঠিক করতে পারেন, তেমনি কীভাবে তা যাচাই, প্রস্তুত ও বিশ্লেষণ করবেন সেই সিদ্ধান্তও নিজেই নেওয়া যায়।
“ডেটা সংগ্রহের পর তা ফলো-আপের জন্য সময় দিতে ভুলবেন না,” লাফলার বলেন। সাংবাদিকদের নিশ্চিত করা উচিত যে তারা ডেটাগুলো যাচাই করবেন এবং ডেটাগুলো লিপিবদ্ধ করার সময় “সত্যের অন্তর্মূলে” যাওয়ার চেষ্টা করবেন। তিনি আরও উল্লেখ করেন যে সাংবাদিকদের ডেটা প্রস্তুত করার সময় “কাট-অফ ডেট” (নির্দিষ্ট তারিখ) নির্ধারণ করা উচিত এবং তাদের রিপোর্টিংয়ের ডেটা গাইড থাকা উচিত।
সমীক্ষা এবং জরিপ তৈরির উত্তম চর্চা
ডেটাসেট তৈরির জন্য সমীক্ষা এবং জরিপ হলো অন্যতম সেরা চর্চা। সমীক্ষা পরিচালনার সময় সাংবাদিকদের বিবেচনা করা উচিত এমন কিছু উল্লেখযোগ্য অনুশীলন নিয়ে কথা বলেন লাফলার।
- গোটা বৈশ্বিক পটভূমি এবং সম্ভাব্য উপগোষ্ঠী সম্পর্কে জানুন। আপনি কোন গোষ্ঠী নিয়ে বিশ্লেষণ করছেন– তা বোঝা গুরুত্বপূর্ণ।
- খোলা প্রশ্ন ব্যবহার এড়িয়ে চলুন, কারণ ডেটা বিশ্লেষণের পর্যায়ে সেগুলো মোকাবেলা করা অনেকাংশে আপনার দুঃস্বপ্নের কারণ হবে।
- নমুনা নিয়ে ভাবুন।
- পুরো বিষয়টি প্রকাশের আগে ছোট কোনো দলের সঙ্গে আপনার প্রশ্নগুলো যাচাই করুন। “নিশ্চিত করুন যে লোকেরা ভুল বুঝতে পারে, এ ধরনের কোন ডেটা এখানে নেই। প্রকাশের আগে সেগুলো পরীক্ষা করুন,” বলেন লাফলার।
- নথিপত্র ভালো মানের হওয়া উচিত এবং সঠিকভাবে স্ক্যান ও স্ক্র্যাপ করা উচিত৷ “সতর্ক থাকুন ছোট ছোট সংখ্যাযুক্ত নথির বিষয়ে,” তিনি জোর দিয়ে বলেন। এগুলোকে ঝরঝরে সারি বা কলামে লিপিবদ্ধ করাই কিন্তু যুদ্ধ জয় নয় — ডেটার নির্ভুলতা এখানে অনেক বেশি গুরুত্বপূর্ণ।