সাংবাদিক হিসেবে নিজেই নিজের ডেটাসেট তৈরি করবেন যেভাবে
আর্টিকেলটি পড়ুন এই ভাষায়:
কর্তৃপক্ষের কাছ থেকে প্রয়োজনীয় ডেটাসেট না পেলে কিংবা এমন কোনো ডেটাসেট নেই বলে জানানো হলে, আপনি কী করবেন? সাংবাদিকদের জন্য প্রায়ই এটি সমস্যা হয়ে দাঁড়ায়, কারণ অনুসন্ধানী প্রতিবেদনের জন্য কার্যকর ডেটা অত্যন্ত গুরুত্বপূর্ণ। ডেটা ছাড়া, সাংবাদিকদের পক্ষে শক্তিশালী প্রতিষ্ঠানগুলোকে জবাবদিহি করা বা তাদের অপরাধ প্রমাণের কাজটি কঠিন হতে পারে।
১৩তম গ্লোবাল ইনভেস্টিগেটিভ জার্নালিজম কনফারেন্সের (#জিআইজেসি২৩) একটি সেশনে গোটা মিডিয়ার ডেটা সাংবাদিকতা বিষয়ক সম্পাদক হেলেনা বেংটসন এবং সেন্টার ফর পাবলিক ইন্টিগ্রিটির জেনিফার লাফলার ধারণা দেন, একেবারে গোড়া থেকে কীভাবে নিজস্ব ডেটাসেট তৈরি করতে হয়।
বেংটসন বলেছেন, ডেটার সংকট যে সবসময় নেতিবাচক, তা নয়; কখনও কখনও তা নতুন ডেটা তৈরির সম্ভাবনা বাড়িয়ে তোলে, যা ধরাবাঁধা সময় কিংবা প্রতিযোগিতার চাপ ছাড়াই সাংবাদিকেরা ব্যবহার করতে পারেন।
নিজস্ব ডেটা তৈরির যত ধাপ
- নথি থেকে ডেটা তৈরি: একজন সাংবাদিক হিসেবে আপনি সহজেই এজেন্সি বা সরকারি অফিসের বিভিন্ন নথি হাতে পেতে পারেন, আর তা থেকেই আপনার প্রয়োজনমাফিক ডেটা তৈরি করতে সক্ষম হবেন। বেংটসন বলেন, বেশিরভাগ সময় আপনি ওইসব নথি ব্যবহারের সুযোগ পাবেন, তবে মুশকিলটা হচ্ছে এগুলো সঠিক বিন্যাসে সাজানো থাকে না। সাংবাদিকেরা যখন এ ধরনের বিশৃঙ্খল ডেটাসেটগুলো হাতে পান, তখন তাদের প্রথম কাজটিই হচ্ছে একটি কাঠামো তৈরি করা। ডেটাসেট তৈরির ক্ষেত্রে, সাংবাদিকদের অবশ্যই ডেটাসেটের প্রতিটি অংশকে সতর্কতার সঙ্গে বিন্যাসের বিষয়টি নিশ্চিত করতে হবে, যেন প্রয়োজনের সময় সহজে তা থেকে তথ্য নেওয়া সম্ভব হয়।
- ব্যক্তি-সূত্র যখন ডেটার উৎস: দুর্দান্ত ডেটাসেট তৈরির আরেকটি কার্যকর উপায় হলো ব্যক্তি-সূত্র কাজে লাগানো। মিডিয়া আউটলেট আর সাংবাদিকেরা নির্দিষ্ট বিষয় ধরে বিভিন্ন জনকে প্রশ্ন করে তাদের থেকে প্রাপ্ত তথ্য নিয়ে ডেটা তৈরি করতে পারেন। সুইডেনের শহরগুলোতে সংগঠিত অপরাধের নিয়ে অনুসন্ধানের জন্য বিভিন্ন ঘটনা পর্যবেক্ষণ ও নথিভুক্ত করতে তার দলের সাংবাদিকদের মাঠ পর্যায়ে পাঠিয়েছিলেন বেংটসন। যে সব এলাকায় অপরাধ সংগঠিত হচ্ছিল, সাংবাদিকদের দলটি সে সব এলাকায় গিয়ে ক্ষুদ্র-ব্যবসায়ীদের সঙ্গে কথা বলেন। “প্রতিবেদকদের সবাইকে একটি ফর্ম পূরণ করতে বলা হয়, এবং ডেটা তৈরির জন্য তা একটি স্প্রেডশিটে লিপিবদ্ধ করা হয়,” বলেন তিনি। এর মাধ্যমে তারা অনেক তথ্য পেয়েছেন। ব্যক্তি-সূত্র ব্যবহার করে ডেটা প্রাপ্তির বিভিন্ন উপায়গুলোর মধ্যে রয়েছে সমীক্ষা, জরিপ, ক্রাউডসোর্সিং, স্যাম্পলিং, টেস্টিং এবং বড় ল্যাঙ্গুয়েজ মডেল (ব্যাপক পরিমাণে টেক্সট থেকে ডেটা তৈরির জন্য প্রশিক্ষিত এআই) ধরে স্ক্র্যাপিং।
- গবেষণা কিংবা পর্যবেক্ষণ: গবেষণা ও পর্যবেক্ষণের উত্তম চর্চা প্রয়োগের মাধ্যমে সুনির্দিষ্ট গবেষণা-পদ্ধতি তৈরি করে নিয়ে সাংবাদিকেরা ডেটা তৈরি করতে পারেন। এজন্য পরিসংখ্যানবিদদের সঙ্গে কাজ করাটা গুরুত্বপূর্ণ বলে মনে করেন বেংটসন; বিশেষ করে, যারা আপনার নির্বাচিত পদ্ধতিগুলো পরীক্ষা করতে পারেন। একটি রান টেস্ট (ব্যবহারের আগে পরিসংখ্যানগতভাবে ডেটা বিশ্লেষণ করে নেওয়া) আপনার পদ্ধতিটি সঠিক কিনা তা নিশ্চিত করার জন্য গুরুত্বপূর্ণ।
নিজেই নিজের ডেটা তৈরির সুবিধা ও অসুবিধা
জেনিফার লাফলারের মতে, একেবারে গোড়া থেকে নিজস্ব ডেটাসেট তৈরি করতে সময় ও প্রচেষ্টার প্রয়োজন এবং সাংবাদিকদের অবশ্যই এর জন্য যথেষ্ট সময় বরাদ্দ করতে হয়। “আপনাকে অবশ্যই নিশ্চিত করতে হবে যে আপনার ডেটাসেট সঠিক এবং সেখানে ধারাবাহিকতা নিশ্চিত করতে হবে,” বলেন তিনি। ডেটা যদি সর্বজনীনভাবে উপলব্ধ না হয়, বা একাধিক উৎস জুড়ে ছড়িয়ে ছিটিয়ে থাকে, সেক্ষেত্রে এটি বেশ চ্যালেঞ্জিং হতে পারে। কাজটি সময় নিয়ে করতে হয় এবং তাতে ধৈর্য, সতর্কতা ও দক্ষতা প্রয়োজন হয়।
ডেটাসেট তৈরির চ্যালেঞ্জ আছে ঠিক, কিন্তু পুঙ্খানুপুঙ্খভাবে সেটি করা গেলে রিপোর্টিংয়ে বাড়তি সুবিধা মেলে, কারণ বাইরের কারও সেই ডেটা ব্যবহারের সুযোগ থাকে না। তাছাড়া ডেটার ওপর সম্পূর্ণ নিয়ন্ত্রণ থাকে বলে, আপনি কোন তথ্যটি ব্যবহার করতে চান তা যেমন ঠিক করতে পারেন, তেমনি কীভাবে তা যাচাই, প্রস্তুত ও বিশ্লেষণ করবেন সেই সিদ্ধান্তও নিজেই নেওয়া যায়।
“ডেটা সংগ্রহের পর তা ফলো-আপের জন্য সময় দিতে ভুলবেন না,” লাফলার বলেন। সাংবাদিকদের নিশ্চিত করা উচিত যে তারা ডেটাগুলো যাচাই করবেন এবং ডেটাগুলো লিপিবদ্ধ করার সময় “সত্যের অন্তর্মূলে” যাওয়ার চেষ্টা করবেন। তিনি আরও উল্লেখ করেন যে সাংবাদিকদের ডেটা প্রস্তুত করার সময় “কাট-অফ ডেট” (নির্দিষ্ট তারিখ) নির্ধারণ করা উচিত এবং তাদের রিপোর্টিংয়ের ডেটা গাইড থাকা উচিত।
সমীক্ষা এবং জরিপ তৈরির উত্তম চর্চা
ডেটাসেট তৈরির জন্য সমীক্ষা এবং জরিপ হলো অন্যতম সেরা চর্চা। সমীক্ষা পরিচালনার সময় সাংবাদিকদের বিবেচনা করা উচিত এমন কিছু উল্লেখযোগ্য অনুশীলন নিয়ে কথা বলেন লাফলার।
- গোটা বৈশ্বিক পটভূমি এবং সম্ভাব্য উপগোষ্ঠী সম্পর্কে জানুন। আপনি কোন গোষ্ঠী নিয়ে বিশ্লেষণ করছেন– তা বোঝা গুরুত্বপূর্ণ।
- খোলা প্রশ্ন ব্যবহার এড়িয়ে চলুন, কারণ ডেটা বিশ্লেষণের পর্যায়ে সেগুলো মোকাবেলা করা অনেকাংশে আপনার দুঃস্বপ্নের কারণ হবে।
- নমুনা নিয়ে ভাবুন।
- পুরো বিষয়টি প্রকাশের আগে ছোট কোনো দলের সঙ্গে আপনার প্রশ্নগুলো যাচাই করুন। “নিশ্চিত করুন যে লোকেরা ভুল বুঝতে পারে, এ ধরনের কোন ডেটা এখানে নেই। প্রকাশের আগে সেগুলো পরীক্ষা করুন,” বলেন লাফলার।
- নথিপত্র ভালো মানের হওয়া উচিত এবং সঠিকভাবে স্ক্যান ও স্ক্র্যাপ করা উচিত৷ “সতর্ক থাকুন ছোট ছোট সংখ্যাযুক্ত নথির বিষয়ে,” তিনি জোর দিয়ে বলেন। এগুলোকে ঝরঝরে সারি বা কলামে লিপিবদ্ধ করাই কিন্তু যুদ্ধ জয় নয় — ডেটার নির্ভুলতা এখানে অনেক বেশি গুরুত্বপূর্ণ।