প্রবেশগম্যতা সেটিংস

লেখাপত্র

বিষয়

সাংবাদিক হিসেবে নিজেই নিজের ডেটাসেট তৈরি করবেন যেভাবে

আর্টিকেলটি পড়ুন এই ভাষায়:

কর্তৃপক্ষের কাছ থেকে প্রয়োজনীয় ডেটাসেট না পেলে কিংবা এমন কোনো ডেটাসেট নেই বলে জানানো হলে, আপনি কী করবেন? সাংবাদিকদের জন্য প্রায়ই এটি সমস্যা হয়ে দাঁড়ায়, কারণ অনুসন্ধানী প্রতিবেদনের জন্য কার্যকর ডেটা অত্যন্ত গুরুত্বপূর্ণ। ডেটা ছাড়া, সাংবাদিকদের পক্ষে শক্তিশালী প্রতিষ্ঠানগুলোকে জবাবদিহি করা বা তাদের অপরাধ প্রমাণের কাজটি কঠিন হতে পারে।

১৩তম গ্লোবাল ইনভেস্টিগেটিভ জার্নালিজম কনফারেন্সের (#জিআইজেসি২৩) একটি সেশনে গোটা মিডিয়ার ডেটা সাংবাদিকতা বিষয়ক সম্পাদক হেলেনা বেংটসন এবং সেন্টার ফর পাবলিক ইন্টিগ্রিটির জেনিফার লাফলার ধারণা দেন, একেবারে গোড়া থেকে কীভাবে নিজস্ব ডেটাসেট তৈরি করতে হয়।

বেংটসন বলেছেন, ডেটার সংকট যে সবসময় নেতিবাচক, তা নয়; কখনও কখনও তা নতুন ডেটা তৈরির সম্ভাবনা বাড়িয়ে তোলে, যা ধরাবাঁধা সময় কিংবা প্রতিযোগিতার চাপ ছাড়াই সাংবাদিকেরা ব্যবহার করতে পারেন।

নিজস্ব ডেটা তৈরির যত ধাপ

  • নথি থেকে ডেটা তৈরি: একজন সাংবাদিক হিসেবে আপনি সহজেই এজেন্সি বা সরকারি অফিসের বিভিন্ন নথি হাতে পেতে পারেন, আর তা থেকেই আপনার প্রয়োজনমাফিক ডেটা তৈরি করতে সক্ষম হবেন। বেংটসন বলেন, বেশিরভাগ সময় আপনি ওইসব নথি ব্যবহারের সুযোগ পাবেন, তবে মুশকিলটা হচ্ছে এগুলো সঠিক বিন্যাসে সাজানো থাকে না। সাংবাদিকেরা যখন এ ধরনের বিশৃঙ্খল ডেটাসেটগুলো  হাতে পান, তখন তাদের প্রথম কাজটিই হচ্ছে একটি কাঠামো তৈরি করা। ডেটাসেট তৈরির ক্ষেত্রে, সাংবাদিকদের অবশ্যই ডেটাসেটের প্রতিটি অংশকে সতর্কতার সঙ্গে বিন্যাসের বিষয়টি নিশ্চিত করতে হবে, যেন প্রয়োজনের সময় সহজে তা থেকে তথ্য নেওয়া সম্ভব হয়।
  • ব্যক্তি-সূত্র যখন ডেটার উৎস: দুর্দান্ত ডেটাসেট তৈরির আরেকটি কার্যকর উপায় হলো ব্যক্তি-সূত্র কাজে লাগানো। মিডিয়া আউটলেট আর সাংবাদিকেরা নির্দিষ্ট বিষয় ধরে বিভিন্ন জনকে প্রশ্ন করে তাদের থেকে প্রাপ্ত তথ্য নিয়ে ডেটা তৈরি করতে পারেন। সুইডেনের শহরগুলোতে সংগঠিত অপরাধের নিয়ে অনুসন্ধানের জন্য বিভিন্ন ঘটনা পর্যবেক্ষণ ও নথিভুক্ত করতে তার দলের সাংবাদিকদের মাঠ পর্যায়ে পাঠিয়েছিলেন বেংটসন। যে সব এলাকায় অপরাধ সংগঠিত হচ্ছিল, সাংবাদিকদের দলটি সে সব এলাকায় গিয়ে ক্ষুদ্র-ব্যবসায়ীদের সঙ্গে কথা বলেন। “প্রতিবেদকদের সবাইকে একটি ফর্ম পূরণ করতে বলা হয়, এবং ডেটা তৈরির জন্য তা একটি স্প্রেডশিটে লিপিবদ্ধ করা হয়,” বলেন তিনি। এর মাধ্যমে তারা অনেক তথ্য পেয়েছেন। ব্যক্তি-সূত্র ব্যবহার করে ডেটা প্রাপ্তির বিভিন্ন উপায়গুলোর মধ্যে রয়েছে সমীক্ষা, জরিপ, ক্রাউডসোর্সিং, স্যাম্পলিং, টেস্টিং এবং বড় ল্যাঙ্গুয়েজ মডেল (ব্যাপক পরিমাণে টেক্সট থেকে ডেটা তৈরির জন্য প্রশিক্ষিত এআই) ধরে স্ক্র্যাপিং।
  • গবেষণা কিংবা পর্যবেক্ষণ: গবেষণা ও পর্যবেক্ষণের উত্তম চর্চা প্রয়োগের মাধ্যমে সুনির্দিষ্ট গবেষণা-পদ্ধতি তৈরি করে নিয়ে সাংবাদিকেরা ডেটা তৈরি করতে পারেন। এজন্য পরিসংখ্যানবিদদের সঙ্গে কাজ করাটা গুরুত্বপূর্ণ বলে মনে করেন বেংটসন; বিশেষ করে, যারা আপনার নির্বাচিত পদ্ধতিগুলো পরীক্ষা করতে পারেন। একটি রান টেস্ট (ব্যবহারের আগে পরিসংখ্যানগতভাবে ডেটা বিশ্লেষণ করে নেওয়া) আপনার পদ্ধতিটি সঠিক কিনা তা নিশ্চিত করার জন্য গুরুত্বপূর্ণ।

নিজেই নিজের ডেটা তৈরির সুবিধা ও অসুবিধা

জিআইজেসি২৩ একটি ডেটা সেশনে কথা বলছেন দ্য মার্কআপের অনুসন্ধানী প্রতিবেদক লাম থুই ভো । ছবি: উলফ ফ্রান্স, জিআইজেএন

জেনিফার লাফলারের মতে, একেবারে গোড়া থেকে নিজস্ব ডেটাসেট তৈরি করতে সময় ও প্রচেষ্টার প্রয়োজন এবং সাংবাদিকদের অবশ্যই এর জন্য যথেষ্ট সময় বরাদ্দ করতে হয়। “আপনাকে অবশ্যই নিশ্চিত করতে হবে যে আপনার ডেটাসেট সঠিক এবং সেখানে ধারাবাহিকতা নিশ্চিত করতে হবে,” বলেন তিনি। ডেটা যদি সর্বজনীনভাবে উপলব্ধ না হয়, বা একাধিক উৎস জুড়ে ছড়িয়ে ছিটিয়ে থাকে, সেক্ষেত্রে এটি বেশ চ্যালেঞ্জিং হতে পারে। কাজটি সময় নিয়ে করতে হয় এবং তাতে ধৈর্য, ​​সতর্কতা ও দক্ষতা প্রয়োজন হয়।

ডেটাসেট তৈরির চ্যালেঞ্জ আছে ঠিক, কিন্তু পুঙ্খানুপুঙ্খভাবে সেটি করা গেলে রিপোর্টিংয়ে বাড়তি সুবিধা মেলে, কারণ বাইরের কারও সেই ডেটা ব্যবহারের সুযোগ থাকে না। তাছাড়া ডেটার ওপর সম্পূর্ণ নিয়ন্ত্রণ থাকে বলে, আপনি কোন তথ্যটি ব্যবহার করতে চান তা যেমন ঠিক করতে পারেন, তেমনি কীভাবে তা যাচাই, প্রস্তুত ও বিশ্লেষণ করবেন সেই সিদ্ধান্তও নিজেই নেওয়া যায়।

“ডেটা সংগ্রহের পর তা ফলো-আপের জন্য সময় দিতে ভুলবেন না,” লাফলার বলেন। সাংবাদিকদের নিশ্চিত করা উচিত যে তারা ডেটাগুলো যাচাই করবেন এবং ডেটাগুলো লিপিবদ্ধ করার সময় “সত্যের অন্তর্মূলে” যাওয়ার চেষ্টা করবেন। তিনি আরও উল্লেখ করেন যে সাংবাদিকদের ডেটা প্রস্তুত করার সময় “কাট-অফ ডেট” (নির্দিষ্ট তারিখ) নির্ধারণ করা উচিত এবং তাদের রিপোর্টিংয়ের ডেটা গাইড থাকা উচিত।

সমীক্ষা এবং জরিপ তৈরির উত্তম চর্চা

ডেটাসেট তৈরির জন্য সমীক্ষা এবং জরিপ হলো অন্যতম সেরা চর্চা। সমীক্ষা পরিচালনার সময় সাংবাদিকদের বিবেচনা করা উচিত এমন কিছু উল্লেখযোগ্য অনুশীলন নিয়ে কথা বলেন লাফলার।

  • গোটা বৈশ্বিক পটভূমি এবং সম্ভাব্য উপগোষ্ঠী সম্পর্কে জানুন। আপনি কোন গোষ্ঠী নিয়ে বিশ্লেষণ করছেন– তা বোঝা গুরুত্বপূর্ণ।
  • খোলা প্রশ্ন ব্যবহার এড়িয়ে চলুন, কারণ ডেটা বিশ্লেষণের পর্যায়ে সেগুলো মোকাবেলা করা অনেকাংশে আপনার দুঃস্বপ্নের কারণ হবে।
  • নমুনা নিয়ে ভাবুন।
  • পুরো বিষয়টি প্রকাশের আগে ছোট কোনো দলের সঙ্গে আপনার প্রশ্নগুলো যাচাই করুন। “নিশ্চিত করুন যে লোকেরা ভুল বুঝতে পারে, এ ধরনের কোন ডেটা এখানে নেই। প্রকাশের আগে সেগুলো পরীক্ষা করুন,” বলেন লাফলার।
  • নথিপত্র ভালো মানের হওয়া উচিত এবং সঠিকভাবে স্ক্যান ও স্ক্র্যাপ করা উচিত৷ “সতর্ক থাকুন ছোট ছোট সংখ্যাযুক্ত নথির বিষয়ে,” তিনি জোর দিয়ে বলেন। এগুলোকে ঝরঝরে সারি বা কলামে লিপিবদ্ধ করাই কিন্তু ‍যুদ্ধ জয় নয় — ডেটার নির্ভুলতা এখানে অনেক বেশি গুরুত্বপূর্ণ।

ক্রিয়েটিভ কমন্স লাইসেন্সের অধীনে আমাদের লেখা বিনামূল্যে অনলাইন বা প্রিন্টে প্রকাশযোগ্য

লেখাটি পুনঃপ্রকাশ করুন


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

পরবর্তী

ডেটা সাংবাদিকতা

রাষ্ট্র যদি তথ্য লুকায়, অনুসন্ধান করবেন কি করে: বেলারুশ যা শেখাল

নিষেধাজ্ঞা সত্ত্বেও কী করে বেলারুশের উৎপাদিত সার বিশেষ করে ইউরিয়া ইউরোপিয় ক্রেতাদের হাতে পৌঁছাচ্ছে এবং কীভাবে বেলারুশের বৃহত্তম রাষ্ট্রীয় সার উৎপাদনকারী প্রতিষ্ঠান উৎপাদনকারী দেশের নাম গোপন করছে  ২০২৩ সালে তা উদ্ঘাটন করেছেন বেলারুশের সাংবাদিকেরা। গোপন তথ্যের খোঁজে তাঁরা ব্যবহার করেছেন নানা সূত্র।

ডেটা সাংবাদিকতা পরামর্শ ও টুল

গুগলশিট ব্যবহার করে কীভাবে দরকারি ডেটা খুঁজবেন

স্প্রেডশিট থেকে ডেটা বাছাই কিংবা প্রয়োজনীয় তথ্য দ্রুত কীভাবে খুঁজতে হয়, তা জানা প্রয়োজন। আর এ জন্য স্প্রেডশিট ব্যবহারে দক্ষতা থাকাটা খুবই গুরুত্বপূর্ণ। কারণ এতে করে আপনি তুলে আনতে পারবেন দারুন সব গল্প।

data journalism missing piece mistake

ডেটা সাংবাদিকতা সংবাদ ও বিশ্লেষণ

ডেটা সাংবাদিকতার ১০ সাধারণ ভুল

যে কোনো বিষয়ে জোরালো তথ্য-উপাত্ত উপস্থাপন করে ডেটা সাংবাদিকতা পুরো সংবাদের জগতে সাড়া ফেলে দিয়েছে। কিন্তু ডেটা সাংবাদিকতা কি সীমাবদ্ধতার ঊর্ধ্বে? জানতে পড়ুন রোয়ান ফিলিপের বিশ্লেষণ।

টিপশীট ডেটা সাংবাদিকতা পরামর্শ ও টুল

টিপশিট: আপনার অনুসন্ধানে কীভাবে সামুদ্রিক ডেটা ব্যবহার করবেন

সমুদ্র সংক্রান্ত ডেটার ধরন হতে পারে বহুবিচিত্র। সমুদ্রে দূষণ, জীববৈচিত্র্য পরিস্থিতি অথবা অর্থবাণিজ্য— এমন বিভিন্ন ধরনের ডেটা, সাংবাদিকেরা ব্যবহার করতে পারেন তাদের রিপোর্টিংয়ে। এই টিপশিটে পাবেন অনুসন্ধানে সামুদ্রিক ডেটা ব্যবহারের পরামর্শ ও রিসোর্সের খোঁজ।