প্রবেশগম্যতা সেটিংস

লেখাপত্র

বিষয়

সাংবাদিক হিসেবে নিজেই নিজের ডেটাসেট তৈরি করবেন যেভাবে

আর্টিকেলটি পড়ুন এই ভাষায়:

কর্তৃপক্ষের কাছ থেকে প্রয়োজনীয় ডেটাসেট না পেলে কিংবা এমন কোনো ডেটাসেট নেই বলে জানানো হলে, আপনি কী করবেন? সাংবাদিকদের জন্য প্রায়ই এটি সমস্যা হয়ে দাঁড়ায়, কারণ অনুসন্ধানী প্রতিবেদনের জন্য কার্যকর ডেটা অত্যন্ত গুরুত্বপূর্ণ। ডেটা ছাড়া, সাংবাদিকদের পক্ষে শক্তিশালী প্রতিষ্ঠানগুলোকে জবাবদিহি করা বা তাদের অপরাধ প্রমাণের কাজটি কঠিন হতে পারে।

১৩তম গ্লোবাল ইনভেস্টিগেটিভ জার্নালিজম কনফারেন্সের (#জিআইজেসি২৩) একটি সেশনে গোটা মিডিয়ার ডেটা সাংবাদিকতা বিষয়ক সম্পাদক হেলেনা বেংটসন এবং সেন্টার ফর পাবলিক ইন্টিগ্রিটির জেনিফার লাফলার ধারণা দেন, একেবারে গোড়া থেকে কীভাবে নিজস্ব ডেটাসেট তৈরি করতে হয়।

বেংটসন বলেছেন, ডেটার সংকট যে সবসময় নেতিবাচক, তা নয়; কখনও কখনও তা নতুন ডেটা তৈরির সম্ভাবনা বাড়িয়ে তোলে, যা ধরাবাঁধা সময় কিংবা প্রতিযোগিতার চাপ ছাড়াই সাংবাদিকেরা ব্যবহার করতে পারেন।

নিজস্ব ডেটা তৈরির যত ধাপ

  • নথি থেকে ডেটা তৈরি: একজন সাংবাদিক হিসেবে আপনি সহজেই এজেন্সি বা সরকারি অফিসের বিভিন্ন নথি হাতে পেতে পারেন, আর তা থেকেই আপনার প্রয়োজনমাফিক ডেটা তৈরি করতে সক্ষম হবেন। বেংটসন বলেন, বেশিরভাগ সময় আপনি ওইসব নথি ব্যবহারের সুযোগ পাবেন, তবে মুশকিলটা হচ্ছে এগুলো সঠিক বিন্যাসে সাজানো থাকে না। সাংবাদিকেরা যখন এ ধরনের বিশৃঙ্খল ডেটাসেটগুলো  হাতে পান, তখন তাদের প্রথম কাজটিই হচ্ছে একটি কাঠামো তৈরি করা। ডেটাসেট তৈরির ক্ষেত্রে, সাংবাদিকদের অবশ্যই ডেটাসেটের প্রতিটি অংশকে সতর্কতার সঙ্গে বিন্যাসের বিষয়টি নিশ্চিত করতে হবে, যেন প্রয়োজনের সময় সহজে তা থেকে তথ্য নেওয়া সম্ভব হয়।
  • ব্যক্তি-সূত্র যখন ডেটার উৎস: দুর্দান্ত ডেটাসেট তৈরির আরেকটি কার্যকর উপায় হলো ব্যক্তি-সূত্র কাজে লাগানো। মিডিয়া আউটলেট আর সাংবাদিকেরা নির্দিষ্ট বিষয় ধরে বিভিন্ন জনকে প্রশ্ন করে তাদের থেকে প্রাপ্ত তথ্য নিয়ে ডেটা তৈরি করতে পারেন। সুইডেনের শহরগুলোতে সংগঠিত অপরাধের নিয়ে অনুসন্ধানের জন্য বিভিন্ন ঘটনা পর্যবেক্ষণ ও নথিভুক্ত করতে তার দলের সাংবাদিকদের মাঠ পর্যায়ে পাঠিয়েছিলেন বেংটসন। যে সব এলাকায় অপরাধ সংগঠিত হচ্ছিল, সাংবাদিকদের দলটি সে সব এলাকায় গিয়ে ক্ষুদ্র-ব্যবসায়ীদের সঙ্গে কথা বলেন। “প্রতিবেদকদের সবাইকে একটি ফর্ম পূরণ করতে বলা হয়, এবং ডেটা তৈরির জন্য তা একটি স্প্রেডশিটে লিপিবদ্ধ করা হয়,” বলেন তিনি। এর মাধ্যমে তারা অনেক তথ্য পেয়েছেন। ব্যক্তি-সূত্র ব্যবহার করে ডেটা প্রাপ্তির বিভিন্ন উপায়গুলোর মধ্যে রয়েছে সমীক্ষা, জরিপ, ক্রাউডসোর্সিং, স্যাম্পলিং, টেস্টিং এবং বড় ল্যাঙ্গুয়েজ মডেল (ব্যাপক পরিমাণে টেক্সট থেকে ডেটা তৈরির জন্য প্রশিক্ষিত এআই) ধরে স্ক্র্যাপিং।
  • গবেষণা কিংবা পর্যবেক্ষণ: গবেষণা ও পর্যবেক্ষণের উত্তম চর্চা প্রয়োগের মাধ্যমে সুনির্দিষ্ট গবেষণা-পদ্ধতি তৈরি করে নিয়ে সাংবাদিকেরা ডেটা তৈরি করতে পারেন। এজন্য পরিসংখ্যানবিদদের সঙ্গে কাজ করাটা গুরুত্বপূর্ণ বলে মনে করেন বেংটসন; বিশেষ করে, যারা আপনার নির্বাচিত পদ্ধতিগুলো পরীক্ষা করতে পারেন। একটি রান টেস্ট (ব্যবহারের আগে পরিসংখ্যানগতভাবে ডেটা বিশ্লেষণ করে নেওয়া) আপনার পদ্ধতিটি সঠিক কিনা তা নিশ্চিত করার জন্য গুরুত্বপূর্ণ।

নিজেই নিজের ডেটা তৈরির সুবিধা ও অসুবিধা

জিআইজেসি২৩ একটি ডেটা সেশনে কথা বলছেন দ্য মার্কআপের অনুসন্ধানী প্রতিবেদক লাম থুই ভো । ছবি: উলফ ফ্রান্স, জিআইজেএন

জেনিফার লাফলারের মতে, একেবারে গোড়া থেকে নিজস্ব ডেটাসেট তৈরি করতে সময় ও প্রচেষ্টার প্রয়োজন এবং সাংবাদিকদের অবশ্যই এর জন্য যথেষ্ট সময় বরাদ্দ করতে হয়। “আপনাকে অবশ্যই নিশ্চিত করতে হবে যে আপনার ডেটাসেট সঠিক এবং সেখানে ধারাবাহিকতা নিশ্চিত করতে হবে,” বলেন তিনি। ডেটা যদি সর্বজনীনভাবে উপলব্ধ না হয়, বা একাধিক উৎস জুড়ে ছড়িয়ে ছিটিয়ে থাকে, সেক্ষেত্রে এটি বেশ চ্যালেঞ্জিং হতে পারে। কাজটি সময় নিয়ে করতে হয় এবং তাতে ধৈর্য, ​​সতর্কতা ও দক্ষতা প্রয়োজন হয়।

ডেটাসেট তৈরির চ্যালেঞ্জ আছে ঠিক, কিন্তু পুঙ্খানুপুঙ্খভাবে সেটি করা গেলে রিপোর্টিংয়ে বাড়তি সুবিধা মেলে, কারণ বাইরের কারও সেই ডেটা ব্যবহারের সুযোগ থাকে না। তাছাড়া ডেটার ওপর সম্পূর্ণ নিয়ন্ত্রণ থাকে বলে, আপনি কোন তথ্যটি ব্যবহার করতে চান তা যেমন ঠিক করতে পারেন, তেমনি কীভাবে তা যাচাই, প্রস্তুত ও বিশ্লেষণ করবেন সেই সিদ্ধান্তও নিজেই নেওয়া যায়।

“ডেটা সংগ্রহের পর তা ফলো-আপের জন্য সময় দিতে ভুলবেন না,” লাফলার বলেন। সাংবাদিকদের নিশ্চিত করা উচিত যে তারা ডেটাগুলো যাচাই করবেন এবং ডেটাগুলো লিপিবদ্ধ করার সময় “সত্যের অন্তর্মূলে” যাওয়ার চেষ্টা করবেন। তিনি আরও উল্লেখ করেন যে সাংবাদিকদের ডেটা প্রস্তুত করার সময় “কাট-অফ ডেট” (নির্দিষ্ট তারিখ) নির্ধারণ করা উচিত এবং তাদের রিপোর্টিংয়ের ডেটা গাইড থাকা উচিত।

সমীক্ষা এবং জরিপ তৈরির উত্তম চর্চা

ডেটাসেট তৈরির জন্য সমীক্ষা এবং জরিপ হলো অন্যতম সেরা চর্চা। সমীক্ষা পরিচালনার সময় সাংবাদিকদের বিবেচনা করা উচিত এমন কিছু উল্লেখযোগ্য অনুশীলন নিয়ে কথা বলেন লাফলার।

  • গোটা বৈশ্বিক পটভূমি এবং সম্ভাব্য উপগোষ্ঠী সম্পর্কে জানুন। আপনি কোন গোষ্ঠী নিয়ে বিশ্লেষণ করছেন– তা বোঝা গুরুত্বপূর্ণ।
  • খোলা প্রশ্ন ব্যবহার এড়িয়ে চলুন, কারণ ডেটা বিশ্লেষণের পর্যায়ে সেগুলো মোকাবেলা করা অনেকাংশে আপনার দুঃস্বপ্নের কারণ হবে।
  • নমুনা নিয়ে ভাবুন।
  • পুরো বিষয়টি প্রকাশের আগে ছোট কোনো দলের সঙ্গে আপনার প্রশ্নগুলো যাচাই করুন। “নিশ্চিত করুন যে লোকেরা ভুল বুঝতে পারে, এ ধরনের কোন ডেটা এখানে নেই। প্রকাশের আগে সেগুলো পরীক্ষা করুন,” বলেন লাফলার।
  • নথিপত্র ভালো মানের হওয়া উচিত এবং সঠিকভাবে স্ক্যান ও স্ক্র্যাপ করা উচিত৷ “সতর্ক থাকুন ছোট ছোট সংখ্যাযুক্ত নথির বিষয়ে,” তিনি জোর দিয়ে বলেন। এগুলোকে ঝরঝরে সারি বা কলামে লিপিবদ্ধ করাই কিন্তু ‍যুদ্ধ জয় নয় — ডেটার নির্ভুলতা এখানে অনেক বেশি গুরুত্বপূর্ণ।

ক্রিয়েটিভ কমন্স লাইসেন্সের অধীনে আমাদের লেখা বিনামূল্যে অনলাইন বা প্রিন্টে প্রকাশযোগ্য

লেখাটি পুনঃপ্রকাশ করুন


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

পরবর্তী

টিপশীট ডেটা সাংবাদিকতা

কোডিংয়ের প্রয়োজন নেই: ডেটা মাইনার দিয়ে ধাপে ধাপে ওয়েবসাইট স্ক্র্যাপিংয়ের পদ্ধতি

ডেটা মাইনার হচ্ছে তথ্য সংগ্রহের একটি টুল ও ব্রাউজার এক্সটেনশন, যা ওয়েবপেজগুলোকে স্ক্র্যাপ করে ব্যবহারকারীকে দ্রুত নির্ভরযোগ্য তথ্য সংগ্রহ করতে সাহায্য করে।

ডেটা সাংবাদিকতা সংবাদ ও বিশ্লেষণ

ডেটা সাংবাদিকদের জন্য প্রতিবেদন লেখার চারটি সাধারণ অ্যাঙ্গেল

ডেটা প্রতিবেদন তৈরির ক্ষেত্রে সাধারণভাবে কী ধরনের অ্যাঙ্গেল বেছে নেওয়া হয়— তা দেখতে গিয়ে ১০০টি ডেটা প্রতিবেদন বিশ্লেষণ করেছেন পল ব্রাডশ। এই লেখায় তিনি বর্ণনা করেছেন, কীভাবে চারটি সাধারণ অ্যাঙ্গেল আপনাকে স্টোরির আইডিয়া বা ধারণা, সেগুলো বিভিন্নভাবে বাস্তবায়ন এবং মনে রাখার মতো বিবেচ্য বিষয়গুলো চিনতে সহায়তা করতে পারে।

ডেটা সাংবাদিকতা

সম্পাদকের বাছাই: ২০২২ সালের সেরা ১০ ডেটা সাংবাদিকতা প্রকল্প

টুইটারে সবচেয়ে জনপ্রিয় ডেটা স্টোরি নিয়ে প্রতি সপ্তাহে, ডেটা সাংবাদিকতার সেরা ১০ কলাম প্রকাশ করে জিআইজেএন। যেখানে থাকে নোড-এক্সেলের নেটওয়ার্ক অ্যানালাইসিস এবং নিজেদের বাছাই করা প্রতিবেদন। বছর শেষে আমরা ২০২২ সালের সেরা ১০টি ডেটা প্রকল্প বাছাই করেছি, যার মধ্যে আছে রাশিয়ার বৈশ্বিক প্রভাব, ইউরেনিয়াম দূষণ, পানির বাজারে কর্তৃত্বসহ আরও অনেক কিছু।

Green,Forest,Aerial,View,And,Data,Analysis,Concept.,Environment,Technology.

ডেটা সাংবাদিকতা পরামর্শ ও টুল

ডেটা ও ভিজ্যুয়াল দিয়ে পরিবেশ বিষয়ক অনুসন্ধানী স্টোরিকে সমৃদ্ধ করুন

আপনার পরিবেশ সাংবাদিকতাকে বদলে দিতে পারে ডেটা ও ভিজ্যুয়ালাইজেশনের ব্যবহার। এশিয়া থেকে আফ্রিকা হয়ে দক্ষিণ আমেরিকা পর্যন্ত দেশে দেশে সাংবাদিকেরা এভাবেই তাদের স্টোরিকে করে তুলছেন আরও অর্থবহ ও হৃদয়গ্রাহী। কাজটি কঠিন নয়, আপনার চর্চা শুরু হতে পারে এই লেখাটির হাত ধরেই।