প্রবেশগম্যতা সেটিংস

ডেটা এখন সাংবাদিকদের কাজের প্রতিটি ক্ষেত্রের সঙ্গে জড়িয়ে আছে—স্থানীয় সরকার ব্যয়ের খবর থেকে শুরু করে বৈশ্বিক জলবায়ু পরিবর্তনের ধরণ বিশ্লেষণ পর্যন্ত। তবে সব নিউজরুম এখনো সেই অনুযায়ী সম্পাদনাগত অবকাঠামো গড়ে তুলতে পারেনি। ছবি: পিক্সেলস

লেখাপত্র

বিষয়

ডেটা সাংবাদিকতা মানে কী সংখ্যা তুলে ধরা, মানব সোর্স আর ডেটা সোর্স কোথায় আলাদা-কী বলছেন ডেটা সাংবাদিকরা

আর্টিকেলটি পড়ুন এই ভাষায়:

আজকাল ছোট কিংবা বড় সব ধরনের প্রিন্ট ও ডিজিটাল নিউজরুমে ডেটার ব্যবহার সাংবাদিকতার অবিচ্ছেদ্য অংশ হয়ে গেছে। স্থানীয় সরকারের ব্যয় থেকে শুরু করে বৈশ্বিক জলবায়ু পরিবর্তন—সবধরনের প্রতিবেদন তৈরিতে ডেটার ব্যবহার চোখে পড়ে। বিভিন্ন প্রবণতা নিশ্চিত করতে, প্রচলিত ভুল ধারণা ভাঙতে এবং এমন সব প্রশ্নের উত্তর খুঁজতে সাংবাদিকরা ডেটা ব্যবহার করেন— যেগুলোর জবাব মানবসূত্র দিয়ে সবসময় পাওয়া সম্ভব হয় না।

১৯৫০-এর দশক থেকেই কিন্তু কোনো না কোনো ভাবে ডেটা সাংবাদিকতার প্রচলন ছিল। তবে মিলেনিয়ামের (২০০০ সাল) পর ব্যাপক প্রসার চোখে পড়ে। আর এটি সম্ভব হয়েছে অনলাইন প্রকাশনায় ইন্টারঅ্যাক্টিভ ডেটাবেস, সার্চযোগ্য রেকর্ড এবং ডেটা ভিজ্যুয়ালাইজেশন ব্যবহার করার ফলে।

তবে সব নিউজরুম এখনো ডেটা ব্যবহারের সঙ্গে তাল মিলিয়ে প্রয়োজনীয় সম্পাদকীয় কাঠামো তৈরি করতে পারেনি। প্রচলিত নিউজরুম থেকে উঠে আসা সম্পাদকদের এখন এমন অনেক খবর সম্পাদনা ও অনুমোদন করতে হয়, যেখানে স্প্রেডশিট, ডেটাসেট এবং পরিসংখ্যানগত বিশ্লেষণ মূল অংশ হিসেবে থাকে। কিন্তু অনেক সময় তাদের ডেটা বিষয়ক কোনো আনুষ্ঠানিক প্রশিক্ষণ না থাকাতে কাজটি আসলে কীভাবে করতে হয় তা নিয়ে তারা পরিষ্কার ধারণা রাখেন না।

মিনিয়াপোলিস স্টার ট্রিবিউনের ডেটা সম্পাদক মেরিজো ওয়েবস্টার। বহু দশক ধরে তিনি ডেটা নিয়ে কাজ করছেন এবং সাংবাদিকদের প্রশিক্ষণ দিচ্ছেন। মেরিজো বলেন, ডেটানির্ভর গল্প তৈরি ও সম্পাদনার প্রক্রিয়া অন্য যেকোনো প্রতিবেদনের মতো একই যুক্তি অনুসরণ করে। আপনি একটি উৎস খুঁজে বের করেন, সেটি যাচাই করেন, প্রশ্ন করেন এবং উত্তরগুলো ন্যায্যভাবে ব্যাখ্যা করেন। কারা ক্ষতিগ্রস্ত হচ্ছে? সরকারি অর্থ কোথায় যাচ্ছে? এবং নীতিগুলো কি প্রতিশ্রুতি অনুযায়ী কাজ করছে? ডেটাও ঠিক এই প্রশ্নগুলোর উত্তর দিতে পারে। এই প্রশ্নগুলো জবাবদিহিমূলক সাংবাদিকতার ক্ষেত্রেও প্রযোজ্য। পার্থক্য শুধু ডেটার উৎসটি একটি স্প্রেডশিট, যা বোঝার জন্য নির্দিষ্ট ধরনের দক্ষতা ও অভিজ্ঞতা প্রয়োজন।

এই বিষয়গুলো নিয়ে নাইট সেন্টারের চার সপ্তাহের একটি কোর্সে প্রধান প্রশিক্ষক হিসেবে কাজ করেছেন ওয়েবস্টার। তিনি বলেন, “ডেটা সাংবাদিক বা যারা তাদের কাজে দক্ষতার সঙ্গে ডেটা ব্যবহার করেন, তাদের অন্য প্রতিবেদকদের থেকে আলাদা ভাবা ঠিক নয়—আর এটা বোঝা খুবই গুরুত্বপূর্ণ।” তিনি আরও বলেন, “তারা প্রশ্ন করে এবং উত্তর খুঁজে বের করে। শুধু পার্থক্য হলো, তারা এক ধরনের ‘ভিন্ন ভাষা’ ব্যবহার করে—যার মাধ্যমে এমন উত্তর পাওয়া যায়, যা অন্যভাবে পাওয়া সম্ভব নয়।”

ডেটানির্ভর গল্প নিয়ে যে সম্পাদকেরা কাজ করেন, তাদের সঙ্গে মূল বিষয়গুলো ভাগাভাগি করার উদ্দেশ্যেই এই কোর্সে অংশ নেয় জিআইজেএন। এই পরামর্শগুলো উৎস যাচাই করা থেকে শুরু করে চূড়ান্ত সম্পাদনা এবং ভিজ্যুয়ালাইজেশন তদারকি পর্যন্ত একটি ডেটা-চালিত গল্পের শুরু থেকে শেষ পর্যন্ত পুরো প্রক্রিয়াটিকেই সম্পন্ন করে।

ডেটা নিয়ে কাজের মানসিকতা গড়ে তোলা

মূলত, ডেটা সাংবাদিকতা হলো ডেটার সঙ্গে ”কথোপোকথন”। সারি ও কলামে সাজানো তথ্যকে ঠিক সেইভাবে প্রশ্ন করা, যেভাবে একজন প্রতিবেদক তার সোর্সকে প্রশ্ন করেন। তবে এখানে সেই প্রশ্ন করার কাজে আপনাকে সাহায্য করবে প্রোগ্রামিং ভাষা ও স্প্রেডশিট।

ওয়েবস্টার বলেন, অনেকেই ডেটা সাংবাদিকতা শুনলে মনে করেন এটি পুরোপুরি গণিতনির্ভর। কিন্তু বাস্তবে এটি অনেক সময় স্প্রেডশিটে যা দেখা যাচ্ছে, তা বুঝে সহজভাবে ব্যাখ্যা করার বিষয়। ডেটা এমন অনেক প্রশ্নের উত্তর খুঁজতে সাহায্য করে, যেগুলোর উত্তর মানব-সোর্স হয় জানে না, নয়তো দিতে পারে না।

মিনিসোটা স্টার ট্রিবিউনের ডেটা এডিটর মেরিজো ওয়েবস্টার। ছবি: মেরিজো ওয়েবস্টারের সৌজন্যে।

ডেটাকে কেবল একটি সম্পূরক অংশ হিসেবে না দেখে সম্পাদকেরা যদি একে সরাসরি তথ্যের উৎস হিসেবে দেখেন, তাহলে তারা ডেটা ব্যবহারের পদ্ধতিও বদলে ফেলবেন।মানব উৎসগুলো যেমন বিভিন্ন ধরনের হয়— নির্ভরযোগ্য সূত্র, গোপন তথ্যদাতা, কিংবা হুইসেলব্লোয়ার। ডেটাও ঠিক এই সবকটি ভূমিকা পালন করতে পারে। ওয়েবস্টারের মতে, ডেটা কখনো হুইসেলব্লোয়ার হিসেবে কাজ করে আপনার কাঙ্ক্ষিত কোনো গোপন বিষয় খুঁজে বের করে দেয়; আবার কখনো ব্যাকগ্রাউন্ড সোর্স হিসেবে বড় কোনো বিষয়কে সামনে আনে। এমনকি এটি একটি ডিরেক্টরি বা সূচি হিসেবেও কাজ করতে পারে, যা আপনাকে গল্পের মূল চরিত্রের সন্ধান দিতে সাহায্য করে। তবে চরিত্র, রক্ত-মাংসের মানুষ এবং প্রাসঙ্গিক প্রেক্ষাপট ছাড়া কেবল ডেটার ওপর ভিত্তি করে লেখা প্রতিবেদনগুলো খুব একটা ভালো হয় না বলে উল্লেখ করেন ওয়েবস্টার। ডেটা আপনাকে সঠিক গন্তব্যে পৌঁছাতে পথ দেখাতে পারে।

তবে কয়েকটি গুরুত্বপূর্ণ দিক থেকে ডেটা মানব উৎসের চেয়ে আলাদা। বিশেষ করে যখন কোনো রিপোর্টার প্রথমবারের মতো কোনো ডেটাসেট নিয়ে কাজ করেন, তখন তা বুঝে উঠতে কিছুটা বেশি সময় লাগতে পারে। ডেটা অনেক সময়ই ত্রুটিপূর্ণ হয়, যা কাজটিকে আরও জটিল করে তোলে। তবে সুবিধাজনক দিক হলো, আপনি একে যত খুশি প্রশ্ন করতে পারেন। আর ডেটাগুলো যদি তথ্যসমৃদ্ধ হয় তবে উত্তরগুলো মানুষের দেওয়া তথ্যের চেয়ে অনেক বেশি সুনির্দিষ্ট বা নির্ভুল হতে পারে।

মিনিয়াপোলিস শহরের হ্রদের সৈকতগুলো নিয়ে স্টার ট্রিবিউনের একটি অনুসন্ধানী প্রতিবেদনের উদাহরণ তুলে ধরেন ওয়েবস্টার। এতে দেখা যায় ডেটা মানব-উৎসের চেয়েও ভালোভাবে তথ্য দিয়েছে এবং নির্ভরযোগ্য উৎস হিসেবে কাজ করেছে। শহর কর্তৃপক্ষ নিশ্চিত করেছিলেন সৈকত বন্ধ হওয়ার ঘটনা আগের চেয়ে বেড়েছে, কিন্তু এর বাইরে তাদের কাছে বলার মতো আর কোনো তথ্য ছিল না। শহরের কর্মকর্তারা নিশ্চিত করেছিলেন যে সৈকত বন্ধের ঘটনা বেড়েছে, কিন্তু তারা এর বেশি কিছু বলতে পারেননি। তবে দুটি ডেটাসেট পুরো বিষয়টি পরিষ্কার করে দেয়—যেখানে দেখা যায়, ভারী বৃষ্টির কারণে যে পানি প্রবাহিত হয়ে লেকে আসছে তাতে ব্যাকটেরিয়া রয়েছে, আর এই কারণে সৈকতগুলো আগের চেয়ে বেশি ঘনঘন বন্ধ করে দেওয়া হচ্ছে।

ওয়েবস্টার বলেন ডেটা বা তথ্য যে কাজটি করতে পারে না, তা হলো—’কেন’ এমনটা হচ্ছে তার কারণ ব্যাখ্যা করা। এটি একটি প্যাটার্ন বা ধারা উন্মোচন করতে পারে। কিন্তু খুব কম ক্ষেত্রেই আপনাকে মূল কারণটি বলতে পারবে। আর সেই কারণ খুঁজে বের করার জন্য এখনও সরাসরি মাঠে নেমে রিপোর্টিং বা জুতোর তলা ক্ষয় করার প্রয়োজন পড়ে।

  • এমনকোনোপ্রশ্নআছেকিযারউত্তরমানবিকউৎসবামানুষসরাসরিদিতেপারছেনা?
  • তথ্যবাডেটাথেকেঠিককীপরিমাণবিস্তারিতবাখুঁটিনাটিবিষয় জানাপ্রয়োজন?
  • এরইমধ্যে অন্যকেউবেরকরেছেনএমনএকটিসংখ্যাইকিআপনাররিপোর্টেরজন্যযথেষ্টহতেপারে?
  • অন্যকোনোসংবাদমাধ্যমকিএরইমধ্যে এইবিশ্লেষণটিকরেফেলেছেযাআপনিসরাসরিব্যবহারকরতেপারেন?
  • এবংকতদ্রুতসংবাদটিপ্রকাশকরাপ্রয়োজন?

ভালো ডেটা সংগ্রহ করুন

ভালো ডেটা খুঁজে পাওয়ার প্রক্রিয়াটি অন্যান্য সূত্র খোঁজার মতোই। বিট রিপোর্টারদের উচিত তারা যে বিষয়গুলো নিয়ে কাজ করেন, সেগুলোর সঙ্গে সম্পর্কিত কী কী ডেটা রয়েছে তা খুঁজে বের করতে সময় দেওয়া। যেমন সংশ্লিষ্ট সরকারি সংস্থাগুলো কী ধরনের প্রতিবেদন প্রকাশ করে, বা পুলিশ বিভাগ কীভাবে বন্দুক সহিংসতার তথ্য সংরক্ষণ ও চিহ্নিত করে।

আপনি কী ধরনের ডেটা পাচ্ছেন— তা কী  “সামারি” ডেটা (আগে থেকেই বাছাই করা) নাকি আপনি ”র” ডেটা নিয়ে কাজ করছেন—তা জানা খুব জরুরি।। সামারি ডেটা হলো এমন তথ্য, যা আগে থেকেই কেউ হাত দিয়েছে। যেমন, স্কুলগুলোতে উদ্ধার হওয়া হ্যান্ডগানের সংখ্যা দেখানো একটি টেবিল। অন্যদিকে, বিস্তারিত বা “র” ডেটাতে প্রতিটি সারিই একটি আলাদা গল্প বা ঘটনা, ব্যক্তি কিংবা দুর্ঘটনাকে বোঝাতে পারে। এই ধরনের ডেটা থাকলে আপনি নিজেই ডেটার সঙ্গে “আলাপ” চালিয়ে যেতে পারেন, অর্থাৎ গভীরভাবে বিশ্লেষণ করতে পারেন।

যদিও বিস্তারিত ডেটা সব সময় পাওয়া যায় না। অনেক সময় তা সংগ্রহ করার সময়ও থাকে না। তবুও সেটি খুঁজে পাওয়ার সবচেয়ে ভালো উপায় হলো একজন প্রতিবেদকের মতো কাজ করা। অর্থাৎ মানুষকে ফোন করা, বিভিন্ন সংস্থাকে জিজ্ঞেস করা তারা কীভাবে তথ্য সংগ্রহ ও সংরক্ষণ করে, এবং বড় কোনো সংখ্যার পেছনের নথিপত্র অনুসরণ করা। কারণ সারসংক্ষেপ ডেটা সাধারণত আরও সমৃদ্ধ মূল ডেটাসেটের দিকেই ইঙ্গিত করে।

ওয়েবস্টারের মতে, অনেক সময় ডেটা সংগ্রহকারীদের সঙ্গে সরাসরি দেখা করার অনুরোধ করা ভালো, যাতে তাদের তথ্য সংগ্রহের পদ্ধতি সম্পর্কে ধারণা পাওয়া যায়। অন্য উপায় হচ্ছে, অভিজ্ঞ কোনো বিশ্লেষককে ডেটাসেট সম্পর্কে মন্তব্য করতে বলা।

এই পর্যায়েই তথ্যের নির্ভুলতা নিশ্চিত করার কাজে হাত দিতে হয়। কোনো তথ্যের জন্য অনুরোধ করার আগেই একজন রিপোর্টারকে বুঝতে হবে, সেই ডেটাতে আসলে কী আছে, কীভাবে তা সংগ্রহ করা হয়েছে, কোন বিষয়গুলো বাদ দেওয়া হয়েছে এবং সময়ের সঙ্গে সঙ্গে সেখানে এমন কোনো পরিবর্তন এসেছে কিনা যা সংখ্যার ওপর প্রভাব ফেলতে পারে।

এই পর্যায়ে সময়সীমা নির্ধারণ করাটা গুরুত্বপূর্ণ। এই সিদ্ধান্তটা নিতে হয় শুরুতেই। সাধারণ নিয়ম হলো যতটা সম্ভব দীর্ঘ সময়ের ঐতিহাসিক তথ্য সংগ্রহ করা—সুযোগ থাকলে পাঁচ থেকে দশ বছরের। কিন্তু ওয়েবস্টারের মতে, এতে প্রায় কিছু জটিলতা দেখা দেয়। যেমন, কোভিড-১৯ মহামারি ২০২০ সালের প্রায় প্রতিটি ডেটাসেটকে ওলটপালট করে দিয়েছে, তা সে বিষয়বস্তু যাই হোক না কেন। তাই ২০২০ সালকে একটি স্বাভাবিক ভিত্তি হিসেবে ধরে নিলে যেকোনো প্রবণতা বিশ্লেষণ বিভ্রান্তিকর হতে পারে।

একইভাবে গুরুত্বপূর্ণ হলো একজন রিপোর্টার যে “তথ্যের জগৎ” নিয়ে কাজ করতে চান, তা নিয়ে ভাবা। যেমন, কেউ যদি গাড়ি দুর্ঘটনার এমন একটি ডেটাবেজ নিয়ে কাজ করেন যেখানে কেবল আহত হওয়া, মৃত্যু বা বড় ধরনের সম্পত্তির ক্ষয়ক্ষতির হিসাব আছে—অথচ সেই রিপোর্টার জানতে চান কত ঘনঘন গাড়িগুলো ভবনে আঘাত করছে; তবে দেখা যাবে ওই নির্দিষ্ট ডেটাসেটটি তার জন্য অত্যন্ত সীমিত বা অপ্রতুল।

মাঝে মাঝে দেখা যায়, উপযুক্ত কোনো ডেটাসেট একেবারেই নেই। তবে এমন পরিস্থিতিতে নতুন একটি ডেটাসেট তৈরি করে নেওয়া সম্ভব। ২০২০ সালের মার্চ মাসে কোভিড-১৯ মহামারির সময় আর্জেন্টিনা যখন তাদের সীমান্ত বন্ধ করে দেয়, তখন ‘লা নেশন’ এর সাংবাদিকরা জানতে পারেন ২১ হাজারের বেশি আর্জেন্টাইন নাগরিক বিদেশে আটকা পড়েছেন। যাদের অনেকেই চরম ঝুঁকিপূর্ণ পরিস্থিতিতে রয়েছেন।

সরকারের সীমিত অনুমানের ওপর নির্ভর না করে, তারা নিজেদের ডেটাবেস তৈরি করেন। এজন্য তারা একটি উন্মুক্ত গুগল ফর্ম চালু করেন, যেখানে কাঠামোবদ্ধ তথ্য সংগ্রহ করা হয়—যেমন অবস্থান, বয়স, ঝুঁকির কারণ, ফেরার টিকিটের অবস্থা—এবং এটি সামাজিক মাধ্যমে ছড়িয়ে দেন। পাশাপাশি, আটকে পড়া ভ্রমণকারীদের ইনস্টাগ্রাম অ্যাকাউন্টগুলো খুঁজে বের করে তাদের সঙ্গে সরাসরি যোগাযোগও করেন।

এইভাবে তৈরি হওয়া ডেটাবেসের মাধ্যমে দলটি দেশভিত্তিক আটকে পড়া মানুষের সংখ্যা চিহ্নিত করতে পারে, সবচেয়ে ঝুঁকিপূর্ণ অবস্থায় থাকা ব্যক্তিদের শনাক্ত করতে পারে, এবং এমন প্রতিবেদন তৈরি করতে পারে যা সংকটের ব্যাপ্তি ও মানবিক দিকটি তুলে ধরে। কাজটি সরকারি সূত্রগুলো দিয়ে করা সম্ভব ছিল না।

ডেটা সাংবাদিক নাতালিয়া লুজাও, যিনি এই প্রজেক্টে কাজ করেছিলেন এবং নাইট সেন্টারের কোর্সে একজন অতিথি বক্তা হিসেবে ছিলেন, তিনি জানান এই কাজ থেকে তারা বেশ কিছু গুরুত্বপূর্ণ শিক্ষা লাভ করেছেন:

  • চূড়ান্ত প্রতিবেদনের কথা মাথায় রেখে পরিকল্পনা করুন: আপনি ডেটাবেস থেকে যেসব প্রশ্নের উত্তর চান, সেই অনুযায়ী কোন কোন তথ্য সংগ্রহ করবেন তা ঠিক করুন।
  • স্থির তথ্যের বদলে পরিবর্তনশীল তথ্য সংগ্রহ করুন—যেমন বর্তমান বয়সের বদলে জন্মতারিখ নিন, যাতে ডেটা ভবিষ্যতেও ব্যবহারযোগ্য থাকে।
  • শুরু থেকেই ডেটা এন্ট্রি একটি নির্দিষ্ট কাঠামোয় রাখুন—যেখানে সম্ভব ফ্রি টেক্সটের বদলে নির্দিষ্ট ক্যাটাগরি ব্যবহার করুন, যাতে পরে ডেটা পরিষ্কার করাই বড় সমস্যা হয়ে না দাঁড়ায়।
  • এবং মনে করবেন না যে ডেটাবেস বড় হলেই সেটি মূল্যবান। লা নাসিওনের হুজ হু ইন কংগ্রেস ডেটাবেসে মাত্র ৩৩০টি সারি ছিল। তবুও এটি পাঠকদের তাদের নির্বাচিত প্রতিনিধিদের সম্পর্কে এমন তথ্য জানাতে পেরেছিল, যা আগে কখনোই এক জায়গায় জড়ো করা হয়নি।

লা নাসিওনের “হুজ হু ইন কংগ্রেস” ডেটাবেস। ছবি: স্ক্রিনশট, লা নাসিওন

বুলেটপ্রুফিং বা তথ্য যাচাই

একটি ডেটানির্ভর প্রতিবেদনকে নির্ভুল ও নির্ভরযোগ্য করে গড়ে তুলতে শেষধাপে গিয়ে তথ্য যাচাই করবেন—এমনটা ভাবা উচিৎ না। ডেটার বা তথ্যের যেকোনো সমস্যা সমাধান করতে অনেক সময় লাগে। তাই একজন রিপোর্টার যখনই কোনো ডেটাসেট শনাক্ত করবেন, ঠিক সেই মুহূর্ত থেকেই ফ্যাক্ট-চেকিংয়ের প্রক্রিয়া শুরু করা উচিত।

সবচেয়ে গুরুত্বপূর্ণ দুটি বিষয় হলো—ডেটা কতটা নির্ভরযোগ্য, এবং বিশ্লেষণটি সঠিক কি না। ওয়েবস্টারের পরামর্শ হলো, প্রতিবেদক ও সম্পাদকদের নতুন ডেটাকে ঠিক হুইসেলব্লোয়ারের মতোই দেখা উচিত—আগ্রহ নিয়ে, তবে সতর্কতার সঙ্গে। তিনি বলেন, “ডেটার সঙ্গে সময় কাটান।” দেখুন এটি কীভাবে সংগ্রহ করা হয়েছে, কত ঘনঘন হালনাগাদ করা হয়, এতে কী কী তথ্য অন্তর্ভুক্ত আছে এবং কী কী বাদ দেওয়া হয়েছে। কলামগুলো স্ক্রল করে দেখুন। কোনো কিছু অস্বাভাবিক মনে হচ্ছে কি না খেয়াল করুন। এমন কোনো কোড আছে কি না যা বুঝে নিতে হবে, মানগুলোর মধ্যে অসঙ্গতি আছে কি না, বা কোনো তথ্য অনুপস্থিত আছে কি না—এসব পরীক্ষা করুন। যে প্রতিষ্ঠান ডেটাগুলো তৈরি করেছে তাদের যদি কোনো কোডবুক বা পদ্ধতিগত নথি থাকে, সেটি ব্যবহার করুন। ডেটাবেসের একটি নির্দিষ্ট কলাম আসলে কী নির্দেশ করছে—তা নিশ্চিত না হয়ে ধরে নেবেন না।

ওয়েবস্টার বলেন, একজন ডেটা প্রতিবেদকের জন্য সবচেয়ে উপকারী অভ্যাসগুলোর একটি হলো একটি ডেটা ডায়েরি রাখা—এটি একটি চলমান রেকর্ড বা খাতা, যেখানে প্রতিটি ব্যবহৃত উৎস, তথ্য পরিষ্কার করার প্রতিটি সিদ্ধান্ত এবং বিশ্লেষণের সময় যুক্ত করা বা পরিবর্তন করা প্রতিটি কলামের বিস্তারিত বিবরণ লিপিবদ্ধ থাকে। এটি মূলত এমন একটি দালিলিক প্রমাণ যা প্রাপ্ত ফলাফল যাচাই করা, ভুলগুলো ধরা এবং প্রকাশের পর কোনো চ্যালেঞ্জ বা প্রশ্নের মুখে পড়লে নিজের কাজকে সমর্থন করতে সাহায্য করে। সম্পাদকদের উচিত এই রেকর্ডটি চাওয়া এবং এটি নিশ্চিত করা যে, ডেটা বিশ্লেষণের পাশাপাশি সরাসরি মাঠপর্যায়ের রিপোর্টিং সমান্তরালভাবে চলছে কিনা।

এছাড়া একটি ডেটা মেমো রাখা। এটি আলাদা হলেও মূল কাজকে সহায়তা করে।এই মেমোটি একটি সারসংক্ষেপ হিসেবে কাজ করে যেখানে মূল অনুসন্ধান, অপ্রত্যাশিত বিষয়, সীমাবদ্ধতা, এবং ডেটা যা দেখাচ্ছে তার সঙ্গে মানুষের দেওয়া তথ্যের সঙ্গে ডেটার প্রাপ্ত তথ্যের তুলনামূলক পার্থক্যগুলো তুলে ধরা হয়। এটি হওয়া উচিত সহজ ও সুনির্দিষ্ট, যা সম্পাদকদের যাচাই-বাছাই করতে সুবিধা দেবে। যখন কোনো ফলাফল অস্বাভাবিক রকমের ভালো মনে হয়, তখন সঠিক কাজ হলো সেটিকে চ্যালেঞ্জ করা: এটি কি আসলেও বিশ্বাসযোগ্য? কেউ কি এটি নিয়ে দ্বিমত পোষণ করেছেন? বিশ্লেষণটি কি সমজাতীয় বিষয়ের মধ্যে তুলনা করছে, নাকি জনসংখ্যার পরিবর্তনের মতো বাহ্যিক বিষয়গুলো এখানে উপেক্ষিত রয়ে গেছে? যে ডেটাসেটটি বিশ্লেষণ করা হচ্ছে, নির্দিষ্ট সময়ে তার পদ্ধতির কোনো পরিবর্তন হয়েছে কিনা? অন্য কোনো সংস্থা বা গবেষক স্বাধীনভাবে একই বিশ্লেষণ করে থাকলে ফলাফল কি একই এসেছে? ওয়েবস্টার আরও পরামর্শ দিয়েছেন যেন কাজের পদ্ধতিটি সহজ ভাষায় লিখে রাখা হয়। যদি স্পষ্টভাবে ব্যাখ্যা করা খুব জটিল মনে হয়, তবে ধরে নিতে হবে বিষয়টি নিয়ে আরও পর্যালোচনার প্রয়োজন আছে।

ডেটা স্টোরি সম্পাদনা

ডেটা স্টোরি বা ডেটা নির্ভর প্রতিবেদন তৈরির ক্ষেত্রে সবচেয়ে সাধারণ সমস্যা হলো ভালো বিশ্লেষণ থাকলেও সেটি খারাপভাবে উপস্থাপন করা হয়। পরিসংখ্যানের দীর্ঘ তালিকা, প্রতিটি অনুচ্ছেদে সংখ্যার ছড়াছড়ি, এবং এমন ফলাফল তুলে ধরা যেগুলো আসলে চমকপ্রদ, স্বাভাবিক নাকি উদ্বেগজনক—তা বোঝার কোনো উপায় থাকে না। ওয়েবস্টার বলেন, এতে পাঠক দ্রুত আগ্রহ হারিয়ে ফেলে।

  • কম সংখ্যক সংখ্যা ব্যবহার করাই ভালো, তবে সেগুলো সঠিকভাবে ব্যবহার করতে হবে। এর মানে হলো কোনো একটি অনুচ্ছেদে সর্বোচ্চ দুই বা তিনটির বেশি সংখ্যা না রাখা (আরেকটি সাধারণ নিয়ম হলো মোট আটটির বেশি সংখ্যা না থাকা)। লক্ষ্য হলো ডেটা কী প্রকাশ করছে তা ব্যাখ্যা করা, শুধু তা দেখানো নয়।
  • ওয়েবস্টার পরামর্শ দেন পরিসংখ্যান বা সংখ্যাগত তথ্যগুলো ঠিক যেমন আছে তেমনভাবে না লিখে নিজের ভাষায় সহজভাবে ব্যাখ্যা করে বলুন।
  • সাংবাদিকদের উচিত তথ্যের সত্যতা বজায় রেখে সংখ্যাগুলোকে সহজ করে বলা। যেমন, “৪৮ দশমিক ৭%” বলার চেয়ে “প্রায় অর্ধেক” বললে পাঠকরা বিষয়টি বেশি পরিষ্কারভাবে বুঝতে পারেন। দশমিক ব্যবহার করলে তথ্যের যে নিখুঁত নির্ভুলতা বোঝায়, বাস্তবে সব সময় তথ্যের প্রকৃতি তেমন নাও হতে পারে। বিশেষ করে যেসব জিনিসকে ভাগ করা যায় না—যেমন মানুষ—সেক্ষেত্রে একেবারেই দশমিক এড়িয়ে চলা উচিত।
  • যেখানে তুলনা করে দেখানোই মূল উদ্দেশ্য, সেখানে সরাসরি বড় সংখ্যা (র ফিগার) ব্যবহার না করে অনুপাত বা শতকরা ব্যবহার করুন।
  • পাঠকদের যেন নিজেরা হিসাব করতে না হয়, সেটাও নিশ্চিত করা গুরুত্বপূর্ণ। তাই হার বা অনুপাত আগে থেকেই রূপান্তর করে দেওয়া উচিত। গল্পটি এমনভাবে সাজানো উচিত যাতে সেটিই পাঠককে সরাসরি চূড়ান্ত ফলাফলে পৌঁছে দেয়।

ওয়েবস্টার বলেন, প্রতিটি বিশ্লেষণে একটি “তারকা নাম্বার” থাকা উচিত—অর্থাৎ সেই একক ফলাফল, যা গল্পের সবচেয়ে গুরুত্বপূর্ণ দিককে সবচেয়ে স্পষ্টভাবে তুলে ধরে। এটি মানবসূত্র থেকে পাওয়া সবচেয়ে শক্তিশালী উদ্ধৃতির সমতুল্য। ডেটা সাংবাদিকরা প্রায়ই বাকি অংশ বাদ দিতে অনিচ্ছুক থাকেন। কিন্তু যে প্রতিবেদনগুলো পাঠকের জন্য সবকিছু একসঙ্গে দেখানোর চেষ্টা করে তার তুলনায় একটিমাত্র সুনির্দিষ্ট ফলাফলের ওপর দাঁড়িয়ে থাকা গল্প অনেক বেশি শক্তিশালী হয়।

ওই “তারকা নাম্বার” যাই হোক না কেন, নিশ্চিত করতে হবে পাঠক যেন বুঝতে পারে এর অর্থ কী। কোনো সংখ্যা তখনই অর্থপূর্ণ হয়, যখন প্রতিবেদন সেটিকে যথাযথ প্রেক্ষাপট দিয়ে ব্যাখ্যা করে।

ভিজুয়ালাইজেশন নিয়ে

যদি কোনো গল্পে চার্ট বা মানচিত্র থাকে, তাহলে একজন সম্পাদকের প্রথম প্রশ্ন হওয়া উচিত—এই ভিজুয়ালটি কি কোনো যোগসূত্র তুলে ধরছে, নাকি শুধু ডেটা প্রদর্শন করছে? এই দুটির মধ্যে পার্থক্য আছে।

সিজে সিনার, স্টার ট্রিবিউন-এর গ্রাফিক্স ও ডেটা ভিজ্যুয়ালস বিভাগের পরিচালক। তিনি বলেন:

  • শক্তিশালী বর্ণনামূলক শিরোনাম, স্পষ্ট ব্যাখ্যামূলক নোট এবং সরাসরি লেবেল থাকলে পাঠকরা চার্ট ভালোভাবে বুঝতে পারেন। আলাদা লেজেন্ড থাকলে চোখকে বারবার এদিক-ওদিক যেতে হয়, যা বোঝার প্রক্রিয়াকে কঠিন করে তোলে। চার্টের কাজ হলো পাঠকের জন্য কাজটি সহজ করে দেওয়া।
  • রঙের ব্যবহারও গুরুত্বপূর্ণ। সবচেয়ে গুরুত্বপূর্ণ সংখ্যাগুলোর জন্য গাঢ় ও বেশি স্যাচুরেটেড রঙ ব্যবহার করা উচিত এবং রঙকে শুধু সাজসজ্জা হিসেবে নয়, সচেতনভাবে ব্যবহার করতে হবে। লাল রং সাধারণত নেতিবাচক মানের সঙ্গে, আর সবুজ রং ইতিবাচক মানের সঙ্গে সম্পর্কিত ধারণা তৈরি করে। কখনও কখনও তুলনার জন্য বিভিন্ন রঙের প্যালেটের চেয়ে একই রঙের দুটি শেড বেশি কার্যকর হতে পারে, তবে যাদের রঙ পার্থক্য বোঝার ক্ষমতা সীমিত, তাদের জন্য অ্যাক্সেসিবিলিটির বিষয়টি বিবেচনায় রাখতে হবে। অ্যালাইনমেন্ট ভিজ্যুয়ালকে পরিষ্কার রাখে। চার্টে উপাদানগুলোর কাছাকাছি অবস্থান তাদের পারস্পরিক সম্পর্ক নির্দেশ করে। এগুলো এমন নকশাগত সিদ্ধান্ত, যা প্রতিটি পাঠকের জন্য গল্প বোঝাকে সহজ করে তোলার জন্য প্রয়োগ করা উচিত।
  • ডেটা আসলে কীভাবে কাজ করছে চার্টের ধরনকে তার সঙ্গে মিলিয়ে নিতে হবে। যেমন, সময়ের সঙ্গে পরিবর্তন বা প্রবণতা দেখানোর জন্য লাইন চার্ট ব্যবহার করা উচিত।
  • ভিজ্যুয়ালাইজেশনে ব্যবহৃত রঙ এবং চার্টের ধরন ছাড়াও সেখানে ব্যবহৃত শব্দগুলোও গুরুত্বপূর্ণ। অবশ্যই করণীয় বিষয়গুলোর মধ্যে রয়েছে: অক্ষ (axes) স্পষ্টভাবে লেবেল করা, সংক্ষিপ্ত রূপের বদলে পূর্ণ নাম লেখা, এবং গুরুত্বপূর্ণ ঘটনাগুলো চিহ্নিত করে ব্যাখ্যা যোগ করা—যেমন তেলের দামের চার্টে মন্দা, অপরাধ প্রবণতার ক্ষেত্রে নীতিগত পরিবর্তন। পাশাপাশি এমন গুরুত্বপূর্ণ তথ্য টুলটিপে (tooltip) লুকিয়ে রাখা উচিত নয়, যা পাঠক হয়তো কখনোই ক্লিক করে দেখবে না।

শেষ ধাপটি হলো—ভিজ্যুয়ালটি কি সত্যিই জায়গা পাওয়ার যোগ্য? যদি একই তথ্য একটি মাত্র বাক্যে আরও স্পষ্টভাবে প্রকাশ করা যায়, তাহলে চার্টটি বাদ দেওয়া উচিত। আর যদি চার্ট এমন কিছু প্রকাশ করে যা একটি বাক্যে বোঝানো সম্ভব নয়, তাহলে সেটি অবশ্যই এমনভাবে তৈরি করতে হবে যাতে সাধারণ পাঠক সহজে তা বুঝতে পারেন।


হানা ডুগল জিআইজেএনের পাক্ষিক টপ টেন ইন ডেটা জার্নালিজম কলামের লেখক। পাশাপাশি আল জাজিরার ডেটা, ভিজ্যুয়াল স্টোরিটেলিং এবং এক্সপেরিমেন্ট টিম—এজে ল্যাবস–এর ডেটা সাংবাদিক। তিনি পুলিশি তদারকি, নজরদারি, এবং প্রতিবাদ-প্রতিরোধসহ বিভিন্ন বিষয় ডেটার মাধ্যমে অনুসন্ধান করেছেন। এছাড়া জিআইজেএনের জন্য মধ্যপ্রাচ্যে ডেটা সাংবাদিকতার প্রতিবেদন,  টিকটক অ্যালগরিদম অনুসন্ধান, এবং যুক্তরাষ্ট্রে আদিবাসী ভূমি নিয়ে ডেটা ব্যবহার করে অনুসন্ধানী প্রতিবেদন করেছেন

ক্রিয়েটিভ কমন্স লাইসেন্সের অধীনে আমাদের লেখা বিনামূল্যে অনলাইন বা প্রিন্টে প্রকাশযোগ্য

লেখাটি পুনঃপ্রকাশ করুন


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

পরবর্তী

ডেটা সাংবাদিকতা

এআই খাতে ট্রিলিয়ন ডলার: রয়টার্স যেভাবে ভিজ্যুয়াল গল্পে এতো বড় ডেটা তুলে ধরেছে

সাংবাদিকরা যখন অর্থনৈতিক বিষয় নিয়ে প্রতিবেদন লেখেন, তখন কিন্তু তারা ডেটার ঘাটতি নয় বরং বর্ণনার ক্ষেত্রে সমস্যায় পড়েন। আর তা হচ্ছে, যে মানুষটি কখনও এক ট্রিলিয়ন ডলার চোখে দেখেননি, তাকে কীভাবে বিপুল এই অর্থের পরিমাণ সম্পর্কে ধারণা দেওয়া যায়?

ডেটা সাংবাদিকতা

বাল্টিকে নাশকতামূলক কর্মকাণ্ড এবং সিরিয়ার অপহৃত শিশু: ২০২৬ সালের সিগমা পুরস্কার জিতেছে যে ১০ ডেটা সাংবাদিকতা প্রকল্প

১৭ সদস্যের বিচারক দল ৩১টি প্রকল্পের চূড়ান্ত তালিকা থেকে ১০টি অসাধারণ ডেটাভিত্তিক সাংবাদিকতা প্রকল্পকে বিজয়ী হিসেবে নির্বাচন করেছেন। চূড়ান্ত তালিকায় ছিল ২৬টি স্বতন্ত্র প্রকল্প এবং পাঁচটি পোর্টফোলিও। যেগুলো এসেছে ভিন্ন ভিন্ন সব দেশ থেকে।

ডেটা সাংবাদিকতা

ভারতের ‘দ্য হিন্দু’ পত্রিকা ডেটা সাংবাদিকতায় যেভাবে এআই যুক্ত করছে

“এআই হচ্ছে অত্যন্ত পারদর্শী একজন ইন্টার্ন বা শিক্ষানবিশ। আপনি একে ঠিক যা করতে বলবেন, সে নিখুঁতভাবে তাই করে দেবে। কিন্তু মূল নিয়ন্ত্রণ বা কর্তৃত্ব থাকবে আপনার হাতেই।”

ডেটা সাংবাদিকতা সম্পাদকের বাছাই

২০২৫ সালের সেরা ডেটা সাংবাদিকতা

২০২৫ সালে সংবাদমাধ্যমে প্রাধান্য পেয়েছিল বেশ কিছু গুরুত্বপূর্ণ ঘটনা। ডেটা সাংবাদিকতা বিষয়ক নিউজরুমগুলো যা নিবিড়ভাবে পর্যবেক্ষণ করেছে—যেমন মার্কিন বাণিজ্যের আধিপত্য, কৃত্রিম বুদ্ধিমত্তার ক্রমবর্ধমান প্রভাব, এবং চলমান সংঘাত।