

ডেটা ব্যবহার করে কাঠামোগত লিঙ্গভিত্তিক সহিংসতা উন্মোচন—১০টি ধাপ
শুরুটা হয়েছিল একজন সন্তানহারা শোকার্ত মায়ের গল্প থেকে। ঘটনাটি ঘটে এসওয়াতিনির কেন্দ্রীয় শহর মাথসাফার কাছে। দক্ষিণ আফ্রিকার ছোট এ শহরটি আগে পরিচিত ছিল সোয়াজিল্যান্ড নামে। জোদওয়া এনকামবুলের মেয়েকে এতটাই নির্মমভাবে আক্রমণ ও ধর্ষণ করা হয়েছিল যে সে আর হাঁটতে পারত না। নিয়মিত তাকে হাসপাতালে নিতে হতো। একটা সময় পর সে হার মানে। ঢলে পড়ে মৃত্যুর কোলে। অভিযুক্ত ব্যক্তিকে গ্রেপ্তার করা হলেও পরে মুক্তি দেওয়া হয়। স্বাভাবিক মৃত্যুর আগ পর্যন্ত তাকে আর কখনো কোনো বিচারের মুখোমুখিও হতে হয়নি।
এ ঘটনাটি হাজারো মর্মান্তিক কাহিনী থেকে নেওয়া মাত্র একটি উদাহরণ। সেন্টার ফর কোলাবরেটিভ ইনভেস্টিগেটিভ জার্নালিজম (সিসিআইজে)-এর উইদআউট জাস্টিস: হাউ এসওয়াতিনিস সিস্টেম ইজ ফেইলিং ভিকটিমস অব জেন্ডার-বেইজড ভায়োলেন্স শীর্ষক অনুসন্ধানী প্রতিবেদনে দেখা গেছে, মাত্র ছয় মাসের মধ্যেই টাইমস অব এসওয়াতিনি পত্রিকার পাতায় প্রায় প্রতি সপ্তাহেই ‘ধর্ষণ’ শব্দটি এসেছে। প্রতিবেদনে উল্লেখ করা হয়েছে যে, দেশে ধর্ষণের হার আন্তর্জাতিক গড়ের চেয়েও বেশি, যদিও বেশিরভাগ ঘটনা নথিভুক্তও হয় না।
এনকামবুলের গল্পই ছিল সেই প্রাথমিক স্ফূলিঙ্গ, যা পরবর্তীতে ব্যাপক অনুসন্ধানে রূপ নেয়। এতে কেবল ব্যক্তিগত ঘটনা বা অভিযুক্তদের ওপর প্রতিবেদন তৈরি করাই হয়নি; বরং এসওয়াতিনিতে নারীর বিরুদ্ধে যৌন নির্যাতন ও সহিংসতাকে সহায়তা করে এমন কাঠামোগত কারণ ও প্রতিষ্ঠানগুলোর কথাও বলা হয়েছে এবং প্রচলিত বিচারব্যবস্থা কীভাবে ভুক্তভোগীদের হতাশ করছে—তুলে ধরা হয়েছে তাও। আদালতের তথ্য সংগ্রহ, বিশ্লেষণ ও যাচাইয়ের মাধ্যমে সাংবাদিকরা ব্যক্তিগত একটি গল্পকে প্রমাণভিত্তিক অনুসন্ধানে রূপান্তরিত করেছেন, যা নিয়ে দীর্ঘদিন ধরে আলোচনা করা হলেও প্রকৃত মাত্রাটা ছিল অস্পষ্ট।
বিশ্বজুড়ে অনুসন্ধানী সাংবাদিকদের বিভিন্ন পরামর্শ ও সম্পাদকীয় সহায়তা দিচ্ছে সিসিআইজে। তাদের একটি দল টাইমস অব এসওয়াতিনিতে প্রকাশিত প্রতিবেদনের ধরন পর্যালোচনা করেছে; পরিবর্তনের দাবিতে আন্দোলনরত কর্মী এবং প্রত্যক্ষ নির্যাতনের শিকার হওয়া এক নারীর সাক্ষাৎকার নিয়েছে; সুইজারল্যান্ড অ্যাকশন গ্রুপ এগেইনিস্ট অ্যাবিউজ (এসডব্লিউএজিএএ) সংগঠনের তিন বছরের তথ্য বিশ্লেষণ করেছে; এবং ১৯৭৭ সাল থেকে বর্তমান সময় পর্যন্ত উচ্চ আদালতের ৪ হাজার ৬০০এর বেশি মামলা পরীক্ষা করেছে। তারা দেখতে পায় যে এর মধ্যে ৩৩০টিরও বেশি মামলা লিঙ্গভিত্তিক সহিংসতার সঙ্গে সম্পর্কিত, যার মধ্যে ২৫৩টি ধর্ষণের অভিযোগ।
তারা লিখেছে, “আমাদের অনুসন্ধানে উঠে এসেছে একাধিক ফাঁকফোকর, যাতে দেখা যায় ভুক্তভোগীরা জবাবদিহিতা আদায়ের প্রক্রিয়াতেই হারিয়ে যায়।” তাদের মতে, এটি এমন একটি বিচার ব্যবস্থার চিত্র তুলে ধরে, যা ২০১৮ সালে গৃহীত সেক্সুয়াল ওফেন্সেস অ্যান্ড ডমেস্টিক ভায়োলন্স অ্যাক্ট (এসওডিভি)-এর মামলার চাপ সামলাতেই হিমশিম খাচ্ছে।
এই ফাঁকগুলোর মধ্যে রয়েছে:
- ভুক্তভোগীরা তাদের অভিজ্ঞতা জানাতে ভয় পান বা অভিযোগ তুলে নিতে বাধ্য হন।
- মামলাগুলো আদালতের নথি থেকে অদৃশ্য হয়ে যায় বা প্রক্রিয়াগত ত্রুটির কারণে খারিজ হয়ে যায়।
- বিচারকরা আইনের ভুল ব্যাখ্যা দেন বা মামলাগুলো বছরের পর বছর ধরে ঝুলে থাকে।
সিসিআইজের সেই সময়ের সিরিজ সম্পাদক ক্যারোলিন থম্পসন এবং ডেটা সম্পাদক সোটিরিস সিডেরিস নীচে ১০-ধাপের একটি গাইড শেয়ার করেছেন। এতে দেখানো হয়েছে কীভাবে তাদের দল সঠিক ডেটা খুঁজে পেয়েছিল, তা বিশ্লেষণের জন্য একটি পদ্ধতি দাঁড় করেছিল, এবং কীভাবে তাঁরা বিচার ব্যবস্থার একটি প্রাতিষ্ঠানিক ব্যর্থতা উন্মোচন করতে সক্ষম হয়েছিল।

অলাভজনক প্রতিষ্ঠান আইমেডআইজেএফ২৪ এর সম্মেলনে সিসিআইজের সিরিজ সম্পাদক ক্যারোলিন থম্পসন (মাঝে) ডেটা সম্পাদক সোটিরিস সিডেরিস (ডানে) এবং সিসিআইজের আফ্রিকা সম্পাদক আজিবোলা আমজাত। ছবি: থম্পসনের সৌজন্যে
১. একটি সুনির্দিষ্ট অনুমানের ভিত্তিতে শুরু করুন
আমরা কাজটি শুরু করেছিলাম সহজ একটি অনুমানের ওপর নির্ভর করে: “‘কেউ একজন কোনো কারণে কাজটি করছে’—: আমরা এ ধারণাটি ব্যবহার করতে পছন্দ করি”, ব্যাখ্যা করেন থম্পসন। এ ক্ষেত্রে যেমন তাঁরা অনুমান করেছিলেন যে এসওয়াতিনি সরকার যৌন সহিংসতা প্রতিরোধে যথাযথ আইন যেমন—এসওডিভি, কার্যকর না করে এবং জনগণকে বিষয়টি সম্পর্কে সচেতন না করে সহিংসতার ঘটনাগুলো প্রতিরোধে ব্যর্থ হয়েছে। এই ধারণাটি প্রমাণের জন্য, কিছু বিষয় শনাক্ত করতে হয়েছিল।
২. তথ্য সংগ্রহ করুন: আপনি এখন পর্যন্ত কী জানেন?
কোনো অনুসন্ধান শুরুর সময়, আপনার হাতে থাকা প্রমাণিত বিষয়গুলো একাট্টা করুন। মানবাধিকার সংগঠন যেমন হিউম্যান রাইটস ওয়াচ এবং ইউএনএফপিএর মতে, এসওয়াতিনিতে এক তৃতীয়াংশেরও বেশি নারী ১৮ বছর বয়স হওয়ার আগেই কোনো না কোনো ধরনের যৌন সহিংসতার শিকার হয়েছেন। এ বিষয়টি প্রমাণের জন্য কী ধরনের তথ্য প্রয়োজন এবং কেন কিছু মামলা সফলভাবে বিচারের দিকে গড়ায় না, তা নিয়ে ভাবতে শুরু করে সিসিআইজের দলটি।
৩. একটি তথ্য-মানচিত্র তৈরি করুন
আপনার অনুসন্ধানের জন্য সবচেয়ে প্রয়োজনীয় যে তথ্যের দরকার তা কোথায় বা কার কাছে পেতে পারেন—আপনাকেই তা চিন্তা করে বের করতে হবে। তাই থম্পসন পরামর্শ দিয়েছেন, “আপনি যে অনুমান/ধারণার ওপর ভর করে অগ্রসর হচ্ছেন, তা মাথায় রেখে চিন্তা করুন। কারা তথ্য সংগ্রহ করতে পারে, এবং সেগুলো কোথায় থাকবে?”
যৌন সহিংসতার সঙ্গে সম্পর্কিত তথ্যগুলো যেমন ডাক্তারের রেকর্ড, পুলিশ রিপোর্ট, মানসিক স্বাস্থ্য সহায়তা সংক্রান্ত তথ্য, সামাজিক যোগাযোগ মাধ্যমে পেতে পারেন। মানুষ এখানে তাদের অভিজ্ঞতার কথা বলে। এক্ষেত্রে গুরুত্বপূর্ণ বিষয়টি হচ্ছে তথ্য সংগ্রহের উৎসগুলো যথেষ্ট সচেনতার সঙ্গে বাছাই করা। “আমাদের লক্ষ্য কিন্তু সবকিছু সংগ্রহ করা নয়,” থম্পসন যোগ করেন। আরো বলেন, “আমাদের লক্ষ্য হলো সম্ভাব্য ডেটাগুলো কোথায় কোথায় থাকতে পারে তা চিন্তা করে খুঁজে বের করা এবং তারপর সিদ্ধান্ত নেওয়া যে কোন তথ্যটি প্রতিবেদনকে প্রাসঙ্গিক করতে সাহায্য করবে।”
৪. ডেটা উৎস খুঁজে বের করুন
আপনার কী ধরনের ডেটার প্রয়োজন তা খুঁজে বের করার বেশ কিছু পদ্ধতি রয়েছে। সবচেয়ে সহজ পদ্ধতিটি হলো অনলাইনে তথ্য খোঁজা। এই ক্ষেত্রে, দলটি স্বাভাবিকভাবে অনলাইন অনুসন্ধান পদ্ধতি ব্যবহার করে। তাঁরা ফাইলের ধরন (পিডিএফ), “এসওয়াতিনি” এবং “কোর্ট” শব্দগুলো ব্যবহার করে।
সিডেরিস বলেন, “আমরা সৌভাগ্যবান ছিলাম কারণ আমরা এসওয়াতিনি সুপ্রিম কোর্টের একটি পাবলিক ডেটাবেস হাতে পেয়েছিলাম।” সবসময় এমনটা নাও ঘটতে পারে। ডেটা উৎসগুলো খুঁজে পাওয়ার অন্যান্য উপায় হতে পারে—পাবলিক ডেটা সংগ্রহের জন্য ওয়েব স্ক্র্যাপিং, তথ্যের জন্য অর্থ পরিশোধ করে ডেটাতে (ক্লোজ ডেটার ক্ষেত্রে) প্রবেশ করা, তথ্য সংগ্রহ করে নিজেই একটি ডেটাসেট তৈরি করা, ফোয়া অনুরোধ, কিংবা শুধু বিশেষজ্ঞদের সঙ্গে কথা বলে তথ্য চাওয়া।

গুগলে তথ্য খোঁজার জন্য ফাইলটাইপ: পিডিএফ (filetype:pdf), এসওয়াতিনি এবং কোর্ট শব্দগুলো ব্যবহার করা হয়েছে। ছবি: স্ক্রিনশট, সিসিআইজের সৌজন্যে
৫. ডেটা বিশ্লেষণ, বিন্যাস ও সংক্ষিপ্তকরণ
লাখ লাখ এন্ট্রিসহ একটি পাবলিক ডেটাবেস হাতে পাওয়ার পর, তা থেকে সবচেয়ে উপযোগী তথ্য বাছাই করার জন্য সাংবাদিকদের দরকার ছিল একটি ডেটা বিশ্লেষণ পদ্ধতি খুঁজে বের করা। তাঁরা ওয়েব স্ক্র্যাপিংয়ের মাধ্যমে ডেটাতে ঢোকেন এবং “ধর্ষণ” বা “যৌন আক্রমণ” এর মতো কিওয়ার্ড ব্যবহার করে ডেটাটি ফিল্টার করার সিদ্ধান্ত নেন। তবে হাতেকলমে এ ধরনের বাছাই প্রক্রিয়া এড়িয়ে চলার পরামর্শ দেন সিডেরিস। তিনি বলেন, “কারণ আমরা পরে জেনেছিলাম যে এতে এপিআই (অ্যাপ্লিকেশন প্রোগ্রাম ইন্টারফেস: তথ্য ও ফিচার বিনিময় করা যায়) ছিল, যা আমরা কাজে লাগাতে পারতাম।”
তাই, এমন কোনো প্রোগ্রাম বা কৃত্রিম বুদ্ধিমত্তা টুল খুঁজুন, যা ডেটা স্ক্র্যাপ করতে সাহায্য করতে পারে। স্ক্র্যাপ করার পর, দলটি একটি স্প্রেডশীট তৈরি করে, যেখানে কিছু প্রাসঙ্গিক তথ্য যেমন মামলার তারিখ যোগ করা হয়। যেসব ফাইল অ্যাক্সেস করা সম্ভব ছিল না, সেগুলোর জন্য দলটি অ্যামাজন টেক্স্যাক্ট (Amazon Textract) ব্যবহার করে, যেন তাদের ডেটাসেটের সঙ্গে লেখাও যোগ করা যায়।

ডেটা স্ক্র্যাপিং, ছবি: স্ক্রিনশট, সিসিআইজের সৌজন্যে
৬. ডেটা মূল্যায়ন করুন
হাজারো ডেটার ভিড়ে না হারিয়ে আপনাকে বরং গুরুত্বপূর্ণ ডেটাগুলোকে মূল্যায়ন করতে হবে। আপনাকে আবারো শুরুর ধারণাটিতে ফিরে যেতে হবে এবং নিজেকে মনে করিয়ে দিতে হবে যে আপনি ঠিক কী প্রমাণ করতে চান। আপনার ধারণাটি কী, এবং ডেটাগুলো কীভাবে এই প্রশ্নগুলোর উত্তর দিয়ে তা প্রমাণে সাহায্য করতে পারে?
সিডেরিস বলেন, “যে ডেটাগুলো আপনার কাজে লাগবে তা শনাক্ত করুন। ডেটাগুলো যেন সামঞ্জস্যপূর্ণ হয় সেজন্য একটি পদ্ধতি ধরে অগ্রসর হন।” আমাদের দলটি ডেটার সঙ্গে লেখা যোগ করে কাজটি করেছে, যেমন—মামলাটি রায়ের পর্যায়ে আছে কিনা। থম্পসন যোগ করেন, “উত্তর খোঁজার লক্ষ্য নিয়ে স্পষ্ট ডেটা তৈরি করাই আদর্শ উপায়, এরপর ফলাফলগুলো একত্রিত করে ব্যাখ্যা সংযুক্ত করা।” আপনি যদি সহজ ডেটা নিয়ে কাজ করেন, তাহলে এটা কিন্তু স্প্রেডশিটে স্বয়ংক্রিয়ভাবে করা যায় (যেমন তারিখ ফরম্যাট ব্যবহার করে)। যদি তথ্যগুলো বিশ্লেষণমূলক হয়, তাহলে হাতে-কলমে বা ম্যানুয়ালি করতে হবে। আর যদি তথ্য আধা-বিশ্লেষণমূলক হয়, তাহলে কৃত্রিম বুদ্ধিমত্তা ব্যবহার করা যেতে পারে, এগুলো অনেক দ্রুত কাজ করে।
৭. একটি পদ্ধতি তৈরি করুন
চ্যাটজিপিটি-৪ ব্যবহার করে ডেটাগুলো ব্যাখ্যার সিদ্ধান্ত নেয় দলটি। কাজটি করতে, তাদের একটি বিস্তারিত প্রম্পট লিখতে হয়েছিল। এআইকে ঠিক কী করতে হবে, প্রম্পটের মাধ্যমে স্পষ্টভাবে নির্দেশনা দেয়া হয়।
সিডেরিস ব্যাখ্যা করেন, “একটি পদ্ধতি তিনভাবে সহায়তা করে। প্রথমত, এটি নিশ্চিত করে যে সবাই একই নিয়মে ডেটা ইনপুট করছে। দ্বিতীয়ত, এ তথ্যগুলো প্রকাশ করা যায়। এর মাধ্যমে অন্যরা আপনার কাজের পদ্ধতি ও সিদ্ধান্তগুলো পর্যালোচনা করতে পারেন। তৃতীয়ত, এটি এইআই টুলে ব্যবহার করা যায়, যা দিয়ে এটি বুঝতে পারে যে আপনি কী চান।”
তবে তিনি জোর দিয়ে বলেন, চিন্তার কাজটি সাংবাদিকেরই করা উচিত। “এআই ও অটোমেশনকে গবেষণা বা ফিল্টার করার টুল হিসেবে ব্যবহার করুন, তথ্যগুলো ব্যাখ্যার জন্য নয়।”
৮. প্রতিবেদন লেখার সময়—এবং প্রকাশনার আগে—আপনার পদ্ধতিটি বিশেষজ্ঞদের দিয়ে যাচাই করুন
মনে রাখবেন, আমরা সাংবাদিক, ডেটা বিজ্ঞানী নই। আপনি যে পদ্ধতি ব্যবহার করে কাজ করেছেন সবসময় তা কমপক্ষে দুইজন বিশেষজ্ঞকে দিয়ে যাচাই করুন। থম্পসন বলেন, এই বিশেষজ্ঞরা গুরুত্বপূর্ণ কিছু বিষয় সম্পর্কে জানবেন, যা আপনার চোখ এড়িয়ে যেতে পারে। যেমন, একই বিষয়ের ওপর অনুরূপ কোনো গবেষণা এরইমধ্যে হয়েছে কিনা তা তাঁরা জানবেন এবং প্যাটার্নগুলো চিহ্নিত করতে পারবেন। সবচেয়ে গুরুত্বপূর্ণ হচ্ছে, আপনি কোনো ডেটা অতিরিক্ত সরলীকরণ করছেন নাকি ভুল ব্যাখ্যা করছেন, এটিও তাঁরা ধরিয়ে দিতে পারবেন।
৯. হাতে-কলমে ডেটা যাচাই করুন
“যদি অটোমেশন বা এআই ব্যবহার করেন, তবে হাতে-কলমে যাচাই না করে কখনোই ফলাফল প্রকাশ করবেন না,” সতর্ক করেন থম্পসন। সাংবাদিকদের কখনোই কৃত্রিম বুদ্ধমত্তার ওপর পুরোপুরি ভরসা করা উচিত নয়; তাছাড়া সবসময় ভুল বা বাদ পড়া তথ্য খুঁজে বের করে নিশ্চিত হওয়া জরুরি। থম্পসন বলেন, “যদি এআই টুল ব্যবহার করেন, তবে এটি কোথা থেকে তথ্য সংগ্রহ করেছে সে প্রমাণ দিতে বলুন, এতে ফ্যাক্ট-চেকিং সহজ হয়। অনেক সময় ম্যানুয়ালি ফ্যাক্ট চেকিং করাটাই সবচেয়ে ভালো উপায়।”কেননা তাদের অনুসন্ধানে দেখা গেছে যে, চ্যাটজিপিটি-৪ সংস্করণে কিছু গুরুত্বপূর্ণ তথ্য ভুল করেছে। যদিও এতে চূড়ান্ত ফলাফল পরিবর্তন হয়নি, কিন্তু এআইয়ের ভুলগুলো সনাক্ত করাতে প্রতিবেদনটি আরও শক্তিশালী হয়েছে।
সিডেরিস যোগ করেন, “চ্যাট-জিপিটি ৪ কেবল একটি টুল। এটি ভুল তথ্য তৈরি করতে পারে, কিছু বিষয় বাদ দিতে পারে, কিংবা প্রসঙ্গ বুঝতে ব্যর্থ হতে পারে।”

চ্যাটজিপিটি ৪ দু’দফা যাচাই করা হলো, ছবি : স্ক্রিনশট, সৌজন্যে সিসিআইজে

ডেটাগুলো হাতে-কলমে (ম্যানুয়ালি) যাচাই করুন। ছবি: স্ক্রিনশট, সিসিআইজে
১০. গল্পটি শনাক্ত করুন
ডেটা বিশ্লেষণ ও ভুল সংশোধনের পর, এবার দেখার পালা—আপনার ডেটাতে আরো কোনো গল্পের সূত্র আছে কিনা। তবে থম্পসন সতর্ক করে বলেছেন যে, ডেটাগুলো ব্যাখ্যা করার সময় আপনি কোনো কিছু দিয়ে প্রভাবিত হচ্ছেন কিনা বা পক্ষপাত গ্রহণ করছেন কিনা তা যাচাই করাটাও গুরুত্বপূর্ণ। “অনেক সময়, পুরো ডেটাগুলো বিশ্লেষণের পর একটি ঘটনার ভিত্তিতে করা অনুমান সঠিক নাও হতে পারে।” ডেটাগুলো বুঝতে ট্যাগ ব্যবহার করে ফিল্টার করা যেতে পারে। পাশাপাশি, ডেটার বর্ণনাগুলো আরও ভালোভাবে বুঝতে ও অনুপস্থিত বিষয়গুলো খুঁজে পেতে কোনো বিশেষজ্ঞের সাহায্য নেওয়াটাও ভালো বিকল্প।
এই অনুসন্ধানে, সিসিআইজের দলটি প্রমাণ করতে পেরেছে যে এসওয়াতিনির আদালতগুলো যৌন সহিংসতার শিকার হওয়া ব্যক্তিদের জন্য ন্যায়বিচার নিশ্চিত করতে ব্যর্থ হচ্ছে। সাংবাদিকরা একই পদ্ধতি ব্যবহার করে উগান্ডা, জিম্বাবুয়ে এবং ইথিওপিয়ার ঘটনাগুলো নিয়েও প্রতিবেদন তৈরি করেছেন। সেখানে তাঁরা ড্রেডলককারীদের (ড্রেডলক: চুলের এক ধরনের স্টাইল) প্রতি বৈষম্য, বাল্যবিবাহ ও ধর্মীয় বিশ্বাসের সম্পর্ক এবং সামরিক বাহিনীর সহযোগিতার মাধ্যমে সংঘটিত সংঘাতমূলক ধর্ষণের ঘটনাগুলো অনুসন্ধান করেছেন।
শেষ পরামর্শ হিসাবে সিডেরিস তাঁর সহকর্মী সাংবাদিকদের বলেন, “স্বচ্ছতার জন্য আপনার কাজের পদ্ধতি এবং প্রাপ্ত ফলাফলগুলো প্রকাশ করুন।” এর মাধ্যমে অন্যরা পরবর্তী গবেষণার জন্য আপনার ডেটাসেটটি ব্যবহার করতে পারবে এবং আপনার অনুসন্ধানী কৌশল থেকে ক্রস-চেক এবং শিক্ষা নিতে পারবে।
সম্পাদকের নোট: আপনি এখানে সম্পূর্ণ ডেটাসেটটি পাবেন। এছাড়া অন্যান্য কয়েকটি আফ্রিকান দেশের আদালতের ডিজিটাল রেকর্ড পাওয়া যাবে এখানে।
সারা উলরিখ জিআইজেএনের জার্মান ভাষার সম্পাদক। নেটওয়ার্ক রিসার্চের সহযোগিতায় তিনি জিআইজেএন ডয়েচ পরিচালনা করেন। তিনি একজন অনুসন্ধানী সাংবাদিক হিসেবেও কাজ করেন। তাঁর কাজের মূল বিষয় হলো ক্ষমতার অপব্যবহার, (শ্রম) শোষণ, এবং ডানপন্থী ও লিঙ্গভিত্তিক সহিংসতা।