অলংকরণ: লুইজা কারাগেওর্গিউ, জিআইজেএন-এর জন্য
সম্পাদকের নোট: এই গাইডটি পুলিৎজার সেন্টারের এআই অ্যাকাউন্টেবিলিটি টিম এবং জিআইজেএনের যৌথ সহযোগিতার ভিত্তিতে তৈরি। ক্যারেন হাও, লাইস মার্টিন্স এবং পাবলো হিমেনেজ আরান্দিয়া গাইডটির বিভিন্ন অংশ তৈরিতে যৌথভাবে কাজ করেছেন।
বিশ্বজুড়ে সমাজের বিভিন্ন ক্ষেত্রে কৃত্রিম বুদ্ধিমত্তা (এআই) গুরুত্বপূর্ণ চালিকাশক্তিতে পরিণত হয়েছে। অনেক দেশের অর্থনীতিতে বড় ধরনের ভূমিকা পালন করছে এবং বিশ্বব্যাপী তথ্য-প্রযুক্তিনির্ভর বা মেধাভিত্তিক কর্মীদের (নলেজ ওয়ার্কার্স) ওপর এর গভীর প্রভাব বিদ্যমান। এই ক্ষেত্রের সবচেয়ে শক্তিশালী খেলোয়াড় বা পক্ষগুলো মূলত মার্কিন যুক্তরাষ্ট্র, ইউরোপ অথবা চীনভিত্তিক কয়েকটি প্রতিষ্ঠান। এর মধ্যে অনেকগুলোই বেসরকারি বড় প্রযুক্তি কোম্পানি। যাদের পেছনে রয়েছে বিলিয়ন ডলারের বিনিয়োগ। এসব কোম্পানিই নির্ধারণ করছে, ভবিষ্যতে এই প্রযুক্তি কীভাবে তৈরি ও ব্যবহার করা হবে।
তবে সাপ্লাই চেইন থেকে শুরু করে প্রয়োগ করা পর্যন্ত—সবখানেই অসংখ্য বিতর্কেরও জন্ম দিয়েছে কৃত্রিম বুদ্ধিমত্তা। এটি উন্নয়নের জন্য তৈরি প্রয়োজনীয় ডেটা সেন্টারগুলো অতিরিক্ত মাত্রায় পানি এবং বিদ্যুৎ খরচ করছে। আর এআইয়ের জন্য প্রয়োজনীয় ডেটা লেবেলিংয়ের কাজে নিয়োজিত শ্রমিকরা লড়াই করছেন কম মজুরি ও মানসিক স্বাস্থ্য সমস্যার সঙ্গে। এদিকে এআই প্রযুক্তিগুলো ব্যবহারের সময় পক্ষপাতদুষ্ট আচরণ করছে, এবং অনেক ক্ষেত্রে তৈরি করছে ভুল বা ভ্রান্ত তথ্য।
সবমিলিয়ে অনুসন্ধানী সাংবাদিকদের জন্য এআইয়ের ক্ষেত্রটি খবরের এক বিশাল ভান্ডার। এই প্রযুক্তির পেছনের খুঁটিনাটি দিকগুলো বুঝতে এবং এটি কীভাবে বা কোন কাঠামোর মাধ্যমে পরীক্ষা-নিরীক্ষা করা যায়, সাংবাদিকদের সেই ধারণা দিতেই এই গাইডটি তৈরি করা হয়েছে।
এআই কী?
অনেক মানুষ প্রথমবার কৃত্রিম বুদ্ধিমত্তার ধারণার সঙ্গে পরিচিত হন চ্যাটজিপিটির মাধ্যমে। তাই অনেকেই চ্যাটজিপিটিকেই এআই হিসেবে মনে করেন এবং এআই বলতে শুধু চ্যাটজিপিটিকেই বোঝেন।
কিন্তু বাস্তবতা এর চেয়ে অনেক বেশি জটিল। কৃত্রিম বুদ্ধিমত্তা বলতে বোঝায় এমন একটি ব্যবস্থা, যেখানে যন্ত্র ব্যবহার করে মানুষের সিদ্ধান্ত গ্রহণের প্রক্রিয়াগুলো অনুকরণ করা হয়। একে নির্দিষ্ট একটি প্রযুক্তির বদলে বরং বহু প্রযুক্তির সংমিশ্রণে তৈরি একটি “গ্র্যাব ব্যাগ” হিসেবে বিবেচনা করাটাই সবচেয়ে ভালো।
বিজ্ঞানী ও গবেষকেরা ১৯৫০-এর দশকে এই শব্দটি প্রবর্তন করেন। তখন থেকেই প্রযুক্তির মাধ্যমে মানুষের বুদ্ধিমত্তাকে পুনরায় সৃষ্টির ভিন্ন ভিন্ন উপায় খুঁজে চলেছেন।
বর্তমানে অনেক বেশি জনপ্রিয় ও ব্যবহৃত এআই পদ্ধতিগুলোর একটি হলো মেশিন লার্নিং এবং এর বিভিন্ন ধরন। যার মধ্যে রয়েছে এর উপশাখা (সাবসেট) ডিপ লার্নিং এবং জেনারেটিভ এআই।
মেশিন লার্নিং হচ্ছে এমন একটি প্রক্রিয়া, যেখানে ডেটা বিশ্লেষণ করে প্যাটার্ন খুঁজে বের করা হয়। যেন সেই তথ্যের ওপর ভিত্তি করে কাজ বা সিদ্ধান্ত নেওয়া সম্ভব হয়। এই ধরনের বিশ্লেষণের জন্য ব্যবহার করা হয় বিভিন্ন গাণিতিক পদ্ধতি—যেমন, সহজ পরিসংখ্যান থেকে শুরু করে জটিল নিউরাল নেটওয়ার্ক। কিন্তু কখন কোন পদ্ধতি ব্যবহার করা হবে তা অনেক সময় নির্ভর করে প্রক্রিয়াজাত বা সংগ্রহ করা ডেটার পরিমাণের ওপর। আর এই প্রশিক্ষণের ফলাফল হিসেবে একটি কম্পিউটার প্রোগ্রাম বা এআই মডেল তৈরি হয়, যা নতুন ডেটা সংগ্রহের মাধ্যমে প্রশ্নের উত্তর দিতে পারে অথবা পুরোনো ডেটার ভিত্তিতে নতুন তথ্য তৈরি করতে পারে। অনেকভাবেই আপনি মেশিন লার্নিংয়ের মাধ্যমে পাওয়া ফলাফলকে (আউটপুট) পুরোনো ডেটার একটি সংমিশ্রণ হিসেবে ভাবতে পারেন। সরকারি সংস্থাগুলো সাধারণ মেশিন লার্নিং মডেল ব্যবহার করতে পারে। যেখানে কল্যাণমূলক তহবিল বা আবাসন ভাতার বিপরীতে আবেদনকারীদের ঝুঁকির মাত্রা নির্ধারণ করা হয়।
ডিপ লার্নিং হলো মেশিন লার্নিংয়ের একটি শাখা, যেখানে বিপুল পরিমাণ ডেটা—অনেক ক্ষেত্রে লাখ বা কোটি সংখ্যক তথ্য—ব্যবহার করা হয়। ডেটা বিশ্লেষণ ও তা থেকে অর্থবহ তথ্য বের করতে এতে নিউরাল নেটওয়ার্কের মতো জটিল বিশ্লেষণ পদ্ধতি ব্যবহার করা হয়। নিউরাল নেটওয়ার্ক হলো এমন একটি গাণিতিক পদ্ধতি, যা মানুষের মস্তিষ্কের গঠন থেকে অনুপ্রাণিত এবং পরস্পর-সংযুক্ত বিভিন্ন নোডের মাধ্যমে কাজ করে। (নিউরাল নেটওয়ার্ক সম্পর্কে আরও জানতে এখানে দেখুন।) এই ধরনের মেশিন লার্নিং প্রায়ই বড় প্রযুক্তি কোম্পানিগুলো ব্যবহার করে। যেমন, সার্চ ইঞ্জিনে ব্যবহারকারী অনুসন্ধান করবে এমন সম্ভাব্য শব্দ অনুমান করা বা স্ট্রিমিং সেবাগুলোতে ব্যক্তিভেদে কনটেন্টের সুপারিশ তৈরির কাজে এটি ব্যবহৃত হয়।
এরপর আসে জেনারেটিভ এআই, যা মেশিন লার্নিংয়ের একটি উপশাখা। এর জন্য আরও বেশি ডেটা প্রয়োজন হয় এবং মডেল তৈরির প্রশিক্ষণ পর্যায়ে আরও বেশি শক্তি ও জটিল গাণিতিক পদ্ধতি ব্যবহার করা হয়। জেনারেটিভ এআই অন্যান্য অনেক মেশিন লার্নিং পদ্ধতি থেকে আলাদা। কারণ এটি কেবল সুপারিশ বা পূর্বাভাস প্রদান না; বরং নতুন লেখা, ছবি বা অন্যান্য ধরনের কনটেন্টও তৈরি করতে পারে। বর্তমানে আমরা লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম)-ভিত্তিক চ্যাটবট, যেমন চ্যাটজিপিটি বা জেমিনির মাধ্যমে এই প্রযুক্তির সঙ্গে পরিচিত হচ্ছি। আবার মিডজার্নির মতো অ্যাপেও এর ব্যবহার দেখা যায়। যেখানে লিখিত নির্দেশনা বা প্রম্পট থেকে ছবি তৈরি করা যায়।
নিচের ছবিতে মেশিন লার্নিংয়ের বিভিন্ন ধরন তুলে ধরা হয়েছে।

কৃত্রিম বুদ্ধিমত্তা এবং এর বিভিন্ন উপশাখা—যেমন মেশিন লার্নিং, ডিপ লার্নিং ও জেনারেটিভ এআই—এর চিত্রভিত্তিক উপস্থাপন। ছবি: পুলিৎজার সেন্টারের সৌজন্যে।
মেশিন লার্নিং কীভাবে কাজ করে সে সম্পর্কে বিস্তারিত ধারণা থাকলে সাংবাদিকদের জন্য এ বিষয়ে কথা বলা সহজ হয়। প্রযুক্তিটি নিয়ে তথ্যভিত্তিক প্রশ্ন করতে সুবিধা হয় এবং এআই উন্নয়নের বিভিন্ন ধাপকে প্রতিবেদনের কাজে আরও কার্যকরভাবে ব্যবহারের সুযোগ তৈরি হয়।
এআইয়ের জবাবদিহিতা বিষয়ক প্রতিবেদনের রূপরেখা
ক্যারেন হাওয়ের সঙ্গে আমরা প্রথম যখন এআই স্পটলাইট সিরিজ তৈরির কাজ শুরু করি, তখন আমাদের মনে বারবার একটি সহজ প্রশ্ন ঘুরপাক খাচ্ছিল। আর তা হচ্ছে, আমরা যখন প্রথম এআই নিয়ে কাজ বা রিপোর্টিং শুরু করেছিলাম, তখন কোন বিষয়টি জানতে পারলে সবচেয়ে ভালো হতো? উত্তরটি ছিল—এআই নিয়ে কী ধরনের প্রতিবেদন হতে পারে, তা কীভাবে খুঁজে বের করতে হয় এবং সেগুলোকে কীভাবে উপস্থাপন করতে হয়, তার একটি সুনির্দিষ্ট রূপরেখা বা ফ্রেমওয়ার্ক।
এআই প্রযুক্তির পরিধি ব্যাপক। আর এর সঙ্গে জড়িয়ে আছে বহুবিধ সমস্যা। তাই কোথা থেকে শুরু করতে হবে তা বোঝা অনেক সময় কঠিন হয়ে পড়ে। আমাদের এই রূপরেখাটি আধুনিক এআই উন্নয়নের ৪টি প্রধান ধাপকে কেন্দ্র করে তৈরি। এর মূল ভিত্তি হলো ইনপুট— অর্থাৎ ডেটা ও প্রযুক্তিগত অবকাঠামো (কম্পিউটিং শক্তি), যা আধুনিক এআই প্রযুক্তির ভিত্তি হিসেবে কাজ করে। এরপর আসে মডেল তৈরি ও প্রশিক্ষণের ধাপ, যা ডেটা এবং নকশাগত সিদ্ধান্ত দ্বারা গঠিত হয়। সর্বশেষ ধাপে এই মডেলগুলো বাস্তব জীবনে প্রয়োগ করা হয়। এই প্রতিটি ধাপের সঙ্গে আলাদা ধরনের সমস্যা, সংশ্লিষ্ট পক্ষ এবং প্রভাবিত ব্যক্তি বা কাঠামো জড়িত থাকে।
আমরা এখন এই প্রতিটি ধাপ, গুরুত্বপূর্ণ ধারণা ও প্রতিবেদনের সাধারণ ধরনগুলো নিয়ে আলোচনা করব।

স্ক্রিনশট: এআই নিয়ে জবাবদিহিমূলক প্রতিবেদন তৈরির কাঠামোর চিত্রভিত্তিক উপস্থাপন। ছবি: পুলিৎজার সেন্টারের সৌজন্যে।
এআই প্রশিক্ষণে কী ধরনের ডেটা ব্যবহৃত হয়েছে তা অনুসন্ধান
সবচেয়ে সাধারণ এআই মডেলগুলো প্রশিক্ষণের জন্য কয়েকশ ডেটা পয়েন্টের ডেটাসেট ব্যবহার করতে পারে। অন্যদিকে, লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম)-এর মতো জটিল মডেলগুলোকে প্রায়ই ইন্টারনেটের বিপুল পরিমাণ তথ্য দিয়ে প্রশিক্ষণ দেওয়া হয়। প্রশিক্ষণ ডেটার ধরনও হতে পারে অত্যন্ত বৈচিত্র্যময়। এটি হতে পারে সারি ও কলামে সুশৃঙ্খলভাবে সাজানো কাঠামোবদ্ধ সারণিভিত্তিক ডেটা, আবার সামাজিক যোগাযোগমাধ্যম, সংবাদ সাইট ও অনলাইন ফোরাম থেকে সংগ্রহ করা অগোছালো বা অসংগঠিত লেখাও হতে পারে। ক্রমেই এর সঙ্গে ছবি ও ভিডিও যুক্ত হচ্ছে।
সাংবাদিকেরা যখন এআইয়ের ডেটা সংগ্রহ ও প্রস্তুতির ধাপ নিয়ে প্রতিবেদন করেন, তখন তারা সাধারণত এমন এআই সিস্টেম নিয়ে কাজ করেন, যেগুলো প্রশিক্ষণের জন্য বিপুল পরিমাণ ডেটা ব্যবহার করে। এসব প্রতিবেদনের একটি বড় অংশ গোপনীয়তা ও মেধাস্বত্ব-সংক্রান্ত বিষয়গুলোকে ঘিরে তৈরি হয়। বিশেষ করে, কপিরাইট-সুরক্ষিত উপকরণ বা ব্যক্তিগত তথ্য কীভাবে এআই মডেলের প্রশিক্ষণ প্রক্রিয়ায় ব্যবহৃত হচ্ছে, তা নিয়ে অনুসন্ধান। উদাহরণ হিসেবে, দ্য আটলান্টিকের একটি প্রতিবেদনে অভিযোগ করা হয়েছে যে, মেটা তাদের জেনারেটিভ এআই মডেল ‘লামা’ প্রশিক্ষণের জন্য হাজার হাজার পাইরেটেড বই ব্যবহার করেছে। তবে কোম্পানিটির বিরুদ্ধে চলমান মামলার কথা উল্লেখ করে মেটার একজন মুখপাত্র এ বিষয়ে দ্য আটলান্টিক-এর সাংবাদিকদের কাছে মন্তব্য করতে অস্বীকৃতি জানান।
অন্যদিকে, দ্য নিউইয়র্ক টাইমসের একটি প্রতিবেদনে দেখা গেছে, গাড়ি বীমা কোম্পানিগুলো চালকদের ঝুঁকি মূল্যায়নের জন্য এমন কিছু সাধারণ অ্যাপ থেকে ব্যক্তিগত ড্রাইভিং-সংক্রান্ত তথ্য কিনছে, যেগুলো ব্যবহারকারীরা সাধারণত নিরীহ বলে মনে করেন।
তবে ডেটা নিয়ে অনুসন্ধান করার অর্থ শুধু তথ্যের উৎস বা ব্যবহার খতিয়ে দেখা নয়; ডেটাসেট প্রস্তুতের পেছনে থাকা মানুষদের কাজও বোঝা জরুরি। কারণ তাদের কাজের মাধ্যমেই ডেটাসেটগুলো এআই প্রশিক্ষণের জন্য প্রস্তুত করা হয়। কোম্পানিগুলো সাধারণত ডেটা সংগ্রহ ও মডেল প্রশিক্ষণকে প্রায় পুরোপুরি স্বয়ংক্রিয় একটি প্রক্রিয়া হিসেবে তুলে ধরে। কিন্তু বাস্তবে বিপুল সংখ্যক কর্মী এসব প্রশিক্ষণ ডেটাসেটগুলো যাচাই, বাছাই ও শ্রেণিবদ্ধ করার কাজ করেন। এদের বেশিরভাগই বৈশ্বিক দক্ষিণের দেশগুলোতে কাজ করেন এবং আউটসোর্সিং প্রতিষ্ঠান বা ডিজিটাল শ্রম প্ল্যাটফর্মের মাধ্যমে নিয়োজিত থাকেন। এই কর্মীরা ছবি দেখে কোনটি বিড়াল আর কোনটি কুকুর তা চিহ্নিত করেন, স্বয়ংচালিত গাড়ির প্রশিক্ষণের জন্য ব্যবহৃত ড্যাশক্যাম ভিডিওতে বিভিন্ন বস্তুর চারপাশে চিহ্ন আঁকেন, কিংবা ঘৃণামূলক বক্তব্য ও সহিংস কনটেন্ট শনাক্ত করেন, যাতে লার্জ ল্যাঙ্গুয়েজ মডেল (এলএলএম) সেগুলো পুনরাবৃত্তি না করে।
বিশ্বের বিভিন্ন দেশ থেকে প্রকাশিত অনুসন্ধানী প্রতিবেদনে দেখা গেছে, ডেটা লেবেলিংয়ের কাজে নিয়োজিত শ্রমিকেরা প্রায়ই শোষণের শিকার হন, কম মজুরি পান এবং অনেক ক্ষেত্রে মানসিকভাবে পীড়দায়ক কনটেন্ট নিয়ে কাজ করতে বাধ্য হন। ব্যুরো অব ইনভেস্টিগেটিভ জার্নালিজমের একটি অনুসন্ধানে দেখা যায়, বিশ্বের বিভিন্ন প্রান্তের স্বল্প পারিশ্রমিক পাওয়া গিগ কর্মীরা অজান্তেই এমন চেহারা শনাক্তকরণ প্রযুক্তি প্রশিক্ষণে সহায়তা করছেন, যা রাশিয়া সরকার ব্যবহার করে। অন্যদিকে, আফ্রিকা আনসেন্সরড-এর একটি প্রতিবেদনে ক্রমবর্ধমান ‘এআই টিউটর’ শিল্পের চিত্র তুলে ধরা হয়েছে। এই খাতে উচ্চশিক্ষিত কর্মীরা লার্জ ল্যাঙ্গুয়েজ মডেলভিত্তিক চ্যাটবটগুলোকে আরও মানসম্মত ও নির্ভুল উত্তর দিতে প্রশিক্ষণ দেন।
কম্পিউটিং সক্ষমতার অনুসন্ধান
প্রশিক্ষণের জন্য ডেটাসেট সংগ্রহ ও প্রস্তুত করার পর কোম্পানিগুলো সেগুলো ব্যবহার করে এআই মডেলকে প্রশিক্ষণ দেয়। সাধারণ এআই মডেলগুলো সাধারণ এআই মডেলগুলো একটি সাধারণ ল্যাপটপেই খুব দ্রুত প্রশিক্ষণ দেওয়া সম্ভব। কিন্তু চ্যাটজিপিটির মতো জটিল মডেলগুলোকে প্রশিক্ষণ দিতে বিপুল পরিমাণ কম্পিউটিং সক্ষমতা প্রয়োজন হয়। এই কম্পিউটিং সক্ষমতাকে সাধারণত “কম্পিউট” বলা হয়। যা সাধারণত বিশেষায়িত কম্পিউটার চিপের মাধ্যমে সরবরাহ করা হয়, যেগুলো বিশাল আকারের ডেটা সেন্টারে স্থাপন করা থাকে।
এআই উন্নয়নের জন্য প্রয়োজনীয় ডেটা সেন্টার ও কম্পিউটিং অবকাঠামো নিয়ে তৈরি প্রতিবেদনগুলো সাধারণত এসব ব্যবস্থার পরিবেশগত, সামাজিক ও অর্থনৈতিক প্রভাবের ওপর আলো ফেলে। আমরা ২০২৪ সালে যখন এআই স্পটলাইট সিরিজ তৈরি করি, তখন ডেটা সেন্টার নিয়ে প্রতিবেদন তুলনামূলকভাবে নতুন একটি বিষয় ছিল। এরপর থেকে লাতিন আমেরিকা, এশিয়া, আফ্রিকা এবং যুক্তরাষ্ট্রে এই বিষয়ে বিপুল পরিমাণ প্রতিবেদন প্রকাশিত হয়েছে। এসব প্রতিবেদনে উঠে এসেছে, ডেটা সেন্টারগুলো কী পরিমাণ বিদ্যুৎ ও পানি ব্যবহার করে এবং এসব তথ্য গোপন রাখতে কোম্পানি বা সরকারের কী ধরনের চেষ্টা থাকে। পুলিৎজার ফেলো লাইস মার্টিন্স যেমন ব্রাজিলে তার একটি অনুসন্ধানে তুলে ধরেছেন, টিকটকের একটি ডেটা সেন্টার এত পরিমাণ বিদ্যুৎ ব্যবহার করার পরিকল্পনা করেছিল, যা ছিল ২২ লাখ মানুষের বিদ্যুৎ চাহিদার সমান। তবে এ বিষয়ে কোম্পানিটি সাংবাদিকের প্রশ্নের কোনো জবাব দেয়নি।
ডেটা সেন্টার নিয়ে প্রতিবেদন শুধু এর পরিবেশগত প্রভাবগুলো তুলে ধরার মধ্যে সীমাবদ্ধ নয়। এসব প্রতিবেদনে আরও খতিয়ে দেখা হয়, ডেটা সেন্টার কীভাবে স্থানীয় জনগোষ্ঠী ও এলাকার ওপর প্রভাব ফেলে, অর্থনৈতিক প্রবৃদ্ধির যে প্রতিশ্রুতি দেওয়া হয় তার কতটা বাস্তবে রূপ নেয়, এবং ডেটা সেন্টার স্থাপন ও বিনিয়োগ টানতে স্থানীয় ও জাতীয় পর্যায়ে কী ধরনের তদবির চালানো হয়। ডেটা সেন্টার বিষয়ক প্রতিবেদনের জন্য সাংবাদিক লাইস আমাদের এই কাঠামোর একটি সংশোধিত সংস্করণ তৈরি করেছেন। সেটি নিচে দেওয়া হলো।

ছবি: পুলিৎজার সেন্টারের সৌজন্যে
মডেল নিয়ে অনুসন্ধান
প্রশিক্ষণ ডেটা এবং গণনাশক্তির সমন্বয়ে একটি এআই মডেল তৈরি হয়। এটি এমন একটি প্রযুক্তি, যা ডেটার ভিত্তিতে বিভিন্ন বিষয়ে অনুমান করতে, তথ্যকে বিভিন্ন শ্রেণিতে ভাগ করতে বা জেনারেটিভ এআইয়ের ক্ষেত্রে সম্পূর্ণ নতুন কনটেন্ট তৈরি করতে পারে। ডেটা ও গণনাশক্তির মতো এআই মডেলগুলোরও ধরন এবং আকারে ভিন্নতা রয়েছে। কিছু মডেল তুলনামূলকভাবে সহজ, যেমন স্বাস্থ্যবিমার প্রিমিয়াম হিসাব করতে ব্যবহৃত মেশিন লার্নিং সিস্টেম। আবার কিছু মডেল অত্যন্ত উন্নত, যেমন ডিপ লার্নিংভিত্তিক সিস্টেম, যা বাস্তবসম্মত ছবি তৈরি করতে সক্ষম।
এআই মডেলকে কেন্দ্র করে তৈরি প্রতিবেদনগুলো সাধারণত পক্ষপাত, ভুলত্রুটি কিংবা স্বয়ংক্রিয় ব্যবস্থার কারণে মানুষ, প্রতিষ্ঠান ও সমাজের ওপর কী প্রভাব পড়ছে, সেসব বিষয় নিয়ে কাজ করে।
এই ধরনের অনুসন্ধানে অনেক সময় মডেলের নকশাগত সিদ্ধান্তগুলো খতিয়ে দেখা হয়, যদি সেগুলো সম্পর্কে তথ্য পাওয়া যায়। যেমন, মডেল প্রশিক্ষণে ব্যবহৃত ডেটা বা এর বিভিন্ন কার্যকরী মানদণ্ড (প্যারামিটার) পরীক্ষা করা হতে পারে। উদাহরণ হিসেবে, এল কনফিদেনসিয়াল-এর একটি অনুসন্ধানে কাতালোনিয়ার কারাগার ব্যবস্থায় ব্যবহৃত একটি এআই ব্যবস্থার সূত্র সংগ্রহ করা হয়েছিল। কারা ভবিষ্যতে অপরাধ করতে পারে, তা অনুমান করার জন্য এই পদ্ধতিটি ব্যবহার করা হতো। সাংবাদিকদের অনুসন্ধানে উঠে আসে, বৈষম্যমূলক বা অপ্রাসঙ্গিক কিছু বিষয়কে ভিত্তি করে মডেলটি নির্দিষ্ট কিছু গোষ্ঠীকে নিয়মিতভাবে বেশি ঝুঁকিপূর্ণ হিসেবে চিহ্নিত করছিল।
যখন এই ধরনের তথ্য পাওয়া যায় না, তখন মডেলের ফলাফল বা আউটপুট বিশ্লেষণ করেও অনুসন্ধান করা সম্ভব। উদাহরণ হিসেবে, রেস্ট অব ওয়ার্ল্ড-এর একটি প্রতিবেদনে জনপ্রিয় ছবি তৈরির টুল মিডজার্নি এআইয়ের তৈরি ৩ হাজার ছবি পদ্ধতিগতভাবে বিশ্লেষণ করা হয়। এতে দেখা যায়, বিভিন্ন সংস্কৃতি সম্পর্কে প্রচলিত ও সরলীকৃত নেতিবাচক ধারণাগুলো এই সিস্টেমের তৈরি ছবিতে প্রতিফলিত হচ্ছে। সাংবাদিকদের মতে, এই বিষয়ে মন্তব্যের জন্য অনুরোধ জানানো হলে কোম্পানিটি কোনো জবাব দেয়নি। আরেকটি অনুসন্ধানে, ফিলিপাইন সেন্টার ফর ইনভেস্টিগেটিভ জার্নালিজম (পিসিআইজে) জনপ্রিয় রাইড-শেয়ারিং অ্যাপ গ্র্যাবের অ্যালগরিদমের কার্যপ্রণালি বোঝার চেষ্টা করে। এর জন্য তারা হাজার হাজার ভাড়ার কোটেশন সংগ্রহ ও বিশ্লেষণ করে। অনুসন্ধানে দেখা যায়, গ্র্যাব যাত্রীদের কাছ থেকে নিয়মিতভাবে অতিরিক্ত ভাড়া আদায় করছে। যদিও এই অতিরিক্ত ভাড়া সাধারণত শুধু তীব্র যানজট বা চাহিদা বেড়ে গেলে প্রযোজ্য হওয়ার কথা। পিসিআইজেকে দেওয়া লিখিত জবাবে গ্র্যাবের ফিলিপাইন শাখা জানায়, তারা শুনানিতে অংশগ্রহণের মাধ্যমে [ল্যান্ড ট্রান্সপোর্টেশন ফ্র্যাঞ্চাইজিং অ্যান্ড রেগুলেটরি বোর্ডের] তদন্তে “পূর্ণ সহযোগিতা” করেছে।
বাস্তব জীবনে এআইয়ের ব্যবহার নিয়ে অনুসন্ধান
সবশেষে, বাস্তব জীবনে কৃত্রিম বুদ্ধিমত্তা কীভাবে ব্যবহার করা হচ্ছে, তা খতিয়ে দেখাও সাংবাদিকদের জন্য গুরুত্বপূর্ণ। কারণ এআই প্রযুক্তি প্রত্যাশা অনুযায়ী কাজ না করলে বা এতে কোনো ত্রুটি দেখা দিলে, অ্যালগরিদম বা জেনারেটিভ এআই অ্যাপের মতো স্বয়ংক্রিয় ব্যবস্থার সিদ্ধান্তের ওপর নির্ভরশীল মানুষ ক্ষতির শিকার হতে পারেন।
যেমন, দ্য গার্ডিয়ান-এ প্রকাশিত এক প্রতিবেদনে সাংবাদিক জোহানা ভুইয়ান দেখিয়েছেন, এআইভিত্তিক অনুবাদ অ্যাপের ওপর যুক্তরাষ্ট্র সরকারের অতিরিক্ত নির্ভরতা কীভাবে একজন আশ্রয়প্রার্থীকে ছয় মাস ধরে আইসিইর (ইমিগ্রেশন অ্যান্ড কাস্টমস এনফোর্সমেন্ট) একটি আটককেন্দ্রে আটকে রেখেছিল। অ্যাপটি অনেক কম-প্রচলিত ভাষায় ভালোভাবে কাজ করত না। ফলে অ্যাপটি তার কথার ভুল অনুবাদ করছিল। ফলে তিনি কারও সঙ্গে কার্যকরভাবে যোগাযোগ করতে পারছিলেন না। এই বিষয়ে দ্য গার্ডিয়ান-এর সাংবাদিকের প্রশ্নের কোনো জবাব দেয়নি যুক্তরাষ্ট্রের ডিপার্টমেন্ট অব হোমল্যান্ড সিকিউরিটি (ডিএইচএস)।
হেরা রিজওয়ানের এক প্রতিবেদনে ভারত সরকারের চেহারা শনাক্তকরণ প্রযুক্তি ব্যবহারের দিকগুলো তুলে ধরা হয়। অনুসন্ধানে দেখা যায়, জরুরি খাদ্য সহায়তা বিতরণের জন্য সরকারি কর্মীরা যে অ্যাপ ব্যবহার করতেন, সেটি কিছু গর্ভবতী নারী ও স্তন্যদানকারী মাকে শনাক্ত করতে ব্যর্থ হচ্ছিল। কারণ তাদের বর্তমান চেহারার সঙ্গে সরকারি ডেটাবেসে সংরক্ষিত কয়েক বছর আগের ছবির যথেষ্ট মিল ছিল না। রিজওয়ানের প্রশ্নের জবাবে ভারতের নারী ও শিশু উন্নয়ন মন্ত্রণালয় কোনো মন্তব্য করেনি।
এআই নিয়ে জবাবদিহিমূলক প্রতিবেদন করা সবার পক্ষেই সম্ভব
উপরের উদাহরণগুলো দেখায় যে, আমাদের এই জবাবদিহিমূলক প্রতিবেদন কাঠামো সাংবাদিকদের বিভিন্ন মাত্রার কারিগরি দক্ষতা ও সম্পদ ব্যবহার করে এআই নিয়ে প্রতিবেদন করতে সহায়তা করতে পারে। এসব প্রতিবেদন ছোট বা বড়—দুই ধরনেরই হতে পারে। আবার কিছু প্রতিবেদন মানুষের অভিজ্ঞতাকে বেশি গুরুত্ব দিতে পারে, আর কিছু হতে পারে প্রযুক্তিগত বিশ্লেষণনির্ভর।
আমরা আশা করি, এই পদ্ধতি ও উদাহরণগুলো অন্য সাংবাদিকদেরও নিজেদের প্রেক্ষাপটে এআই নিয়ে জবাবদিহিমূলক প্রতিবেদন করার নতুন উপায় খুঁজে পেতে সাহায্য করবে।
রিসোর্স
- সাংবাদিকদের জন্য অ্যালগরিদমিক সাক্ষরতা (অ্যালগরিদমিক লিটারেসি): সাংবাদিকদের জন্য ব্যাখ্যামূলক উপকরণ ও অন্যান্য সহায়ক রিসোর্সের একটি সংগ্রহ।
- এআই স্পটলাইট সিরিজের উন্মুক্ত কারিকুলাম: পুলিৎজার সেন্টারের এই উদ্যোগে বিশ্বজুড়ে সাংবাদিকদের এআই সম্পর্কে প্রশিক্ষণ দিতে তৈরি ভিডিও টিউটোরিয়াল, ফ্রেমওয়ার্ক এবং স্লাইড ডেক পাওয়া যাবে।
- এআই-তৈরি কনটেন্ট শনাক্ত করার জন্য সাংবাদিকদের গাইড
- সামাজিক যোগাযোগমাধ্যমের অ্যালগরিদম অনুসন্ধানের গাইড
গবেষণা
- অ্যালগরিদমিক জাস্টিস লীগ: অ্যালগরিদমের কারণে সৃষ্ট ক্ষতি নথিভুক্ত ও বিশ্লেষণ করে এমন একটি সংস্থা।
- এআই নাউ ইনস্টিটিউট: এআই এবং অ্যালগরিদমিক জবাবদিহি বিষয়ে গবেষণা প্রকাশ করে এমন একটি স্বাধীন প্রতিষ্ঠান।
- সেন্টার ফর ডেমোক্রেসি অ্যান্ড টেকনোলজি: ডিজিটাল যুগে নাগরিক স্বাধীনতা নিয়ে প্রতিবেদন ও গবেষণা প্রকাশ করে এমন একটি অলাভজনক সংস্থা।
- ডেটা অ্যান্ড সোসাইটি: প্রযুক্তি, ডেটা এবং নীতিনির্ধারণসংক্রান্ত বিষয় নিয়ে কাজ করা একটি অলাভজনক গবেষণা প্রতিষ্ঠান।
- অ্যালগরিদমওয়াচ: জুরিখ ও বার্লিনভিত্তিক একটি অলাভজনক সংস্থা, যা অ্যালগরিদমের প্রভাব ও জবাবদিহি নিয়ে কাজ করে।
- প্রাইভেসি ইন্টারন্যাশনাল: লন্ডনভিত্তিক একটি অলাভজনক সংস্থা, যা গোপনীয়তা ও ডিজিটাল অধিকার নিয়ে কাজ করে।
- দেরেচোস ডিজিটালেস: লাতিন আমেরিকাকেন্দ্রিক একটি অলাভজনক ডিজিটাল অধিকারবিষয়ক সংস্থা।
- আফ্রিকান ডিজিটাল রাইটস নেটওয়ার্ক: আফ্রিকাজুড়ে ডিজিটাল অধিকার নিয়ে কাজ করা একটি প্যান-আফ্রিকান সংগঠন।
গ্যাব্রিয়েল গাইগার গ্রিসের এথেন্সভিত্তিক একজন অনুসন্ধানী সাংবাদিক। তিনি নজরদারি প্রযুক্তি এবং অ্যালগরিদমিক জবাবদিহি নিয়ে প্রতিবেদন করার ক্ষেত্রে বিশেষজ্ঞ। বর্তমানে তিনি নেদারল্যান্ডসভিত্তিক অলাভজনক সংবাদকক্ষ লাইটহাউস রিপোর্টস-এ অনুসন্ধানী সাংবাদিক হিসেবে কাজ করছেন। তার প্রতিবেদন ওয়ার্ড, ল্য মঁদ, ডের স্পিগেল এবং দ্য গার্ডিয়ানসহ বিভিন্ন আন্তর্জাতিক গণমাধ্যমে প্রকাশিত হয়েছে।
লাম থুই ভো একজন সাংবাদিক, যিনি ডেটা বিশ্লেষণ ও মাঠপর্যায়ের প্রতিবেদনের সমন্বয়ে মানুষের জীবনে বিভিন্ন ব্যবস্থা ও নীতির প্রভাব অনুসন্ধান করেন। বর্তমানে তিনি অভিবাসী জনগোষ্ঠীর জন্য এবং তাদের অংশগ্রহণে প্রতিবেদন তৈরিতে নিবেদিত স্বাধীন অলাভজনক সংবাদমাধ্যম ডকুমেন্টেড-এর অনুসন্ধানী প্রতিবেদক হিসেবে কাজ করছেন। পাশাপাশি তিনি ক্রেইগ নিউমার্ক গ্র্যাজুয়েট স্কুল অব জার্নালিজম-এ ডেটা সাংবাদিকতার সহযোগী অধ্যাপক। এর আগে তিনি দ্য মার্কআপ, বাজফিড নিউজ, দ্য ওয়াল স্ট্রিট জার্নাল, আল জাজিরা আমেরিকা এবং এনপিআরের প্ল্যানেট মানি-তে সাংবাদিক হিসেবে কাজ করেছেন।