প্রবেশগম্যতা সেটিংস

লেখাপত্র

বিষয়

ডেটা সাংবাদিকতার উল্টো পিরামিড কাঠামোর হালনাগাদ সংস্করণ

আর্টিকেলটি পড়ুন এই ভাষায়:

পল ব্রাডশ-র লেখাটি প্রথম প্রকাশিত হয় অনলাইন জার্নালিজম ব্লগে, অনুমতি নিয়ে এখানে পুনঃপ্রকাশ করা হলো।

ছবি: পল ব্রাডশ/ অনলাইন জার্নালিজম ব্লগ

এক দশকের বেশি সময় আগে আমি প্রকাশ করেছিলাম ডেটা সাংবাদিকতার উল্টো পিরামিড কাঠামো নিয়ে লেখা আমার এ নিবন্ধটি। এরইমধ্যে বিভিন্ন ভাষায় মডেলটি অনুদিত হয়েছে, বিশ্বজুড়ে বিভিন্নভাবে চর্চিত হওয়ার পাশাপাশি অন্তর্ভূক্ত হয়েছে সাংবাদিকতার অসংখ্য বই গবেষণা পত্রে । তবে সময়ের সঙ্গে সঙ্গে বিভিন্ন প্রশিক্ষণ আর আলোচনার মধ্য দিয়ে মডেলটি  বিকশিত ও উন্নত হয়েছে, বিভিন্ন সময়ে আমি নতুন যে দিকগুলো নিয়ে  লিখেছি বা সুপারিশ করেছি তা এখানে তুলে ধরা হলো— ইংরেজিতে করা একটি সংশোধিত মডেলসহ (উপরে; নিবন্ধটি জার্মান, রাশিয়ান ইউক্রেনিয়ান ভাষায়ও প্রকাশ করা হয়)।  

ডেটা সাংবাদিকতার উল্টো পিরামিড কাঠামোতে সবচেয়ে মৌলিক যে পরিবর্তনটি যোগ হয়েছে তা হচ্ছে সবার আগে প্রধান ধাপটিকে চিহ্নিতকরণ— ধারণা বিকাশ— যা অন্য ধাপগুলোকে নেতৃত্ব দেয়। উপরের চিত্রে যেটি উল্লেখ করা হয়েছে ‘কনসিভ’ লেবেলযুক্ত অংশে।

ডেটা সাংবাদিকতা নিয়ে কাজের শুরুটা কিন্তু প্রায়ই সাংবাদিকদের জন্য বড় ধরনের বাধা হয়ে দাঁড়ায়। সাম্প্রতিক বছরগুলোতে আমি এ সম্পর্কে অনেক কিছু লিখেছি (সম্পূর্ণ তালিকার জন্য নীচে দেখুন)।

দ্বিতীয় বড় পরিবর্তনটি হচ্ছে প্রশ্ন করাকে একটি পদ্ধতি হিসেবে আরো বেশি জোরালো করে তোলা, যা (অবশ্যই) অন্য সব ধাপগুলোর জন্যও প্রযোজ্য — শুধু ডেটা বিশ্লেষণেই নয় বরং আমরা যেভাবে আমাদের সূত্র, আমাদের ধারণা এবং ডেটার নির্ভরযোগ্যতা নিয়ে প্রশ্ন করি, এসব ক্ষেত্রেও।

আমি গত কয়েক বছর ধরে যে আধুনিক পিরামিড পদ্ধতিগুলো ব্যবহার করছি তার পাশাপাশি আমি প্রতিটি ধাপের সঙ্গে সম্পর্কিত বেশ কয়েকটি সূত্রের লিঙ্কও একত্রিত করতে চেয়েছি। যেগুলো এখানে রয়েছে…

ধাপ ১: ধারণা

সহজ গল্প থেকে শুরু করে নতুন ডেটা সেটের মাধ্যমে দ্রুত মোড় ঘুরিয়ে গভীর অনুসন্ধান— সব ক্ষেত্রেই ডেটা সাংবাদিকতা বৈচিত্র্যময় গল্প বলার অসংখ্য দরজা খুলে দেয়। নিচের লিঙ্কগুলো উভয় পরিস্থিতিকে বর্ণনার পাশাপাশি সাংবাদিকরা কীভাবে তাদের কাঙ্ক্ষিত গন্তব্যগুলোতে পৌঁছেছেন তাও তুলে ধরে।

পর্যায় : সংকলন

একটি গল্পের জন্য বিভিন্ন উৎস থেকেই ডেটা আসতে পারে। নীচের লিঙ্কগুলোতে এগুলো তুলে ধরা হলো— যেমন, ডেটার প্রচলিত উৎস থেকে সনাক্ত করা ও এপিআই (অ্যাপ্লিকেশন প্রোগ্রামিং ইন্টারফেস), ডেটা এন্ট্রি বা স্ক্র্যাপিংয়ের মাধ্যমে নিজেই ডেটাগুলো সংকলন করা, ফোয়া বা কোম্পানির অ্যাকাউন্ট ব্যবহার এবং টেক্সটকে ডেটা হিসাবে বিবেচনা করা।

ধাপ ৩: পরিষ্কার

যে কোনো ডেটা প্রকল্পে ডেটা ক্লিনিং অনেক বেশি সময় নিয়ে নিতে পারে (যদিও এটি ৮০ শতাংশ সময় নিয়ে নিতে পারে বলে ব্যাপকভাবে প্রচারিত তথ্যটি সঠিক নয়) — যদিও এ ক্ষেত্রটি নিয়ে সম্ভবত কমই লেখা হয়েছে। হ্যাডলি উইকহ্যামের টাইডি ডেটা এখানে নিয়মের ব্যতিক্রম, নীচে আমি কিছু পোস্ট ও একটি ভিডিও যুক্ত করেছি— যেখানে এই ধাপটি নিয়ে আলোচনা করা হয়েছে।

ধাপ ৪: প্রেক্ষাপট

ডেটাকে প্রেক্ষাপটের সঙ্গে মেলানো প্রসঙ্গে আমার সম্ভবত আরও অনেক বেশি লেখা উচিত। এ নিয়ে আমি প্রধান যে দুইটি জায়গায় লিখেছি, সেগুলো হলো:

ধাপ ৫: একত্রিত করা

প্রায়ই প্রেক্ষাপট বর্ণনার অর্থ দাঁড়ায় ডেটাসেটকে একত্রিত করা। এটি করার সবচেয়ে সাধারণ উপায় হলো স্প্রেডশীট ফাংশন VLOOKUP (কিংবা XLOOKUP) ব্যবহার। গত মাসে আমি আমার বই থেকে নিয়ে “ফাইন্ডিং স্টোরিজ ইন স্প্রেডশীট” শিরোনামে একটি লেখা প্রকাশ করেছি। এখানে দুটি ডেটাসেটকে একত্রিত করার প্রক্রিয়া দেখানো হয়েছে। বিষয়টি নিয়ে এখানে একটি ভিডিও-ও এমবেড করা আছে।

প্রশ্ন করা (প্রতিটি পর্যায়ে)

উপরের সবগুলো ধাপ জুড়ে—  এবং নীচের ‘যোগাযোগ’ ধাপটি সহ— যেমনটি আমি বলেছি, প্রশ্ন করতে হবে। এখানে কিছু পোস্ট রয়েছে যা এই বিষয়টির সঙ্গে বিশেষভাবে সম্পর্কিত:

ধাপ ৬: যোগাযোগ

ডেটা ভিজ্যুয়ালাইজেশন থেকে টিভি সাংবাদিকতা, সংক্ষিপ্ত সংবাদ উপস্থাপন থেকে লম্বা প্রতিবেদন তৈরির মতো বেশ কয়েকটি দিকে যেতে পারে সাংবাদিকতার ‘যোগাযোগ’ ধাপটি। এখানে এমন  কিছু পোস্ট রয়েছে যেখানে আমি গল্প বলার বিভিন্ন পর্যায়গুলো তলিয়ে দেখেছি।


পল ব্র্যাডশ বার্মিংহাম সিটি ইউনিভার্সিটিতে ডেটা সাংবাদিকতা এবং মাল্টিপ্ল্যাটফর্ম অ্যান্ড মোবাইল জার্নালিজমে স্নাতকোত্তর বিভাগ পরিচালনা এবং বিবিসি ইংল্যান্ড ডেটা ইউনিটে পরামর্শক ডেটা সাংবাদিক হিসাবে কাজ করছেন।

ক্রিয়েটিভ কমন্স লাইসেন্সের অধীনে আমাদের লেখা বিনামূল্যে অনলাইন বা প্রিন্টে প্রকাশযোগ্য

লেখাটি পুনঃপ্রকাশ করুন


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

পরবর্তী

টিপশীট ডেটা সাংবাদিকতা পরামর্শ ও টুল

টিপশিট: আপনার অনুসন্ধানে কীভাবে সামুদ্রিক ডেটা ব্যবহার করবেন

সমুদ্র সংক্রান্ত ডেটার ধরন হতে পারে বহুবিচিত্র। সমুদ্রে দূষণ, জীববৈচিত্র্য পরিস্থিতি অথবা অর্থবাণিজ্য— এমন বিভিন্ন ধরনের ডেটা, সাংবাদিকেরা ব্যবহার করতে পারেন তাদের রিপোর্টিংয়ে। এই টিপশিটে পাবেন অনুসন্ধানে সামুদ্রিক ডেটা ব্যবহারের পরামর্শ ও রিসোর্সের খোঁজ।

Leon Yin on Investigating Algorithms YouTube

ডেটা সাংবাদিকতা পদ্ধতি

অ্যালগরিদমের গোপন রহস্য: অনুসন্ধানী ডেটা সাংবাদিক লিওন ইয়িনের সঙ্গে কথোপকথন

সোশ্যাল মিডিয়া বা সার্চ ইঞ্জিনের অ্যালগরিদম নিয়ে অনুসন্ধানের জন্য খ্যাতি কুড়িয়েছেন ডেটা সাংবাদিক লিওন ইয়িন। ২০২০ সালে তাঁর একটি কাজের কথা উল্লেখ করা হয়েছিল মার্কিন কংগ্রেসের একটি উপকমিটির শুনানিতে। পড়ুন, তিনি এসব কাজ কীভাবে করেন।

ডেটা সাংবাদিকতা

সাংবাদিক হিসেবে নিজেই নিজের ডেটাসেট তৈরি করবেন যেভাবে

কোনো বিষয়ে অনুসন্ধান করতে গিয়ে কর্তৃপক্ষের কাছ থেকে যদি কাঙ্ক্ষিত ডেটা না পান, বা তেমন কোনো ডেটা যদি আদৌ না থাকে— তাহলে কী করবেন? পড়ুন, কীভাবে এসব ক্ষেত্রে তৈরি করে নিতে পারেন নিজস্ব ডেটাসেট।

টিপশীট ডেটা সাংবাদিকতা

কোডিংয়ের প্রয়োজন নেই: ডেটা মাইনার দিয়ে ধাপে ধাপে ওয়েবসাইট স্ক্র্যাপিংয়ের পদ্ধতি

ডেটা মাইনার হচ্ছে তথ্য সংগ্রহের একটি টুল ও ব্রাউজার এক্সটেনশন, যা ওয়েবপেজগুলোকে স্ক্র্যাপ করে ব্যবহারকারীকে দ্রুত নির্ভরযোগ্য তথ্য সংগ্রহ করতে সাহায্য করে।