إعداد إمكانية الوصول

خيارات الألوان

لون أحادي لون باهت مظلم

أدوات القراءة

عزل حاكم

مجموعة من الصور التي استخدمها صحفيون في الجزيرة على الصفحة الرئيسية للموقع

القصص

هذا ما تعلمته “الجزيرة” من تحليل 6500 صورة على صفحتها الرئيسية

مجموعة من الصور التي استخدمها صحفيون في الجزيرة على الصفحة الرئيسية للموقع

يعتبر اختيار الصورة الصحيحة لسرد قصتك على نفس القدر من الأهمية مع عنوان إخباري جيد، ومع قرب انتهاء عام 2017، قررنا أن نقوم بجمع كافة الصور التي قمنا بنشرها على صفحتنا الرئيسية خلال هذا العام، ونسأل أنفسنا ما هي أنماط الصور التي رآها قراؤنا عند زيارتهم لموقعنا؟

طرح الأسئلة الصحيحة

استعنا بـVision API، الخاص بجوجل، من أجل تحليل محتوى وسياق كل صورة، إذ يستخدم هذا النموذج القوي، المعتمد على تعلم الآلة، قواعد بيانات جوجل الضخمة الخاصة بالصور، من أجل تحديد الوجوه والمعالم والعناصر اليومية داخل صورة، وتعتمد طريقة عمله على أنه يسمح لك بتحميل أي صورة من خلال هذه الخدمة، ومن ثم تستقبل سمات الصورة على هيئة أرقام ترجيحية.

إذا قمت بتحميل صورة الرئيس الأمريكي “دونالد ترامب”، ستعود إليك مع التفاصيل التالية:

للاستفادة من هذه التقنية وضعنا عاملان رئيسيان في عين الاعتبار:

ما الذي نريد أن نتعلمه من صورنا الـ6500؟

كيف يمكن للآلات  البصرية المعتمدة على هذه التقنية أن تُستخدم في غرف الأخبار؟

بدأنا استكشافنا بطرح الأسئلة التالية على أنفسنا:

– من هو الرئيس أو الشخصية العامة الأكثر ظهورًا في صورنا في عام 2017؟

– كم عدد المرات التي استخدمنا فيها أوجه أشخاص ومن هم هؤلاء الأشخاص؟

– كم كان منهم من النساء وكم كان منهم من الرجال؟

– كم مرة استخدمنا صور محتجين؟

– كم عدد المرات التي أعدنا فيها استخدام نفس الصورة لقصة مختلفة؟

– كم عدد المرات التي استخدمنا فيها خرائط كصورة رئيسية لنا؟

– ما هي العناصر اليومية التي ظهرت بدرجة أكبر في صورنا؟

بالطبع، لم نكن واثقين من مدى دقة أو قصور Vision API في تحليل قاعدة البيانات الخاصة بنا، وعليه بدأنا بعينة صغيرة من الصور، وما لبثت أن أخذت في الازدياد حتى انتهى بنا الأمر بأن نضع استفساراتنا ونقسم أكثر من 25 ألف سجل من البيانات.

المسائل التقنية

استخدمنا “بايثون” في البرمجة النصية والاستفسار عن البيانات، وMySQL في تخزين وفرز البيانات.

استغرق تشغيل البرمجة النصية ثماني ساعات، مُضاف إليها أربع ساعات أخرى من أجل إتمام استفسارات SQL والتحليل.

نتائج أولية

رغم أن جوجل Vision API يعتبر أحد أكثر منصات الكشف عن الصور تقدمًا، فإن به أوجه قصور، فمثلما هو متوقع لا يحدد العناصر المتواجدة داخل إطار بصورة صحيحة دائمًا، وفي بعض الحالات، يكون هامش الخطأ هذا مقبولًا تمامًا، لكن في حالات أخرى يكون ذلك بعيدًا عن الهدف كليًّا.

الآن وقد اتضح هذا، إليكم بعض العوامل التي تستحق أن توضع في الاعتبار عند استخدام Vision API الخاص بجوجل:

– كانت الميزة الأكثر إفادة لتحليل صور الأخبار هي خاصية web entities، أو الكشف عن المواضع التي أشار فيها أحد المواقع إلى صورة، إذ تزودك هذه الخاصية بقائمة من الكلمات المفتاحية الترجيحية، بالإضافة إلى روابط قصص في نفس السياق تحتوي على الصورة. كثيرًا ما كان ذلك دقيقًا جدًّا في الكشف عن الأشخاص المعروفين.

– أما في حالات الأشخاص الأقل شهرة، أسفر الدمج بين web entities وlabel entities (أي الكشف عن المواضع المُشار فيها إلى تصنيف)، عن نتائج أفضل.

– أما الصور التي تحتوي على مجموعات من الأشخاص، فلم تشهد نجاحًا كبيرًا. في أمثلة عديدة، كان كثيرًا ما يتم تبديل تصنيف مجموعة كبيرة من اللاجئين المتواجدين في قوارب ويرتدون سترات نجاة، خطأً وبكل ثقة  الى “مرح” .

– وفي بعض الأحيان، تم إهمال عناصر مهمة في صورة. على سبيل المثال، لم ينتج عن إدخال صورة مقاتلين أعلى شاحنة نصف نقل في الصحراء، سوى “مركبة” باعتبارها كلمة مفتاحية.

– الصور المرسومة يدويا أو الرسوم التوضيحية أسفرت عن نتائج سيئة جدًّا.

لا تعمل هذه التقنية بشكل جيد في الصور المرسومة يدويا او التي تحوي مجموعة من الناس

إجابات على أسئلتنا

من هو الرئيس أو الشخصية العامة الأكثر ظهورًا في صورنا في عام 2017؟

“ترامب”، يليه الرئيس التركي “رجب طيب إردوجان” ووزير الخارجية الأمريكي السابق “ريكس تيلرسون”، وبحثنا بدرجة أعمق فوجدنا أن تعبيرات وجه “ترامب” كان 20% منها فرحة، و6.% غضبًا، و3% حزنًا، و2% مفاجأة.

كم عدد المرات التي استخدمنا فيها أوجه أشخاص؟

3,726 مرة.

كم كان منهم من النساء وكم كان منهم من الرجال؟

للأسف، لم نستطع الإجابة على هذا السؤال.

كم مرة استخدمنا فيها صور محتجين؟

414 مرة.

كم عدد المرات التي أعدنا فيها استخدام نفس الصورة لقصة مختلفة؟

أعدنا استخدام 1703 صورة خلال العام الماضي في قصص إخبارية.

كم عدد المرات التي استخدمنا فيها خرائط كصورة رئيسية لنا؟

143 مرة.

ما هي العناصر اليومية التي ظهرت بدرجة أكبر في صورنا؟

قائمة الأشخاص الذين ظهروا 5 مرات أو أكثر:

أفكار ختامية

إن استخدام أدوات تحليل الصور بمفردها لا يعني شيئًا ما لم يتم طرح الأسئلة الصحيحة، ومن أجل أن نحصل على نتائج عملية، ينبغي أن يتم إدماج هذه الأنماط التقنية بصورة مثالية داخل غرف الأخبار المتواجدة الحالية، من أجل تقديم قيمة لكل من الصحفيين والمشاهدين.

الخطة الآن هي أن نحاول تجربة عمليات ادماج هذه الأنماط التقنية بآليات عمل محددة كتلك : – وضع وسوم على ملفات الصور، داخل نظام إدارة المحتوى الخاص بنا، من أجل تسهيل الأمر على صحفيينا أن يجدوا صورًا محددة بسرعة كبيرة. على سبيل المثال: العثور على كل صور “دونالد ترامب” إلى جانب “إيمانويل ماكرون” بابتسامة على وجهه. – مساعدة الصحفيين على إيجاد أفضل صورة تتماشى مع القصة، أو ما هو أفضل؛ أن نقوم بفلترة جميع الصور التي لن تتماشى مع الصورة. – الاستفادة من خدمة Cloud Video Intelligence الخاصة بجوجل من أجل تحليل محتوى الفيديوهات الحية واستخراج محتوى يستحق النشر، بسرعة. – تطبيق التقنية على VR (أي الواقع الافتراضي)،على صور ثلاثية الأبعاد، بحيث يمكن الكشف عن أشياء موضوعة في إطار معين.

هذه كانت أسئلتنا. إذا كان لك أن تحلل نفس مجموعة الصور، أي أسئلة ستطرحها؟

نُشِر هذا المقال للمرة الأولى على صفحة معامل “الجزيرة” بموقع Medium، ويُعاد نشرها هنا بعد الحصول على إذن.

إعادة نشر مقالتنا عبر الانترنت أوطباعة تحت رخصة النشاط الابداعي

إعادة نشر هذا المقال


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

إقرأ التالي

ورقة نصائح الأمن والأمان نصائح وأدوات

كيف يمكن للصّحفيين أن يعتنوا بأنفسهم عند التّحقيق في الصور القاسية للحرب والصراع

يواجه خبراء المصادر المفتوحة كمًا هائلاً من الصّور القاسية. فكيف يمكن للصّحفيين حماية أنفسهم من الأذى الناجم عن مشاهدة الصّور الصّادمة باستمرار؟
التّحقيقات مفتوحةُ المصدرِ التي كانت في السابق محصورةً بمواقع متخصّصة مثل Bellingcat، دخلت عالم الصحافة السائدة، مدفوعة بالحاجة إلى التحقُّق على الفور من كميات كبيرة من الصور ومقاطع الفيديو والادّعاءات. بات لدى وسائل الإعلام الكبيرة مثل بي بي سي ونيويورك تايمز فرق مخصصة للتّحقيقات البصريّة، وتزايدت أهمية عملها في سياق حرب المعلومات.

العثور على سجلات أمريكية لمتابعة التّحقيقات العابرة للحدود

دليل لبعض مصادر البيانات الحكوميّة الأمريكيّة التي يمكن أن تساعد الصّحفيين الأجانب والأمريكيين في تغطية الحروب الأمريكيّة ومبيعات الأسلحة وتأثير السياسة الخارجيّة الأمريكيّة.

رون ديبرت في الجلسة الافتتاحية #gijc23

الأمن والأمان

أزمة القرصنة العالمية: كيف يمكن للصحفيين الاستقصائيين مواجهتها

تم تحذير أكبر تجمع على الإطلاق من الصحفيين الاستقصائيين من أنهم يواجهون وباء التجسس السيبراني ، ويجب أن يذهبوا إلى الهجوم لفضح الممثلين السيئين الذين يسعون إلى تقويض الأمن الرقمي.