مجموعة من الصور التي استخدمها صحفيون في الجزيرة على الصفحة الرئيسية للموقع

القصص

هذا ما تعلمته “الجزيرة” من تحليل 6500 صورة على صفحتها الرئيسية

من قبل AJ Labs • 22 مايو 2018

مجموعة من الصور التي استخدمها صحفيون في الجزيرة على الصفحة الرئيسية للموقع

يعتبر اختيار الصورة الصحيحة لسرد قصتك على نفس القدر من الأهمية مع عنوان إخباري جيد، ومع قرب انتهاء عام 2017، قررنا أن نقوم بجمع كافة الصور التي قمنا بنشرها على صفحتنا الرئيسية خلال هذا العام، ونسأل أنفسنا ما هي أنماط الصور التي رآها قراؤنا عند زيارتهم لموقعنا؟

طرح الأسئلة الصحيحة

استعنا بـVision API، الخاص بجوجل، من أجل تحليل محتوى وسياق كل صورة، إذ يستخدم هذا النموذج القوي، المعتمد على تعلم الآلة، قواعد بيانات جوجل الضخمة الخاصة بالصور، من أجل تحديد الوجوه والمعالم والعناصر اليومية داخل صورة، وتعتمد طريقة عمله على أنه يسمح لك بتحميل أي صورة من خلال هذه الخدمة، ومن ثم تستقبل سمات الصورة على هيئة أرقام ترجيحية.

إذا قمت بتحميل صورة الرئيس الأمريكي “دونالد ترامب”، ستعود إليك مع التفاصيل التالية:

للاستفادة من هذه التقنية وضعنا عاملان رئيسيان في عين الاعتبار:

ما الذي نريد أن نتعلمه من صورنا الـ6500؟

كيف يمكن للآلات البصرية المعتمدة على هذه التقنية أن تُستخدم في غرف الأخبار؟

بدأنا استكشافنا بطرح الأسئلة التالية على أنفسنا:

– من هو الرئيس أو الشخصية العامة الأكثر ظهورًا في صورنا في عام 2017؟

– كم عدد المرات التي استخدمنا فيها أوجه أشخاص ومن هم هؤلاء الأشخاص؟

– كم كان منهم من النساء وكم كان منهم من الرجال؟

– كم مرة استخدمنا صور محتجين؟

– كم عدد المرات التي أعدنا فيها استخدام نفس الصورة لقصة مختلفة؟

– كم عدد المرات التي استخدمنا فيها خرائط كصورة رئيسية لنا؟

– ما هي العناصر اليومية التي ظهرت بدرجة أكبر في صورنا؟

بالطبع، لم نكن واثقين من مدى دقة أو قصور Vision API في تحليل قاعدة البيانات الخاصة بنا، وعليه بدأنا بعينة صغيرة من الصور، وما لبثت أن أخذت في الازدياد حتى انتهى بنا الأمر بأن نضع استفساراتنا ونقسم أكثر من 25 ألف سجل من البيانات.

المسائل التقنية

استخدمنا “بايثون” في البرمجة النصية والاستفسار عن البيانات، وMySQL في تخزين وفرز البيانات.

استغرق تشغيل البرمجة النصية ثماني ساعات، مُضاف إليها أربع ساعات أخرى من أجل إتمام استفسارات SQL والتحليل.

نتائج أولية

رغم أن جوجل Vision API يعتبر أحد أكثر منصات الكشف عن الصور تقدمًا، فإن به أوجه قصور، فمثلما هو متوقع لا يحدد العناصر المتواجدة داخل إطار بصورة صحيحة دائمًا، وفي بعض الحالات، يكون هامش الخطأ هذا مقبولًا تمامًا، لكن في حالات أخرى يكون ذلك بعيدًا عن الهدف كليًّا.

الآن وقد اتضح هذا، إليكم بعض العوامل التي تستحق أن توضع في الاعتبار عند استخدام Vision API الخاص بجوجل:

– كانت الميزة الأكثر إفادة لتحليل صور الأخبار هي خاصية web entities، أو الكشف عن المواضع التي أشار فيها أحد المواقع إلى صورة، إذ تزودك هذه الخاصية بقائمة من الكلمات المفتاحية الترجيحية، بالإضافة إلى روابط قصص في نفس السياق تحتوي على الصورة. كثيرًا ما كان ذلك دقيقًا جدًّا في الكشف عن الأشخاص المعروفين.

– أما في حالات الأشخاص الأقل شهرة، أسفر الدمج بين web entities وlabel entities (أي الكشف عن المواضع المُشار فيها إلى تصنيف)، عن نتائج أفضل.

– أما الصور التي تحتوي على مجموعات من الأشخاص، فلم تشهد نجاحًا كبيرًا. في أمثلة عديدة، كان كثيرًا ما يتم تبديل تصنيف مجموعة كبيرة من اللاجئين المتواجدين في قوارب ويرتدون سترات نجاة، خطأً وبكل ثقة الى “مرح” .

– وفي بعض الأحيان، تم إهمال عناصر مهمة في صورة. على سبيل المثال، لم ينتج عن إدخال صورة مقاتلين أعلى شاحنة نصف نقل في الصحراء، سوى “مركبة” باعتبارها كلمة مفتاحية.

– الصور المرسومة يدويا أو الرسوم التوضيحية أسفرت عن نتائج سيئة جدًّا.

لا تعمل هذه التقنية بشكل جيد في الصور المرسومة يدويا او التي تحوي مجموعة من الناس

إجابات على أسئلتنا

من هو الرئيس أو الشخصية العامة الأكثر ظهورًا في صورنا في عام 2017؟

“ترامب”، يليه الرئيس التركي “رجب طيب إردوجان” ووزير الخارجية الأمريكي السابق “ريكس تيلرسون”، وبحثنا بدرجة أعمق فوجدنا أن تعبيرات وجه “ترامب” كان 20% منها فرحة، و6.% غضبًا، و3% حزنًا، و2% مفاجأة.

كم عدد المرات التي استخدمنا فيها أوجه أشخاص؟

3,726 مرة.

كم كان منهم من النساء وكم كان منهم من الرجال؟

للأسف، لم نستطع الإجابة على هذا السؤال.

كم مرة استخدمنا فيها صور محتجين؟

414 مرة.

كم عدد المرات التي أعدنا فيها استخدام نفس الصورة لقصة مختلفة؟

أعدنا استخدام 1703 صورة خلال العام الماضي في قصص إخبارية.

كم عدد المرات التي استخدمنا فيها خرائط كصورة رئيسية لنا؟

143 مرة.

ما هي العناصر اليومية التي ظهرت بدرجة أكبر في صورنا؟

قائمة الأشخاص الذين ظهروا 5 مرات أو أكثر:

أفكار ختامية

إن استخدام أدوات تحليل الصور بمفردها لا يعني شيئًا ما لم يتم طرح الأسئلة الصحيحة، ومن أجل أن نحصل على نتائج عملية، ينبغي أن يتم إدماج هذه الأنماط التقنية بصورة مثالية داخل غرف الأخبار المتواجدة الحالية، من أجل تقديم قيمة لكل من الصحفيين والمشاهدين.

الخطة الآن هي أن نحاول تجربة عمليات ادماج هذه الأنماط التقنية بآليات عمل محددة كتلك : – وضع وسوم على ملفات الصور، داخل نظام إدارة المحتوى الخاص بنا، من أجل تسهيل الأمر على صحفيينا أن يجدوا صورًا محددة بسرعة كبيرة. على سبيل المثال: العثور على كل صور “دونالد ترامب” إلى جانب “إيمانويل ماكرون” بابتسامة على وجهه. – مساعدة الصحفيين على إيجاد أفضل صورة تتماشى مع القصة، أو ما هو أفضل؛ أن نقوم بفلترة جميع الصور التي لن تتماشى مع الصورة. – الاستفادة من خدمة Cloud Video Intelligence الخاصة بجوجل من أجل تحليل محتوى الفيديوهات الحية واستخراج محتوى يستحق النشر، بسرعة. – تطبيق التقنية على VR (أي الواقع الافتراضي)،على صور ثلاثية الأبعاد، بحيث يمكن الكشف عن أشياء موضوعة في إطار معين.

هذه كانت أسئلتنا. إذا كان لك أن تحلل نفس مجموعة الصور، أي أسئلة ستطرحها؟

نُشِر هذا المقال للمرة الأولى على صفحة معامل “الجزيرة” بموقع Medium، ويُعاد نشرها هنا بعد الحصول على إذن.

هذا العمل مرخص تحت رخصة المشاع الابداعي العالمية

إعادة نشر مقالتنا عبر الانترنت أوطباعة تحت رخصة النشاط الابداعي

إقرأ قصص أخرى متصلة

Vision API أدوات لكشف الصور تحليل الصور مختبر الجزيرة

إعادة نشر هذا المقال

هذا العمل مرخص تحت رخصة المشاع الابداعي العالمية

Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

<h2>هذا ما تعلمته &ldquo;الجزيرة&rdquo; من تحليل 6500 صورة على صفحتها الرئيسية</h2> من قبل <a href="https://twitter.com/ajlabs">AJ Labs</a> for Global Investigative Journalism Network &bull; 22 مايو 2018 <a href="https://gijn.org/wp-content/uploads/2018/05/aj-labs-collage.png"></a>مجموعة من الصور التي استخدمها صحفيون في الجزيرة على الصفحة الرئيسية للموقعيعتبر اختيار الصورة الصحيحة لسرد قصتك على نفس القدر من الأهمية مع عنوان إخباري جيد، ومع قرب انتهاء عام 2017، قررنا أن نقوم بجمع كافة الصور التي قمنا بنشرها على صفحتنا الرئيسية خلال هذا العام، ونسأل أنفسنا ما هي أنماط الصور التي رآها قراؤنا عند زيارتهم لموقعنا؟طرح الأسئلة الصحيحةاستعنا بـVision API، الخاص بجوجل، من أجل تحليل محتوى وسياق كل صورة، إذ يستخدم هذا النموذج القوي، المعتمد على تعلم الآلة، قواعد بيانات جوجل الضخمة الخاصة بالصور، من أجل تحديد الوجوه والمعالم والعناصر اليومية داخل صورة، وتعتمد طريقة عمله على أنه يسمح لك بتحميل أي صورة من خلال هذه الخدمة، ومن ثم تستقبل سمات الصورة على هيئة أرقام ترجيحية.إذا قمت بتحميل صورة الرئيس الأمريكي "دونالد ترامب"، ستعود إليك مع التفاصيل التالية:<a href="https://gijn.org/wp-content/uploads/2018/05/aj-labs-trump.jpg"></a>للاستفادة من هذه التقنية وضعنا عاملان رئيسيان في عين الاعتبار:ما الذي نريد أن نتعلمه من صورنا الـ6500؟ كيف يمكن للآلات&nbsp; البصرية المعتمدة على هذه التقنية أن تُستخدم في غرف الأخبار؟بدأنا استكشافنا بطرح الأسئلة التالية على أنفسنا:- من هو الرئيس أو الشخصية العامة الأكثر ظهورًا في صورنا في عام 2017؟- كم عدد المرات التي استخدمنا فيها أوجه أشخاص ومن هم هؤلاء الأشخاص؟- كم كان منهم من النساء وكم كان منهم من الرجال؟- كم مرة استخدمنا صور محتجين؟- كم عدد المرات التي أعدنا فيها استخدام نفس الصورة لقصة مختلفة؟- كم عدد المرات التي استخدمنا فيها خرائط كصورة رئيسية لنا؟- ما هي العناصر اليومية التي ظهرت بدرجة أكبر في صورنا؟بالطبع، لم نكن واثقين من مدى دقة أو قصور Vision API في تحليل قاعدة البيانات الخاصة بنا، وعليه بدأنا بعينة صغيرة من الصور، وما لبثت أن أخذت في الازدياد حتى انتهى بنا الأمر بأن نضع استفساراتنا ونقسم أكثر من 25 ألف سجل من البيانات.المسائل التقنيةاستخدمنا "بايثون" في البرمجة النصية والاستفسار عن البيانات، وMySQL في تخزين وفرز البيانات.استغرق تشغيل البرمجة النصية ثماني ساعات، مُضاف إليها أربع ساعات أخرى من أجل إتمام استفسارات SQL والتحليل.نتائج أوليةرغم أن جوجل Vision API يعتبر أحد أكثر منصات الكشف عن الصور تقدمًا، فإن به أوجه قصور، فمثلما هو متوقع لا يحدد العناصر المتواجدة داخل إطار بصورة صحيحة دائمًا، وفي بعض الحالات، يكون هامش الخطأ هذا مقبولًا تمامًا، لكن في حالات أخرى يكون ذلك بعيدًا عن الهدف كليًّا.الآن وقد اتضح هذا، إليكم بعض العوامل التي تستحق أن توضع في الاعتبار عند استخدام Vision API الخاص بجوجل:- كانت الميزة الأكثر إفادة لتحليل صور الأخبار هي خاصية web entities، أو الكشف عن المواضع التي أشار فيها أحد المواقع إلى صورة، إذ تزودك هذه الخاصية بقائمة من الكلمات المفتاحية الترجيحية، بالإضافة إلى روابط قصص في نفس السياق تحتوي على الصورة. كثيرًا ما كان ذلك دقيقًا جدًّا في الكشف عن الأشخاص المعروفين.- أما في حالات الأشخاص الأقل شهرة، أسفر الدمج بين web entities وlabel entities (أي الكشف عن المواضع المُشار فيها إلى تصنيف)، عن نتائج أفضل.- أما الصور التي تحتوي على مجموعات من الأشخاص، فلم تشهد نجاحًا كبيرًا. في أمثلة عديدة، كان كثيرًا ما يتم تبديل تصنيف مجموعة كبيرة من اللاجئين المتواجدين في قوارب ويرتدون سترات نجاة، خطأً وبكل ثقة&nbsp; الى "مرح" .- وفي بعض الأحيان، تم إهمال عناصر مهمة في صورة. على سبيل المثال، لم ينتج عن إدخال صورة مقاتلين أعلى شاحنة نصف نقل في الصحراء، سوى "مركبة" باعتبارها كلمة مفتاحية.- الصور المرسومة يدويا أو الرسوم التوضيحية أسفرت عن نتائج سيئة جدًّا.<a href="https://gijn.org/wp-content/uploads/2018/05/screenshot-aj-labs.jpg"></a>لا تعمل هذه التقنية بشكل جيد في الصور المرسومة يدويا او التي تحوي مجموعة من الناسإجابات على أسئلتنا من هو الرئيس أو الشخصية العامة الأكثر ظهورًا في صورنا في عام 2017؟"ترامب"، يليه الرئيس التركي "رجب طيب إردوجان" ووزير الخارجية الأمريكي السابق "ريكس تيلرسون"، وبحثنا بدرجة أعمق فوجدنا أن تعبيرات وجه "ترامب" كان 20% منها فرحة، و6.% غضبًا، و3% حزنًا، و2% مفاجأة. كم عدد المرات التي استخدمنا فيها أوجه أشخاص؟3,726 مرة. كم كان منهم من النساء وكم كان منهم من الرجال؟للأسف، لم نستطع الإجابة على هذا السؤال. كم مرة استخدمنا فيها صور محتجين؟414 مرة. كم عدد المرات التي أعدنا فيها استخدام نفس الصورة لقصة مختلفة؟ أعدنا استخدام 1703 صورة خلال العام الماضي في قصص إخبارية. كم عدد المرات التي استخدمنا فيها خرائط كصورة رئيسية لنا؟143 مرة. ما هي العناصر اليومية التي ظهرت بدرجة أكبر في صورنا؟<a href="https://gijn.org/wp-content/uploads/2018/05/aj-labs-label.jpg"></a>قائمة الأشخاص الذين ظهروا 5 مرات أو أكثر:<a href="https://gijn.org/wp-content/uploads/2018/05/aj-labs-names-1.jpg"></a>أفكار ختاميةإن استخدام أدوات تحليل الصور بمفردها لا يعني شيئًا ما لم يتم طرح الأسئلة الصحيحة، ومن أجل أن نحصل على نتائج عملية، ينبغي أن يتم إدماج هذه الأنماط التقنية بصورة مثالية داخل غرف الأخبار المتواجدة الحالية، من أجل تقديم قيمة لكل من الصحفيين والمشاهدين.الخطة الآن هي أن نحاول تجربة عمليات ادماج هذه الأنماط التقنية بآليات عمل محددة كتلك : - وضع وسوم على ملفات الصور، داخل نظام إدارة المحتوى الخاص بنا، من أجل تسهيل الأمر على صحفيينا أن يجدوا صورًا محددة بسرعة كبيرة. على سبيل المثال: العثور على كل صور "دونالد ترامب" إلى جانب "إيمانويل ماكرون" بابتسامة على وجهه. - مساعدة الصحفيين على إيجاد أفضل صورة تتماشى مع القصة، أو ما هو أفضل؛ أن نقوم بفلترة جميع الصور التي لن تتماشى مع الصورة. - الاستفادة من خدمة Cloud Video Intelligence الخاصة بجوجل من أجل تحليل محتوى الفيديوهات الحية واستخراج محتوى يستحق النشر، بسرعة. - تطبيق التقنية على VR (أي الواقع الافتراضي)،على صور ثلاثية الأبعاد، بحيث يمكن الكشف عن أشياء موضوعة في إطار معين.هذه كانت أسئلتنا. إذا كان لك أن تحلل نفس مجموعة الصور، أي أسئلة ستطرحها؟ نُشِر هذا المقال للمرة الأولى على<a href="https://medium.com/@ajlabs/weve-analysed-6-500-images-that-appeared-on-our-homepage-and-here-is-what-we-ve-learned-650fdedf4a45"> صفحة معامل "الجزيرة" بموقع Medium</a>، ويُعاد نشرها هنا بعد الحصول على إذن. 
	This <a target="_blank" href="https://gijn.org/ar/%d9%82%d8%b5%d8%b5/hdha-ma-tlmth-aljzyrt-mn-thlyl-6500-swrt-ly-sfhtha-alryysyt/">article</a> first appeared on <a target="_blank" href="https://gijn.org">Global Investigative Journalism Network</a> and is republished here under a Creative Commons license.
	<img id="republication-tracker-tool-source" src="https://gijn.org/?republication-pixel=true&amp;post=657947&amp;ga=UA-21528033-17">

إقرأ التالي

دراسة حالات منهجية نصائح وأدوات

التحقيق في سوريا بعد الأسد: صندوقٌ أسود وقد انفتح

من قبل Feras Dalatey • 10 أبريل 2025

إعداد إمكانية الوصول

حجم الخط

خيارات الألوان

أدوات القراءة

أخرى

القصص

هذا ما تعلمته “الجزيرة” من تحليل 6500 صورة على صفحتها الرئيسية

إقرأ قصص أخرى متصلة

إعادة نشر هذا المقال

إقرأ التالي

جوزات السّفر هي المفتاح لكشف السرِّيّة الخارجيّة – كيف نستخدم التعلّم الآلي للعثور عليها بكفاءة

“لا تتوقف عن التعلُّم يومًا”: تغطية أخبار اليمن بعيدًا عن العناوين الرئيسية

كيف تستخدم منصّات البيانات في الشرق الأوسط البيانات لتحدي الروايات وتعزيز العدالة

دراسة حالات منهجية نصائح وأدوات

التحقيق في سوريا بعد الأسد: صندوقٌ أسود وقد انفتح

القصص

هذا ما تعلمته “الجزيرة” من تحليل 6500 صورة على صفحتها الرئيسية

مصادر ذات صلة

دليل متخصص في التحقيق في الحرارة الشديدة

كيف يمكن للصّحفيين أن يعتنوا بأنفسهم عند التّحقيق في الصور القاسية للحرب والصراع

العثور على سجلات أمريكية لمتابعة التّحقيقات العابرة للحدود

دليل المراسل للتحقيق في جرائم الحرب

شارك

مصادر ذات صلة

دليل متخصص في التحقيق في الحرارة الشديدة

كيف يمكن للصّحفيين أن يعتنوا بأنفسهم عند التّحقيق في الصور القاسية للحرب والصراع

العثور على سجلات أمريكية لمتابعة التّحقيقات العابرة للحدود

دليل المراسل للتحقيق في جرائم الحرب

قصص ذات صلة

جوزات السّفر هي المفتاح لكشف السرِّيّة الخارجيّة – كيف نستخدم التعلّم الآلي للعثور عليها بكفاءة

“لا تتوقف عن التعلُّم يومًا”: تغطية أخبار اليمن بعيدًا عن العناوين الرئيسية

كيف تستخدم منصّات البيانات في الشرق الأوسط البيانات لتحدي الروايات وتعزيز العدالة

التحقيق في سوريا بعد الأسد: صندوقٌ أسود وقد انفتح

إقرأ قصص أخرى متصلة

إعادة نشر هذا المقال

إقرأ التالي

جوزات السّفر هي المفتاح لكشف السرِّيّة الخارجيّة – كيف نستخدم التعلّم الآلي للعثور عليها بكفاءة

“لا تتوقف عن التعلُّم يومًا”: تغطية أخبار اليمن بعيدًا عن العناوين الرئيسية

كيف تستخدم منصّات البيانات في الشرق الأوسط البيانات لتحدي الروايات وتعزيز العدالة

دراسة حالات منهجية نصائح وأدوات

التحقيق في سوريا بعد الأسد: صندوقٌ أسود وقد انفتح