Erişilebilirlik Ayarları

Yazı boyutu

Renk Seçenekleri

Tek renkli Sessiz renk Koyu

Okuma araçları

izolasyon Yönetici
Data journalism errors confusion
Data journalism errors confusion

Image: Shutterstock

Hikayeler

Başlıklar

Verilerle İlgili Yapılmaması Gerekenler: Hedef Kitleleri Rakamlarla Yanıltmaktan Kaçınmak İçin Öneriler!

Bu Yazıyı Oku

En titiz veri ve araştırmacı gazeteciler bile bazen rakamların kendilerini ele geçirmesine izin verebilir. Yanlış hesaplamalardan ve yanlışlıklardan kaçınmak çok önemlidir, ancak okuyucularınıza rakamları akıllıca ve verilerin anlattığı hikayeyi en iyi şekilde anlayabilecekleri şekilde sunmak da bir o kadar önemlidir.

Araştırmacı gazetecilerin sayılarla ilgili yaptığı meşhur hatalar arasında, yüzdeleri diğer yüzde değerlerine ekleyerek veya çıkararak hesaplamaya çalışmak yer alır. (Örneğin, başarılı kovuşturmaların %12’den %7’ye düşmesi %5’lik bir düşüş değil , yaklaşık %42’lik bir düşüştür.) Bu o kadar klasik bir hatadır ki, Associated Press yüzdeler için % simgesini kullanırken, muhabirlerden değişiklikleri ölçmek ve daha iyi doğruluk ve anlayış sağlamak için “yüzde puanı” yazmalarını ister. Korelasyonu nedensellikle karıştırmak da bir diğer önemli kategori hatasıdır. GIJN ise “Veri Gazeteciliğinde 10 Yaygın Hata ” ve ” Bir Araştırmayı Mahvedebilecek 10 Basit Veri Hatası ” gibi haberlerde büyük sayısal hatalardan kaçınmak için ipuçları sunar.

Ancak yakın zamanda düzenlenen NICAR 2025 veri gazeteciliği konferansında bir panel, gözlemci muhabirlerin haber açılarını bozabilecek ve çok ihtiyaç duyulan okuyucu güvenini zedeleyebilecek birçok ince rakam hatası yaptığı konusunda uyardı. Bu uzmanlar ayrıca, teknik olarak doğru rakamların bile uygunsuz formatlar, metinde çok fazla rakam bulunması veya bu rakamların daha iyi anlaşılması için basitleştirilmemesi ve bağlamlandırılmaması nedeniyle okuyucuları yanıltabileceği veya şaşırtabileceği konusunda uyardı.

NICAR oturumunda , Kaliforniya Üniversitesi, Berkeley Gazetecilik Yüksek Lisans Okulu’nda veri görselleştirme ve araştırma yöntemleri dersleri veren veri gazetecisi Jennifer LaFleur ve Reuters’da ödüllü veri muhabiri Jaimi Dowdell yer aldı.

LaFleur ve Dowdell, okuyucuları sayılarla yanlış bilgilendirmekten veya yanıltmaktan kaçınmak için şu ipuçlarını sundular:

Yanıltıcı kesinlik, yanlışlığa yol açabilir. Elbette, “kadınların %25,21’i” gibi istatistiklerin “dört kadından biri”nden daha doğru olduğunu düşünürdünüz. Ancak LaFleur, “%25,21” gibi kesin rakamların okuyucular için genellikle “dört kadından biri”nden daha az yardımcı olmakla kalmayıp, verilerin aslında desteklemediği bir doğruluğu da yansıtabileceği konusunda uyarıyor. LaFleur, “Bence ondalık basamak eklemeyi seviyoruz çünkü bu bizi gerçekten zeki gösteriyor, ancak okuyucunun yorumlaması zor,” diye belirtti. “Ve bazen – eğer haber yaptığınız verilerde bir hata payı varsa – bu ondalık basamak aslında yanlış bir kesinlik yansıtıyor.” Uzmanlar ayrıca çoğu verinin derlendiği anda teknik olarak güncelliğini yitirdiğini ve bu nedenle çok sayıda ondalık basamak kullanmanın genellikle hem kaynakların hem de haberin veri kalitesi konusunda okuyucuları yanıltabileceğini belirtiyor. “Mümkünse ‘dört kadından biri’ veya ‘neredeyse yarısı’ deyin,” diye ekledi. “Çok geçerli bir sebep yoksa, mümkünse rakamlarınızı yuvarlayın: ‘44.792’ yerine ‘neredeyse 45.000’ deyin.” Araştırmacı Gazeteciler ve Editörler (IRE) veri uzmanları, enflasyona göre ayarlanmış öğretmen maaşlarını devlet verilerinden 53.234 dolar olarak hesaplayıp ardından aynı veri girdilerinden bu maaş ortalamasını 53.226 dolar olarak yeniden hesaplayarak, tam sayıların kesin ortalamasının tehlikesini kanıtladılar. Dolayısıyla, sonunda, sayıyı 53.200 dolara yuvarlamanın daha açık ve doğru olacağı sonucuna vardılar.

Sayı artışlarında “kat kat daha fazla” ifadesinden kaçının.   Muhabirler genellikle, örneğin, bir şeyin 500 tanesinin, o şeyin 100 tanesinden “beş kat daha fazla” olduğunu iddia ederler. Aslında, sadece dört kat daha fazladır. (Bir şeyin %100 artmasının, iki katına çıktığı veya “iki kat daha fazla” olduğu anlamına geldiğini hatırlayın.) Bunun yerine, yeni değerin orijinal değerin “beş katı” olduğunu söylemek daha doğrudur – hatta sayıyı orijinalin “beş katı” olarak adlandırmak daha da iyidir. LaFleur, “Bunu her zaman görüyorum; ‘daha fazla’dan bahsetmemenizi, bunun yerine kaç [kat] olduğunu açıklamanızı öneriyorum, çünkü ‘daha fazla’ okuyucular için de kafa karıştırıcı olabilir,” dedi. “Ne zaman ‘X kat daha fazla’ görsem, beş kat daha fazla değil, beş kat daha fazla oran kastettiklerini tahmin ediyorum.”

Küçük sayılar için ondalık işaretini kaydırın. Uzmanlar, haberlerde “100’de” (yüzde) ifadesinin kullanılmasının zorunlu veya sihirli bir yanı olmadığını söylüyor. Okuyucunun anlamasına yardımcı oluyorsa, muhabirler küçük sayılar ve taban sayıları için ondalık işaretini sağa kaydırabilirler; örneğin, %0,07’lik bir cinayet oranını 100.000 kişi başına 70 cinayete dönüştürebilirler.

Göreceli boyutları karşılaştırırken basit tutun. İkili, bu noktayı sevgili (artık hayatta olmayan) kedilerinin ağırlıklarını karşılaştırarak ortaya koydu – Dowdell’ın kedisi Amigo 10 kg, LaFleur’ın kedisi Stanley ise 5 kg idi. Dowdell, “Amigo, Stanley’den %100 daha ağırdı” veya “Amigo, Stanley’nin ağırlığının %200’üydü” demenin teknik olarak doğru olduğunu belirtse de, her ikisinin de birçok okuyucu için belirsiz kalacağı konusunda uyardı. Bunun yerine, izleyiciler şu daha basit ifadeyi çok daha iyi anlayacaktı: “Amigo, Stanley’nin iki katı ağırlığındaydı.”

Yuvarlak sayılar kırmızı alarm olabilir. Dowdell, doğru bir devlet veri setinden doğru şekilde hesaplanmış, iyi sunulmuş sayıların veya oranların bile , muhabirlerin fark etmeyebileceği 5.000 kayıtlık bir web sitesi indirme sınırı nedeniyle yine de yanlış olabileceği konusunda uyardı. “Küçük yazıları okuduğunuzdan emin olun – her veri setinde sayılarla neler yapabileceğiniz ve yapamayacağınız hakkında bilgi vardır,” diye ekledi. “Genel olarak yuvarlak sayılara dikkat edin: Çok mükemmel olması kırmızı alarm anlamına gelir.”

“Kişi başına” ifadesinin yalnızca kişi başına anlamına geldiğini unutmayın. Dowdell, “kişi başına” ifadesinin anlamı konusunda şaşırtıcı derecede yaygın bir yanlış anlama olduğunu, bunun yalnızca “kişi başına” anlamına geldiğini belirtti. LaFleur, bazen bir toplulukta “kişi başına 300 cinayet” gibi absürt istatistiklere atıfta bulunan haberlerle karşılaştığını da sözlerine ekledi. “Bu nedenle, şiddet suçları veya nadir görülen hastalık enfeksiyonları gibi küçük rakamlar söz konusu olduğunda, 10.000 veya 100.000 kişi başına raporlandığını görürsünüz, böylece tam sayıyı görebilirsiniz,” diye ekledi.

Sayılar ölçeği göstermediğinde grafikleri kullanın. Amerika Birleşik Devletleri’nin “ulusal ücretli doğum izni olmayan sadece altı ülkeden biri” olduğu istatistiği, bu uç politikanın ölçeğini yansıtmada yetersiz kalıyor. LaFleur, bu ülkelerden dördü dünya haritasında gösterilemeyecek kadar küçük ada ülkeleri olduğu için biraz daha az bilgilendirici olsa da, The New York Times’ın aşağıdaki grafiğinin konuyu okuyucular için daha anlamlı bir bakış açısıyla ele aldığını söylüyor.

NYT'nin ülkelere göre küresel ücretli izin politikasına ilişkin grafiği

New York Times’ın küresel ücretli izin politikasına ilişkin bir grafiği. Turuncu renkli ülkeler ulusal düzeyde ücretli doğum izni sunmuyor. Görsel: Ekran görüntüsü, The New York Times.

Milyarlar konusunda dikkatli olun ve ölçeği gösterin. Uzmanlar, milyarlarca rakamının medyada o kadar sık ​​kullanıldığını, bu yüzden hem muhabirlerin hem de okuyucuların bu rakamların ne kadar büyük olduğunu anlayamadıklarını belirtiyor. Biraz perspektif: Bir milyon saniye yalnızca 11 günü temsil ederken, bir milyar saniye neredeyse 32 yıla eşittir. Ayrıca, finansal tablolarda milyonlar ile milyarları karıştırmak şaşırtıcı derecede kolaydır. Dowdell, yakın zamanda bir gözlemci muhabirinin, Trump yönetiminin DOGE hizmetinin, kamuoyuna açıkladığı 8 milyar dolar yerine, bir hükümet sözleşmesini iptal ederek yalnızca 8 milyon dolar tasarruf ettiğini fark ettiğini, bunun büyük bir hata olduğunu aktardı. Bir yetkilinin “8.000.000,00 dolar” ifadesini “8.000.000.000 dolar” olarak yanlış okuduğu anlaşılıyor.

Soru: “Neyi unuttum?” 2021’den eğlenceli bir örnekte, Ulusal Kamu Radyosu, “Beş yüz yirmi beş bin altı yüz dakika: Nasıl ölçersiniz; bir yılı nasıl ölçersiniz?” başlıklı, ünlü sayısal sözlere sahip bir Broadway şarkısına atıfta bulunarak “13.140.000 Dakika: ‘Kira’nın ilk gösteriminden bu yana 25 yıl geçti” başlığını attı. Ancak şarkının veri muhabirleri için de iyi bir soru oluşturduğu ortaya çıktı, çünkü haberin editörleri, aradaki artık yıllardaki yedi ek günü, yani her biri 527.040 dakikayı hesaba katmayı unutmuşlardı. Sonuç olarak, başlık “13.150.080 Dakika” olarak düzeltilmek zorunda kaldı.

Taslağınızı yüksek sesle okuyun. NICAR katılımcılarına, veri hikayesi taslaklarını yüksek sesle okumanın birçok faydası olduğu söylendi. LaFleur, “Hikayeleri her zaman yüksek sesle okurum; bu, nerede çok fazla sayı olduğunu anlamanın iyi bir yoludur,” diye açıkladı. “Analizlerinizi yaparken, birkaç cümleyle açıklayabildiğinizden emin olun. Eskiden annemi arayıp ona açıklayarak ve bir hikayem olup olmadığını hızlıca anlayarak test ederdim.” Dowdell da aynı fikirde: “En önemli şey, bulgularınızı, dinleyicilerinizi bir sürü sayıyla boğmadan vurgulamaktır.”

Popüler bir anlatıya uyan sayılara dikkat edin. Şubat ayında, ABD’de öne çıkan bir veri hikayesi, başlangıçta Tesla Cybertrucks için %14,5’lik bir yangın ölüm oranı olduğunu iddia etti; bu, yollardaki bu siyasi olarak kutuplaştırıcı araçlardan yedisinden biri için bir ölüm anlamına geliyordu – sağduyunun şüpheli olarak işaretlemesi gereken endişe verici derecede yüksek bir oran. LaFleur, yayının daha sonra yaptığı düzeltmeye dikkat çekti ve gerçek oranın 1.000 kat daha düşük veya 100.000 araçta 14,5 ölüm olduğunu kabul etti. (Ayrıca, küçük örneklem boyutu ve “elma ve armut” veri sorunları nedeniyle bu sayı bile hatalıydı. Veriler toplam iki araba kazasına ve Las Vegas’taki Yılbaşı Günü intihar bombası olayına dayanıyordu ve ayrıca satılan tartışmalı araç sayısını hafife almıştı.)

LaFleur, her şeyden önce, “Eğer bir şey doğru gelmiyorsa içgüdülerinizi dinleyin” diye öğütlüyor.

Dowdell kendi ipuçlarını şu şekilde özetledi: “Hikayelerinize kendi hipotezinizle ilgili sorular sorarak yaklaşın. Belki de düşündüğünüz hikaye bu değildir. Hikayelerin çoğu orijinal hipotezi asla desteklemez ve sonunda başka bir yola saparız; bu da genellikle daha ilginç ve kesinlikle daha doğru bir hikayeyle sonuçlanır.”

İki veri uzmanı ayrıca, Sarah Cohen tarafından yazılan IRE’nin ” Haber Odasındaki Sayılar ” rehberinin ikinci baskısında yer alan matematik tazeleme derslerini ve tavsiyeleri de önerdi . Bu el kitabındaki ipuçları şunlardır:

Bir paragraftaki toplam rakam sayısını sekiz veya daha az tutmaya çalışın. Bir kural olmasa da bir kılavuz olarak uzmanlar, muhabirlere “alıntılarınızı seçtiğiniz kadar dikkatli rakamlarınızı da seçmenizi” ve herhangi bir paragrafta bahsedilen toplam rakam sayısını sekizle sınırlamanızı tavsiye ediyor. Bu genellikle iki ayrı rakama (yüzdeler gibi) ve bir yıla atıfta bulunmak anlamına gelir. Örneğin, aşağıdaki cümlede birkaç rakam fazla olsa da, ondalık basamaklar olmadan en azından kılavuza yakın olurdu: “Fazlalık Giderme Ofisi’nin bütçesi 2024’te %48 artarak 700,3 milyon dolardan 1,03 milyar dolara çıktı.” Daha da iyisi, tek bir rakama bile indirgenebilir: “Fazlalık Giderme Ofisi’nin bütçesi geçen yıl neredeyse yarı yarıya artarak 1 milyar dolara çıktı.” Haber Odası Rehberinde IRE Rakamları

Ortalamaların ortalamasını almaktan kaçının. Cohen, haber odalarında sıkça yapılan bu hatayı “bir sebze karışımını fazla pişirmeye” benzetiyor ve şöyle yazıyor: “Bazen muhabirler, örneğin bir bütçede bir dizi yüzdelik değişikliği alır ve “ortalama yüzdelik değişiklik” için bir ortalama hesaplarlar. Bu, yeni ve küçük bir departmandaki %140’lık artışı, eğitimdeki %2’lik artışla aynı şekilde ele alır.”

“Bir/bir” risk olasılıklarını hesaplamak için basit bir yöntem kullanın. Nadir olayların olasılığını hesaplamak ve raporlamak karmaşık görünebilir, ama aslında öyle değil. 4,3 milyonluk bir şehirde her yıl 20 kişiye yıldırım çarpıyorsa, bu kurbanları nüfusa böldüğümüzde, 0,000005 gibi anlamsız bir sayı elde ederiz. Ancak Cohen, bir sayısını bu küçük sayılara bölerek mantıklı “bir/bir” sayıyı elde edebileceğimizi belirtiyor; bu durumda: o şehirde bir yılda yıldırım çarpma olasılığı 200.000’de bir.


Rowan Philp, GIJN’nin kıdemli muhabiri ve etki editörüdür. Daha önce Güney Afrika’nın Sunday Times gazetesinin baş muhabiriydi . Dış muhabir olarak, dünya çapında yirmiden fazla ülkeden haberler, siyaset, yolsuzluk ve çatışma konularında haber yaptı.

Bu Çalışma Bir Lisans Altında Lisanslanmıştır Creative Commons Atıf-Türevi Olmayan 4.0 Uluslararası Lisansı

İçeriklerimizi bir Creative Commons Lisansı Altında Ücretsiz, Çevrim içi veya Basılı Olarak Yeniden Yayınlayın.

Bu Yazıyı Yeniden Yayınla

Bu Çalışma Bir Lisans Altında Lisanslanmıştır Creative Commons Atıf-Türevi Olmayan 4.0 Uluslararası Lisansı


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Sonrakini Oku

Veri Gazeteciliği

Veri Gazeteciliği İlk 10: Çin’in Balıkçılık Filosu, Queer Sineması, Ian Kasırgası, İran Protestoları

Çin’in küresel balıkçılık operasyonu, aşırı avlanma ve deniz yaşamının ve ekosistemlerin yok edilmesiyle ilgili endişeleri artırıyor ve The New York Times, küresel erişimini haritalandırdı. Haftalık NodeXL ve Twitter’daki en popüler veri gazeteciliği hikayelerinden oluşan insan küratörlüğümüz aynı zamanda Güneydoğu Asya bölgesindeki queer sinema tarihini öne çıkarıyor, Ian Kasırgası’nın ABD’deki yıkıcılığını, İran’ın kadın hakları protestolarını ve Kanada’daki sosyal konut sorunlarını ele alıyor.