Erişilebilirlik Ayarları

Yazı boyutu

Renk Seçenekleri

Tek renkli Sessiz renk Koyu

Okuma araçları

izolasyon Yönetici
bell curve, standard deviations
bell curve, standard deviations

Image: Shutterstock

Hikayeler

Başlıklar

Veri Gazetecilerinin Standart Sapma Hakkında Bilmeleri Gereken 4 Şey

Bu Yazıyı Oku

bell curve, standard deviations

Resim: Shutterstock

Akademik araştırmaları okuyan bir gazeteciyseniz, muhtemelen “standart sapma” terimini birçok kez görmüşsünüzdür. Bunun ne anlama geldiğinden veya izleyicilere nasıl açıklayacağınızdan emin değilseniz, okumaya devam edin çünkü sizin için detaylandıracağız.

İşte bilmeniz gereken dört önemli şey.

1. Bir veri setinin standart sapması, veri içinde ne kadar varyasyon olduğunu gösteren bir sayıdır.

Araştırmacılar doğum oranları, sıcaklık okumaları ve öğrenci test puanları gibi nicel verileri analiz ederken, verilerin ne kadar yakın veya uzak olduğunu ölçmek için genellikle verilerin standart sapmasını hesaplarlar. Daha yüksek bir standart sapma, verilerin daha fazla yayıldığı anlamına gelir. Standart sapma ne kadar düşükse, verilerin ortalama değeri etrafında veri kümesi o kadar yakın olur.

Ohio Eyalet Üniversitesi’nde istatistik profesörü olan Deborah J. Rumsey Aptallar için İstatistik adlı kitabında, ölçmenin kritik bağlam sağladığına dikkat çekiyor.

“Onsuz, verilerle ilgili hikayenin yalnızca bir kısmını alıyorsunuz” diye belirtiyor. “İstatistikçiler, bir ayağı buzlu suda, diğer ayağı da bir kova kaynar suda olan insan hakkındaki hikayeyi anlatmaktan hoşlanır. Ortalama olarak harika hissettiklerini söyler. Ama ayaklarının her biri için iki sıcaklıktaki değişkenliği bir düşünün. Örneğin, eve daha yakın olan ortalama ev fiyatı, ev ararken karşılaşabileceğiniz ev fiyatlarının aralığı hakkında size hiçbir şey söylemez. Maaşlar aşırı derecede dağılmışsa, ortalama maaş şirketinizde gerçekten neler olup bittiğini tam olarak temsil etmeyebilir. ”

2. Bilim insanları tahminlerde bulunmak eğilimleri araştırmak ve diğer önemli araştırma sorularını yanıtlamak için standart sapmayı kullanabilir.

Bir veri setinin standart sapması, birçok akademik çalışmada sınırlı bir rol oynamaktadır. Bilim insanları, standart sapma değerlerini yalnızca bir tablo veya listede not edebilir veya akademik bir makale kapsamında bunlardan bahsedebilir. Bununla birlikte, bazen araştırmacılar, çalışmalarının merkezinde yer alan soruları yanıtlamalarına yardımcı olmak için ölçüye büyük ölçüde güvenirler.

Örneğin:

-Araştırmacılar, kısmen zaman içinde toplanan verilerin standart sapmasına dayanarak hava durumu, seçmen davranışı, vergi geliri, sağlık hizmeti kullanımı ve diğer birçok şey hakkında tahminlerde bulunabilirler.

-Hisse senedi araştırmacıları, piyasa oynaklığını ölçmek için hisse senedi fiyatlarının standart sapmasını kullanır ve yüksek standart sapma yüksek oynaklığı gösterir.

-Öğrenci test puanlarını inceleyen araştırmacılar, çoğu öğrencinin ortalamada mı yoksa ortalamaya yakın mı performans gösterdiğini veya test puanlarının her yerde olup olmadığını belirlemek için standart sapmayı kullanabilir. Bu önlem aynı zamanda araştırmacıların uzmanlaşmak için daha fazla yardıma ihtiyacı olan öğrencilerin oranını tahmin etmelerine de olanak tanıyor.

İşte standart sapmanın nasıl hesaplanacağına dair kısa bir açıklama.

3. Bazı araştırmalarda bilim insanları bulgularını inç veya pound gibi bir ölçü birimi yerine standart sapma cinsinden bildirirler.

Veri setleri farklı birimlere sahip veri noktalarına sahip olduğunda bilim insanlarının genellikle karşılaştırmalar yapmadan ve ilişkileri aramadan önce verileri standartlaştırması veya yeniden ölçeklendirmesi gerekir. Örneğin, bilim insanları ons [veya gram] olarak ölçülen portakal suyu tüketimi ile 100.000 bin kişi başına her ay uygulanan aşı sayısı olarak ölçülen grip aşısı oranları arasındaki ilişkiyi incelemek isteyebilirler.

Verileri standartlaştırma süreci, her sayısal veri noktasının veri setinin standart sapmasına bölünmesidir. Bunu yapmak, ölçü birimlerini değiştirir. Ons, inç ve pound veya kilogram gibi ortak birimler kullanarak bulguları ifade etmek yerine, standart sapmalar cinsinden haber hazırlanmalıdır.

“Bildirilen bir sayı varsa, sayıyı nasıl yorumlayacağınızı anladığınızdan emin olmak istersiniz.” – Harvard Tıp Okulu profesörü Brian Healy

Varsayımsal olarak, portakal suyu tüketimine ve grip aşısı oranlarına bakan bilim insanları, meyve suyu tüketimindeki bir standart sapma artışının aşılama oranlarında bir standart sapma azalmasıyla ilişkili olduğu sonucuna varabilirler.

Harvard Tıp Okulu’nda nöroloji doçenti olan Brian Healy, veri setlerini standartlaştırmak araştırmacıların birlikte çalışmasını kolaylaştırabilirken, birçok insanın sonuçları anlamakta zorluk çekebileceğini belirtiyor. Gazetecileri bunu  yakından okumaya çağırıyor.

Brigham’daki Partners Multipl Skleroz Merkezi ve Boston’daki Kadın Hastanesi’nin baş biyoistatistikçisi olan Healy, “Sorun şu ki, makaleye gerçekten yakından bakmadıkça, tek bir standart sapmanın ne anlama geldiği hakkında hiçbir fikriniz olmayacak” diyor.

“Sonuçların gösterildiği birimleri anlayın” diye ekliyor. “Haberleştirilen bir sayı varsa, sayıyı nasıl yorumlayacağınızı anladığınızdan emin olmak istersiniz ve birimleri bilmeden sayıyı nasıl yorumlayacağınızı anlayamazsınız.”

4. Bilim insanları, aykırı değer olarak düşündükleri bir veri noktasının aslında bir aykırı değer olup olmadığını doğrulamak için standart sapmayı kullanabilir.

Aykırı değerler, istatistiksel analizleri karmaşıklaştırabilen ve sonuçları çarpıtabilen aşırı yüksek veya düşük değerlerdir. Birçok araştırmacı, örneğin veri toplama veya girme hatası gibi hatalardan kaynaklanan aykırı değerleri kaldıracak veya değiştirecektir.

Bir veri setindeki tüm verilerin grafiğine baktığınızda, bazı veri noktaları diğerlerinden çok farklı olduğu için aykırı değerler olarak görünür. Bir veri setinin standart sapması, bireysel değerlerin ortalamadan ne kadar uzak olduğunu hesaba kattığından, bilim insanları bunu genellikle olağandışı bir veri noktasının aykırı değer olup olmadığını ölçmek için kullanır. Bu yöntem, verilerin çoğunluğunun ortalama değerin bulunduğu çan merkezine yakın birleştiği simetrik, çan şeklindeki bir eğri modelini izleyen veri kümeleri için iyi çalışır.

Standart sapma aykırı değerlerden etkilense de, gazeteciler büyük bir standart sapmanın veri kalitesi sorunlarını gösterdiğini varsaymamalıdır.

Veri seti için standart sapmayı hesapladıktan sonra aykırı değerleri tespit etmek kolaydır. Çan şeklindeki bir eğriyi izleyen veriler için genel bir kural, verilerin yaklaşık %99,7’sinin ortalamanın üç standart sapması içinde olacağıdır. Bu sınırın dışındaki veriler genellikle aykırı değerler olarak kabul edilir.

Bir veri setinin standart sapması aykırı değerlerden etkilense de, gazeteciler büyük bir standart sapmanın veri kalitesi sorunlarını gösterdiğini varsaymamalıdır. Rumsey, Statistics for Dummies’de yazdığı gibi, “büyük bir standart sapma mutlaka kötü bir şey değildir sadece çalışılan gruptaki büyük miktarda varyasyonu yansıtıyor.”

Bu gönderi ilk olarak The Journalist’s Resource tarafından yayınlandı ve burada Creative Commons lisansı ile yeniden yayımlandı. The Journalist’s Resource, Güney Florida Üniversitesi Halk Sağlığı Koleji’nde sağlık ekonomisi profesörü olan Troy Quast‘a ve Harvard Tıp Okulu’nda nöroloji doçenti olan Brian Healy’ye bu bilgi formunun hazırlanmasındaki yardımları için teşekkür eder.

Ek kaynaklar
Gazetecilerin İstatistiksel Önem Hakkında Bilmeleri Gereken 5 Şey

İklim Değişikliğini Araştırmak İçin Yeni Veri Araçları ve İpuçları

GIJN Kaynak Merkezi: Veri Gazeteciliği

Denise-Marie OrdwayDenise-Marie Ordway, ABD ve Orta Amerika’da gazete ve radyo istasyonlarında çalıştıktan sonra 2015 yılından beridir The Journalist’s Resource’un genel yayın yönetmenidir. Çalışmaları USA TODAY, The New York Times ve The Washington Post’ta yayınlandı. 2014-15 Harvard Nieman Üyesiydi.

Bu Çalışma Bir Lisans Altında Lisanslanmıştır Creative Commons Atıf-Türevi Olmayan 4.0 Uluslararası Lisansı

İçeriklerimizi bir Creative Commons Lisansı Altında Ücretsiz, Çevrim içi veya Basılı Olarak Yeniden Yayınlayın.

Bu Yazıyı Yeniden Yayınla

Bu Çalışma Bir Lisans Altında Lisanslanmıştır Creative Commons Atıf-Türevi Olmayan 4.0 Uluslararası Lisansı


Material from GIJN’s website is generally available for republication under a Creative Commons Attribution-NonCommercial 4.0 International license. Images usually are published under a different license, so we advise you to use alternatives or contact us regarding permission. Here are our full terms for republication. You must credit the author, link to the original story, and name GIJN as the first publisher. For any queries or to send us a courtesy republication note, write to hello@gijn.org.

Sonrakini Oku

Tweet mapping of Brazil presidential election

Veri Gazeteciliği

Veri Gazeteciliği İlk 10: Dezenformasyon Reklam Geliri, Bolsonaro’nun Balonu, Rus Seferberlik Evlilikleri, Itaewon Trajedisi

Twitter’da bu haftanın en popüler veri gazeteciliği hikayeleri arasında Google reklamlarının dezenformasyonu nasıl körüklediği, çevrim içi Bolsonaro yanlısı tweet balonunun analizi, evliliklerin bize Rusya’daki seferberlik rakamları hakkında neler söylediği ve Itaewon’daki kalabalığın ezilme trajedisinin zaman çizelgesi yer alıyor.

Haber Yazım Araçları ve İpuçları Veri Gazeteciliği

Verileri Yorumlama: Rakamları Nasıl Okuyacağınızı Bildiğinizden Emin Olmak İçin İpuçları!

Araştırmacı gazetecilik için verileri kullanırken, bilgilerin nasıl elde edileceğini ve temizleneceğini öğrenmek önemlidir. Ancak bulgularınızı doğru yorumlamanız ve sayılardan, filtrelerden ve elektronik tablolardan doğru sonuçları çıkarmanız da çok önemlidir. Eğer matematiği doğru yapamazsanız cevapları doğru okuyamazsanız ve hedef kitlenizi yanıltabilirsiniz.