Image: Shutterstock
Veri Gazetecilerinin Standart Sapma Hakkında Bilmeleri Gereken 4 Şey
Bu Yazıyı Oku
Resim: Shutterstock
Akademik araştırmaları okuyan bir gazeteciyseniz, muhtemelen “standart sapma” terimini birçok kez görmüşsünüzdür. Bunun ne anlama geldiğinden veya izleyicilere nasıl açıklayacağınızdan emin değilseniz, okumaya devam edin çünkü sizin için detaylandıracağız.
İşte bilmeniz gereken dört önemli şey.
1. Bir veri setinin standart sapması, veri içinde ne kadar varyasyon olduğunu gösteren bir sayıdır.
Araştırmacılar doğum oranları, sıcaklık okumaları ve öğrenci test puanları gibi nicel verileri analiz ederken, verilerin ne kadar yakın veya uzak olduğunu ölçmek için genellikle verilerin standart sapmasını hesaplarlar. Daha yüksek bir standart sapma, verilerin daha fazla yayıldığı anlamına gelir. Standart sapma ne kadar düşükse, verilerin ortalama değeri etrafında veri kümesi o kadar yakın olur.
Ohio Eyalet Üniversitesi’nde istatistik profesörü olan Deborah J. Rumsey, Aptallar için İstatistik adlı kitabında, ölçmenin kritik bağlam sağladığına dikkat çekiyor.
“Onsuz, verilerle ilgili hikayenin yalnızca bir kısmını alıyorsunuz” diye belirtiyor. “İstatistikçiler, bir ayağı buzlu suda, diğer ayağı da bir kova kaynar suda olan insan hakkındaki hikayeyi anlatmaktan hoşlanır. Ortalama olarak harika hissettiklerini söyler. Ama ayaklarının her biri için iki sıcaklıktaki değişkenliği bir düşünün. Örneğin, eve daha yakın olan ortalama ev fiyatı, ev ararken karşılaşabileceğiniz ev fiyatlarının aralığı hakkında size hiçbir şey söylemez. Maaşlar aşırı derecede dağılmışsa, ortalama maaş şirketinizde gerçekten neler olup bittiğini tam olarak temsil etmeyebilir. ”
2. Bilim insanları tahminlerde bulunmak eğilimleri araştırmak ve diğer önemli araştırma sorularını yanıtlamak için standart sapmayı kullanabilir.
Bir veri setinin standart sapması, birçok akademik çalışmada sınırlı bir rol oynamaktadır. Bilim insanları, standart sapma değerlerini yalnızca bir tablo veya listede not edebilir veya akademik bir makale kapsamında bunlardan bahsedebilir. Bununla birlikte, bazen araştırmacılar, çalışmalarının merkezinde yer alan soruları yanıtlamalarına yardımcı olmak için ölçüye büyük ölçüde güvenirler.
Örneğin:
-Araştırmacılar, kısmen zaman içinde toplanan verilerin standart sapmasına dayanarak hava durumu, seçmen davranışı, vergi geliri, sağlık hizmeti kullanımı ve diğer birçok şey hakkında tahminlerde bulunabilirler.
-Hisse senedi araştırmacıları, piyasa oynaklığını ölçmek için hisse senedi fiyatlarının standart sapmasını kullanır ve yüksek standart sapma yüksek oynaklığı gösterir.
-Öğrenci test puanlarını inceleyen araştırmacılar, çoğu öğrencinin ortalamada mı yoksa ortalamaya yakın mı performans gösterdiğini veya test puanlarının her yerde olup olmadığını belirlemek için standart sapmayı kullanabilir. Bu önlem aynı zamanda araştırmacıların uzmanlaşmak için daha fazla yardıma ihtiyacı olan öğrencilerin oranını tahmin etmelerine de olanak tanıyor.
İşte standart sapmanın nasıl hesaplanacağına dair kısa bir açıklama.
3. Bazı araştırmalarda bilim insanları bulgularını inç veya pound gibi bir ölçü birimi yerine standart sapma cinsinden bildirirler.
Veri setleri farklı birimlere sahip veri noktalarına sahip olduğunda bilim insanlarının genellikle karşılaştırmalar yapmadan ve ilişkileri aramadan önce verileri standartlaştırması veya yeniden ölçeklendirmesi gerekir. Örneğin, bilim insanları ons [veya gram] olarak ölçülen portakal suyu tüketimi ile 100.000 bin kişi başına her ay uygulanan aşı sayısı olarak ölçülen grip aşısı oranları arasındaki ilişkiyi incelemek isteyebilirler.
Verileri standartlaştırma süreci, her sayısal veri noktasının veri setinin standart sapmasına bölünmesidir. Bunu yapmak, ölçü birimlerini değiştirir. Ons, inç ve pound veya kilogram gibi ortak birimler kullanarak bulguları ifade etmek yerine, standart sapmalar cinsinden haber hazırlanmalıdır.
“Bildirilen bir sayı varsa, sayıyı nasıl yorumlayacağınızı anladığınızdan emin olmak istersiniz.” – Harvard Tıp Okulu profesörü Brian Healy
Varsayımsal olarak, portakal suyu tüketimine ve grip aşısı oranlarına bakan bilim insanları, meyve suyu tüketimindeki bir standart sapma artışının aşılama oranlarında bir standart sapma azalmasıyla ilişkili olduğu sonucuna varabilirler.
Harvard Tıp Okulu’nda nöroloji doçenti olan Brian Healy, veri setlerini standartlaştırmak araştırmacıların birlikte çalışmasını kolaylaştırabilirken, birçok insanın sonuçları anlamakta zorluk çekebileceğini belirtiyor. Gazetecileri bunu yakından okumaya çağırıyor.
Brigham’daki Partners Multipl Skleroz Merkezi ve Boston’daki Kadın Hastanesi’nin baş biyoistatistikçisi olan Healy, “Sorun şu ki, makaleye gerçekten yakından bakmadıkça, tek bir standart sapmanın ne anlama geldiği hakkında hiçbir fikriniz olmayacak” diyor.
“Sonuçların gösterildiği birimleri anlayın” diye ekliyor. “Haberleştirilen bir sayı varsa, sayıyı nasıl yorumlayacağınızı anladığınızdan emin olmak istersiniz ve birimleri bilmeden sayıyı nasıl yorumlayacağınızı anlayamazsınız.”
4. Bilim insanları, aykırı değer olarak düşündükleri bir veri noktasının aslında bir aykırı değer olup olmadığını doğrulamak için standart sapmayı kullanabilir.
Aykırı değerler, istatistiksel analizleri karmaşıklaştırabilen ve sonuçları çarpıtabilen aşırı yüksek veya düşük değerlerdir. Birçok araştırmacı, örneğin veri toplama veya girme hatası gibi hatalardan kaynaklanan aykırı değerleri kaldıracak veya değiştirecektir.
Bir veri setindeki tüm verilerin grafiğine baktığınızda, bazı veri noktaları diğerlerinden çok farklı olduğu için aykırı değerler olarak görünür. Bir veri setinin standart sapması, bireysel değerlerin ortalamadan ne kadar uzak olduğunu hesaba kattığından, bilim insanları bunu genellikle olağandışı bir veri noktasının aykırı değer olup olmadığını ölçmek için kullanır. Bu yöntem, verilerin çoğunluğunun ortalama değerin bulunduğu çan merkezine yakın birleştiği simetrik, çan şeklindeki bir eğri modelini izleyen veri kümeleri için iyi çalışır.
Standart sapma aykırı değerlerden etkilense de, gazeteciler büyük bir standart sapmanın veri kalitesi sorunlarını gösterdiğini varsaymamalıdır.
Veri seti için standart sapmayı hesapladıktan sonra aykırı değerleri tespit etmek kolaydır. Çan şeklindeki bir eğriyi izleyen veriler için genel bir kural, verilerin yaklaşık %99,7’sinin ortalamanın üç standart sapması içinde olacağıdır. Bu sınırın dışındaki veriler genellikle aykırı değerler olarak kabul edilir.
Bir veri setinin standart sapması aykırı değerlerden etkilense de, gazeteciler büyük bir standart sapmanın veri kalitesi sorunlarını gösterdiğini varsaymamalıdır. Rumsey, Statistics for Dummies’de yazdığı gibi, “büyük bir standart sapma mutlaka kötü bir şey değildir sadece çalışılan gruptaki büyük miktarda varyasyonu yansıtıyor.”
Bu gönderi ilk olarak The Journalist’s Resource tarafından yayınlandı ve burada Creative Commons lisansı ile yeniden yayımlandı. The Journalist’s Resource, Güney Florida Üniversitesi Halk Sağlığı Koleji’nde sağlık ekonomisi profesörü olan Troy Quast‘a ve Harvard Tıp Okulu’nda nöroloji doçenti olan Brian Healy’ye bu bilgi formunun hazırlanmasındaki yardımları için teşekkür eder.
Ek kaynaklar
Gazetecilerin İstatistiksel Önem Hakkında Bilmeleri Gereken 5 Şey
İklim Değişikliğini Araştırmak İçin Yeni Veri Araçları ve İpuçları
GIJN Kaynak Merkezi: Veri Gazeteciliği
Denise-Marie Ordway, ABD ve Orta Amerika’da gazete ve radyo istasyonlarında çalıştıktan sonra 2015 yılından beridir The Journalist’s Resource’un genel yayın yönetmenidir. Çalışmaları USA TODAY, The New York Times ve The Washington Post’ta yayınlandı. 2014-15 Harvard Nieman Üyesiydi.