The Internet Archive and its Wayback Machine are invaluable tools for investigative journalists. Image: Shutterstock
Bir Sonraki Araştırmanız İçin İnternet Arşivi Wayback Makinesini Kullanmanın İpuçları!
Bu Yazıyı Oku
İnternet Arşivi bu yıl 25. yılını kutluyor. Arşiv mevcut kütüphanesinin tamamını erişime açtı. Günde 1 milyardan fazla arşivlenmiş URL’si bulunan, tüm bunları kullanıma açan Wayback Machine öenmli bir araştırma kaynağı.
Gazetecilerin, araştırmacıların, teyitçilerin, aktivistlerin ve genel halkın her gün kullanımına açık ücretsiz Wayback Machine’e erişmesinin birçok yolu var. Bizim hakkımızda binlerce makale yazıldı veya hizmetlerimize atıfta bulunuldu. Aslında, GIJN’nin 2020 için En Sevdiğim Araçlar serisinde de detaylar görebilirsiniz.
Wayback Machine’i denemek isteyenlere tavsiyeler listesi:
URL’leri Arşivlemek
Bir web sitesine atıfta bulunan bir makale yayınlarsanız ve o sitenin sahipleri önemli sayfaları veya sitenin kendisini kaldırırsa, arşivlenmemişlerse sonsuza kadar kaybolabilirler. Bunun sana olmasına izin vermeyebilirsin!
Wayback Machine’in “Sayfayı Şimdi Kaydet” hizmetiyle kullanıcılar tarafından her gün on milyonlarca URL arşivleniyor. Herkes URL’leri gönderebilir ve ücretsiz bir arşiv hesabıyla oturum açtıysanız, orijinal sayfada yakalamak istediğiniz harici bağlantılar olan tüm “dışarı bağlantıları” arşivlemeyi ve bu yakalama işlemine ilişkin genel bir rapora sahip olmayı da isteyebilirsiniz. Size e-postayle yollanıyor. Bir diğer kullanışlı özellik ise yakalanan URL’leri bir WACZ dosyasına indirebilmeniz ve kendi araçlarınızla inceleyebilmeniz/işleyebilmenizdir.
Save Page Now çok sayıda otomatik Twitter arşivlemesi yapabilir. Örneğin, URL’sini girip ilgili seçeneği işaretlerseniz, herhangi bir Twitter profilinden en son 3.200 Tweeti kolayca arşivleyebilirsiniz.
İşte teknik bilgi: Arşivlemek istediğiniz URL’lerin bir listesi varsa, bunları bir Google E-Tablosunun “A sütununa” ekleyin ve burada bulabileceğiniz “Sayfayı Şimdi Kaydet” Google E-Tablolar hizmeti aracılığıyla gönderin. URL daha önce Wayback Machine tarafından arşivlenmişse, B, C ve D sütunları bir durum kodu, arşivlenmiş URL ve bir bayrak ile doldurulacaktır.
Başka bir seçenek de tek bir URL’yi “spn@archive.org” adresine e-posta göndermek ve konu satırına “yakalanan dış bağlantıları” eklerseniz bunlar da korunur. Yine, işlem tamamlandığında bir e-posta raporu alacaksınız.
Son olarak, teknik açıdan daha yetkin olanlar için Wayback Machine, mevcut yazılım iş akışlarınıza entegrasyona veya yeni uygulamalar oluştururken işinizi otomatikleştirmeye yardımcı olacak bir API veya programlama arabirimi sağlar. Bunun bir örneği, küresel gazeteciliği güçlendirmek için yazılım ve girişimler oluşturan San Francisco merkezli kâr amacı gütmeyen teknoloji şirketi Meedan’ın “Kontrol” hizmetini Wayback Machine ile nasıl entegre ettiğidir .
Farklı Arşivlenmiş Sürümlerdeki Değişiklikleri Karşılaştırın
Hiç aynı web sayfasının iki versiyonu arasındaki farkı keşfetmek ve göstermek istediniz mi? Belki de bir şirketin veya bireyin sitelerini nasıl değiştirdiğini veya sayfalarındaki ifadeleri nasıl uyarladığını görmek istersiniz? Bunu “Değişiklikler” özelliği ile yapabilirsiniz.
Bunu denemek için, Wayback Machine’in ana sayfasındaki arama işlevine arşivlenmiş herhangi bir URL’yi girin. Ardından “Değiştir” seçeneğini seçin.
Çeşitli tarih ve saatlerin arşivlenmiş sürümlerinin bir listesi size gösterilecektir; bu değişiklikler, arşivlenmiş bir URL’den diğerine değişiklik derecelerini temsil etmek için renk kodludur.
Ardından, URL’nin zaman damgalı herhangi iki sürümünü seçin ve bunlar, metin farklılıkları mavi ve sarı metinle vurgulanarak yan yana oluşturulacaktır. Bu özellik, bir İngiliz blog yazarı ve siyasi danışmanın tarihi nasıl yeniden yazmaya çalıştığını göstermek için kullanıldı ve aşağıdaki ekran görüntüsünde gösterilmektedir.
Wayback Machine’in “Değişiklikler” özelliği, İngiltere başbakanının eski başdanışmanı Dominic Cummings’in orijinal blog gönderisine (solda) gizli eklemeler (mavi, sağda) nasıl yaptığını gösteriyor. Resim: Ekran görüntüsü
Daha Derin Arşiv Aramaları
Anahtar kelimeler ve/veya mim türleri kullanarak yakalanan herhangi bir URL’nin alt URL’lerini aramak için Wayback Machine’in URL’ler seçeneğini kullanabilirsiniz. İlginç yakalamaları bulmak için sonuçları kolayca filtreleyebilir ve sıralayabilirsiniz.
Belirli dosyalar ve web sitesi koleksiyonları mühendislerimiz tarafından indekslenmiştir ve Wayback Machine bunlar için tam metin arama arayüzü sunmaktadır. Wayback Machine ana sayfasının altındaki “Koleksiyon Arama” bölümüne göz atın. Öne çıkanlar arasında poetry.com, Russian Independent Media gibi kayıp web siteleri ve 749 milyon PDF‘den oluşan bir koleksiyon bulunmaktadır. Koleksiyonlar için mevcut hizmetleri görebileceğiniz bir başka yer de Internet Archive ana sayfasıdır.
Arşivlenmiş materyallerin belirli koleksiyonlarını indekslememizi isterseniz (örneğin çeşitli URL kalıplarını eşleştirerek) lütfen info@archive.org adresinden bize ulaşın.
API’leri Wayback Machine ile Kullanmak
“Sayfayı Şimdi Kaydet” hizmeti aracılığıyla arşivlemeyi destekleyen bir API’ye ek olarak, belirli URL’lerin arşivlenip arşivlenmediğini görmek için Wayback Makinesini sorgulamak için kullanılabilecek API’ler de vardır. Daha fazla bilgiye buradadan erişebilirsiniz .
Hizmetlerinin çoğu gibi, Wayback de API’lerinin kullanım sıklığına resmi sınırlar koymuyor. Ancak, zaman zaman kısıtlama önlemleri uygulayabilir. Wayback Machine’in kullanımıyla ilgili herhangi bir sorunla karşılaşırsanız, bize Twitter üzerinden bir e-posta veya DM gönderin gazetecileri desteklemek bizim önceliğimiz.
Arşivlenmiş Sayfalara Kaynak Eklemek
Herhangi bir arşivin daha eksiksiz bir şekilde anlaşılması için kaynağın hayati önem taşıdığının farkındayız. Bunu göz önünde bulundurarak, kullanıcıların arşivlenmiş kaynaklarımızı daha iyi anlamalarına yardımcı olmak için kaynak afişleri eklemeye başladık. Bu tür afişler arşivlenmiş bir web sayfası kaldırıldığında veya sayfa hakkında bilinen bir araştırma kuruluşu tarafından yazıldığında kullanılabilir.
Wayback Machine, arşivlenmiş sayfaların harici kullanımlarına bağlantı veren sarı başlıklar içerir ve sayfa hakkında ek tarihsel bağlam sağlayan bir “Yakalama hakkında” sekmesine sahiptir. Resim: Ekran görüntüsü
Bir web sayfasını oluşturan arşivlenmiş URL’lerin her birinin kaynağı, o sayfanın anlaşılması için kritik olabilir. Örneğin, arşivlenmiş bir web sayfasındaki belirli görüntüler, sayfadaki diğer öğelerle aynı saat ve tarihte mi çekildi? Bu bilgileri, arşivlenmiş her URL oynatma sayfasının sağ üst köşesindeki “Bu yakalama hakkında” bağlantısını tıklayarak görebilirsiniz.
Arşivlerimizin bütünlüğüne gösterdiğimiz özen ve dikkat ve yıllar içinde onların kaynağına getirdiğimiz şeffaflık, insanların Wayback Machine’e duyduğu genel güvene katkıda bulunmuştur, bu nedenle Wayback Machine’de saklanan kanıtlar dünya çapında birden fazla mahkeme tarafından kabul edilmiştir.
“Sayfayı Şimdi Kaydet” özelliğimizle oluşturduğunuz arşivlere içerik eklememizi isterseniz lütfen bizimle iletişime geçin .
Tarayıcı Uzantıları
Tahmin edebileceğiniz gibi, Safari , Firefox ve Chrome için tarayıcı uzantılarımızın yanı sıra iOS ve Android için yerel mobil uygulamalarımız var. Ayrıca web gezinme deneyimlerinin süper kolay olması için Wayback Machine 404 (ve diğer hata koşulları) algılamasını doğrudan tarayıcılarına oluşturmak için bir arama motoru olan Brave ile ortaklık kurdu.
Her şeyden önce, lütfen İnternet Arşivi ve Wayback Makinesi desteğinin yalnızca bir e-posta veya Twitter DM uzağınızda olduğunu bilin. Lütfen sorularınızı, isteklerinizi, hata raporlarınızı ve başarı öykülerinizi paylaşın. Özellikle hizmetlerimizle ilgili beğenmediğiniz şeyleri veya hangi özellikleri geliştirmemiz veya eklememiz gerektiğini düşündüğünüzü duymak istiyoruz. Bu şekilde, gazetecilerin ihtiyaç ve isteklerini desteklemek için daha iyi bir iş çıkarmak için çalışabiliriz.
Fakat bekleyin! Fazlası var…
İnternet Arşivi, herkese açık web’in çoğunu arşivlemeye ek olarak, Internet Archive Scholar hizmetimiz aracılığıyla 25 milyondan fazla açık erişim bilimsel makale de dahil olmak üzere diğer materyal koleksiyonlarını korur ve kullanıma sunar ; önizlenebilen, ödünç alınabilen veya indirilebilen yaklaşık 30 milyon e-kitap ve metin ve milyonlarca saatlik arşivlenmiş TV haberleri (10 yılın daha iyi bir kısmı için düzinelerce istasyon), ilgili altyazıların tam metin dizine eklenmesi yoluyla aranabilir.
Internet Archive ve Wayback Machine’in proje ve hizmetlerinden haberdar olmak için lütfen bizi Twitter @internetarchive ve @ waybackmachine’de takip edin ve blog yazılarımızı okuyun .
Ek kaynaklar
İnternet Arşivi Nedir ve Ne Bulabilirim?
İnternet Arşivi Wayback Makinesi Nasıl Kullanılır
OSINT Araştırmaları için Archive.org’u Kullanma
GIJN Web Semineri: Evden Raporlamak için Açık Kaynak Bilgilerini Kullanma
GIJN Kaynak Merkezi: Çevrimiçi Araştırma Araçları
Mark Graham , Wayback Machine’i beş yıldan fazla bir süredir yönetiyor . Bundan önce, NBC News Digital’de kıdemli başkan yardımcısıydı. Graham ayrıca ilk ABD-Sovyet e-posta hizmetinin çalıştırılmasına yardımcı oldu, çevrim içi bir tartışma sistemi için ilk web tabanlı arayüzü oluşturmak için bir proje başlattı ve kadınlar için erken bir çevrim içi hizmeti olan iVillage’ın çalışmasına yardımcı oldu.