{"id":1258790,"date":"2023-12-22T11:44:26","date_gmt":"2023-12-22T16:44:26","guid":{"rendered":"https:\/\/gijn.org\/?p=1258790"},"modified":"2024-06-06T04:55:12","modified_gmt":"2024-06-06T08:55:12","slug":"arastirmaci-gazetecilere-belge-metni-analizinde-yol-gosterecek-ipuclari","status":"publish","type":"post","link":"https:\/\/gijn.org\/tr\/hikayeler\/arastirmaci-gazetecilere-belge-metni-analizinde-yol-gosterecek-ipuclari\/","title":{"rendered":"Ara\u015ft\u0131rmac\u0131 Gazetecilere Metin Analizinde Yol G\u00f6sterecek \u0130pu\u00e7lar\u0131"},"content":{"rendered":"<p>Ara\u015ft\u0131rmac\u0131 gazeteciler genellikle b\u00fcy\u00fck belgeleri veya metin halindeki verileri g\u00f6zden ge\u00e7irme ve birle\u015ftirme zorlu\u011fuyla kar\u015f\u0131 kar\u015f\u0131ya kal\u0131rlar. Bu \u00e7ok yorucu ve yo\u011fun emek gerektiren bir i\u015f olabilir.<\/p>\n<p>\u0130deal olarak, kolay analiz i\u00e7in verilere elektronik tablo, CSV veya JSON dosyas\u0131 gibi kolay bir formatta eri\u015filebilir. \u00d6nlenebilir sa\u011fl\u0131k tehditlerini ara\u015ft\u0131ran <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.theexamination.org\/\">The Examination<\/a> ve Latin Amerika&#8217;ya odaklanan bir veri gazetecili\u011fi kurulu\u015fu olan <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/datacritica.org\/acerca-de-data-critica\/\">Data Critica<\/a>&#8216;da veri analisti olan <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/iniciativaidea.org\/en\/ponentes-2023\/fernanda-aguirre\/\">Fernanda Aguirre<\/a>, \u00e7o\u011fu zaman verilerin PDF&#8217;ler, e-postalar, makaleler ve sosyal a\u011f g\u00f6nderileri gibi \u00e7\u0131kar\u0131lmas\u0131 zor kaynaklarda s\u0131k\u0131\u015f\u0131p kald\u0131\u011f\u0131n\u0131 belirtti.<\/p>\n<p>Aguirre, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/gijc2023.org\/\">13. K\u00fcresel Ara\u015ft\u0131rmac\u0131 Gazetecilik Konferans\u0131&#8217;ndaki (#GIJC23)<\/a> bir oturumda &#8220;Bu t\u00fcr belgeleri analiz etmek, yap\u0131land\u0131r\u0131lm\u0131\u015f bir \u015fekilde geldiklerinde oldu\u011fu kadar sezgisel de\u011fildir&#8221; diyor. Yap\u0131land\u0131r\u0131lmam\u0131\u015f veri olarak bilinen, \u00f6zellikle metin tabanl\u0131 verilerle u\u011fra\u015ft\u0131\u011f\u0131m\u0131z zaman fazlad\u0131r.&#8221;<\/p>\n<p>Aguirre GIJC23&#8217;te yap\u0131land\u0131r\u0131lm\u0131\u015f verileri analiz etmenin metin formundaki bilgileri analiz etmekten daha kolay oldu\u011funu vurgulad\u0131. \u00c7\u00fcnk\u00fc yap\u0131land\u0131r\u0131lm\u0131\u015f verilerin gazetecilerin aritmetik i\u015flemler uygulayarak, kategorileri sayarak ve y\u00fczdeleri ya da de\u011fi\u015fim oranlar\u0131n\u0131 hesaplayarak verileri kolayca manip\u00fcle etmelerine olanak sa\u011flad\u0131\u011f\u0131n\u0131 belirtti.<\/p>\n<p>Aguirre, verileri bu kolay kullan\u0131labilir duruma getirmek i\u00e7in \u00f6l\u00e7\u00fclebilir bir \u015feye d\u00f6n\u00fc\u015ft\u00fcr\u00fclmesi gerekti\u011fini s\u00f6yledi.<\/p>\n<p>&#8220;Bu basit\u00e7e, bizi daha fazla ara\u015ft\u0131rmam\u0131z gereken y\u00f6ne i\u015faret eden i\u00e7g\u00f6r\u00fcleri \u00e7\u0131kararak yap\u0131l\u0131r&#8221; diyen Aguirre, &#8220;metin i\u00e7eren belgeleri analiz etmenin amac\u0131n\u0131n onlardan yararl\u0131 bilgiler \u00e7\u0131karmak oldu\u011funu&#8221; belirtti.<\/p>\n<p>Ancak bu s\u00fcre\u00e7 g\u00f6z korkutucu olabilir, bu nedenle Aguirre ara\u015ft\u0131rmac\u0131 gazetecilere s\u00fcre\u00e7 boyunca rehberlik edecek ipu\u00e7lar\u0131 verdi.<\/p>\n<p><strong>Sorular Sorun: <\/strong>Aguirre, herhangi bir belgeyi analiz etmek i\u00e7in ilk ad\u0131m\u0131n, gazetecilerin t\u0131pk\u0131 di\u011fer bilgi kaynaklar\u0131nda oldu\u011fu gibi bir dizi ilgili soru sormas\u0131 gerekti\u011fini s\u00f6yledi.<\/p>\n<p>Belgeye ba\u011fl\u0131 olarak, sorular olaya kar\u0131\u015fanlar\u0131n isimlerini, olay yerini ya da olay g\u00fcn\u00fcn\u00fc ortaya \u00e7\u0131karabilir. Bu ilk a\u015fama tamamen ger\u00e7eklerin temelini ve muhtemelen olaylar\u0131n kronolojisini olu\u015fturmakla ilgilidir.<\/p>\n<p><strong>Metni \u0130\u015fleyin: <\/strong>Aguirre, analizin bir sonraki a\u015famas\u0131nda, anlamsal i\u00e7erik i\u00e7ermeyen terimler olan &#8220;<a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.opinosis-analytics.com\/knowledge-base\/stop-words-explained\/\">ba\u011fla\u00e7lar vs..<\/a>&#8221; \u00e7\u0131kar\u0131lmas\u0131n\u0131n \u00f6nemli oldu\u011funu s\u00f6yledi. Artikel ve ba\u011fla\u00e7lar\u0131 da i\u00e7eren bu t\u00fcr kelimelerin yayg\u0131n olarak kullan\u0131ld\u0131\u011f\u0131n\u0131, ancak ger\u00e7ek bir bilgi ya da anlam ta\u015f\u0131mad\u0131klar\u0131n\u0131 da s\u00f6zlerine ekledi. Resmi bir liste olmamakla birlikte Aguirre, her durak s\u00f6zc\u00fck listesinin dile g\u00f6re de\u011fi\u015fece\u011fini s\u00f6yledi.<\/p>\n<p><strong>Do\u011fal Dil \u0130\u015flemeyi Dikkate Al\u0131n<\/strong><\/p>\n<p>Bazen metin analizi karma\u015f\u0131k olabilir. Bu gibi durumlarda Aguirre,<a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/online.york.ac.uk\/the-role-of-natural-language-processing-in-ai\/\"> bilgisayarlar\u0131n insanlar\u0131n yazma ve konu\u015fma bi\u00e7imlerini anlamas\u0131na yard\u0131mc\u0131 olan bir t\u00fcr yapay zeka dil \u00f6\u011frenme modeli<\/a> olan <a rel=\"noopener\" target=\"_blank\" href=\"http:\/\/chat.openai.com\/\">Do\u011fal Dil \u0130\u015fleme&#8217;<\/a>nin (NLP) kullan\u0131lmas\u0131n\u0131 \u00f6nerdi. Belgelerin analizinde kullan\u0131labilecek birka\u00e7 kullan\u0131\u015fl\u0131 NLP tekni\u011finin alt\u0131n\u0131 \u00e7izdi.<\/p>\n<p><strong><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/learn.microsoft.com\/en-us\/azure\/ai-services\/language-service\/named-entity-recognition\/overview\">Adland\u0131r\u0131lm\u0131\u015f Varl\u0131k Tan\u0131ma (NER)<\/a>:<\/strong> Bu teknik, belgelerdeki farkl\u0131 t\u00fcrdeki varl\u0131klar\u0131n \u00e7\u0131kar\u0131lmas\u0131n\u0131 sa\u011flar. Aguirre, bu tekni\u011fin bir belgenin ne hakk\u0131nda konu\u015ftu\u011funu anlamak ve adland\u0131r\u0131lm\u0131\u015f varl\u0131klar\u0131n isimler, yerler, milliyetler, dini veya siyasi gruplar, kurulu\u015flar ve \u015firketler, ajanslar ve kurumlar ve konumlar gibi \u00f6nceden tan\u0131mlanm\u0131\u015f kategorilere s\u0131n\u0131fland\u0131r\u0131lmas\u0131nda yararl\u0131 oldu\u011funu s\u00f6yledi.<\/p>\n<p><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/guides.library.upenn.edu\/penntdm\/methods\/topic_modeling\"><strong>Konu Modelleme:<\/strong><\/a> Bu teknik, bir metin g\u00f6vdesi i\u00e7indeki benzer kelime gruplar\u0131n\u0131 analiz etmeye ve tan\u0131mlamaya yard\u0131mc\u0131 olur. &#8220;Konu modellemesini sadece verilerinizi analiz etmek i\u00e7in de\u011fil, ayn\u0131 zamanda d\u00fczenlemek i\u00e7in de bir teknik olarak d\u00fc\u015f\u00fcnmeyi seviyorum&#8221; diyen Aguirre, bu teknikle <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/towardsdatascience.com\/topic-modeling-with-latent-semantic-analysis-58aeab6ab2f2\">LSA<\/a>,\u00a0<a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.baeldung.com\/cs\/latent-dirichlet-allocation\">LDA<\/a>,\u00a0<a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/maartengr.github.io\/BERTopic\/index.html\">BERTopic<\/a>,\u00a0<a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/towardsdatascience.com\/how-to-perform-topic-modeling-with-top2vec-1ae9bb4e89dc\">Top2Vec<\/a>\u00a0gibi <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/medium.com\/nanonets\/topic-modeling-with-lsa-psla-lda-and-lda2vec-555ff65b0b05\">algoritmalar\u0131n<\/a> kullan\u0131labilece\u011fini s\u00f6zlerine ekledi. Veri bilimcisi <a href=\"https:\/\/github.com\/kurtispykes\" target=\"_blank\" rel=\"noopener\">Kurtis Pykes<\/a> da <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.datacamp.com\/tutorial\/what-is-topic-modeling\">konu modellemesini<\/a>, bir metin g\u00f6vdesi i\u00e7indeki benzer kelime gruplar\u0131n\u0131 analiz eden ve tan\u0131mlayan bir t\u00fcr istatistiksel modelleme olarak a\u00e7\u0131klad\u0131. Bu yakla\u015f\u0131m, belgeleri taramak, belgelerdeki kelime ve kelime \u00f6be\u011fi kal\u0131plar\u0131n\u0131 tespit etmek ve benzer kelimeleri konular halinde \u00fcretmek veya gruplamak i\u00e7in kullan\u0131l\u0131r. Konu modellemesi, bir dizi metin belgesi i\u00e7indeki gizli konular\u0131 ke\u015ffetmek ve tan\u0131mlamak i\u00e7in kullan\u0131l\u0131r.<\/p>\n<p><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.documentcloud.org\/about\/\"><strong>DocumentCloud:<\/strong> <\/a>Bu, gazetecilerin kaynak belgeleri y\u00fcklemesine, d\u00fczenlemesine, analiz etmesine, a\u00e7\u0131klama eklemesine ve a\u00e7\u0131k web&#8217;de yay\u0131nlamas\u0131na olanak tan\u0131yan pop\u00fcler, a\u00e7\u0131k kaynakl\u0131 bir yaz\u0131l\u0131m program\u0131d\u0131r. <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.muckrock.com\/news\/archives\/2021\/dec\/20\/muckrock-gumshoe-nyu\/\">Gumshoe<\/a>, DocumentCloud platformuna yak\u0131n zamanda entegre edilen ara\u00e7lardan biridir. Bu yapay zeka arac\u0131, gazetecilerin ve haber merkezlerinin, \u00f6rne\u011fin Bilgi Edinme \u00d6zg\u00fcrl\u00fc\u011f\u00fc talepleri sonucunda al\u0131nan devasa belgeleri incelerken kar\u015f\u0131la\u015ft\u0131klar\u0131 zorluklar\u0131 ele almay\u0131 ama\u00e7l\u0131yor.<\/p>\n<p><strong><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.makeuseof.com\/what-is-hugging-face-and-what-is-it-used-for\/\">Hugging Face<\/a>:<\/strong> <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.makeuseof.com\/page\/about\/\">MUO<\/a>&#8216;da yak\u0131n zamanda yay\u0131nlanan bir makalede, Hugging Face&#8217;in dil ve bilgisayarla g\u00f6rme projeleri \u00fczerinde \u00e7al\u0131\u015fmak i\u00e7in ara\u00e7lar ve kaynaklar sa\u011flayan a\u00e7\u0131k kaynakl\u0131 bir platform oldu\u011fu a\u00e7\u0131kland\u0131.(Hem \u00fccretsiz hem de \u00fccretli katmanlar\u0131 var.) Aguirre, Hugging Face&#8217;in \u00f6z\u00fcnde kullan\u0131c\u0131lar\u0131n &#8220;\u00e7ok \u00e7e\u015fitli diller i\u00e7in mevcut olan \u00e7ok \u00f6zel mod\u00fclleri bulmalar\u0131na&#8221; yard\u0131mc\u0131 oldu\u011funu s\u00f6yledi. Ayr\u0131ca Hugging Face, kullan\u0131c\u0131lar\u0131n makine \u00f6\u011frenimi modelleri olu\u015fturmalar\u0131n\u0131, e\u011fitmelerini ve da\u011f\u0131tmalar\u0131n\u0131 sa\u011flayan bir veri bilimi <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.techtarget.com\/whatis\/definition\/Hugging-Face\">platformudur<\/a>. Bir veri bilimi platformu olmas\u0131n\u0131n yan\u0131 s\u0131ra Hugging Face, yapay zeka uzmanlar\u0131n\u0131n, makine \u00f6\u011frenimi m\u00fchendislerinin ve veri bilimcilerinin fikirlerini payla\u015fmak ve gerekli deste\u011fi almak i\u00e7in bir araya geldi\u011fi bir merkez veya topluluk g\u00f6revi g\u00f6r\u00fcyor.<\/p>\n<p><strong>\u0130\u015f birli\u011fi Yap\u0131n<\/strong><\/p>\n<p>Belgeleri analiz etme s\u00fcreci bazen gazetecilerin sahip olamayabilece\u011fi teknik beceriler gerektirmektedir. Aguirre, bu gibi durumlarda gazetecileri, karma\u015f\u0131k soru\u015fturmalarla ba\u015fa \u00e7\u0131kmalar\u0131na ve belgelerdeki farkl\u0131 t\u00fcrden varl\u0131klar\u0131 ay\u0131klamalar\u0131na yard\u0131mc\u0131 olacak veri ekipleri ve hatta programc\u0131lar\u0131 olan akademi veya di\u011fer haber merkezleriyle i\u015f birli\u011fi yapmaya \u00e7a\u011f\u0131rd\u0131.<\/p>\n<p>Aguirre, i\u015f birli\u011finin \u00f6zellikle programlama yapmayan gazeteciler i\u00e7in &#8220;belgelerle ilgili karma\u015f\u0131k soru\u015fturmalarla ba\u015fa \u00e7\u0131kman\u0131n harika bir yolu&#8221; oldu\u011funu s\u00f6yledi.<\/p>\n<p>Gazetecilerin bir belgeyi analiz etmeden \u00f6nce birka\u00e7 sayfa okumak zorunda olmad\u0131klar\u0131n\u0131, ancak belgelerin i\u00e7indeki belirli sayfalara gitmek ve gerekli bilgileri \u00e7\u0131karmak i\u00e7in NLP tekniklerini kolayca kullanabileceklerini de s\u00f6zlerine ekledi.<\/p>\n<p>Aguirre, bu tekniklerin belgelerde belirli bilgilerin nerede aranaca\u011f\u0131n\u0131 bulmaya yard\u0131mc\u0131 oldu\u011funu a\u00e7\u0131klad\u0131.<\/p>\n<p>Ara\u015ft\u0131rmac\u0131 Gazetecilik i\u00e7in Metin Analizi konulu GIJC23 panelinin tamam\u0131n\u0131 <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/www.youtube.com\/watch?v=GEz_7o_ziyo\">Youtube kanal\u0131ndan<\/a> ya da giri\u015fe ekledi\u011fimiz videodan izleyebilirsiniz.<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ara\u015ft\u0131rmac\u0131 gazeteciler genellikle b\u00fcy\u00fck belgeleri veya metin halindeki verileri g\u00f6zden ge\u00e7irme ve birle\u015ftirme zorlu\u011fuyla kar\u015f\u0131 kar\u015f\u0131ya kal\u0131rlar. Bu \u00e7ok yorucu ve yo\u011fun emek gerektiren bir i\u015ftir.<\/p>\n","protected":false},"author":3031167,"featured_media":1258845,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_price":"","_stock":"","_tribe_ticket_header":"","_tribe_default_ticket_provider":"","_tribe_ticket_capacity":"0","_ticket_start_date":"","_ticket_end_date":"","_tribe_ticket_show_description":"","_tribe_ticket_show_not_going":false,"_tribe_ticket_use_global_stock":"","_tribe_ticket_global_stock_level":"","_global_stock_mode":"","_global_stock_cap":"","_tribe_rsvp_for_event":"","_tribe_ticket_going_count":"","_tribe_ticket_not_going_count":"","_tribe_tickets_list":"[]","_tribe_ticket_has_attendee_info_fields":false,"republication-tracker-tool-hide-widget":false,"footnotes":"","_tec_slr_enabled":"","_tec_slr_layout":""},"categories":[23206],"tags":[23345,23630,22375,23631,19956,22514],"gijn_topic":[22516,18933,18925],"series":[],"gijn_language":[],"gijn_region":[],"class_list":["post-1258790","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-hikayeler","tag-ai-tr","tag-dogal-dil-isleme","tag-gijc23-tr","tag-metin-analizi","tag-veri-gorsellestirme-tr","tag-yapay-zeka-tr","gijn_topic-gijc23-3","gijn_topic-arastirma-ipuclari-ve-araclar","gijn_topic-veri-gazeteciligi"],"acf":[],"ticketed":false,"_links":{"self":[{"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/posts\/1258790","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/users\/3031167"}],"replies":[{"embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/comments?post=1258790"}],"version-history":[{"count":4,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/posts\/1258790\/revisions"}],"predecessor-version":[{"id":1554394,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/posts\/1258790\/revisions\/1554394"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/media\/1258845"}],"wp:attachment":[{"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/media?parent=1258790"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/categories?post=1258790"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/tags?post=1258790"},{"taxonomy":"gijn_topic","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/gijn_topic?post=1258790"},{"taxonomy":"series","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/series?post=1258790"},{"taxonomy":"gijn_language","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/gijn_language?post=1258790"},{"taxonomy":"gijn_region","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/gijn_region?post=1258790"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}