{"id":635919,"date":"2023-04-28T07:40:37","date_gmt":"2023-04-28T11:40:37","guid":{"rendered":"https:\/\/gijn.org\/?p=635919"},"modified":"2024-11-04T07:06:16","modified_gmt":"2024-11-04T12:06:16","slug":"pdflerden-veri-cikartmak-icin-chatgpt-kullanma-potansiyelinin-test-edilmesi","status":"publish","type":"post","link":"https:\/\/gijn.org\/tr\/hikayeler\/pdflerden-veri-cikartmak-icin-chatgpt-kullanma-potansiyelinin-test-edilmesi\/","title":{"rendered":"PDF&#8217;lerden Veri \u00c7\u0131kartmak i\u00e7in ChatGPT Kullanma Potansiyelinin Test Edilmesi!"},"content":{"rendered":"<p>&nbsp;<\/p>\n<p>PDF&#8217;ler gibi tonlarca metin belgesini elektronik tablolara d\u00f6n\u00fc\u015ft\u00fcr\u00fcyorum. Bu s\u0131k\u0131c\u0131 ve pahal\u0131 bir i\u015f. Bu y\u00fczden ne zaman yeni bir yapay zeka teknolojisi ortaya \u00e7\u0131ksa, bu teknolojinin pek \u00e7ok insan\u0131n PDF&#8217;yi teslim etmek, hesap tablosu istemek ve bir tane geri almak i\u00e7in istedi\u011fi \u015feyi yap\u0131p yapamayaca\u011f\u0131n\u0131 merak ediyorum. OpenAI&#8217;nin ChatGPT&#8217;sine birka\u00e7 programlama problemi att\u0131ktan ve uygulanabilir bir sonu\u00e7 ald\u0131ktan sonra, sonunda oraya var\u0131p varmad\u0131\u011f\u0131m\u0131z\u0131 merak ettim.<\/p>\n<p>OpenAI&#8217;nin GPT-3&#8217;\u00fcn\u00fcn yeni moda oldu\u011fu zamanlarda Montrealli gazeteci Roberto Rocha&#8217;n\u0131n <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/robertorocha.info\/getting-tabular-data-from-unstructured-text-with-gpt-3-an-ongoing-experiment\/\">benzer bir test denedi\u011fini g\u00f6rm\u00fc\u015ft\u00fcm. <\/a>Sonu\u00e7lar harektsizdi ancak OpenAI&#8217;nin en yeni modeli olan ChatGPT, tabloyu daha uygun hale getiren birka\u00e7 iyile\u015ftirmeye sahip: GPT-3&#8217;ten 10 kat daha b\u00fcy\u00fck ve sonu\u00e7 olarak genellikle daha tutarl\u0131, <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/openai.com\/blog\/instruction-following\/\">talimatlar\u0131 a\u00e7\u0131k\u00e7a takip etmek i\u00e7in e\u011fitildi<\/a> ve programlama dillerini anl\u0131yor.<\/p>\n<p>ChatGPT&#8217;nin PDF&#8217;lerden yap\u0131land\u0131r\u0131lm\u0131\u015f verileri ne kadar iyi \u00e7\u0131karabildi\u011fini test etmek i\u00e7in, iki belge setini elektronik tablolara d\u00f6n\u00fc\u015ft\u00fcrmek i\u00e7in bir Python beti\u011fi yazd\u0131m (sonunda payla\u015faca\u011f\u0131m!):<\/p>\n<ul>\n<li style=\"font-weight: 400;\">New York veri ihlali bildirim formlar\u0131ndan olu\u015fan 7.000 sayfal\u0131k bir PDF. Be\u015f farkl\u0131 form, k\u00f6t\u00fc OCR ve araya kar\u0131\u015fm\u0131\u015f baz\u0131 serbest bi\u00e7imli mektuplar vard\u0131.<\/li>\n<li style=\"font-weight: 400;\">Polis i\u00e7 soru\u015fturmalar\u0131ndan 1.400 not. Bunlar tamamen yap\u0131land\u0131r\u0131lmam\u0131\u015ft\u0131 ve e-postalar ile belge taramalar\u0131n\u0131 i\u00e7eriyordu. \u00c7ok da\u011f\u0131n\u0131k.<\/li>\n<\/ul>\n<p>Genel stratejim \u015fuydu:<\/p>\n<ol>\n<li style=\"font-weight: 400;\">M\u00fcmk\u00fcn olan <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/github.com\/freedmand\/textra\">en y\u00fcksek kaliteli ara\u00e7lar\u0131<\/a> kullanarak OCR&#8217;yi yeniden yap\u0131n. Bu \u00e7ok \u00f6nemliydi \u00e7\u00fcnk\u00fc ChatGPT k\u00f6t\u00fc OCR edilmi\u015f metinlerle \u00e7al\u0131\u015fmay\u0131 reddediyordu.<\/li>\n<li style=\"font-weight: 400;\">Verileri elimden geldi\u011fince temizledim, fiziksel d\u00fczeni korudum ve \u00e7\u00f6p karakterleri ve \u015fablon metinleri kald\u0131rd\u0131m.<\/li>\n<li style=\"font-weight: 400;\">Belgeleri tek tek kay\u0131tlara ay\u0131r\u0131n.<\/li>\n<li style=\"font-weight: 400;\">ChatGPT&#8217;den her kayd\u0131 JSON&#8217;a d\u00f6n\u00fc\u015ft\u00fcrmesini isteyin.<\/li>\n<\/ol>\n<p>Her iki veri setini tan\u0131mak ve t\u00fcm bu \u00f6n i\u015flemleri yapmak i\u00e7in yakla\u015f\u0131k bir hafta harcad\u0131m. Bir kez yap\u0131ld\u0131ktan sonra, ChatGPT&#8217;nin bir metin par\u00e7as\u0131n\u0131 JSON&#8217;a d\u00f6n\u00fc\u015ft\u00fcrmesini sa\u011flamak ger\u00e7ekten \u00e7ok kolay. Bir kayd\u0131 yap\u0131\u015ft\u0131rabilir ve &#8220;bunun JSON temsilini d\u00f6nd\u00fcr&#8221; diyebilirsiniz ve o da bunu yapacakt\u0131r. Ancak bunu birden fazla kay\u0131t i\u00e7in yapmak k\u00f6t\u00fc bir fikirdir \u00e7\u00fcnk\u00fc ChatGPT metinden rastgele se\u00e7ilen alan adlar\u0131n\u0131 kullanarak kendi \u015femas\u0131n\u0131 olu\u015fturacakt\u0131r. Ayr\u0131ca de\u011ferleri ayr\u0131\u015ft\u0131rmak i\u00e7in kendi yoluna karar verecektir. \u00d6rne\u011fin adresler bazen bir dize, bazen de bir JSON nesnesi ya da bir dizi olarak ortaya \u00e7\u0131kacak ve adresin bile\u015fenleri b\u00f6l\u00fcnecektir.<\/p>\n<p><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/github.com\/dair-ai\/Prompt-Engineering-Guide\/blob\/main\/guides\/prompts-intro.md\">\u0130stem tasar\u0131m\u0131<\/a>, tutarl\u0131 sonu\u00e7lar elde etmede en \u00f6nemli fakt\u00f6rd\u00fcr ve dil se\u00e7imleriniz b\u00fcy\u00fck bir fark yarat\u0131r. Bir ipucu: ChatGPT&#8217;nin bir g\u00f6reve at\u0131fta bulunurken hangi ifadeyi kulland\u0131\u011f\u0131n\u0131 bulun ve bunu taklit edin. (Bilmiyorsan\u0131z, her zaman \u015funu sorabilirsiniz: &#8220;_______ adresini kullanarak _____ adresini nas\u0131l kullanaca\u011f\u0131n\u0131z\u0131 a\u00e7\u0131klay\u0131n.&#8221;)<\/p>\n<p>ChatGPT kodu anlad\u0131\u011f\u0131 i\u00e7in, istemimi belirli bir <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/json-schema.org\/\">JSON \u015femas\u0131na <\/a>uygun JSON istemek \u00fczere tasarlad\u0131m. Bu benim istemimdi:<\/p>\n<p><a href=\"https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.14.33.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-629902\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.14.33-1170x622.png\" alt=\"\" width=\"771\" height=\"410\" srcset=\"https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.14.33-1170x622.png 1170w, https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.14.33-336x179.png 336w, https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.14.33-771x410.png 771w, https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.14.33-768x408.png 768w, https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.14.33-1536x817.png 1536w, https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.14.33.png 1542w\" sizes=\"auto, (max-width: 771px) 100vw, 771px\" \/><\/a><\/p>\n<p>Resim: Ekran G\u00f6r\u00fcnt\u00fcs\u00fc, OpenNews:Source<\/p>\n<p>Her yan\u0131ttan bir JSON nesnesi \u00e7\u0131karmaya ve buna kar\u015f\u0131 baz\u0131 do\u011frulama kontrolleri yapmaya \u00e7al\u0131\u015ft\u0131m. \u0130ki kontrol \u00f6zellikle \u00f6nemliydi: 1) JSON&#8217;un eksiksiz oldu\u011fundan, kesilmedi\u011finden veya bozulmad\u0131\u011f\u0131ndan emin olmak ve 2) anahtarlar\u0131n ve de\u011ferlerin \u015femayla e\u015fle\u015fti\u011finden emin olmak. Do\u011frulama kontrol\u00fc ba\u015far\u0131s\u0131z olursa tekrar deniyordum ve genellikle ikinci veya \u00fc\u00e7\u00fcnc\u00fc denemede ge\u00e7erli JSON geri al\u0131yordum. Ba\u015far\u0131s\u0131z olmaya devam ederse, bunu not eder ve kayd\u0131 atlard\u0131m. Baz\u0131 kay\u0131tlar ChatGPT&#8217;nin ho\u015funa gitmiyor.<\/p>\n<p><b>Sonu\u00e7lar<\/b><\/p>\n<p>Etkileyici bir \u015fekilde, ChatGPT \u00e7o\u011funlukla kullan\u0131labilir bir veri seti olu\u015fturdu. \u0130lk bak\u0131\u015fta, m\u00fckemmel bir \u015fekilde ay\u0131klanm\u0131\u015f bir veri setine sahip oldu\u011fumu bile d\u00fc\u015f\u00fcnd\u00fcm. Ancak sayfalar\u0131 inceleyip de\u011ferleri kar\u015f\u0131la\u015ft\u0131rd\u0131\u011f\u0131mda hatalar fark etmeye ba\u015flad\u0131m. Baz\u0131 isimler yanl\u0131\u015f yaz\u0131lm\u0131\u015ft\u0131. Baz\u0131lar\u0131 tamamen eksikti. Baz\u0131 say\u0131lar yanl\u0131\u015ft\u0131.<\/p>\n<p>Hatalar, ince ve nispeten seyrek olsa da, \u00e7o\u011fu veri gazetecisinin yapmak istedi\u011fi temel analizleri yapmam\u0131 engellemeye yetti. Ortalamalar, histogramlar, minimumlar ve maksimumlar yoktu.<\/p>\n<p>Ancak benim projelerim i\u00e7in hatalar tolere edilebilirdi. \u0130hlal edilen veri taban\u0131ndaki b\u00fcy\u00fck oyuncular\u0131 bulmak istiyordum, bu y\u00fczden baz\u0131 isimlerin yanl\u0131\u015f olmas\u0131 ya da baz\u0131 say\u0131sal de\u011ferlerin bir s\u0131f\u0131r eksik olmas\u0131 umurumda de\u011fildi. Polis verileri i\u00e7in temelde belirli olaylar\u0131 ve ilgili ki\u015fileri tan\u0131mlayacak bir \u00f6zet ar\u0131yordum. E\u011fer bir \u015feyi g\u00f6zden ka\u00e7\u0131r\u0131rsam, sorun olmazd\u0131.<\/p>\n<p>Genel olarak, bunlar ChatGPT&#8217;nin ortaya \u00e7\u0131kard\u0131\u011f\u0131 hata t\u00fcrleridir:<\/p>\n<ul>\n<li style=\"font-weight: 400;\"><b>ChatGPT verileri <\/b><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/en.wikipedia.org\/wiki\/Hallucination_(artificial_intelligence)\"><b>hal\u00fcsinasyona<\/b><\/a><b> u\u011fratt\u0131, yani bir \u015feyler uydurdu. <\/b>\u0130nce ve tespit edilmesi zor \u015fekillerde genelde bu oldu. \u00d6rne\u011fin, &#8220;2222 Colony Road, Moorcroft &#8220;u (&#8220;r &#8220;ye dikkat edin) &#8220;2222 Colony Road, Mooncroft &#8220;a d\u00f6n\u00fc\u015ft\u00fcrd\u00fc. &#8220;Mooncroft&#8221; (&#8220;n&#8221; ile) kelimesi metnin hi\u00e7bir yerinde ge\u00e7miyor. ChatGPT koloni ve ay kelimeleri aras\u0131nda bir ba\u011flant\u0131 kuruyor gibi g\u00f6r\u00fcn\u00fcyordu. Ne kadar tuhaf.<\/li>\n<li style=\"font-weight: 400;\"><b>\u0130nsanlar\u0131n isimlerine tak\u0131ld\u0131 ve cinsiyetlerini tahmin etti.<\/b> Baz\u0131 formlarda bir &#8220;selamlama&#8221; alan\u0131 vard\u0131, bu da ChatGPT&#8217;nin uygun olmad\u0131\u011f\u0131nda selamlama (&#8220;Bayan&#8221;, &#8220;Bay&#8221;) eklemesine ve verildi\u011finde bile (&#8220;Dr&#8221; ve &#8220;Prof&#8221;) atlamas\u0131na neden oluyor gibi g\u00f6r\u00fcn\u00fcyordu. Ayr\u0131ca, bir kay\u0131tta birden fazla isim g\u00f6r\u00fcnd\u00fc\u011f\u00fcnde do\u011fru ismi kullanamad\u0131 ve en son geleni tercih etti.<\/li>\n<li style=\"font-weight: 400;\"><b>ChatGPT \u00f6nceki istemleri hat\u0131rlayarak kar\u0131\u015f\u0131kl\u0131klara neden oldu<\/b>. Bazen, mevcut kayd\u0131n metninde tamamen ge\u00e7erli bir isim g\u00f6r\u00fcnmesine ra\u011fmen, daha \u00f6nceki bir kay\u0131ttaki bir ismi veya ticari varl\u0131\u011f\u0131 kullanm\u0131\u015ft\u0131r. \u00d6rne\u011fin, bir kay\u0131tta en son 150 ve 30 sayfa \u00f6nce g\u00f6r\u00fclen bir avukat\u0131n ve hukuk firmas\u0131n\u0131n isimlerini kulland\u0131. Bu sorun beni isimlerin ve kurulu\u015flar\u0131n mevcut kay\u0131tta ger\u00e7ekten var oldu\u011fundan emin olmaya zorlad\u0131.<\/li>\n<li style=\"font-weight: 400;\"><b>Yaz\u0131m hatas\u0131 oldu\u011funu d\u00fc\u015f\u00fcnd\u00fc\u011f\u00fc kelimeler &#8220;d\u00fczeltildi&#8221;.<\/b> Bu genellikle yard\u0131mc\u0131 oluyordu ancak bazen bir hataya yol a\u00e7\u0131yordu. Bu durum \u00f6zellikle e-posta adreslerinde sorun yarat\u0131yordu.<\/li>\n<li style=\"font-weight: 400;\"><b>Hatalar veride rastgele da\u011f\u0131lm\u0131\u015f gibi g\u00f6r\u00fcn\u00fcyordu.<\/b> Baz\u0131 s\u00fctunlar di\u011ferlerinden daha fazla hata i\u00e7erirken, t\u00fcm s\u00fctunlarda %1 ile %6 aras\u0131nda de\u011fi\u015fen hata oranlar\u0131 vard\u0131. Hatalar sat\u0131rlar aras\u0131nda da da\u011f\u0131lm\u0131\u015ft\u0131. T\u00fcm bunlar bir araya geldi\u011finde, tamamen ge\u00e7erli bir veri seti elde etmek i\u00e7in her sat\u0131r\u0131 her kay\u0131tla kar\u015f\u0131la\u015ft\u0131rmam gerekti\u011fi anlam\u0131na geliyordu ki bu da en ba\u015fta ka\u00e7\u0131nmaya \u00e7al\u0131\u015ft\u0131\u011f\u0131m i\u015fin ta kendisiydi.<\/li>\n<\/ul>\n<p>B\u00fcy\u00fck dil modelleriyle ilgili sorunlar \u015fimdiye kadar<a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/interaktiv.br.de\/ai-generated-fact-boxes\/\"> \u00e7ok iyi belgelenmi\u015ftir.\u00a0 <\/a>ChatGPT&#8217;deki b\u00fcy\u00fck ilerlemelere ra\u011fmen, bunlardan baz\u0131lar\u0131 deneylerimde ortaya \u00e7\u0131kt\u0131. Bu sorunlar\u0131 g\u00f6rmezden gelip ChatGPT&#8217;den t\u00fcretilen \u00e7al\u0131\u015fmalar\u0131 do\u011frudan okuyuculara sunma giri\u015fimleri ka\u00e7\u0131n\u0131lmaz olarak <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/gizmodo.com\/cnet-ai-chatgpt-news-robot-1849996151\">feci ba\u015far\u0131s\u0131zl\u0131klara yol a\u00e7acakt\u0131r.<\/a><\/p>\n<p>ChatGPT bazen bir belgeyle \u00e7al\u0131\u015fmay\u0131 reddediyor ve basmakal\u0131p bir yan\u0131t veriyor. Her ikisi de kamuya a\u00e7\u0131k belgeler olmas\u0131na ra\u011fmen, hem polis notlar\u0131nda hem de New York veri ihlali veri k\u00fcmelerinde &#8220;hassas bilgiler&#8221; ile ilgili endi\u015felerle yan\u0131t verdi.<\/p>\n<p><a href=\"https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.16.57.png\"><img loading=\"lazy\" decoding=\"async\" class=\"alignnone size-full wp-image-629903\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.16.57-1170x289.png\" alt=\"\" width=\"771\" height=\"190\" srcset=\"https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.16.57-1170x289.png 1170w, https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.16.57-336x83.png 336w, https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.16.57-771x190.png 771w, https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.16.57-768x190.png 768w, https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.16.57.png 1450w\" sizes=\"auto, (max-width: 771px) 100vw, 771px\" \/><\/a><\/p>\n<p>G\u00f6r\u00fcnt\u00fc: Ekran g\u00f6r\u00fcnt\u00fcs\u00fc, OpenNews Kayna\u011f\u0131<\/p>\n<h4><b>ChatGPT Veri Gazetecili\u011finde Devrim Yaratacak m\u0131?<\/b><\/h4>\n<p>Ben \u00f6yle d\u00fc\u015f\u00fcnm\u00fcyorum, \u00fc\u00e7 nedenden dolay\u0131:<\/p>\n<ol>\n<li style=\"font-weight: 400;\">Hay\u0131r, teknik nedenlerden dolay\u0131: OpenAI&#8217;nin API&#8217;si arac\u0131l\u0131\u011f\u0131yla ChatGPT ile \u00e7al\u0131\u015fmak ac\u0131 verici derecede yava\u015f. Sadece veri ihlali PDF&#8217;sinden yakla\u015f\u0131k 2.500 kay\u0131t \u00e7\u0131karmak yakla\u015f\u0131k \u00fc\u00e7 hafta s\u00fcrd\u00fc. Bu projeye ChatGPT yayg\u0131nla\u015fmadan \u00f6nce ba\u015flad\u0131\u011f\u0131m ve h\u0131z s\u0131n\u0131rlamas\u0131 getirilmeden \u00f6nce iki hafta boyunca kullanabildi\u011fim d\u00fc\u015f\u00fcn\u00fcld\u00fc\u011f\u00fcnde bu daha da \u00f6nemli. Ayr\u0131ca API g\u00fcvenilir de\u011fil ve s\u0131k s\u0131k kesinti ve kesintiler ya\u015fan\u0131yor, ancak bu durum <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/openai.com\/blog\/chatgpt-plus\/\">gelecekte d\u00fczelebilir.<\/a><\/li>\n<li style=\"font-weight: 400;\">Hay\u0131r, ekonomik nedenlerden dolay\u0131: ChatGPT ile bir t\u00fcr el eme\u011fini di\u011feriyle takas etti\u011fimize ikna oldum. Programlama ve transkripsiyonu temizlik, do\u011fruluk kontrol\u00fc ve do\u011frulama ile takas ediyoruz. Herhangi bir sat\u0131r potansiyel olarak yanl\u0131\u015f olabilece\u011finden, g\u00fcven olu\u015fturmak i\u00e7in her alan kontrol edilmelidir. Sonu\u00e7ta, \u00e7ok fazla i\u015f tasarrufu yapt\u0131\u011f\u0131m\u0131za ikna olmad\u0131m.<\/li>\n<li style=\"font-weight: 400;\">Hay\u0131r, editoryal nedenlerden dolay\u0131: Veri hal\u00fcsinasyonu ve di\u011fer kar\u0131\u015f\u0131kl\u0131klarla ilgili sorunlar, bence bu yakla\u015f\u0131m\u0131 \u015firket i\u00e7i veya gazetecilere y\u00f6nelik kullan\u0131mlarla s\u0131n\u0131rl\u0131yor. Bir hikaye olu\u015fturucudan daha iyi bir ipucu olu\u015fturucu. ChatGPT&#8217;yi gazetecilik i\u015f ak\u0131\u015f\u0131n\u0131n sonuna koymak, daha fazla h\u0131z ve miktar\u0131 daha az g\u00fcvenilirlikle de\u011fi\u015f toku\u015f etme riski ta\u015f\u0131yor.<\/li>\n<\/ol>\n<p>&nbsp;<\/p>\n<p>Bu sorunlar\u0131n toplam\u0131, ChatGPT&#8217;nin \u00e7o\u011fu kullan\u0131m\u0131n\u0131, \u00f6zellikle geni\u015f \u00f6l\u00e7ekte, editoryal olarak kullan\u0131\u015fs\u0131z hale getiriyor. Ama bence hala yeri var. K\u00fc\u00e7\u00fck bir PDF&#8217;i tabloya d\u00f6n\u00fc\u015ft\u00fcrmesi gereken, kaynaklar\u0131 yetersiz k\u00fc\u00e7\u00fck haber odalar\u0131 i\u00e7in bu uygulanabilir olabilir (<i>Hey ChatGPT, bu metni bir dizi JSON nesnesine d\u00f6n\u00fc\u015ft\u00fcrebilir misin?<\/i>).<\/p>\n<p>Ayr\u0131ca baz\u0131 PDF&#8217;ler o kadar da\u011f\u0131n\u0131k ve d\u00fczensizdir ki, ay\u0131klama komut dosyas\u0131 yazmak \u00e7ok zaman al\u0131r. Bunun gibi sorunlar nedeniyle say\u0131s\u0131z projem \u00f6ld\u00fc. ChatGPT bu t\u00fcr projelere hayat verme potansiyeli sunuyor.<\/p>\n<p>ChatGPT , hatalar\u0131n ve eksik de\u011ferlerin tolere edilebilir oldu\u011fu kullan\u0131m durumlar\u0131nda veya haftalarca ger\u00e7ek bir temizlik ve analize girmeden \u00f6nce verilerin durumuna bakmak istedi\u011finiz spek\u00fclatif durumlarda bir ke\u015fif arac\u0131 veya potansiyel olu\u015fturucu olarak da hizmet edebilir.<\/p>\n<h4><b>Kendiniz Deneyin!\u00a0<\/b><\/h4>\n<p>ChatGPT eklentisi beti\u011fimi <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/github.com\/brandonrobertz\/chatgpt-document-extraction\">GitHub&#8217;da kullan\u0131ma sundum.<\/a> Belki sorunlu bir veri projeniz vard\u0131r ve bunu kendiniz denemek istersiniz. Ya da belki de olas\u0131l\u0131klar\u0131 ve s\u0131n\u0131rlamalar\u0131 y\u00fcz y\u00fcze g\u00f6rmek istersiniz. \u0130\u00e7ten i\u00e7e birilerinin nihayet <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/publicfiles.fcc.gov\/\">FCC TV ve kablolu yay\u0131n siyasi reklam if\u015fa veri setini k\u0131raca\u011f\u0131n\u0131 <\/a>ve ProPublica&#8217;n\u0131n <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/projects.propublica.org\/free-the-files\/\">Free The Files <\/a>projesinden bu yana <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/wandb.ai\/deepform\/political-ad-extraction\/benchmark\">a\u00e7\u0131k kalan <\/a>b\u00f6l\u00fcm\u00fc kapataca\u011f\u0131n\u0131 umuyorum.<\/p>\n<p>Her iki durumda da, bu teknoloji hakk\u0131nda haber yapaca\u011f\u0131m\u0131z\u0131 ve bu teknolojiyi bir s\u00fcre daha kullanaca\u011f\u0131m\u0131z\u0131 hissediyorum. Herhangi bir teknolojiyi tan\u0131man\u0131n en iyi yolu onu kullanmakt\u0131r.<\/p>\n<div class=\"oembed-container\"><iframe loading=\"lazy\" title=\"ChatGPT Data Extraction: A quick demonstration\" width=\"500\" height=\"281\" src=\"https:\/\/www.youtube.com\/embed\/wsSqRv-y1r4?feature=oembed\" frameborder=\"0\" allow=\"accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture; web-share\" referrerpolicy=\"strict-origin-when-cross-origin\" allowfullscreen><\/iframe><\/div>\n<p>Bu makale ilk olarak<a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/source.opennews.org\/\"> OpenNews: Source<\/a>&#8216;da <a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/source.opennews.org\/articles\/testing-pdf-data-extraction-chatgpt\/\">yay\u0131nlanm\u0131\u015f<\/a> ve burada Creative Commons lisans\u0131 alt\u0131nda yeniden yay\u0131nlanm\u0131\u015ft\u0131r.<\/p>\n<h4><b>Ek kaynaklar<\/b><\/h4>\n<p><a href=\"https:\/\/gijn.org\/2022\/10\/03\/gazetecilikte-yapay-zeka-hakkinda-bilmeniz-gereken-10-sey\/\"><i>Gazetecilikte Yapay Zeka Hakk\u0131nda Bilmeniz Gereken 10 \u015eey<\/i><\/a><\/p>\n<p><a href=\"https:\/\/gijn.org\/2022\/03\/31\/gazetecilerin-haberde-yapay-zeka-ve-uydu-goruntulerini-kullanma-kilavuzu\/\"><i>Gazetecilerin Hik\u00e2ye Anlat\u0131m\u0131 \u0130\u00e7in Yapay Zeka ve Uydu G\u00f6r\u00fcnt\u00fclerini Kullanma K\u0131lavuzu<\/i><\/a><\/p>\n<p><a href=\"https:\/\/gijn.org\/2019\/09\/09\/beyond-the-hype-using-ai-effectively-in-investigative-journalism\/\"><i>Aldatmacan\u0131n \u00d6tesinde: Ara\u015ft\u0131rmac\u0131 Gazetecilikte Yapay Zekay\u0131 Etkili Bir \u015eekilde Kullanmak<\/i><\/a><\/p>\n<hr \/>\n<p><img decoding=\"async\" class=\"alignleft\" src=\"https:\/\/gijn.org\/wp-content\/uploads\/2023\/03\/Screenshot-2023-03-28-at-18.10.53-140x140.png\" \/><b><i><\/i><\/b><\/p>\n<p><a rel=\"noopener\" target=\"_blank\" href=\"https:\/\/source.opennews.org\/people\/brandon-roberts\/\"><b><i>Brandon Roberts<\/i><\/b><\/a><i> a\u00e7\u0131k kaynak konusunda uzmanla\u015fm\u0131\u015f ve hesaplama tekniklerini gazetecilik projelerine getiren ba\u011f\u0131ms\u0131z bir veri gazetecisidir.<\/i><\/p>\n","protected":false},"excerpt":{"rendered":"<p>PDF gibi metin belgelerini elektronik tablolara d\u00f6n\u00fc\u015ft\u00fcrmek s\u0131k\u0131c\u0131 ve pahal\u0131 bir i\u015ftir. Yapay zeka arac\u0131 ChatGPT&#8217;nin PDF&#8217;lerden ne kadar iyi veri \u00e7\u0131karabildi\u011fini g\u00f6rmek i\u00e7in veri gazetecisi Brandon Roberts iki belge setini elektronik tablolara d\u00f6n\u00fc\u015ft\u00fcrmek i\u00e7in bir Python beti\u011fi yazd\u0131.<\/p>\n","protected":false},"author":3031167,"featured_media":1191116,"comment_status":"closed","ping_status":"closed","sticky":false,"template":"","format":"standard","meta":{"_acf_changed":false,"_price":"","_stock":"","_tribe_ticket_header":"","_tribe_default_ticket_provider":"","_tribe_ticket_capacity":"0","_ticket_start_date":"","_ticket_end_date":"","_tribe_ticket_show_description":"","_tribe_ticket_show_not_going":false,"_tribe_ticket_use_global_stock":"","_tribe_ticket_global_stock_level":"","_global_stock_mode":"","_global_stock_cap":"","_tribe_rsvp_for_event":"","_tribe_ticket_going_count":"","_tribe_ticket_not_going_count":"","_tribe_tickets_list":"[]","_tribe_ticket_has_attendee_info_fields":false,"republication-tracker-tool-hide-widget":false,"footnotes":"","_tec_slr_enabled":"","_tec_slr_layout":""},"categories":[23206],"tags":[19970,23345,25423,19762,25424,19690,19917,22514],"gijn_topic":[18933],"series":[],"gijn_language":[17789],"gijn_region":[18919],"class_list":["post-635919","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-hikayeler","tag-acik-kaynak-tr","tag-ai-tr","tag-chatgpt-tr","tag-gijnturkce-tr","tag-github-tr","tag-veri-gazeteciligi-tr","tag-veri-kazima-tr","tag-yapay-zeka-tr","gijn_topic-arastirma-ipuclari-ve-araclar","gijn_language-tr-tr","gijn_region-afrika-tr"],"acf":[],"ticketed":false,"_links":{"self":[{"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/posts\/635919","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/users\/3031167"}],"replies":[{"embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/comments?post=635919"}],"version-history":[{"count":2,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/posts\/635919\/revisions"}],"predecessor-version":[{"id":1860641,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/posts\/635919\/revisions\/1860641"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/media\/1191116"}],"wp:attachment":[{"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/media?parent=635919"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/categories?post=635919"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/tags?post=635919"},{"taxonomy":"gijn_topic","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/gijn_topic?post=635919"},{"taxonomy":"series","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/series?post=635919"},{"taxonomy":"gijn_language","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/gijn_language?post=635919"},{"taxonomy":"gijn_region","embeddable":true,"href":"https:\/\/gijn.org\/tr\/wp-json\/wp\/v2\/gijn_region?post=635919"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}