Makine öğrenmesi ile Türkçe haber metinlerinde anahtar ifade çıkarımı

dc.contributor.advisorUçar, Erdem
dc.contributor.authorÇetingöz, Mustafa
dc.date.accessioned2017-04-20T08:38:51Z
dc.date.available2017-04-20T08:38:51Z
dc.date.issued2011
dc.departmentEnstitüler, Fen Bilimleri Enstitüsü, Bilgisayar ve Öğretim Teknolojileri Eğitimi Ana Bilim Dalıen_US
dc.descriptionYüksek Lisans Tezitr
dc.description.abstractSayısal kaynakların çokluğu ve genel ağda (internet) yaşanan gelişmeler, üretilen bilgi miktarında artış yaşanması sonucunu doğurmaktadır. Bilgi erişimi, ulaşılmak istenen bilgi kaynaklarının düzenlenmesi, istenildiğinde bilgiye en kısa zamanda ve en kolay şekilde ulaşılmasının sağlanması ile ilgilenen bir araştırma konusudur. Metin işleme; bilgi erişiminin önemli konuları arasındadır. Ayrıca, ses ve görüntü gibi bilgi kaynaklarına erişim konuları da ilgili çalışmalar arasında yer almaktadır. Metin işlemenin alt konuları arasında ise, metnin özetlenmesi, metni karakterize edecek anahtar ifadelerin belirlenmesi gibi uygulamalar bulunmaktadır. Anahtar ifade, bir metnin içeriğini özetleyen anlamsal kelime ya da kelimeler topluluğudur. Anahtar ifade ile, bir metnin tamamının okunmasına gerek kalmayacak şekilde metnin içeriği hakkında fikir sahibi olunması amaçlanmaktadır. Otomatik anahtar ifade çıkarımı ise, insan eliyle çıkarılan anahtar ifadelere en yakın anahtar ifadelerin bulunması işlemidir. Otomatik anahtar ifade çıkarımı alanında hâlen açık kaynak kodlu yazılım olan KEA (Keyphrase Extraction Algorithm) algoritması ile İngilizce, İspanyolca ve Fransızca dilleri için yapılmış yazılımlar sıkça kullanılmaktadır. Kea algoritması, bir metin üzerinde sözcüksel yöntemler kullanılarak aday anahtar ifadelerin belirlenmesi, her aday ifade için özellik değerlerinin hesaplanması ve ardından makine öğrenme yöntemlerini kullanarak aday ifadeler arasından uygun olanın seçimi adımlarından oluşur. Bu çalışmada da Türkçe haber metinlerinden elde edilen eğitim ve test verileri kullanılarak, KEA algoritması ile ve ilave bir özellik eklenerek oluşturulan KEA-SPR algoritması ile uygulama geliştirilmiş, ilave edilen özellik için performans karşılaştırılması yapılmıştır.en_US
dc.description.abstractAbstracten_US
dc.description.abstractThe abundance of digital sources and developments in the general network (internet) have resulted in the increase in the amount of produced information. Information retrieval is a research subject dealing with the organization of information sources to be reached and with providing information easily and as soon as possible if required. Especially text processing and additionally studies about the subjects concerning the access to information sources such as sound and video have taken part among the subjects of information retrieval. In addition, implementations such as summarization of text, determination of the keyphrases to characterize the text have taken part among the sub-questions of text processing. Keyphrase is a semantic word or phrase summarizing the content of a text. By using keyphrases, it is aimed to have an opinion about the content of a text without reading it completely. Automatic keyphrase extraction is deducing the most proximate keyphrases to the one inferred by people. It is still possible to encounter frequently the use of software designed for English, Spanish and French languages with the open source software KEA (Keyphrase Extraction Algorithm) on the subject of automatic keyphrases extraction. The Kea algorithm consists of determining the candidate keyphrases on a text by using lexical methods, calculating the feature value for each candidate and then choosing the most convenient candidate among the candidate phrases by using machine learning methods. In this study, the application has been developed through the KEA algorithm and KEA-SPR algorithm constituted with an additional feature by using the data of education and test obtained from Turkish news texts and also the performance comparison has been made for the additional feature.en_US
dc.identifier.urihttps://hdl.handle.net/20.500.14551/2137
dc.identifier.yoktezid300167en_US
dc.language.isotren_US
dc.publisherTrakya Üniversitesi Fen Bilimleri Enstitüsüen_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectBilgisayar MühendisliğiBbilimlerien_US
dc.subjectBilgisayar ve Kontrolen_US
dc.subjectComputer Engineeringen_US
dc.subjectComputer Scienceen_US
dc.subjectMakine Öğrenmesien_US
dc.subjectMachine Learningen_US
dc.titleMakine öğrenmesi ile Türkçe haber metinlerinde anahtar ifade çıkarımıen_US
dc.title.alternativeKeyphrase extraction for Turkish news text with machine learning methodsen_US
dc.typeMaster Thesisen_US
dc.type.descriptionNo: 0058991en_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
MUSTAFA ÇETİNGÖZ.pdf
Boyut:
852.27 KB
Biçim:
Adobe Portable Document Format
Açıklama:
Tam Metin / Full Text
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.68 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: