Kümeleme Performansını Ölçmek için Yeni Bir Yöntem ve Metin Kümeleme için Değerlendirmesi

dc.contributor.authorAslanyürek, Murat
dc.contributor.authorMesut, Altan
dc.date.accessioned2024-06-12T10:05:02Z
dc.date.available2024-06-12T10:05:02Z
dc.date.issued2021
dc.departmentTrakya Üniversitesien_US
dc.description.abstractBu çalışmada kümeleme performansını ölçmek için kullanılabilecek alternatif bir yöntem önerilmiştir. Önerilen yöntemin tutarlılığını test etmek için, Wikipedia makale özetlerinden oluşan iki farklı veri kümesinde k-Means, k-Medoids ve CLARANS yöntemleri ile kümelemeler yapılmış ve hem önerdiğimiz yöntem hem de mevcut yöntemler ile performans ölçümleri hesaplanmıştır. Sadece İngilizce özetlerin olduğu ilk veri kümesi farklı sayıda kümelere ayrılarak test edilmiştir. Özetlerin içeriği hakkında önceden bilgi sahibi olunmadığı için ne kadar doğru kümelendiğini değerlendirmek için dahili yöntemler olan Silhouette, Calinski-Harabasz ve Davies-Bouldin indeksleri kullanılmıştır. 6 farklı dile ait Wikipedia özetlerini içeren ikinci veri kümesi ise özetlerin dillerine göre sınıflanmış olması için kümeleme yöntemleri ile 6 kümeye ayrılmıştır. Veri kümesindeki metinlerin hangi dile ait olduğu önceden bilindiği için kümelemenin başarısı hem dahili hem de harici yöntemler ile ölçülebilmiştir. Veri sıkıştırma algoritmalarının birbirine benzer metinlerin olduğu bir dosyayı, birbirinden farklı metinlerin olduğu dosyaya göre daha iyi sıkıştırdığı bilindiğinden, sıkışma oranının alternatif bir değerlendirme ölçütü olarak kullanılabileceği önerilmiştir. Silhouette, Calinski-Harabasz ve Davies-Bouldin indeksleri gibi dahili yöntemlere göre çok daha hızlı hesaplanabilen önerilen Sıkıştırma Oranı İndeksi (SOİ), 4 farklı sıkıştırma algoritması ile test edilmiş ve ikinci veri kümesinde kullanılan 9 harici yöntemle de aynı sonuçları vermiştir.en_US
dc.identifier.doi10.31590/ejosat.932938
dc.identifier.endpage65en_US
dc.identifier.issn2148-2683
dc.identifier.issue27en_US
dc.identifier.startpage53en_US
dc.identifier.trdizinid1174614en_US]
dc.identifier.urihttps://doi.org/10.31590/ejosat.932938
dc.identifier.urihttps://search.trdizin.gov.tr/yayin/detay/1174614
dc.identifier.urihttps://hdl.handle.net/20.500.14551/13199
dc.identifier.volume0en_US
dc.indekslendigikaynakTR-Dizinen_US
dc.language.isotren_US
dc.relation.ispartofAvrupa Bilim ve Teknoloji Dergisien_US
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanıen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.titleKümeleme Performansını Ölçmek için Yeni Bir Yöntem ve Metin Kümeleme için Değerlendirmesien_US
dc.typeArticleen_US

Dosyalar