Twitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizi

dc.contributor.authorGünçe, Enes
dc.contributor.authorCarus, Aydın
dc.date.accessioned2024-06-12T10:05:02Z
dc.date.available2024-06-12T10:05:02Z
dc.date.issued2020
dc.departmentTrakya Üniversitesien_US
dc.description.abstractTwitter gibi sosyal ağlar, insanların iletişim kurması için popüler bir platform haline gelmiştir. Bireysel kullanıcıların yanı sıra kurumlar ve şirketler de ürün tanıtımı, pazarlama ya da herhangi bir konu hakkında geri bildirim alma gibi daha birçok nedenden dolayı bu sahaya ilgi duymaktadır. Kurumların ve şirketlerin hedefi, kişilerin ilgilendikleri ürün ve alanlar dışında gereksiz bilgiler ile rahatsız edilmemesini sağlamaktır. Bunun için de kurum ve şirketler, paylaşım yapanın kadın veya erkek oluşu, tweetin ilgili olduğu alan gibi bilgilere ihtiyaç duymakta ve bu bilgilere bağlı olarak, kendi hedef kitlelerine ulaşmak için çeşitli çalışmalar yapmaktadır. Bu çalışmada Twitter’da üretilen içeriklerden yola çıkılarak, paylaşım yapanın cinsiyeti ve paylaşılan tweetin ilgi alanı için tahmin yapılmıştır. Bu amaçla, Twitter Uygulama Programlama Arayüzü (API- Application Programming Interface) kullanan bir uygulama geliştirilmiştir. Bu uygulama kullanılarak, iki farklı eğitim seti oluşturmaya yönelik veriler toplanmıştır. Cinsiyet tespitine yönelik eğitim seti için, tweetler filtreleme yapılmadan toplanmıştır. İlgi alanı tespitine yönelik eğitim seti için, tweetler farklı ilgi alanları için belirlenmiş anahtar kelime kümeleri yardımıyla, filtreleme yapılarak toplanmıştır. Daha sonra, bu tweetler, etiketleme çalışmasına kolaylık sağlaması amacıyla uygulama kullanılarak el ile etiketlenmiştir. Çeşitli denemeler yapılarak, özniteliklerin belirlenmesinin ardından, gözetimli makine öğrenmesinde kullanılacak iki farklı eğitim seti oluşturulmuştur. Oluşturulan bu eğitim setleri kullanılarak; Naive Bayes, K-En Yakın Komşu Algoritması (KNN- K-Nearest Neighbors), C4.5, Destek Vektör Makineleri (SVM- Support Vector Machine) ve Ardışık Minimal Optimizasyon algoritmaları (SMO- Sequential Minimal Optimization) için modeller oluşturulmuştur. Modellerin başarımı, kappa istatistik ve doğruluk ölçütleri dikkate alınarak değerlendirilmiştir. Elde edilen modellerin başarımları değerlendirildiğinde; cinsiyet tahmini için oluşturulan modeller içinde, en düşük başarıma %44,6 doğruluk ve 0.17 kappa değeri ile SVM algoritması sahipken en yüksek başarımı %99,9 doğruluk ve 0.99 kappa değeri ile SMO algoritması sağlamıştır. Aynı şekilde ilgi alanı için oluşturulan modeller içinde en düşük başarımı %47,9 doğruluk ve 0.37 kappa değeri ile SVM algoritması vermişken en yüksek başarım %93,18 doğruluk ve 0.91 kappa değeri ile KNN algoritması tarafından sağlanmıştır. Doğruluk değerleri ve kappa değerlerinin birbiri ile uyumlu olduğu görülmüştür.en_US
dc.identifier.doi10.31590/ejosat.819722
dc.identifier.endpage194en_US
dc.identifier.issn2148-2683
dc.identifier.issueEjosat Özel Sayı 2020 (ISMSIT)en_US
dc.identifier.startpage187en_US
dc.identifier.trdizinid485033en_US]
dc.identifier.urihttps://doi.org/10.31590/ejosat.819722
dc.identifier.urihttps://search.trdizin.gov.tr/yayin/detay/485033
dc.identifier.urihttps://hdl.handle.net/20.500.14551/13196
dc.identifier.volume0en_US
dc.indekslendigikaynakTR-Dizinen_US
dc.language.isotren_US
dc.relation.ispartofAvrupa Bilim ve Teknoloji Dergisien_US
dc.relation.publicationcategoryMakale - Ulusal Hakemli Dergi - Kurum Öğretim Elemanıen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.titleTwitter Platformunda Makine Öğrenmesi Algoritmalarıyla Cinsiyet ve İlgi Analizien_US
dc.typeArticleen_US

Dosyalar