Türkçe twitter verileri üzerinde güvenilirlik skorlama ile sahte haber tespiti

dc.contributor.advisorAydın, Özlem
dc.contributor.authorKantarci, Hüsein
dc.date.accessioned2023-12-27T13:11:46Z
dc.date.available2023-12-27T13:11:46Z
dc.date.issued2023
dc.date.submitted2023
dc.departmentEnstitüler, Fen Bilimleri Enstitüsü, Bilgisayar Mühendisliği Anabilim Dalıen_US
dc.description.abstractGünümüzde, internet üzerindeki veri yığını özellikle sosyal medya aracılığıyla hızla büyümektedir. Bu veri yığını, kullanıcılar tarafından kasıtlı veya kasıtsız bir şekilde paylaşılan ve doğruluğu ile güvenilirliği sorgulanması gereken bilgilerle doludur. Özellikle yanlış bilginin tekrarlandığında insanların inançlarını çarpıtabileceği gerçeği göz önünde bulundurulduğunda, sosyal mecralarda karşılaşılan bu tekrarlı ve tehlikeli haberlerin önüne geçmeye yönelik yapılan çalışmaların büyük önemi ortaya çıkmaktadır. Bu çalışmada, Twitter veri setindeki tweetlerin güvenilirlik skorlaması yapmak amacıyla denetimsiz makine öğrenmesi kullanılarak sahte haberlerin tespiti yapılmıştır. Türkçe Twitter haber veri setinin bir kısmı, önceden belirlenmiş kullanıcılar tarafından atılmış tweetler toplanarak manuel bir şekilde etiketlenmiştir. Daha sonra K-Means modeli eğitilerek, manuel olarak etiketlenmiş verilerle karşılaştırılmıştır. Elde edilen sonuçlar değerlendirildiğinde, modelin F1 skoru olarak 0.33 başarı elde etmiştir. Bu sonuçlar, modelin sosyal medya platformlarında yanlış bilgi tespitinde potansiyel bir etkinlik gösterdiğini ve kullanıcıları yanıltıcı içeriklerden korumada önemli bir adım olduğunu ortaya koymaktadır.en_US
dc.description.abstractIn today's world, the data on the internet is rapidly growing, especially through social media. This data is filled with information shared by users, intentionally or unintentionally, that needs to be questioned for its accuracy and reliability. Particularly, considering the fact that misinformation can distort people's beliefs when repeated, the importance of efforts to combat repetitive and dangerous news encountered on social platforms becomes evident. In this study, unsupervised machine learning is employed to perform credibility scoring on tweets from the Twitter dataset. A portion of the Turkish Twitter news dataset is manually labeled by collecting tweets from pre-determined users. Subsequently, the KMeans model is trained and compared with the manually labeled data. The results show that the model achieved an F1 score of 0.33, indicating its potential effectiveness in detecting false information on social media platforms and representing a significant step towards safeguarding users from misleading content.en_US
dc.identifier.urihttps://hdl.handle.net/20.500.14551/8655
dc.identifier.yoktezid824843en_US
dc.language.isotren_US
dc.publisherTrakya Üniversitesi Fen Bilimleri Enstitüsüen_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectSahte haber tespitien_US
dc.subjectDenetimsiz öğrenmeen_US
dc.subjectK-Means modelien_US
dc.subjectFake news detectionen_US
dc.subjectUnsupervised learningen_US
dc.subjectK-Means modelen_US
dc.titleTürkçe twitter verileri üzerinde güvenilirlik skorlama ile sahte haber tespitien_US
dc.title.alternativeFake news detection with credibility scoring on Turkish Twitter dataen_US
dc.typeMaster Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
0192758.pdf
Boyut:
737.93 KB
Biçim:
Adobe Portable Document Format
Açıklama:
Tam Metin / Full Text
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.44 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: