Derin öğrenme ile ilaç moleküllerinin sınıflandırılması

dc.contributor.advisorKorkmaz, Selçuk
dc.contributor.advisorSüt, Necdet
dc.contributor.authorKanberiz, Hatice
dc.date.accessioned2020-07-24T11:58:05Z
dc.date.available2020-07-24T11:58:05Z
dc.date.issued2020
dc.date.submitted2020
dc.departmentEnstitüler, Sağlık Bilimleri Enstitüsü, Biyoistatistik ve Tıbbi Bilişim Ana Bilim Dalıen_US
dc.description.abstractİlaç geliştirme çalışmalarının erken evresinde binlerce molekül arasından aktivite gösteren moleküller tespit edilerek ilaç geliştirme çalışmalarına harcanan süre ve maliyet azaltılmaya çalışılmaktadır. Bu amaçla yüksek verimli tarama deneyleri yapılarak moleküller aktif ve inaktif olarak sınıflandırılmaktadır. Bu deneylerden elde edilen veriler PubChem veri tabanına yüklenmektedir. Bu veri tabanındaki veriler kullanılarak makine öğrenimi algoritmaları yardımıyla sınıflandırma modelleri geliştirilebilir, böylece aktivite gösteren moleküller daha hızlı ve daha ucuz bir şekilde tespit edilebilir. Bu çalışmada PubChem veri tabanından elde edilen farklı derecelerde dengesizlik yapısına sahip 5 adet veri seti derin sinir ağları (DSA) algoritmasıyla eğitilmiştir. Eğitilen DSA algoritmasının performansı literatürde sıklıkla kullanılan destek vektör makineleri (DVM) ve random forest (RF) algoritmalarıyla karşılaştırılmıştır. Algoritmaların performans karşılaştırmasında dengeli doğruluk oranı, duyarlılık, pozitif kestirim değeri, F1 skor, MCC ölçütleri göz önüne alınmıştır. Bu ölçütler değerlendirildiğinde, pozitif kestirim değeri dışındaki diğer ölçütler açısından, özellikle dengesiz veri setlerinde performans değerlendirmesinde en önemli ölçütlerden olan F1 skor ve MCC açısından, DSA algoritmasının DVM ve RF algoritmalarına göre daha yüksek performans gösterdiği görülmüştür. Sonuç olarak, DSA algoritması dengesiz veri yapılarında diğer makine öğrenimi algoritmalarına göre daha iyi bir performans gösterdiği için ilaç geliştirme çalışmalarına harcanan süreyi ve maliyeti azaltmada tercih edilebilecek iyi bir makine öğrenimi algoritmasıdır.en_US
dc.description.abstractIn the early stages of drug development studies, molecules that are active among thousands of molecules are identified and the time and cost spent on drug development studies are tried to be reduced. For this purpose, molecules are classified as active and inactive by performing high-throughput screening experiments. The data obtained from these experiments are uploaded to PubChem database. By using the data in this database, classification models can be developed with the help of machine learning algorithms, so that the molecules showing activity can be detected faster and cheaper. In this study, 5 data sets with different degree of imbalance structure obtained from PubChem database were trained with deep neural network (DSA) algorithm. The performance of the trained DSA algorithm was compared with the support vector machines (DVM) and random forest (RF) algorithms that are frequently used in the literature. Balanced accuracy, sensitivity, positive predictive value, F1 score and MCC criteria were taken into consideration in the performance comparison of the algorithms. When these criteria were evaluated, it was observed that DSA algorithm performed better than DVM and RF algorithms in terms of F1 score and MCC which is one of the most important criteria in performance evaluation especially in unbalanced data sets in terms of other criteria except positive predictive value. As a result, DSA algorithm is a good machine learning algorithm that can be preferred in reducing time and cost spent on drug development studies because it performs better in unbalanced data structures than other machine learning algorithms.en_US
dc.identifier.urihttps://hdl.handle.net/20.500.14551/5147
dc.identifier.yoktezid614306en_US
dc.language.isotren_US
dc.publisherTrakya Üniversitesi, Sağlık Bilimleri Enstitüsüen_US
dc.relation.publicationcategoryTezen_US
dc.rightsinfo:eu-repo/semantics/openAccessen_US
dc.subjectPubChem,en_US
dc.subjectDerin Öğrenmeen_US
dc.subjectDengesiz Verien_US
dc.subjectDestek Vektör Makinelerien_US
dc.subjectRandom Foresten_US
dc.subjectSanal Taramaen_US
dc.subjectDeep Learningen_US
dc.subjectUnbalanced Dataen_US
dc.subjectSupport Vector Machinesen_US
dc.subjectRandom Foresten_US
dc.subjectVirtual Screningen_US
dc.titleDerin öğrenme ile ilaç moleküllerinin sınıflandırılmasıen_US
dc.title.alternativeActivity classification of drug molecules using deep learningen_US
dc.typeMaster Thesisen_US

Dosyalar

Orijinal paket
Listeleniyor 1 - 1 / 1
Yükleniyor...
Küçük Resim
İsim:
0170062.pdf
Boyut:
1.31 MB
Biçim:
Adobe Portable Document Format
Açıklama:
Lisans paketi
Listeleniyor 1 - 1 / 1
Küçük Resim Yok
İsim:
license.txt
Boyut:
1.44 KB
Biçim:
Item-specific license agreed upon to submission
Açıklama: