Yapay sinir ağlarını kullanarak bir ses tanıma sistemi geliştirilmesi
Yükleniyor...
Dosyalar
Tarih
2005
Yazarlar
Dergi Başlığı
Dergi ISSN
Cilt Başlığı
Yayıncı
Erişim Hakkı
info:eu-repo/semantics/openAccess
Özet
Bu çalışmada amacımız bir ses girdi cihazı ile alman konuşmayı metine çevirmektir. Bu amaç doğrultusunda konuşmacının söylediği belirli Türkçe kelimeler analiz edilerek metne çevrilip; konuşmacı bağımlı, fonem-tabanlı, ayrışık bir ses tanıma sistemi geliştirilmek istenmiştir. Birinci bölümde tezin amacı ayrıntılı bir şekilde açıklanmıştır. İkinci bölümde sesin özelliklerinden bahsedildi. Üçüncü bölümde ses tanıma işlemi hakkında bilgi verildi. îşlem adımları olarak sesin alınması, sesin sayısal kodlanması, ses sinyalini işleme teknikleri (ses analizi) ve ses sinyalinin modellenmesi ayrıntılı olarak açıklandı. Ses tanıma kullanıcıları ve kullanım alanları ile ses tanıma avantajları ve smırlamalarmdan bahsedildi. Dördüncü bölümde ses sinyalinin modellenmesinde kullamlan Saklı Markov Modelleri (SMM)'nin teorisi ve ses tanımadaki uygulaması anlatılmıştır. Beşinci bölümünde yine ses sinyali modelleme telcniklerinden biri olan ve tezimizin uygulama aşamasında faydalandığımız Yapay Sinir Ağları (YSA), teorisi ve ses tanımadaki kullanımı ile açıklanmıştır. Altıncı bölümde ses tanıma sistemimizin genel yapısı hakkında bilgi verildi. Sistemimizi oluşturan modüllerin uygulamamızdaki görevleri açıklandı. Yedinci bölümde sistemimizin genel yapısı ve gerçekleştirimi hakkında bilgi verildi. Sekizinci bölümde elde ettiğimiz sonuçlar ve programın genel bir değerlendirmesi yapıldı.
In this study, our aim is to transform a speech fragment received via a sound reception instrument to a text fragment. To this effect, a speaker-dependent, phoneme- based and discrete speech recognition system has been developed that is intended to decode certain Turkish words uttered by a certain speaker into a textual format. In Section 1, the aim of the thesis is explained in detail. In Section 2, the acoustic features of sound are presented. In Section 3, some background information is given about the process of speech recognition. The phases of this process, which are sound reception, digitalization of the sound, processing sound signals (sound analysis) and modelling the sound signal, are given a detailed explanation. Users and areas of use of speech recognition systems are briefly presented along with the advantages of and constraints on these systems. In Section 4, an explanation is offered for the theory of Hidden Markov Models (HMMs), which is used in modelling the sound signal, and its application in speech recognition. In Section 5, an explanation is offered for the theory of Neural Artificial Network (ANN) which is used in modelling the sound signal, and its application in speech recognition. In Section 6, some information is given about the top-level structure of our speech recognition system. The modules constituing our system is presented in terms of the tasks they perform. In Section 7, the general structure of our system and its implementation are described. In Section 8, an evaluation is given for the findings we have obtained and for the program we have realized.
In this study, our aim is to transform a speech fragment received via a sound reception instrument to a text fragment. To this effect, a speaker-dependent, phoneme- based and discrete speech recognition system has been developed that is intended to decode certain Turkish words uttered by a certain speaker into a textual format. In Section 1, the aim of the thesis is explained in detail. In Section 2, the acoustic features of sound are presented. In Section 3, some background information is given about the process of speech recognition. The phases of this process, which are sound reception, digitalization of the sound, processing sound signals (sound analysis) and modelling the sound signal, are given a detailed explanation. Users and areas of use of speech recognition systems are briefly presented along with the advantages of and constraints on these systems. In Section 4, an explanation is offered for the theory of Hidden Markov Models (HMMs), which is used in modelling the sound signal, and its application in speech recognition. In Section 5, an explanation is offered for the theory of Neural Artificial Network (ANN) which is used in modelling the sound signal, and its application in speech recognition. In Section 6, some information is given about the top-level structure of our speech recognition system. The modules constituing our system is presented in terms of the tasks they perform. In Section 7, the general structure of our system and its implementation are described. In Section 8, an evaluation is given for the findings we have obtained and for the program we have realized.
Açıklama
Anahtar Kelimeler
Ses Tanıma, Yapay Sinir Ağları, Hızlı Fourier Dönüşümü, Saklı Markov Modelleri, Konuşmacı Bağımlı Ses Tanıma, Fonem Tabanlı Ses Tanıma