Yapay sinir ağlarını kullanarak bir ses tanıma sistemi geliştirilmesi

Yükleniyor...
Küçük Resim

Tarih

2005

Dergi Başlığı

Dergi ISSN

Cilt Başlığı

Yayıncı

Erişim Hakkı

info:eu-repo/semantics/openAccess

Özet

Bu çalışmada amacımız bir ses girdi cihazı ile alman konuşmayı metine çevirmektir. Bu amaç doğrultusunda konuşmacının söylediği belirli Türkçe kelimeler analiz edilerek metne çevrilip; konuşmacı bağımlı, fonem-tabanlı, ayrışık bir ses tanıma sistemi geliştirilmek istenmiştir. Birinci bölümde tezin amacı ayrıntılı bir şekilde açıklanmıştır. İkinci bölümde sesin özelliklerinden bahsedildi. Üçüncü bölümde ses tanıma işlemi hakkında bilgi verildi. îşlem adımları olarak sesin alınması, sesin sayısal kodlanması, ses sinyalini işleme teknikleri (ses analizi) ve ses sinyalinin modellenmesi ayrıntılı olarak açıklandı. Ses tanıma kullanıcıları ve kullanım alanları ile ses tanıma avantajları ve smırlamalarmdan bahsedildi. Dördüncü bölümde ses sinyalinin modellenmesinde kullamlan Saklı Markov Modelleri (SMM)'nin teorisi ve ses tanımadaki uygulaması anlatılmıştır. Beşinci bölümünde yine ses sinyali modelleme telcniklerinden biri olan ve tezimizin uygulama aşamasında faydalandığımız Yapay Sinir Ağları (YSA), teorisi ve ses tanımadaki kullanımı ile açıklanmıştır. Altıncı bölümde ses tanıma sistemimizin genel yapısı hakkında bilgi verildi. Sistemimizi oluşturan modüllerin uygulamamızdaki görevleri açıklandı. Yedinci bölümde sistemimizin genel yapısı ve gerçekleştirimi hakkında bilgi verildi. Sekizinci bölümde elde ettiğimiz sonuçlar ve programın genel bir değerlendirmesi yapıldı.
In this study, our aim is to transform a speech fragment received via a sound reception instrument to a text fragment. To this effect, a speaker-dependent, phoneme- based and discrete speech recognition system has been developed that is intended to decode certain Turkish words uttered by a certain speaker into a textual format. In Section 1, the aim of the thesis is explained in detail. In Section 2, the acoustic features of sound are presented. In Section 3, some background information is given about the process of speech recognition. The phases of this process, which are sound reception, digitalization of the sound, processing sound signals (sound analysis) and modelling the sound signal, are given a detailed explanation. Users and areas of use of speech recognition systems are briefly presented along with the advantages of and constraints on these systems. In Section 4, an explanation is offered for the theory of Hidden Markov Models (HMMs), which is used in modelling the sound signal, and its application in speech recognition. In Section 5, an explanation is offered for the theory of Neural Artificial Network (ANN) which is used in modelling the sound signal, and its application in speech recognition. In Section 6, some information is given about the top-level structure of our speech recognition system. The modules constituing our system is presented in terms of the tasks they perform. In Section 7, the general structure of our system and its implementation are described. In Section 8, an evaluation is given for the findings we have obtained and for the program we have realized.

Açıklama

Anahtar Kelimeler

Ses Tanıma, Yapay Sinir Ağları, Hızlı Fourier Dönüşümü, Saklı Markov Modelleri, Konuşmacı Bağımlı Ses Tanıma, Fonem Tabanlı Ses Tanıma

Kaynak

WoS Q Değeri

Scopus Q Değeri

Cilt

Sayı

Künye