Plugie
Feel Free To Blog
Speech Recognition For Indonesian Language
Posted on 28 June 2007 by admin
Almost people in the world has a dream to make a machine which can understand what people says. Maybe it is still far away from perfection. A lot of algorithms has been tried to face this goal. One kind of algorithm is to make a model for words using HMMs. Generally, there are two kind of HMMs: DHMMs and CDHMMs. These algorithms will be tried to recognize indonesian words, such as: satu, dua, tiga, and empat in the case independent speaker. The uterances of 7 men and 8 women are going to be used for testing. For training, uterances from 5 men and 5 women will be used.
Cepstral, log energi, and fundamental frequency are used for speech features. There will be 7 variations for this combination of features. The features that give the best performance will be reported. Cepstral coefficient is got from LPC coefficient. While, SIFT algorithm will be used for search fundamental frequency.
After make some experiments, number of code vector which used for quantize vector in DHMMs system, has a big influence on DHMMs performance. Not always the bigger of number of codevector give the bigger performance. Features that give the best performance in DHMMs system is cepstral using 8 code vector. The result is the system that can recognize 128 uterances from 150 variations (85,3%).
For CDHMMs system, combination of cepstral, log energy, and frequency fundamental give the best performance which can recognize 143 uterances (95,3%).
Cepstral, log energi, and fundamental frequency are used for speech features. There will be 7 variations for this combination of features. The features that give the best performance will be reported. Cepstral coefficient is got from LPC coefficient. While, SIFT algorithm will be used for search fundamental frequency.
After make some experiments, number of code vector which used for quantize vector in DHMMs system, has a big influence on DHMMs performance. Not always the bigger of number of codevector give the bigger performance. Features that give the best performance in DHMMs system is cepstral using 8 code vector. The result is the system that can recognize 128 uterances from 150 variations (85,3%).
For CDHMMs system, combination of cepstral, log energy, and frequency fundamental give the best performance which can recognize 143 uterances (95,3%).
To be continued ..
mahasiswa stt telkom (sekarang IT Telkom).,sedang mengajukan judul TA tentang
aplikasi speech to text pada hp berbasis j2me dengan metode dicrette hidden markov menggunakan algoritma LPC(Linear Predictive Coding) yang diolah oleh modul VQ(vector quantization)
tapi masih meraba-raba.
mohon bantuannya pak.
terima kasih
Apa yang saya buat adalah speech to text, jadi kebalikannya yang akan Anda buat. Di TA saya memang ada bahasan DHMM, VQ dan LPC Anda bisa cari di perpustakaan STT Telkom dengan judul Analisis DHMMs dan CDHMMs untuk Isolated-Word Recognition.
mohon pencerahan pak…
apa yang dimaksud dengan IVR…
terima kasih
Jadi proses speech to text tidak dilakukan di HP melainkan di server.
Yang paling penting dari mekanisme ini adalah MSC operator dapat mem forward setiap call yang diawali * ke server IVR dan juga memforward no tujuan setelah * tersebut ke IVR.
mohon bantuannya……………..
ada contohnya gak ya…………
Semoga bermanfaat
ditunggu kabarnya
aq hanya ingin nanya nih ama teman2
klo tau silahkan kirim ke email q ini
morrisrobertus@yahoo.com
pertanyaannya
1.Apakah dalam pembuatan aplikasi voice recognition diperlukan mikrofon untuk sebuah laptop?
2.Apakah dalam pembuatan aplikasi voice recognition bisa dalam bahasa java?
Thanks klo uda berpartisipasi klo mau mengirim email ke aq.
salam persahabatan.
1. Mikrofon berguna untuk mengubah sinyal suara menjadi sinyal listrik. Untuk membuat aplikasi orang menggunakan bahasa pemrograman misalnya java.
2. Saya belum pernah membuat aplikasi voice recognition menggunakan java. Tapi secara teori harusnya bisa.
Penasaran ama voice recognition dengan bahasa pemrograman java kira-kira sperti apa y???
maap masih awam soalnya
1.pernahkah admin membuat sebuah aplikasi speech recognition?
2.apa-apa aja yang ada dalam aplikasi speech recognition tersebut?
trimakasih admin………
1. pernah untuk keperluan skripsi.
2. tulisan di atas adalah abstraksi dari skripsi yang dibuat. Ada proses recording, pelatihan model dan pengenalan suara. Analisis LPC dan cepstral, proses kuantisasi. Grafik LPC, sinyal suara dan kayak nya masih banyak lagi.. soalnya dah lupa..
ada beberapa pertanyaan yang ingin saya tanyakan kepada admin diantaranya :
1. untuk proses recording seperti apa
2. dan bagaimana cara untuk pelatihan model pengenalan suara nya kebetulan saya menggunakan metode HMM..
terimakasih atas jawabanya…..
perkenalkan namaku puphe, aku gi nyari topik TA ttg speech to text, rencananya menggunakan software matlab..
yang pengen aku tanyain:
1. pengetahuan dasar apa yang perlu saya ketahui untuk mengangkat topik ini??
2. BUku yang paling bagus untuk di baca apa ? dah ada yang berbahasa Indonesia g??
saya mau tanya masalh speech recognize nih…
Apa udah ada aplikasi yang digunakan untuk mengubah suara ke teks menggunkan bahasa indonsia?
otepad.exe dan sekaligus dapat mengeja per huruf untuk membentuk sebuah kata….(dengan menyebut satu per satu huruf maka akn tampil jg di notepad shg dpt membentuk kalimat )
waktu lagi nyari2 ketemu nih judul speech recognition,
n saya tertarik ama nih judul tapi masih blum kebayang alur program nya…
mudah-mudahan admin berkenan untuk membalas n membantu saya karena, nih posting kan dah cukup lama…
saya cukup tertarik dengan topik speech recognition ini.
yg terpikir di benak saya adalah speech recognition to text tapi apakah sudah ada penerapannya dalam pembentukan lirik lagu?kalau ada dengan menggunakan metode apa ya?
terima kasih sekali jika bapak mau menjawab dan membantu
dengan nama siapapun ,salah satunya penyimpan73@yahoo.com
http://www.kaskus.us/showthread.php?p=157682033#post157682033
sebaiknya jangan menggunakan jasa yg tidak dikenal
Saya berencana buat aplikasi pengenlan suara, dimana aplikasii tersebut mapu membedakan suara laki-laki atau perempuan,
Mohon Pencerahan nya
Tapi saya masih bingung, apa aja yg harus sya pelajari n kuasai?
pemrograman pa yg ccok bt kasus saya d’atas?
adakah buku, artikel atau referensi yg bagus bt mendukung tugas akhir saya?
taufiq_moesliem@yahoo.com