Pengenalan Suara (Voice Recognition)

CODEORAYO COMMUNITY General Software Engineering Pengenalan Suara (Voice Recognition)

  • Post
    codeorayo
    Keymaster
    none
    Suara manusia merupakan media berkomunikasi yang efektif serta paling sering digunakan selain bahasa isyarat dan tulisan. Suara manusia pada dasarnya memiliki ciri khas tersendiri, sehingga dapat dikatakan suara manusia satu dengan yang lain berbeda. Ada semacam karakteristik yang membentuk kekhasan suara manusia yaitu Pitch, Formant dan Fomant Bandwith. Pengembangan aplikasi pada saat ini tidak hanya terbatas pada pengembangan tingkat aplikasi yang monoton, dimana konsumen atau pengguna menggunakan aplikasi dengan mengandalkan tombol atau sentuhan pada layar perangkat pintar (telepon genggam, tablet serta PC).

    Saat ini pengembangan aplikasi yang memiliki tingkat lebih interaktif, seperti contoh menggunakan suara (voice) atau gerakan (motion) sudah semakin banyak.

    Pengembangan aplikasi untuk tingkat pengenalan suara tidak semata-mata hanya mengerti dasar dari pemrograman, tetapi pengembang aplikasi (developer) harus mengerti bagaimana metode serta algoritma dari pengenalan suara (voice recognition) tersebut. Seperti contoh metode pencocokan suara autocorelation dan euclidean distance. Walaupun ke dua metode tersebut diterapkan akan mendapatkan hasil yang tidak jauh berbeda, tetapi ke dua metode tersebut memiliki ciri khas dan algoritma tersendiri yang perlu dikaji lebih dalam.

    Sebagai penjelasan singkat, Autocorrelation merupakan cross-correlation dari suatu sinyal kepada sinyal itu sendiri. Pada pemrosesan sinyal cross-correlation merupakan metode pengukuran dari 2 gelombang sinyal sebagai fungsi jarak waktu antara 2 sinyal tersebut. Autocorrelation dapat digunakan untuk mendeteksi pitch (fundamental frekuensi) pada suatu sinyal periodic. Sebuah cara untuk medeteksi pitch pada sinyal suara diperlukan suatu nilai autokorelasi. Nilai autikorelasi suatu sinyal suara akan menunjukkan bagaimana bentuk gelombang itu membentuk korelasi dengan diri sendiri sebagai fungsi perubahan waktu. Bentuk yang mirip (memiliki korelasi) pada setiap lag waktu tertentu menunjukkan perulangan bentuk (periodik) pola sinyal suara. Berdasarkan pola tersebut nantinya akan didapatkan nilai estimasi dari pitch (fundamental frekuensi).

    Euclidean distance merupakan metode perhitungan 2 buah titik dalam Euclidean space. Euclidean space berkaitan dengan Teorema Phytagoras dan biasanya diterapkan pada suatu template array yang berbasis 1, 2 atau 3 dimensi. Pada penelitian Damayanti Eva, beliau berhasil menerapkan Euclidean distance sebagai metode pencocokkan suara. Seorang Mahasiswa Indonesia bernama Aris, telah melakukan penelitian terhadap penggunaan metode pencocokan autocorelation dan euclidean distance pada pengenalan suara. Dihasilkan pada kedua metode tersebut untuk kasus yang sama, mendapatkan hasil yang tidak jauh berbeda. Pada metode autocorrelation, tingkat keakurasian mencapai 35% sedangkan untuk metode euclidean distance mencapai 30%.

    http://se.ittelkom-pwt.ac.id/pengenalan-suara-voice-recognition/

  • You must be logged in to reply to this topic.