Telematika: SPEECH RECOGNITION

Speech recognition atau yang dikenal juga sebagai pengenalan suara otomatis bekerja dengan mengkonversi kata yang diucapkan dengan teks. Pengenalan suara adalah sebuah sistem yang dilatih untuk pengguna tertentu sehingga seseorang dapat mengakui ucapan mereka berdasarkan suara vokal mereka yang unik. Dikenal juga dengan pengenal suara otomatis (automatic speech recognition) atau pengenal suara komputer (computer speech recognition). Merupakan salah satu fitur antarmuka telematika yang merubah suara menjadi tulisan (hebat, padahal kalo lagi di dikte sama dosen juga kita bisa ngubah suara jadi tulisan). Istilah ‘voice recognition’ terkadang digunakan untuk menunjuk ke speech recognition dimana sistem pengenal dilatih untuk menjadi pembicara istimewa, seperti pada kasus perangkat lunak untuk komputer pribadi, oleh karena itu disana terdapat aspek dari pengenal pembicara, dimana digunakan untuk mengenali siapa orang yang berbicara, untuk mengenali lebih baik apa yang orang itu bicarakan. Speech recognition merupakan istilah masukan yang berarti dapat mengartikan pembicaraan siapa saja.

PRINSIP KERJA

Speaker recognition menggunakan fitur akustik ucapan yang ditemukan berbeda pada setiap orang. Ciri akustik tersebut disebabkan adanya perbedaan anatomi (seperti bentuk mulut dan tenggorokan) dan kebiasaan yang berbeda seperti (penekanan dan gaya bahasa). Perbedaan yang khas tersebut disebut “voiceprints“ yang menjadi suatu metode biometric.

Aplikasi speech recognition diantaranya :
- “Call home”
- “call routing”
- “domotic appliance control and content-based spoken audio search”
- entri data sederhana (misalnya memasukkan nomor kartu kredit)
- penyusunan dokumen terstruktur (misalnya sebuah laporan radiologi)
- pidato-untuk-pengolahan teks (misalnya pengolah kata atau email)
- dalam pesawat terbang cockpits ( biasanya disebut Direct Voice Input)

Contoh Penerapan Speech Recognition dalam medis :
Front-End SR adalah tempat penyedia perintah ke mesin pengenalan ucapan, kata-kata yang dikenali ditampilkan tepat setelah mereka berbicara.
Back-End SR adalah penyedia perintah ke sistem dikte digital, dan suara yang disalurkan melalui pidato mesin pengakuan dan rancangan dokumen yang dikenali disalurkan bersama-sama dengan suara asli file.

Telematika

Jumat, 12 Oktober 2012

SPEECH RECOGNITION

Tidak ada komentar:

Posting Komentar