Speech
recognition atau yang dikenal juga sebagai pengenalan suara otomatis
bekerja dengan mengkonversi kata yang diucapkan dengan teks. Pengenalan
suara adalah sebuah sistem yang dilatih untuk pengguna tertentu sehingga
seseorang dapat mengakui ucapan mereka berdasarkan suara vokal mereka
yang unik. Dikenal juga dengan pengenal suara otomatis (automatic speech
recognition) atau pengenal suara komputer (computer speech recognition).
Merupakan salah satu fitur antarmuka telematika yang merubah suara
menjadi tulisan (hebat, padahal kalo lagi di dikte sama dosen juga kita
bisa ngubah suara jadi tulisan). Istilah ‘voice recognition’ terkadang
digunakan untuk menunjuk ke speech recognition dimana sistem pengenal
dilatih untuk menjadi pembicara istimewa, seperti pada kasus perangkat
lunak untuk komputer pribadi, oleh karena itu disana terdapat aspek dari
pengenal pembicara, dimana digunakan untuk mengenali siapa orang yang
berbicara, untuk mengenali lebih baik apa yang orang itu bicarakan.
Speech recognition merupakan istilah masukan yang berarti dapat
mengartikan pembicaraan siapa saja.
PRINSIP KERJA
Speaker recognition menggunakan fitur akustik
ucapan yang ditemukan berbeda pada setiap orang. Ciri akustik tersebut
disebabkan adanya perbedaan anatomi (seperti bentuk mulut dan
tenggorokan) dan kebiasaan yang berbeda seperti (penekanan dan gaya
bahasa). Perbedaan yang khas tersebut disebut “voiceprints“ yang menjadi
suatu metode biometric.
Aplikasi speech recognition diantaranya :
- “Call home”
- “call routing”
- “domotic appliance control and content-based spoken audio search”
- entri data sederhana (misalnya memasukkan nomor kartu kredit)
- penyusunan dokumen terstruktur (misalnya sebuah laporan radiologi)
- pidato-untuk-pengolahan teks (misalnya pengolah kata atau email)
- dalam pesawat terbang cockpits ( biasanya disebut Direct Voice Input)
- “Call home”
- “call routing”
- “domotic appliance control and content-based spoken audio search”
- entri data sederhana (misalnya memasukkan nomor kartu kredit)
- penyusunan dokumen terstruktur (misalnya sebuah laporan radiologi)
- pidato-untuk-pengolahan teks (misalnya pengolah kata atau email)
- dalam pesawat terbang cockpits ( biasanya disebut Direct Voice Input)
Contoh Penerapan Speech Recognition dalam medis :
Front-End SR adalah tempat penyedia perintah ke mesin pengenalan ucapan, kata-kata yang dikenali ditampilkan tepat setelah mereka berbicara.
Back-End SR adalah penyedia perintah ke sistem dikte digital, dan suara yang disalurkan melalui pidato mesin pengakuan dan rancangan dokumen yang dikenali disalurkan bersama-sama dengan suara asli file.
Front-End SR adalah tempat penyedia perintah ke mesin pengenalan ucapan, kata-kata yang dikenali ditampilkan tepat setelah mereka berbicara.
Back-End SR adalah penyedia perintah ke sistem dikte digital, dan suara yang disalurkan melalui pidato mesin pengakuan dan rancangan dokumen yang dikenali disalurkan bersama-sama dengan suara asli file.
Tidak ada komentar:
Posting Komentar