Ресурси і програми української письмової та усної мови
English | Українською
Усномовна інформатика |
Технології і програми розпізнавання та розуміння мовлення |
Програма розпізнавання мовлення
|
Дедалі більше людині доводиться
взаємодіяти з комп’ютерними системами як настільними, так і
портативними та віддаленими. Технології розпізнавання мовлення дають
змогу здійснювати цю взаємодію найбільш природним для людини чином -
голосом. Розпізнавання мовлення часто називають терміном "розпізнавання мови". Це не зовсім коректно, оскільки існує окрема задача розпізнавання мови, що передбачає відповідь на запитання, якою мовою послуговується користувач, котрого ми називатимемо терміном "диктор". Інколи вживається термін "розпізнавання голосу". Це може означати і введення тексту голосом, і ідентифікацію людини за голосом, і виділення голосових сегментів у звуковому сигналі. Загалом, метою розпізнавання мовлення як розділу наукової дисципліни розпізнавання образів
є отримання різного роду інформації на основі вхідного
мовленнєвого (голосового) сигналу: про що говориться, хто говорить, якою мовою, в
якому фізичному стані перебуває диктор тощо.
Завдяки розпізнаванню мовлення вивільняються руки користувача
при керуванні комп’ютерними системами, введенні текстової інформації,
транскрибуванні (стенографуванні) фонограм тощо. Вже тепер починають
з’являтися системи, що допомагають в оволодіванні розмовною іноземною
мовою на основі технології розпізнавання мовлення. Велике майбутнє також за
системами усного перекладу. В голосових
інформаційно-довідкових системах (IVR) розпізнавання мовлення по
телефонному каналу дає можливість здійснювати пошук інформації та
замовляти різноманітні послуги. Голосові замки́ надзвичайно
перспективні для захисту персональної інформації. Якщо поруч із звуковим нам доступний зоровий канал, то його можна
використовувати як додаткову інформацію при вирішенні наведених задач.
В такому разі йдеться про технології
мультимодального розпізнавання та розуміння мовлення. А при поєднанні
технологій розуміння мовлення та синтезу мовлення за текстом виникає
система усного діалогу. В наш час у вирішенні багатьох задач розпізнавання мовлення спостерігається значний прогрес для Західних мов, особливо для англійської. Для української мови ми пропонуємо випробувати програму розпізнавання мовлення у системі диктування, яка швидко розвивається та скоро може стати незамінним помічником при взаємодії з комп’ютером, а вже зараз програма дає змогу набирати текст голосом. Наші сервіси розпізнавання мовлення дають змогу перетворювати звукозаписи на текст та відстежувати сюжети радіо та телебачення за ключовими словами. Також пропонуємо детальніше ознайомитися з іншими технологіями: розпізнавання диктора, розпізнавання мови, пошук ключових слів. Той, кого цікавлять науковий бік справи та публікації, може знайти корисну інформацію в розділі, присвяченому теоретичним засадам усномовної інформатики. Пізніше буде описано розуміння мовленнєвого сигналу та усний переклад. Обговоренню технології та програм розпізнавання на форумі КіберМови присвячений Розділ розпізнавання мовлення. |