Ukrainian Speech & Language Resources & Software
English | Українською
Усномовна інформатика |
Розпізнавання мови за мовленнєвим сигналом |
|
Задача розпізнавання мови буквально означає відповідь на запитання, якою мовою, діалектом або акцентом послуговується користувач, котрого ми називатимемо терміном "диктор". Нерідко термін "розпізнавання мови" застосовують до всього спектру задач, що стосуються розпізнавання мовленнєвого сигналу або перетворення мовлення в текст за допомогою комп’ютера. Більше про це читайте у загальному розділі технологій розпізнавання мовлення. При вирішенні задач розпізнавання мови формується так званий усномовний файл (паспорт) єдиний для всіх дикторів, що говорять однією мовою або діалектом. Усномовний паспорт формується засобами навчання/самонавчання розпізнаванню за навчальною вибіркою. Чим більша навчальна вибірка і чим ширше представлено у вибірці фонетичне розмаїття, тим кращі шанси розпізнати мову. Можливе формування паспорта диктора як з урахуванням фонемності, так і шляхом злиття усіх фонем мови в одну більш складну акустичну модель. Розпізнавання мови актуально в голосових інформаційно-довідкових системах, щоб знати, якою мовою розмовляє користувач. Далі засоби розпізнавання та синтезу мовлення дають можливість здійснювати пошук інформації та замовляти різноманітні послуги рідною мовою користувача. Не менш важливо автоматично визначати мову диктора у програмах і системах перетворення фонограм у текст, транскрибування звукозаписів та пошуку ключових слів. В наш час надійність розпізнавання мови перевищує 90% в залежності від того, чи близькі мови, які потрібно розрізнити, чи тривалий фрагмент мовлення та наскільки якісний канал передачі мовленнєвого сигналу (мікрофон, телефон, присутність шумів тощо). Про це свідчать змагання, які регулярно проводить американський інститут стандартизації. У цих змаганнях також бере участь і українська мова. На сьогодні в програмах розпізнавання мовлення, які пропонує КіберМова, вважається відомою мова, якою промовляє користувач. Функцію розпізнавання мови, якою говорить диктор, планується реалізувати для систем перетворення фонограм на текст. |