Ukrainian Speech & Language Resources & Software
English | Українською
Усномовна інформатика |
Пошук ключових слів у потоці мовлення
|
|
Пошук ключових слів передбачає знаходження у потоці мовлення сегментів, що відповідають певним словам або словосполученням. Інколи виникає потреба шукати набір слів, що знаходяться досить близько один до одного. Розв’язуючи задачу пошуку ключових слів, можна спочатку перетворити мовлення на текст, а вже потім шукати ключові слова у тексті. Втім, у цьому випадку закладається доволі суттєва помилка, що можлива при розпізнаванні мовлення. Крім того, при такому підході в принципі неможливо знайти слова, які не увійшли до словника розпізнавання. Загалом при досить високій надійності системи розпізнавання та словнику на мільйон і більше слів описаний спосіб себе виправдовує. Особливо приваблює можливість індексувати зміст розпізнаного тексту, що робить пошук практично моментальним. Інший підхід засновано на формуванні акустичної моделі шуканих ключових слів та на порівнянні цієї моделі з акустичним сигналом. Акустична модель слова виводиться з його фонемної транскрипції або будується на підставі сигналу вимовленого слова. у другому випадку, щоправда, прив’язаність до конкретного диктора гарантує успішний пошук лише у фонограмах голосу цього диктора. Порівняно з підходом, що передбачає попереднє перетворення мовлення на текст, час пошуку досить тривалий і вимірюється у відсотках від довжини сигналу. Також відсутня можливість скористатися лінгвістичною інформацією щодо контексту слів. Це не дає змогу відсіювати випадки хибного спрацювання на словах, які насправді є складовими деякого іншого довшого слова. Так ключове слово "позиція" помилково може бути знайдене у слові "опозиція". Наведені два підходи займають крайні позиції. Свого роду компромісом є так званий фонемний пошук, коли мовлення спочатку перетворюється на послідовність не слів, а фонем. Далі пошук здійснюється на підставі фонемних транскрипцій ключових слів. У цьому випадку з’являється можливість символьної індексації, що суттєво прискорює пошук. Крім того, за фонемним контекстом можна будувати найбільш вірогідні гіпотези контексту слів, що дає змогу відкидати такі слова, які насправді є складовими інших слів. Будь-яка система пошуку ключових слів має такий параметр, як чутливість. При збільшенні чутливості зменшується кількість пропущених ключових слів, але і зростає хибне спрацьовування або "хибна тривога". Якість роботи системи пошуку ключових слів оцінюється на площині з осями, що відповідають хибному спрацьовуванню та пропущеним словам. Змінюючи чутливість будується деяка крива, і чим ближче ця крива до осей ординат, тим краще працює система. Вас можуть зацікавити сервіси розпізнавання мовлення, що дають змогу перетворювати звукозаписи на текст та відстежувати сюжети радіо та телебачення за ключовими словами. |