Розпізнавання мовлення – введення тексту голосом українською мовою (VoiceTypist)

Випробовуйте програму розпізнавання усної української мови для Windows. Словник розпізнавання складається з 200 000 слів. Охоплено загальновживану лексику включно із суспільно-політичною тематикою (можна диктувати новини), погодою, спортом, культурою, економікою. Розпізнаються великі міста, країни, поширені імена та загальновідомі прізвища. Програма включає ряд функцій редагування тексту, деякі з них викликаються голосом.
Подивіться відеосюжети, як працює програма розпізнавання мовлення.
Приєднуйтесь до обговорення програми на форумі.

Системні вимоги

Програма працює в системі MS Windows, а для роботи в Linux і Macintosh потрібно встановити Wine (безкоштовно) або Bordeaux. Для розпізнавання мовлення необхідно 1.4 гігабайти вільної оперативної пам’яті і майже стільки ж місця на диску, де розташована операційна система.

Інсталяція

У версії від 11 листопада 2012 року суттєво зменшено розмір дистрибутиву базової версії.

Завантажити базову версію (587 MB)
Виконати завантажену програму інсталяції. Наприкінці встановлення Вам запропонують запустити програму розпізнавання усної мови.
Підготувати мікрофон. Перевірити рівень звукозапису: слід вимкнути підсилення (boost, особливо для чутливих мікрофонів), зниження шумів (noise reduction) та автоматичний рівень сигналу. Індикатор рівня сигналу при вимовлянні не має заходити суттєво за середину шкали.

Запуск програми розпізнавання

Виконати програму через піктограму з десктопу або з меню запуску в розділі CyberMova.
Клацнути пункт меню Start. Розпочнеться завантаження програми, з’явиться повідомлення: Loading Speech-to-Text data...
Почекати декілька секунд, поки не висвітиться: Done.
Розпочати диктувати українською мовою. При перерві диктування натисніть пункт меню Pause. Використовуйте Resume для продовження диктування.
Після розпізнаної фрази можна ставити пунктуацію командами: "крапка", "кома", "знак питання" і "знак оклику". Абзац розпочинається командою "новий рядок". Може бути викликана лише одна команда в одній фразі.
Продиктований текст можна покласти у кліпбоард. Фрази будуть зібрані в один абзац до моменту команди "новий рядок".
Деякі пункти меню можна викликати голосом. Назва відповідної голосової команди у пункті меню слідує за символами "))". Наприклад, командою "Відмінити" можна видаляти останню розпізнану фразу.
З меню Microphones можна обрати джерело звукозапису. Обравши інший мікрофон/драйвер, перезапустіть розпізнавання (Finish, Start). Не всі пункти можуть працювати!

Розпізнавання мовлення: набір тексту голосом українською мовою у Windows (Wine під Linux)

Поради

Мікрофон має бути достатньо якісним. Скоріше за все не підійде вбудований мікрофон. Уникайте дихання в мікрофон, розташовуйте його збоку від рота.
В умовах посилених шумів рівень запису слід ставити нижчим, а говорити гучніше.
Система загалом краще розпізнає коротші фрази. Тому варто розбити довге речення на декілька коротших і робити між ними паузу.

Заплановані можливості

Невдовзі буде розпочато тестування повної версії системи розпізнавання мовлення з розширеними характеристиками та новими функціями.

Збільшення словника до мільйона слів. Автоматизоване поповнення лексики. Користувач додає нові слова у словник, надає зразки тексту, що містять лексику потрібних предметних областей.
Перетворення фонограм у текст: стенографування, транскрибування звукових файлів (звукозаписів нотаток, засідань, передач новин тощо).
Відображення регістру літер у розпізнаному тексті. Автоматичне прогнозування знаків пунктуації.
Врахування внесених користувачем виправлень при подальшому розпізнаванні.

Вас також можуть зацікавити сервіси розпізнавання мовлення, що дають змогу перетворювати звукозаписи на текст та відстежувати сюжети радіо та телебачення за ключовими словами.

Стежте за виходом пробних випусків і релізів, висловлюйте свої міркування та побажання на форумі в Розділі розпізнавання мовлення.