Словари для julius

Привет

В общем, играюсь тут немного. Есть такая штука - julius. Для тех, кому лень читать или не понимает буржуйского - это программный пакет, предназначенный для восприятия звуковых файлов и распознавания сказанного. Но не все так просто. Для того, чтобы что то распознать, ему надо иметь словарь, который содержит таблицу "слово-произношение". Вопрос собсна по этой таблице для тех, кто юзал (или пытался) данную программу.
Есть ли возможность автоматического создания словарей? Вернее, могу ли я сказать слово, а он мне предложит транскрипцию для него?
PGP 0x31361F01
arcanisrepo
arcanis
Есть ли возможность автоматического создания словарей? Вернее, могу ли я сказать слово, а он мне предложит транскрипцию для него?
Это относится к понятию распознование речи, которое по своей сути довольно сложное и тонкое понятие. Очень много зависит от того, где ты и как желаешь это использовать. Это же касается и словарей, например,
- работа по маркеру (без настройки на голос), в основном спецслужбы, размер словаря составляет, как правило, не больше 20 слов. Распознавание без настройки на голос гарантирует, что система распознает любое включенное в словарь слово, кем бы оно ни было произнесено. Создание словаря для распознавания речи без настройки на голос - дело весьма сложное и дорогое. Имеющихся готовых словарей не более 30 (русский официально в их число не входит).
- с настройкой на голос определенного человека. Размеры словаря при работе с настройкой на голос могут составлять несколько тысяч слов. Процедура настройки на голос выглядит следующим образом: человек читает некий специальным образом составленный текст, компьютер распознает слова и выдает вариант распознавания человеку. Человек исправляет ошибки и читает текст снова. После нескольких таких итераций процесс сходится, и компьютер оказывается в состоянии распознавать речь своего "хозяина".
И, как вывод из сказанного, автоматически словари не создаются.
К тебе больше подходит 2-ой вариант, создание словаря с настройкой на голос (лично твой). О первом способе забудь и даже не думай о нем.
Программу найти в наше время, я думаю, не сложно. Такие имеются, все дело за языком и обучением (составлением словаря). Но далее, как я представляю, нужно иметь модуль к этой программе, который по распознанному слову говорит тебе транскрипцию.
А сейчас внимание, может я и не прав, в процессе обучения (составления словаря) ты сам должен грамотно говорить, т.е. произносить слова в правильной фонетической транскрипции. И в чем тогда смысл всего этого? Пока словарь составил - уже и выучил. Ну если только для закрепления - но это уже игра.
Ошибки не исчезают с опытом - они просто умнеют
vasek
К тебе больше подходит 2-ой вариант, создание словаря с настройкой на голос (лично твой). О первом способе забудь и даже не думай о нем.
Программу найти в наше время, я думаю, не сложно. Такие имеются, все дело за языком и обучением (составлением словаря). Но далее, как я представляю, нужно иметь модуль к этой программе, который по распознанному слову говорит тебе транскрипцию.
ну вот в этом и заключался вопрос. Я ему голос - он мне транскрипцию. А то там в словарях какая то странная транскрипция приведена, а методом тыка не особо хочется.

ЗЫ С произношением вроде нормально, стандартные словари он воспринимает без ошибок
PGP 0x31361F01
arcanisrepo
Для интереса можешь почитать статью об альтернативах, а также об использовании Julius
Ошибки не исчезают с опытом - они просто умнеют
vasek
Для интереса можешь почитать статью об альтернативах, а также об использовании Julius
видел.
В общем, я так подумал, скачал с voxforge daily сборку для акустической модели (англ), а там есть набор слов и их транскрипции. Вроде что то составил.
+ набросал скрипт для запуска (по мотивам этой статьи) и обработку в питоне
PGP 0x31361F01
arcanisrepo
 
Зарегистрироваться или войдите чтобы оставить сообщение.