arcanis |
|
Темы:
31
Сообщения:
1496
Участник с: 09 сентября 2012
|
Привет В общем, играюсь тут немного. Есть такая штука - julius. Для тех, кому лень читать или не понимает буржуйского - это программный пакет, предназначенный для восприятия звуковых файлов и распознавания сказанного. Но не все так просто. Для того, чтобы что то распознать, ему надо иметь словарь, который содержит таблицу "слово-произношение". Вопрос собсна по этой таблице для тех, кто юзал (или пытался) данную программу. Есть ли возможность автоматического создания словарей? Вернее, могу ли я сказать слово, а он мне предложит транскрипцию для него? |
vasek |
|
Темы:
48
Сообщения:
11320
Участник с: 17 февраля 2013
|
arcanisЭто относится к понятию распознование речи, которое по своей сути довольно сложное и тонкое понятие. Очень много зависит от того, где ты и как желаешь это использовать. Это же касается и словарей, например, - работа по маркеру (без настройки на голос), в основном спецслужбы, размер словаря составляет, как правило, не больше 20 слов. Распознавание без настройки на голос гарантирует, что система распознает любое включенное в словарь слово, кем бы оно ни было произнесено. Создание словаря для распознавания речи без настройки на голос - дело весьма сложное и дорогое. Имеющихся готовых словарей не более 30 (русский официально в их число не входит). - с настройкой на голос определенного человека. Размеры словаря при работе с настройкой на голос могут составлять несколько тысяч слов. Процедура настройки на голос выглядит следующим образом: человек читает некий специальным образом составленный текст, компьютер распознает слова и выдает вариант распознавания человеку. Человек исправляет ошибки и читает текст снова. После нескольких таких итераций процесс сходится, и компьютер оказывается в состоянии распознавать речь своего "хозяина". И, как вывод из сказанного, автоматически словари не создаются. К тебе больше подходит 2-ой вариант, создание словаря с настройкой на голос (лично твой). О первом способе забудь и даже не думай о нем. Программу найти в наше время, я думаю, не сложно. Такие имеются, все дело за языком и обучением (составлением словаря). Но далее, как я представляю, нужно иметь модуль к этой программе, который по распознанному слову говорит тебе транскрипцию. А сейчас внимание, может я и не прав, в процессе обучения (составления словаря) ты сам должен грамотно говорить, т.е. произносить слова в правильной фонетической транскрипции. И в чем тогда смысл всего этого? Пока словарь составил - уже и выучил. Ну если только для закрепления - но это уже игра.
Ошибки не исчезают с опытом - они просто умнеют
|
arcanis |
|
Темы:
31
Сообщения:
1496
Участник с: 09 сентября 2012
|
vasekну вот в этом и заключался вопрос. Я ему голос - он мне транскрипцию. А то там в словарях какая то странная транскрипция приведена, а методом тыка не особо хочется. ЗЫ С произношением вроде нормально, стандартные словари он воспринимает без ошибок |
vasek |
|
Темы:
48
Сообщения:
11320
Участник с: 17 февраля 2013
|
Для интереса можешь почитать статью об альтернативах, а также об использовании Julius
Ошибки не исчезают с опытом - они просто умнеют
|
arcanis |
|
Темы:
31
Сообщения:
1496
Участник с: 09 сентября 2012
|
vasekвидел. В общем, я так подумал, скачал с voxforge daily сборку для акустической модели (англ), а там есть набор слов и их транскрипции. Вроде что то составил. + набросал скрипт для запуска (по мотивам этой статьи) и обработку в питоне |