Нужен движок распознавания речевых команд!

  • Автор темы earman
  • Дата начала
Статус
Закрыто для дальнейших ответов.
E

earman

#1
Всем привет!

У меня возникла следующая проблема. Мне необходимо написать прогу (пишу на Visual C++) с речевым интерфейсом (в обе стороны - синтез голосовых сообщений и распознавание голосовых команд). Так вот, если с первой половиной (синтезом) проблем никаких: существуют замечательные русские движки Digalo, L&H и др. (а англоязычных и того больше), то вот с распознаванием проблема...

Задача - не распознавать полноценный текст, а различать где-то пару десятков команд. Все что мне пока удалось откопать - это VoiceCom Центра Речевых Технологий. Они просят за свои продукты бабки, причем на запрос прайс-листа пока не ответили :) ... А демку скачать нельзя...

В общем, у кого есть некоторый опыт в разработке речевых программ - подскажите, плз, какой-нибудь движок командного распознавания, желательно - бесплатный (ну или крякнутый или даже платный на худой конец ;) ), совместимый с Microsoft SAPI. Буду крайне благодарен!
 

admin

Well-known member
08.08.2003
2 754
0
#2
earman
а Авторском ПО недавно была похожая прога, но она читала, а не распознавала речь.
 
E

earman

#3
"Читает" в смысле синтезирует речь по тексту? Я ж говорю - таких-то программ много... Меня интересует именно распознавание!
 
P

Pete

#4
2earman: не думаю, что под MS SAPI можно найти что-то стоящее и бесплатное, разпознавание речи вещь не тривиальная и свое know how открывать никто не спешит, зачем - ведь на этом можно делать деньги... Если на микрософте нет какого-нить MS Speech Engine в свободном доступе, то думаю от других контор найти что-то будет тяжело. Я бы порылся на сайте IBM, эта контора давно и серьезно занимается данной проблематикой, может еще что-нить на SF есть, энтузиастов много ведь...
 
K

klizardin

#6
HTK speech recognition toolkit. http://htk.eng.cam.ac.uk/ -- но это не под сапи хотя вещь неплохая и также и для распознования
образов и тому подобного.
 
K

klizardin

#7
HTK speech recognition toolkit. http://htk.eng.cam.ac.uk/ -- но это не под сапи хотя вещь неплохая и также и для распознования
образов и тому подобного.
 
E

Emerald

#8
Здесь, думаю, можно найти то, что вам нужно:
http://art.bdk.com.ru/govor/katalog.htm
Сайт вроде ничего свиду. Только чето с этого сайта ничего у меня толком не заработало.
earman у меня такая ж проблема как и у тебя. Вобще я пришел к том что самая большая проблема распознование так как реальный материал найти невозможно, а толко новости с сайта ИБМ о том что они наделали. :)
И еще о сайте там есть ссылки на библиотики которые: выделяют речь из звыкового спектра, и расскладывают сигнал в ряд фурье. Имея данные вещи можно уже и самому занятся иследованиями, но :) ФТП та на пароле.
earman где ты брал движок от L&H бо он уменя отказывается воспроизводить реч в упор :(
Так что давайте развивать тему : ;)
 
E

earman

#9
Emerald
Привет, товарищ по борьбе :)
Вот конкретно те ссылки, откуда я качал L&H:
http://www.vector-ski.ru/vecs/govorilka/lhttsrur.zip
http://activex.microsoft.com/activex/contr...t2/lhttseng.exe
Соответственно, русский и англ.

Digalo (я считаю, лучше по качеству) здесь:
Для просмотра контента необходимо: Войти или зарегистрироваться

Для просмотра контента необходимо: Войти или зарегистрироваться


В принципе, они много где лежат: заходи на www.filesearch.ru и ищи файлы, которые я написал...

Действительно, тему надо развивать!
Неужели никто серьезно не занимался использованием речевых технологий в своих прогах???
 
E

Emerald

#10
earman
ты сюда http://htk.eng.cam.ac.uk/ заходил интерестная тема
я оттуда практически все закачал. Как раз там про распознование речь ведется.
Ой а у тебя Microsoft Agent Работает.
Вроде как L&H я оттуда же скачивал но оно мне дает ошибка озвучания ( я проверяю через Speech.cpl, Sam там работает)
:)
Есть еще одна тема это Dragon Naturally Speaking я где то 4 или 3 у меня была п-кая версия, это типа полный програмный коплекс если не знаеш и расспазнает и чиает и управляет вобщем усе.
Но с течем времени и довольно слабым для него кампом я его удалил и теперь жалею :) :( ;) ;)
Вот думаю еще пошарится по немецким, французким ну и другим сайтам може там чтото есть.
Если что нибуть найдеш пиши.
 
E

Emerald

#11
earman
Прювет!
А ты не пробывал посмотреть Microsoft Speech SDK 5.1
Я уже давно его закачал но не смотрел что за фигня а тут есть тема про распознование причём уже готовые бибки с примерами ;)
Хотя это помоему все анл мова но ё маё мыж не шиком лыты и байтом не придавлены ;)
 
D
#12
А может у кого завалялся исходник с кафедры в БГУ! Если есть то кинте ссылку!
 
E

Emerald

#13
<!--QuoteBegin-Dico+6:06:2005, 22:07 -->
<span class="vbquote">(Dico @ 6:06:2005, 22:07 )</span><!--QuoteEBegin-->А может у кого завалялся исходник с кафедры в БГУ![/quote]

:) Однако чем вы там занимаетесь
 
D
#14
Ну мы нечем! Но в БГУ есть лаборатория распознавания речи и образов! Так что у многих студентов есть возможность в ней работать и проходить практику!!!!
 
Статус
Закрыто для дальнейших ответов.