Нужен движок распознавания речевых команд!

Тема в разделе "C и С++ FAQ", создана пользователем earman, 21 ноя 2004.

Статус темы:
Закрыта.
  1. earman

    earman Гость

    Всем привет!

    У меня возникла следующая проблема. Мне необходимо написать прогу (пишу на Visual C++) с речевым интерфейсом (в обе стороны - синтез голосовых сообщений и распознавание голосовых команд). Так вот, если с первой половиной (синтезом) проблем никаких: существуют замечательные русские движки Digalo, L&H и др. (а англоязычных и того больше), то вот с распознаванием проблема...

    Задача - не распознавать полноценный текст, а различать где-то пару десятков команд. Все что мне пока удалось откопать - это VoiceCom Центра Речевых Технологий. Они просят за свои продукты бабки, причем на запрос прайс-листа пока не ответили :) ... А демку скачать нельзя...

    В общем, у кого есть некоторый опыт в разработке речевых программ - подскажите, плз, какой-нибудь движок командного распознавания, желательно - бесплатный (ну или крякнутый или даже платный на худой конец ;) ), совместимый с Microsoft SAPI. Буду крайне благодарен!
     
  2. admin

    admin Well-Known Member

    Регистрация:
    8 авг 2003
    Сообщения:
    2.811
    Симпатии:
    0
    earman
    а Авторском ПО недавно была похожая прога, но она читала, а не распознавала речь.
     
  3. earman

    earman Гость

    "Читает" в смысле синтезирует речь по тексту? Я ж говорю - таких-то программ много... Меня интересует именно распознавание!
     
  4. Pete

    Pete Гость

    2earman: не думаю, что под MS SAPI можно найти что-то стоящее и бесплатное, разпознавание речи вещь не тривиальная и свое know how открывать никто не спешит, зачем - ведь на этом можно делать деньги... Если на микрософте нет какого-нить MS Speech Engine в свободном доступе, то думаю от других контор найти что-то будет тяжело. Я бы порылся на сайте IBM, эта контора давно и серьезно занимается данной проблематикой, может еще что-нить на SF есть, энтузиастов много ведь...
     
  5. Dr.Gigabit

    Dr.Gigabit Гость

  6. klizardin

    klizardin Гость

    HTK speech recognition toolkit. http://htk.eng.cam.ac.uk/ -- но это не под сапи хотя вещь неплохая и также и для распознования
    образов и тому подобного.
     
  7. klizardin

    klizardin Гость

    HTK speech recognition toolkit. http://htk.eng.cam.ac.uk/ -- но это не под сапи хотя вещь неплохая и также и для распознования
    образов и тому подобного.
     
  8. Emerald

    Emerald Гость

    Сайт вроде ничего свиду. Только чето с этого сайта ничего у меня толком не заработало.
    earman у меня такая ж проблема как и у тебя. Вобще я пришел к том что самая большая проблема распознование так как реальный материал найти невозможно, а толко новости с сайта ИБМ о том что они наделали. :)
    И еще о сайте там есть ссылки на библиотики которые: выделяют речь из звыкового спектра, и расскладывают сигнал в ряд фурье. Имея данные вещи можно уже и самому занятся иследованиями, но :) ФТП та на пароле.
    earman где ты брал движок от L&H бо он уменя отказывается воспроизводить реч в упор :(
    Так что давайте развивать тему : ;)
     
  9. earman

    earman Гость

    Emerald
    Привет, товарищ по борьбе :)
    Вот конкретно те ссылки, откуда я качал L&H:
    http://www.vector-ski.ru/vecs/govorilka/lhttsrur.zip
    http://activex.microsoft.com/activex/contr...t2/lhttseng.exe
    Соответственно, русский и англ.

    Digalo (я считаю, лучше по качеству) здесь:
    ftp://ftp.iif.hu/pub/mirror/ftp.winsite.c...galocoreenu.exe
    ftp://ftp.iif.hu/pub/mirror/ftp.winsite.c...galocorerus.exe

    В принципе, они много где лежат: заходи на www.filesearch.ru и ищи файлы, которые я написал...

    Действительно, тему надо развивать!
    Неужели никто серьезно не занимался использованием речевых технологий в своих прогах???
     
  10. Emerald

    Emerald Гость

    earman
    ты сюда http://htk.eng.cam.ac.uk/ заходил интерестная тема
    я оттуда практически все закачал. Как раз там про распознование речь ведется.
    Ой а у тебя Microsoft Agent Работает.
    Вроде как L&H я оттуда же скачивал но оно мне дает ошибка озвучания ( я проверяю через Speech.cpl, Sam там работает)
    :)
    Есть еще одна тема это Dragon Naturally Speaking я где то 4 или 3 у меня была п-кая версия, это типа полный програмный коплекс если не знаеш и расспазнает и чиает и управляет вобщем усе.
    Но с течем времени и довольно слабым для него кампом я его удалил и теперь жалею :) :( ;) ;)
    Вот думаю еще пошарится по немецким, французким ну и другим сайтам може там чтото есть.
    Если что нибуть найдеш пиши.
     
  11. Emerald

    Emerald Гость

    earman
    Прювет!
    А ты не пробывал посмотреть Microsoft Speech SDK 5.1
    Я уже давно его закачал но не смотрел что за фигня а тут есть тема про распознование причём уже готовые бибки с примерами ;)
    Хотя это помоему все анл мова но ё маё мыж не шиком лыты и байтом не придавлены ;)
     
  12. Dico

    Dico Гость

    А может у кого завалялся исходник с кафедры в БГУ! Если есть то кинте ссылку!
     
  13. Emerald

    Emerald Гость

    <!--QuoteBegin-Dico+6:06:2005, 22:07 -->
    <span class="vbquote">(Dico @ 6:06:2005, 22:07 )</span><!--QuoteEBegin-->А может у кого завалялся исходник с кафедры в БГУ![/quote]

    :) Однако чем вы там занимаетесь
     
  14. Dico

    Dico Гость

    Ну мы нечем! Но в БГУ есть лаборатория распознавания речи и образов! Так что у многих студентов есть возможность в ней работать и проходить практику!!!!
     
Загрузка...
Статус темы:
Закрыта.

Поделиться этой страницей