• Познакомьтесь с пентестом веб-приложений на практике в нашем новом бесплатном курсе

    «Анализ защищенности веб-приложений»

    🔥 Записаться бесплатно!

  • CTF с учебными материалами Codeby Games

    Обучение кибербезопасности в игровой форме. Более 200 заданий по Active Directory, OSINT, PWN, Веб, Стеганографии, Реверс-инжинирингу, Форензике и Криптографии. Школа CTF с бесплатными курсами по всем категориям.

Нужен движок распознавания речевых команд!

  • Автор темы earman
  • Дата начала
Статус
Закрыто для дальнейших ответов.
E

earman

Всем привет!

У меня возникла следующая проблема. Мне необходимо написать прогу (пишу на Visual C++) с речевым интерфейсом (в обе стороны - синтез голосовых сообщений и распознавание голосовых команд). Так вот, если с первой половиной (синтезом) проблем никаких: существуют замечательные русские движки Digalo, L&H и др. (а англоязычных и того больше), то вот с распознаванием проблема...

Задача - не распознавать полноценный текст, а различать где-то пару десятков команд. Все что мне пока удалось откопать - это VoiceCom Центра Речевых Технологий. Они просят за свои продукты бабки, причем на запрос прайс-листа пока не ответили :) ... А демку скачать нельзя...

В общем, у кого есть некоторый опыт в разработке речевых программ - подскажите, плз, какой-нибудь движок командного распознавания, желательно - бесплатный (ну или крякнутый или даже платный на худой конец ;) ), совместимый с Microsoft SAPI. Буду крайне благодарен!
 
A

admin

earman
а Авторском ПО недавно была похожая прога, но она читала, а не распознавала речь.
 
E

earman

"Читает" в смысле синтезирует речь по тексту? Я ж говорю - таких-то программ много... Меня интересует именно распознавание!
 
P

Pete

2earman: не думаю, что под MS SAPI можно найти что-то стоящее и бесплатное, разпознавание речи вещь не тривиальная и свое know how открывать никто не спешит, зачем - ведь на этом можно делать деньги... Если на микрософте нет какого-нить MS Speech Engine в свободном доступе, то думаю от других контор найти что-то будет тяжело. Я бы порылся на сайте IBM, эта контора давно и серьезно занимается данной проблематикой, может еще что-нить на SF есть, энтузиастов много ведь...
 
D

Dr.Gigabit

Здесь, думаю, можно найти то, что вам нужно:
 
K

klizardin

HTK speech recognition toolkit. -- но это не под сапи хотя вещь неплохая и также и для распознования
образов и тому подобного.
 
K

klizardin

HTK speech recognition toolkit. -- но это не под сапи хотя вещь неплохая и также и для распознования
образов и тому подобного.
 
E

Emerald

Здесь, думаю, можно найти то, что вам нужно:
Сайт вроде ничего свиду. Только чето с этого сайта ничего у меня толком не заработало.
earman у меня такая ж проблема как и у тебя. Вобще я пришел к том что самая большая проблема распознование так как реальный материал найти невозможно, а толко новости с сайта ИБМ о том что они наделали. :)
И еще о сайте там есть ссылки на библиотики которые: выделяют речь из звыкового спектра, и расскладывают сигнал в ряд фурье. Имея данные вещи можно уже и самому занятся иследованиями, но :) ФТП та на пароле.
earman где ты брал движок от L&H бо он уменя отказывается воспроизводить реч в упор :(
Так что давайте развивать тему : ;)
 
E

earman

Emerald
Привет, товарищ по борьбе :)
Вот конкретно те ссылки, откуда я качал L&H:


Соответственно, русский и англ.

Digalo (я считаю, лучше по качеству) здесь:
link removed
link removed

В принципе, они много где лежат: заходи на www.filesearch.ru и ищи файлы, которые я написал...

Действительно, тему надо развивать!
Неужели никто серьезно не занимался использованием речевых технологий в своих прогах???
 
E

Emerald

earman
ты сюда заходил интерестная тема
я оттуда практически все закачал. Как раз там про распознование речь ведется.
Ой а у тебя Microsoft Agent Работает.
Вроде как L&H я оттуда же скачивал но оно мне дает ошибка озвучания ( я проверяю через Speech.cpl, Sam там работает)
:)
Есть еще одна тема это Dragon Naturally Speaking я где то 4 или 3 у меня была п-кая версия, это типа полный програмный коплекс если не знаеш и расспазнает и чиает и управляет вобщем усе.
Но с течем времени и довольно слабым для него кампом я его удалил и теперь жалею :) :( ;) ;)
Вот думаю еще пошарится по немецким, французким ну и другим сайтам може там чтото есть.
Если что нибуть найдеш пиши.
 
E

Emerald

earman
Прювет!
А ты не пробывал посмотреть Microsoft Speech SDK 5.1
Я уже давно его закачал но не смотрел что за фигня а тут есть тема про распознование причём уже готовые бибки с примерами ;)
Хотя это помоему все анл мова но ё маё мыж не шиком лыты и байтом не придавлены ;)
 
D

Dico

А может у кого завалялся исходник с кафедры в БГУ! Если есть то кинте ссылку!
 
E

Emerald

<!--QuoteBegin-Dico+6:06:2005, 22:07 -->
<span class="vbquote">(Dico @ 6:06:2005, 22:07 )</span><!--QuoteEBegin-->А может у кого завалялся исходник с кафедры в БГУ![/quote]

:) Однако чем вы там занимаетесь
 
D

Dico

Ну мы нечем! Но в БГУ есть лаборатория распознавания речи и образов! Так что у многих студентов есть возможность в ней работать и проходить практику!!!!
 
Статус
Закрыто для дальнейших ответов.
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!