• B правой части каждого сообщения есть стрелки и . Не стесняйтесь оценивать ответы. Чтобы автору вопроса закрыть свой тикет, надо выбрать лучший ответ. Просто нажмите значок в правой части сообщения.

Нужен нормальный транскрибатор аудио-текст оффлайн.

wizard76

Green Team
15.06.2018
109
105
Не могу найти ни одной нормальной проги для транскрибации аудио в текст. Нужен именно такой транскрибатор, чтобы открыл готовый аудиофайлик (например, запись доклада), и он тебе его в текст перенес. Все равно какая ось,- винда или линь, без разницы. Все, что нашел на просторах, либо тупо не работает нормально, либо какой-то жуткий танец с бубнами, а на выходе абзац. Была, конечно, идея по-русски сделать, поднести смарт с голосовым гуглонабором к колонкам, да как-то..не то. У кого есть решение, напишите, или скиньте прогу.
 
Программу не подскажу, но вот хороший ролик о создании голосового помощника на Python, там используются нужные тебе модули.
Голосовой ассистент на 🐍 Python | Урок как сделать?

Ещё из этой серии голосовые блокноты

 
очень давно, в прошлой жизни, довелось пользоваться программой Диктограф... можно добавлять свои словари. и действительно ведь работала шельма... ))) правда сейчас не знаю как она работает. давно ей не пользовался... прога под винду...
 
f22, Глюк,

Спасибо, вы неправильно поняли,- мне не нужен ни ввод текста голосом ни голосовой ассистент, этого добра хватает, тот же Google Translate или Google Docs, там есть запись и перевод речи в текст, лучше не придумали. Поясню, нужно нечто вроде Voco.Professional, чтобы было распознавание речи из аудиозаписей, чтобы файлы целиком переводило.
 
Поясню, нужно нечто вроде Voco.Professional, чтобы было распознавание речи из аудиозаписей, чтобы файлы целиком переводило.
Я же не зря тебе ролик посоветовал - вот библиотека для распознавания голоса.

Вот нужна тебе возможность audio_transcribe.
Скармливаешь ему wav, aiff или flac файл, выбираешь тот API, которым будешь распознавать, а потом на выходе получаешь файл с текстом.
 
Ок, попробовал, благодарю, не работало, но потом как-то запустил. Безусловно, стоит внимания, с учетом того, что я два часа с питоном провозился, но на выходе русскую речь он превращает в клингонский. Если повозиться с исходным материалом, да подобрать приличный api, скорее всего и не найдешь проще. Кстати, кому в будущем понадобится, для винды Voco.Enterprise берите, остальное шлак полный. Единственное, запись должна быть качественной и чистой, иначе время зря потратите, транскрибация будет жуткая, да и работает медленно. А под линь варианты есть тоже, пример выше в посте, но полдня точно убьете. Большие файлы не транскрибируйте, лучше разбейте на части, т.к. самовылеты и зависоны, это минимум, с чем вы столкнетесь. Сами понимаете, убить несколько часов на перевод, чтобы выяснить, что что-то не сохраняет или какой ерунды не хватает, обидно, в общем, нужны домашние заготовки под эту задачу. Если обобщить, то нормального транскрибатора я так и не нашел, но хоть что-то.
Лан, всем откликнувшимся, спасибо.
 
Последнее редактирование:
Мы в соцсетях:

Обучение наступательной кибербезопасности в игровой форме. Начать игру!