Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Распознавание речи (Speech Recognition) Горыныч / Диктограф

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7

Открыть новую тему     Написать ответ в эту тему

Infection

iB3 PostgreSQL Coder
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
Программы распознавания речи

 
Распознавание речи
 
Название Статус Языки Обсуждение Поиск    
MSpeech Free >50 - Программы    
RealSpeaker Shareware 11 - Варезник    
Диктограф Shareware ? - Варезник    
Горыныч Shareware ? - Варезник    
Dragon NaturallySpeaking Shareware ? Программы Варезник  

Речевые технологии
Каталог программ на Озоне
 
Статьи
On-line и OS сервисы
 
Microsoft Agent / Speech API / Text-to-Speech
Yandex SpeechKit
Google Web Speech API Demo
Google Cloud Speech-to-Text (free $300 credit)
IBM Watson Text-to-Speech Demo
VoiceNavigator Web
 
 
Родственные темы
Программы для транскрибирования - транскрайберы
 


старая шапка

Всего записей: 352 | Зарегистр. 21-12-2001 | Отправлено: 12:34 18-06-2003 | Исправлено: Maz, 17:58 17-03-2020
Burn



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Не мог удержаться чтоб не сказать ДА!
 
Добавлено
Все что было сказано я не читал. Могу заметить что в этом году знакомый написал диплом по такой проге. Я принимал участи в написание проги. Она хорошо распознает речь. Программа писалась под пилота. Он говорит команды а программа управляет самолетом. У нас получилось под конкретного человека 100% распознование речи. Программа основана на элементах искуственного интеллекта. Сложность в ней в том, что ее надо обучить. Тупо сидеть и произносить слова, она будет их распознавать. Это необходимо чтоб прога понимала голос. Чем больше записать голосов, тем больше будет вероятность правильного распознования. Вот.

Всего записей: 1146 | Зарегистр. 28-09-2001 | Отправлено: 21:11 29-06-2003
Acerv

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Burn

Цитата:
Это необходимо чтоб прога понимала голос. Чем больше записать голосов, тем больше будет вероятность правильного распознования. Вот.

Может быть - чем больше будет наговорено слов, тем больше процент распознования?
Распознование делалалось под одного человека? На каком языке творилась?
И как бы эту прогу попробовать?
Можно или нет?
Единственный голос ЗА в общем объеме голосов за распозновование на руском языке, но, увы, за что-то неизвестное .
АВТОРА!!!! И прогу.

Всего записей: 39 | Зарегистр. 26-06-2003 | Отправлено: 21:47 29-06-2003
Tor_Zoom



Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Из нашиз бесспорный лидер на этом поприще прога ГОРЫНЫЧ (бери лучше версии из последних).

 
У меня щас стоит этот горынычь 5.011 версии (староват наверно) - короче я хотел сказать, что он меня достал, там не толко сложно заствить его написать требуемое слово, но и голосовые команды он тоже очень плохо распознаёт. Единственное что почти без ошибок он может написать ! и римские цыфры - ну может ещё какие нить слова. Вобщем не стоит тратить на него своё время.

Всего записей: 126 | Зарегистр. 17-05-2003 | Отправлено: 22:14 29-06-2003 | Исправлено: Tor_Zoom, 22:17 29-06-2003
Acerv

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Tor_Zoom
Имелся в виду Горыныч Проф2, выпуск март-апрель этого года, но и все равно надо в нем, теоретически, иметь объем слов более 10000, а в старом Горныче или Комбате объем около 5000, да и в нем действительное трех слов не свяжещь слитно без вмешательства.

Всего записей: 39 | Зарегистр. 26-06-2003 | Отправлено: 22:27 29-06-2003
Burn



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Я разговор вел не о Горыныче. У проги пока названия нет. Естественно что чем больше наговорить слов, тем точнее прога распознает слова. Конечно нужно наговаривать и с разным ударением и скоростью и интонацией и т.д. А если еще записать несколько голосов (мужских и женских), то программа будет болле универсальна под любой голос. Повторюсь, что писалась и обучалась под голос конкретного человека. И было 100% распознование. В настоящее время программа дорабатывается в другом направлении. Я постараюсь связаться с автором и если получу добор то обязательно выложу её.

Всего записей: 1146 | Зарегистр. 28-09-2001 | Отправлено: 23:29 29-06-2003
savage2000

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Как я понял, хорошей программы распознавания русской речи нет.
Тогда возникает следующий вопрос: а есть ли хорошие программы распознавания других языков, но ПОЛНОСТЬЮ обучаемые? Т.е. я говорю слово - программа, естественно, "ни бэ, ни мэ" , я ввожу, как это слово пишется, но русское слово! В итоге я получу программу, которая знает мой голос и пишет русскими словами.
Рано или поздно я так могу вбить свой небогатый лексикон (лексикон среднестатистического человека - 3-5 тысяч слов, это только Пушкин мог порядка 35 тыс. слов употреблять).
Очевидные недостатки такого подхода:
 - только один голос
 - вначале придется каждое слово вбивать.
Но меня бы это устроило. Все равно через месяц больше 95% слов уже не приходилось бы набивать.  
Какая программа подошла бы под мои критерии?

Всего записей: 102 | Зарегистр. 07-12-2002 | Отправлено: 23:55 29-06-2003
KostiKL



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Главные трудности фонемного подхода  
 
1. Темп речи варьируется в широких пределах, часто в несколько раз. При этом различные звуки речи растягиваются или сжимаются не пропорционально. Например, гласные изменяются значительно сильнее, чем полугласные и особенно смычные согласные. Для так называемых щелевых звуков есть свои закономерности. (Полугласные - это звуки при генерации которых необходимо участие голосовых связок, как и для гласных звуков, но сами они в обиходе считаются согласными. Например, так обычно звучат "м", "н", "л" и "р". Смычные звуки образуются при резком смыкании и размыкании органов артикуляции. Например "б", "п", "д", "т". Образование щелевых звуков связано с шипением и прочими эффектами турбулентности в органах артикуляции. Можно назвать "в", "ж", "с", а также "ш" и другие шипящие. В качестве примеров для простоты намеренно не приведены звуки, не имеющие буквенных обозначений.) Эта свойство называется временной нестационарностью образцов речевого сигнала.  
 
2. Произнося одно и то же слово или фразу в разное время, под влиянием различных факторов (настроения, состояния здоровья и др.), мы генерируем заметно не совпадающие спектрально-временные распределения энергии. Это справедливо даже для дважды подряд произнесенного слова. Намного сильнее этот эффект проявляется при сравнении спектрограмм одной и той же фразы, произнесенной разными людьми. Обычно этот эффект называют спектральной нестационарностью образцов речевого сигнала (см. примеры спектрограмм).  
 
3. Изменение темпа речи и четкости произношения является причиной коартикуляционной нестационарности, означающей изменение взаимовлияния соседних звуков от образца к образцу.  
 
4. Проблема кластеризации слитной речи. Из непрерывного речевого потока довольно непросто выделить какие-либо речевые единицы. Многие звуки "слипаются" либо имеют нечеткие границы.  
 
Вот лишь некоторые причины, препятствующие реализации систем распознавания речи.  

 
Это лишь небольшая цитатка из неплохой статью, дядьки, который этим вроде не один год занимается, даже вроде ученый какой-то...
Если заинтересовало, выложу куда-нибудь!
 
 
Добавлено
savage2000
Хорошо распознается английский, причем почти любыми программами перечисленными здесь! Бери Dragon Dictate какой-нибудь и вперед....
 
 
Добавлено

Цитата:
Dragon Naturally Speaking Personal Edition. v.1.0  
Как утверждает Dragon Systems Inc. - это первая в мире система распознавания беглой речи (датируется она 1997 годом). То есть с ее помощью можно набирать тексты на компьютере, просто диктуя иx так, как Вы обычно говорите - с интонацией, не разделяя слова и т.д. Судя по демонстрационному ролику, вещь просто фантастическая! Целое предложение здесь формируется не по отдельным словам, а в процессе диктовки. Нужные слова подставляются исxодя из контекста. Все манипуляции с текстом производятся голосом. Создается впечатление, что система понимает все, что ей говоришь, xоть основана она, конечно, на Dragon Dictate, и основной набор команд остался таким же.

 
Это древнее описание Dragon'a... с тех времен когда еще 32Мб оперативки за счастье было! Делаем выводы о распознавании английской речи!...
Увы наши программеры таким похвастаться не могут!
И не надо тыкать программами, которые распознают отдельные слова!

Всего записей: 669 | Зарегистр. 04-02-2003 | Отправлено: 23:57 29-06-2003
Acerv

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
savage2000
Вопрос конечно интересный. Я попробовал подобный подход на Dragon NaturallySpeaking, не получилось. При внимательном чтении инструкции по Dragon NaturallySpeaking понял, что он поодерживает один язык (английский), но с вариантами различных диалектов.
Поэтому в этом направлении , по моему мнению, более перспективнен работа с программами, которые поддерживают несколько языков. Вот, к примеру Voice Suite на http://www.autonomy.com/Content/Products/AV/Voice_Suite/ - поддерживает несколько языков, но сам продукт не нашел или упомянутый выше IBM ViaVoice - тоже 10 языков, только создавай свой профиль и говори на каком хочешь языке (теоретически).  
Надо бы на art.bdk.com/ru ревизию всех описанных ими программ устроить,  может и новое найдем, а то они с 1999 года на обновляются.  
 
Добавлено
KostiKL
Это похоже ты приводишь статью дядьки, который хочет создать единую базу размеченных речевых фрагмента (аллофонов), т.е. загнать все произношения  русскго языка под какие-то одни правила, а все произношения индивидульны, т.е. надо идти по направлению обучения каждого пользователя под свою базу данных объема словаря.  
Вот почему у меня вызывает сомнения высказывания Burn, что надо больше голосов и мужских и женских, ведь в том же Драконе есть различия в обучении и произношения мужского и женского голоса. Может он что-то революционное придумал?
 
 

Всего записей: 39 | Зарегистр. 26-06-2003 | Отправлено: 00:20 30-06-2003
KostiKL



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Acerv

Цитата:
идти по направлению обучения каждого пользователя под свою базу данных объема словаря

по этому поводу никаких возражений...
Но обобщатели всегда найдутся!
Без них никуда!

Всего записей: 669 | Зарегистр. 04-02-2003 | Отправлено: 00:34 30-06-2003
Farch



Silver Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
хм программы тут уникальные. а кото видел программу которая работает по голосовым меткам? как телефон например

Всего записей: 3211 | Зарегистр. 25-12-2001 | Отправлено: 14:43 30-06-2003 | Исправлено: Farch, 00:37 18-01-2004
KostiKL



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Мда....
Замолчали также как замолчали производители обсуждаемого софта!

Всего записей: 669 | Зарегистр. 04-02-2003 | Отправлено: 00:26 06-07-2003
Acerv

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
KostiKL
Так а что говорить- обсудили. Никто русскоязычные проги плотно не испытывал. Ни у кого нет даже Light версий. Я эту тему уже в трех или четерых форумах поднимал - все замолкают.
Мне добрые люди обещали привезти из Москвы все три проги, попробую разобраться, если что получиться путнее - напишу.
Счас скачал IBM ViaVoice (660Мег) - оказалась 7-ая версия, под ХР не запускается, поставил на закачку 10 версию, посмотрю как она работает с новами словарными базами. Отпишу что получится - где-то в августе (отпуск).

Всего записей: 39 | Зарегистр. 26-06-2003 | Отправлено: 11:47 06-07-2003
KostiKL



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Acerv
С нетерпением ждем-с!

Всего записей: 669 | Зарегистр. 04-02-2003 | Отправлено: 12:30 06-07-2003
Acerv

Junior Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
KostiKL
Так и сами тоже ищете и пробуйте =))

Всего записей: 39 | Зарегистр. 26-06-2003 | Отправлено: 12:52 06-07-2003
KostiKL



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Acerv
Само собой...
Периодически ищу новости!
Я имел ввиду будем ждать реальных отзывов о реальных продуктах!
У меня ж возможности качать по 600 Мб нету, а не рынке свежего и нового из этой области не найдешь!

Всего записей: 669 | Зарегистр. 04-02-2003 | Отправлено: 12:58 06-07-2003 | Исправлено: KostiKL, 13:04 06-07-2003
Eng

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
...Мдааа... видать не вышло ничего...  
Декабрь на дворе...

Всего записей: 16 | Зарегистр. 19-08-2002 | Отправлено: 09:43 05-12-2003
Sorok



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

Цитата:
Счас скачал IBM ViaVoice (660Мег) - оказалась 7-ая версия

А адресок не дадите?

Всего записей: 1709 | Зарегистр. 27-09-2001 | Отправлено: 13:13 05-12-2003
Lingvist

Newbie
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
За последние годы примерил на себе большинство программ, пытающихся  
разобрать человеческую речь. И пришёл к не утешительному выводу... .  
 
Русская речь обладает огромной избыточностью:
 
Конечно есть чем гордиться! Огромное колличество интонаций, синонимов, а какое разнообразие суффиксов, окончаний, не говоря о правописании, произношени, и пунктуации. Ну ладно, точку в этих проблемах ставить бесполезно.
 
Обращает на себя внимание сокраментальный вопрос,  а кто занимается проблемами машинного распознования речи?  
 
Ответ:  
 
К сожалению этим занимаетя очень узкий круг специалистов, в основном программистов, весьма далеких от понимания фундаментальных основ языкознания и фонетики.
Не смотря на это, энтузиасты спонсирующие подобные разработки, требуют  
быстрой отдачи или хотя-бы возврата выброшеных средств.
Мир начал наполняться суббпродуктами монопольного производсва  
Dragon, Combat, переделками типа Горыныч или Диктограф.  
 
О качестве продуктов постараюсь не говорить!  Зато пользователя вероятно умиляет количество и разнообразие меню, а Help - ну это произведение искуства, почитав его, вы только со временем начнёте понимать, что Вас так сказать "кинули".  
 
И тогда вы поймете, что дрессируете бешенную бездомную собаку, с абсолютно пустым желудком. А ваша комманда произнесённая в микрофон, будучи выведена на экран дисплея, может вызвать смех, ужас или долгий безутешный вой!  
Но фраза из трех коротких слов, в которой последнее "мать", удивительно точно и красиво за абзацем, в новой строке, подчеркивает набранный Вами текст !
 
Приглашаю к общению заинтересованных специалистов, пользователей, программистов.
 
Мать природа дала нам зрение и слух и заставила общаться, научим этому "железо"?!

Всего записей: 1 | Зарегистр. 11-01-2005 | Отправлено: 16:03 11-01-2005 | Исправлено: Lingvist, 21:56 17-01-2005
Mobil84



Junior Member
Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
KostiKL
Это лишь небольшая цитатка из неплохой статью, дядьки, который этим вроде не один год занимается, даже вроде ученый какой-то...  
Если заинтересовало, выложу куда-нибудь! "
 
где можно прочитать всю эту статью полностью?
 
 
 
Burn
ну как там насчет проги? даш скачать?

Всего записей: 108 | Зарегистр. 22-11-2004 | Отправлено: 12:45 12-01-2005
Timka



Full Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Программы распознавания речи  

Каталог на Озоне
Горыныч ПРОФ 3.x в Варезнике
 
Статьи
P.S. Перенёс в шапку. У кого есть что добавить - милости просим

Всего записей: 470 | Зарегистр. 29-04-2003 | Отправлено: 17:54 12-10-2006 | Исправлено: Timka, 21:31 12-10-2006
Открыть новую тему     Написать ответ в эту тему

Страницы: 1 2 3 4 5 6 7

Компьютерный форум Ru.Board » Компьютеры » Программы » Распознавание речи (Speech Recognition) Горыныч / Диктограф


Реклама на форуме Ru.Board.

Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
Modified by Ru.B0ard
© Ru.B0ard 2000-2024

BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

Рейтинг.ru