Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    да ещё 200руб. за ключ хотите, спрашивается за что?
    Разработчик решает, продавать ему свою прогу или раздавать бесплатно. А вы как, юзер выбираете, купить, не покупать или спереть! Колхоз, как говорится, дело довровольное.

    Всего записей: 1838 | Зарегистр. 09-02-2008 | Отправлено: 17:27 15-06-2014
    Denis0k

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Сталкивался кто? - как известно Microsoft Agent умеет проигрывать wav... так вот:  
    У меня установлена семерка и все работает и проигрывает.  
    Ставлю на другую семерку (исправление установлено) работает но не проигрывает звуковой файл...В чем может быть проблемка???  
     
    Добавлено:  
    Все решил проблему

     
    Такая же проблема. Всё работает на win 7x32 bit, а на win 7x64 bit не проигрывается звук. Причем сделал lwv файл с текстом - текст пишет, а звука нет. Все установлено аналогично. wav файлы через проигрыватель воспроизводит.
    В чем может быть дело?

    Всего записей: 4 | Зарегистр. 01-09-2015 | Отправлено: 10:55 04-09-2015
    somero

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Объясните мне, чайнику/нубу в этих-ваших-Тэ-Тэ -эС,
    есть ли в природе нечто, что после установки в Windows 7 (x86) Prof
    "родит" в папке "C:\Program Files\Common Files\SpeechEngines\Microsoft\TTS20\"
    рядом с папочкой "en-US\" (которая есть там с момента инсталляции оси)
    папочку "ru-RU\" со всеми вытекающими последствиями?
    а?!

    Всего записей: 2 | Зарегистр. 27-02-2007 | Отправлено: 10:50 24-09-2015
    cuneiform

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Кто плиз может просветить в связи с запретом на скачивание с мелкософтовского сервака
    движков SAPI4, которые все еще можно разыскать в рунете, но в виде урезанной раздачи, вместо пары движок-аддон на серваке мелкософта, в рунете смог найти только сами движки без аддонов:
     
    Lernout & Hauspie TruVoice голосовые модули (TTS) невысокого качества, обеспечивают возможность речевого вывода для Microsoft Agent.
     
    Language    TTS Engine (2-3 MB)    Language Add-On (128 KB)
            
    American English    tv_enua.exe    already installed
    British English    lhttseng.exe    already installed
    Dutch    lhttsdun.exe    agtx0413.exe
    French    lhttsfrf.exe    agtx040C.exe
    German    lhttsged.exe    agtx0407.exe
    Italian    lhttsiti.exe    agtx0410.exe
    Japanese    lhttsjpj.exe    agtx0411.exe
    Korean    lhttskok.exe    agtx0412.exe
    Portuguese (Brazilian)    lhttsptb.exe    agtx0416.exe
    Russian    lhttsrur.exe    agtx0419.exe
    Spanish    lhttsspe.exe    agtx0C0A.exe
     
    В этой таблице аддоны колонка справа
     
    Спрашивается: где взять эти аддоны? Может кто-нить их дать в личку?
    Мне бы надо их для русского, немецкого, французского и итальянского языков (=4).
     
    ПОлучается, мелкософт согласился разрешить (!) по просьбам трудящихся (!) юзать старый агент в 7-ке с помощью фиксы на SDK высокого уровня, а голосов-то нет полных...
    Вопрос поднимаю в связи с тем что SAPI 5 меньше голосов имеет с TruVoices, чем SAPI4 c L&H .  
     
    Хотя людям на 8-ке, 10-ке пора переходить на MS Speech Platform, Балаболка ее принимает .  
    Следует помнить, голоса SAPI 5 и голоса Microsoft Speech Platform несовместимы друг с другом, поэтому нельзя переключаться между ними при помощи тегов Voice или Lang.

    Всего записей: 2097 | Зарегистр. 27-04-2006 | Отправлено: 03:23 27-12-2015 | Исправлено: cuneiform, 20:05 27-12-2015
    Rodny



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    cuneiform
    Что за аддоны? Не помню я на мелкософтовском сервере аддонов к L&H...

    ----------
    Imagus / Viewhance

    Всего записей: 2877 | Зарегистр. 28-07-2006 | Отправлено: 16:05 27-12-2015
    cuneiform

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    cuneiform
    Что за аддоны? Не помню я на мелкософтовском сервере аддонов к L&H...

     
    http://mytts.forum2x2.ru/t316-topic
     
    аддоны в колонке справа
     
    На мелкософтонском сервере это всё заблоировано, отказ в доступе.

    Всего записей: 2097 | Зарегистр. 27-04-2006 | Отправлено: 20:02 27-12-2015 | Исправлено: cuneiform, 03:54 28-12-2015
    Rodny



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Так это не к L&H аддоны, а компоненты для MS Agent. Забирай: http://rghost.ru/6s5CNv4Xq
    AgtX040C.exe French
    AgtX0407.exe German
    AgtX0410.exe Italian
    AgtX0419.exe Russian


    ----------
    Imagus / Viewhance

    Всего записей: 2877 | Зарегистр. 28-07-2006 | Отправлено: 23:23 28-12-2015
    cuneiform

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ах, вот оно что! Кто ж знал! - А как это понять, назначение? - Это язык интерфейса? Или что-то другое? Меня бы английский интерфейс устроил, не надо других языков принципиально. - Я избавляюсь от других языков интерфейса.
    Скачал, благодарю.
     
    В любом случае - очень большое спасибо за участие!  
     
    С Новым Годом наступающим!

    Всего записей: 2097 | Зарегистр. 27-04-2006 | Отправлено: 02:34 29-12-2015
    Rodny



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    cuneiform
    На странице закачки было такое описание
    То есть это просто давало возможность Мерлину и компании озвучивать происходящее не только на английском.
    И без этих персонажей смысла в этих компонентах нет, насколько я помню.
     
    Добавлено:
    На всякий случай, полный архив всего, что было на странице MS и не только (кроме движков):  
    11 агентов,  
    29 компонентов локализации к ним,
    SAPI4.0 / SAPI5.1
    http://rghost.ru/6mxWqyxpL

    ----------
    Imagus / Viewhance

    Всего записей: 2877 | Зарегистр. 28-07-2006 | Отправлено: 13:04 29-12-2015 | Исправлено: Rodny, 13:30 29-12-2015
    cuneiform

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    cuneiform
    На странице закачки было такое описание
    То есть это просто давало возможность Мерлину и компании озвучивать происходящее не только на английском.
    И без этих персонажей смысла в этих компонентах нет, насколько я помню.
     
    Добавлено:
    На всякий случай, полный архив всего, что было на странице MS и не только (кроме движков):  
    11 агентов,  
    29 компонентов локализации к ним,
    SAPI4.0 / SAPI5.1
    http://rghost.ru/6mxWqyxpL

     
    Замечательный исторический уже набор компонентов SAPI 4 / SAPI 5.1. Большое спасибо.
    Может быть желательна инструкция по порядку установки компонентов?
    Что вперед, что потом.
    И кажется в подборке нет голосов (voices) -  в SAPI 4 больше голосов, в SAPI 5.1 меньше должно быть.
    Если учесть, что всё заблокировано, то имхо в набор надо включить и голоса.
    Вот у меня, например, нет голоса SAPI 5.1 Nuance RealSpeak Yannick German Male voice - мужской немецкий голос.
    Хотя остальные по сайтам разбросаны. - 4 женских голоса Nuance RealSpeak из 5-6 (SAPI 5.1)  удалось разыскать и скачать. Например, Steffi - тот же женский голос - Nuance RealSpeak.
    ============================================
     
    В английском тексте про аддоны сказано, что они добавляют на дополнительном языке тексты диалогов и советов-хэлпов для core components.  
    Как это понимать? - По умолчанию все на англ. языке (диалоги с системой).
    Поставили аддон другого языка, 128 кб, скажем русский.
    Надо понимать так, что все текстовые диалоги с TTS через персонажи будут по-русски тогда? А если аддоны не ставить, то тексты диалогов будут предлагаться по-английски.
    Правильно?
     

    Всего записей: 2097 | Зарегистр. 27-04-2006 | Отправлено: 01:22 30-12-2015 | Исправлено: cuneiform, 02:16 30-12-2015
    Rodny



    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    cuneiform
    А зачем вообще понадобился весь этот раритет? Какая конечная цель?
     
    Инструкция простая: поставить ядро MSagent.exe, нужный движок, нужного агента, компонент локализации.
    Порядок вряд ли важен.
    Движки L&H непосредственного отношения к MS не имеют, и их найти не проблема.
    Остальными кроме русских голосов я не особо интересовался.
     

    Цитата:
    В английском тексте про аддоны сказано, что они добавляют на дополнительном языке тексты диалогов и советов-хэлпов для core components.  
    Как это понимать? - По умолчанию все на англ. языке (диалоги с системой).  

    Добавляют не тексты, а возможность читать эти системные тексты на языках, отличных от английского.
    Насколько я помню, по экрану бродил Мерлин и озвучивал тексты, на которые я показывал (или тыкал?) мышкой. Если OS английская, то нужны английские движок+аддон, если русская - русские, соответственно.

    ----------
    Imagus / Viewhance

    Всего записей: 2877 | Зарегистр. 28-07-2006 | Отправлено: 15:09 30-12-2015
    cuneiform

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    А зачем вообще понадобился весь этот раритет? Какая конечная цель?  

     
    Хороший вопрос.  
     
    Требования такие, чтобы не выходить за примерно 50 Мб для голосов.
    А это помимо MS Speech Platform есть старые голоса для SAPI 5
    Правда, не знаю какие голоса (нем, фр, англ, итал) используются в SAPI с более высокими номерами после 5.1.

    Всего записей: 2097 | Зарегистр. 27-04-2006 | Отправлено: 21:13 30-12-2015 | Исправлено: cuneiform, 00:26 04-01-2016
    cuneiform

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Кто ищет зарубежные голоса на иностранных языках SAPI 5,
    типа, English Brit / US, French, German, Italian, etc., etc.
    Я нашел то, что искал - голоса небольшие по объему! До примерно 100 Мб.
    Никаких вам 500-700 Мб!
    Долго ранее не мог найти немецкий мужской голос небольшого объема файла Yannick  
    Пишите в личку. Поделюсь.

    Всего записей: 2097 | Зарегистр. 27-04-2006 | Отправлено: 00:24 04-01-2016 | Исправлено: cuneiform, 00:43 04-01-2016
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Кто ищет зарубежные голоса на иностранных языках SAPI 5,  
    типа, English Brit / US, French, German, Italian, etc., etc.  
    Не проще ли Vocalizer Expressive или допотопный Vocalizer поставить? И ставиться без проблем и голоса есть любого размера и качества.

    Всего записей: 1838 | Зарегистр. 09-02-2008 | Отправлено: 06:48 04-01-2016
    cuneiform

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Русский голос Милена Vokalizer на рутрекере выложен = 600 Мб и куча предварительных условий-установок софта. А если надо читать несколько голосов? Может хорошее качество.
    Но для меня лучше хуже качество, но больше голосов. И поменьше всякого софта для этого предварительно устанавливать.

    Всего записей: 2097 | Зарегистр. 27-04-2006 | Отправлено: 03:38 08-01-2016
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    И поменьше всякого софта для этого предварительно устанавливать.
    Не понял...
    Вроде нужно только VS runtime поставить, больше ничего?
    Или вы имеете ввиду "всякого софта для этого предварительно устанавливать" - это установка MD?

    Всего записей: 1838 | Зарегистр. 09-02-2008 | Отправлено: 07:42 08-01-2016
    cuneiform

    Silver Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Вроде нужно только VS runtime поставить, больше ничего?  

     
    Для работы так же необходимо установить: microsoft visual c++ 2005 sp1 redistributable package и microsoft visual c++ 2005 service pack 1 redistributable package atl security update

    Всего записей: 2097 | Зарегистр. 27-04-2006 | Отправлено: 15:17 10-01-2016
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Для работы так же необходимо установить: microsoft visual c++ 2005 sp1 redistributable package и microsoft visual c++ 2005 service pack 1 redistributable package atl security update  
     
    Это просто VS runtime updates. Т.к. VS runtime (несколько версий) обычно уже стоят, все update-ы к ним тоже уже стоят.

    Всего записей: 1838 | Зарегистр. 09-02-2008 | Отправлено: 19:52 10-01-2016
    ajoukov

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    Эта утилита (acatts.exe) просто перегоняет текст в wav, используя библиотеку acatts.dll напрямую, минуя костыли SAPI4/5. Исходники и саму программу перезалил  

     
    У кого-нибудь еще сохранились эти исходники Ajaja?  
     
     

    Всего записей: 2 | Зарегистр. 22-02-2016 | Отправлено: 03:57 22-02-2016
    Apokrif

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    У кого-нибудь еще сохранились эти исходники Ajaja

    У него самого на http://mytts.forum2x2.ru/ спросите!

    Всего записей: 1838 | Зарегистр. 09-02-2008 | Отправлено: 10:28 22-02-2016
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru