Перейти из форума на сайт.

НовостиФайловые архивы
ПоискАктивные темыТоп лист
ПравилаКто в on-line?
Вход Забыли пароль? Первый раз на этом сайте? Регистрация
Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)

Модерирует : gyra, Maz

 Версия для печати • ПодписатьсяДобавить в закладки
Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

Открыть новую тему     Написать ответ в эту тему

vikkiv



Advanced Member
Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
Microsoft Agent / Speech API
 
   
 
Microsoft Agent - это набор программных сервисов, поддерживающих воспроизведение интерактивных анимированных персонажей в рамках интерфейса Windows. Разработчики могут использовать эти персонажи для создания различных интерактивных приложений и справочных систем, а также для представления информации в HTML-документах различными способами. В дополнение к поддержке обычного способа ввода информации с помощью клавиатуры и мыши Microsoft Agent предлагает поддержку распознавания голосовой информации (с помощью технологии Microsoft Speech API (SAPI)), позволяя управлять приложениями на уровне голосовых команд. Персонажи также могут воспроизводить синтезированную речь, аудиофрагменты или текст в специальном окне. Для поддержки голосовых функций в системе должны быть установлены Microsoft Agent 2.0, компоненты ядра Microsoft Speech API 4.x/5.x и движки для воспроизведения и распознавания речи (Text-to-Speech / Speech Recognition) на нужном языке. По желанию можно также установить дополнительные экранные персонажи.
Microsoft Agent 2.0 + Speech API 4.0 + Speech API 5.1 + Lernout & Hauspie TTS3000 Russian TTS Engine для Windows 95-Vista - полный комплект всех необходимых файлов, кроме локализаций и движков на языках отличных от русского и инструментов для разработчиков. Windows ME-Vista уже включают Microsoft Agent 2.0 и экранный персонаж Merlin. В Windows 2000 также входит Speech API 4.0, а в Windows XP-2003/Vista - Speech API 5.1/5.3. В Windows 9x и Windows 7 требуется полная установка всех компонентов, причем для Windows 7 Microsoft Agent доступен в виде специального исправления.

[c]Движки для синтеза речи (TTS):

Хотелось-бы обобщить разговоры о различных синтезаторах речи (Text-to-Speech - TTS) для PC, а то сообщения появляются довольно редко в каждом отдельном тематическом разделе.
 
Ниже идёт список голосов/синтезаторов речи для русского языка (в примерном порядке убывания качества):
 
1. Acapela-Group Алёна 22Khz - 150Mb - SAPI5/SAPI4 - Релиз в первой половине 2008-го года. Перед установкой 30-ти дневной демо версии Алёны необходимо установить ядро (~23 MB). Образец
2. Loquendo Ольга / Loquendo Дмитри ~100MB - SAPI5  - Первый релиз в конце 2008-го года. Образец1, Образец2
3. ScanSoft Катерина  22Khz - 44MB - SAPI5 (бывшая Татьяна-SAPI4) - что-то близко или даже немного/много лучше Николая (хотя у Татьяны не было такого истерического характера). Образец
4. Speech Cube Elan v5.1 - Николай (Nicolai) 16Khz - 12MB SAPI4 + SAPI5 - эволюция Digit (2002) 8MB ili Digalo (2000) 7.5MB, с поддержкой не только SAPI4 но и SAPI5 + возможность использования в нескольких программах одновременно (многоканальность) известные версии 4.2. и 5.1 а так-же Телеком и Мултимедиа. (в новых версиях Speech Cube Nicolaja пока не видно - ver 5.2 и 6.0). Из подверсий можно отметить Acapela Multimedia - SDK (ettsengine.exe), Acapela Telecom (SpeechCube.exe / acatel_srv.exe) и Acapela Evaluator (ElanTempoEvaluator.exe / ElanSaysoEvaluator.exe / AcapelaEvaluator.exe). Digit 2002 - работает  только с одной встроенной программой - с другими не хочет - так уж устроен.
5. Сакрамент - Рассказчик 3 (TalkerPro) 1 CD SAPI5 . В комплекте 2 голоса (+ 1 дополнительный отдельно -или +2 по разным источникам) - Судя по образцам с сайта производителя качество голосов не очень - однако судя по отзывам пользователей немного лучше чем Nicolai. Цена диска на рынке 150 руб. Без диска не работает - диск защищен "StarForce 3.02 protector" - так-что образ диска не создашь. вот и придется как захочешь что-нибудь послушать - вставлять диск, но мне надоело (достало).
6. Сакрамент - Рассказчик 2 (Игорь + Вика=9MB + Юлия=2.5MB) SAPI5- (+ Ольга-5.1Мб / Ирина-4.2Мб / Вячеслав-4.7Мб / Юра-2.2Мб) Sakrament Teller -  что-то улучшено но не очень заметно по сравнению с предыдущими версиями от Сакрамента за исключением разнообразия Мужской/Женский голоса.
7. Сакрамент - Рассказчик 1 (Борис) 6.5MB SAPI5 - Хуже чем Nicolai и Катерина но лучше чем все другие.
8. Иван - Ivan (Tigrix) 1.5MB SAPI4 То-же среднего качества (по моему близко около первого Сакрамента).
9. Magic -Gooddy 2004 (ver: 98->2000->2004) 28MB SAPI4: Старая программа для Windows 98 ->XP - точно не помню но кажется это был словарь вместе с TTS - качество чуть лучше чем L&H 3000. Тоже одна из первых разработок для русского языка.
10. Оратор (Orator) 4.5MB- сам не тестировал но судя по образцам до Nicolai далеко.
11. Speaking Mouse 3MB - то-же что и ниже но немного по-лучше.
12. L&H 3000 (Lernout & Hauspie) SAPI4  (мужской и женский голос) 3MB - Что-то слабо похожее на русскую речь.
 
Итого - 22 (или 24 по разным источникам) возможных голосов на Русском языке.
 
В общем я лично пока рекомендую (из общедоступных) только 4 голоса:
 
  1)  Acapela-Group Алёна 22Khz - SAPI5/SAPI4
  2)  Loquendo Ольга / Loquendo Дмитри
  3)  Nicolai (v5.1 - лучше чем 4.2 так как говорят что исправлены многие ошибки в том числе слежение за текстом и соответствие анимации движения губ в приложениях использующих визуальных агентов для сопровождения речи) и
  4)  Katerina  
 (остальные пока слушать трудно - в следствии более низкого качества) но стоит упомянуть об их болезнях:
 
  Многие считают что: Nicolai - голос выразительного дауна (или выразительного робота). Katerina - истерическая алкоголичка (или алкоголическая истеричка) в следствии её интонаций. (Все выражения и оценки взяты из других форумов).
 
  5) - как опция Сакрамент - Рассказчик 3 - но проблема с диском.
 
Ну а программы для их использования - это дело вкуса и отдельный разговор.
 
По поводу других языков - из самых известных производителей можно отметить достижения следующих разработчиков:
 
Loquendo :: Cepstral :: Acapela Group (Former Elan Speech / Babel) :: Nuance RealSpeak :: AT&T Natural Voices :: NeoSpeech VoiceText (Kate (230MB) / Paul (230MB))
 
+ Bonus: Acapela Group 30-Day Trial (Arabic (Salma / Nawfal) / 25 голосов)

Движки для распознавания речи (SR):

  • Горыныч :: Диктограф
     
    Внимание! Обсуждение движков для распознавания речи ведем в этой теме.

    Дополнительные экранные персонажи:

  • Microsoft Agent Ring :: Zero2000 :: MyDevotion :: DesktopMates
  • Microsoft Agent Character Editor + руководство по использованию

    Программы для чтения текста голосом (говорилки):

  • DeskBot (рекомендуется версия mini) - полное использование всех наворотов технологий Microsoft Agent и Text-to-Speech: анимированные персонажи, чтение текстовых файлов, документов MS Office и буфера обмена через SAPI 4.0, напоминание времени, звуковые эффекты - реверберация, шепот и др., всего 1 Мб.

  • Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 19:57 13-10-2006 | Исправлено: vadim1275, 15:07 30-04-2019
    lapidus2000

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
     Кстати, для словаря AOT тоже есть редактор , его можно скачать у них на сайте http://www.aot.ru/download.php  (MorphWizard).

     
    А лучше наверное отправить выявленные ошибки им для последуещей правки. Они же лингвисты ,а мы все любители.
     
    15 ноября 2007 года Стартовала специальная акция! Найди десять ошибок в морфологическом словаре и получи любой наш COM-объект бесплатно. Ошибки высылать на sokirko@yandex.ru .  
     
    15 ноября 2007 года Пользователь Natasha нашла две ошибки в морфологическом словаре. Ошибки исправлены.

    Всего записей: 82 | Зарегистр. 12-11-2006 | Отправлено: 20:06 21-08-2008 | Исправлено: lapidus2000, 20:08 21-08-2008
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Немного доработал проверку и правку ударений: http://ifolder.ru/7806212 http://ifolder.ru/7806893
     
     
    lapidus2000
    Цитата:
    А лучше наверное отправить выявленные ошибки им для последуещей правки. Они же лингвисты ,а мы все любители.  
    15 ноября 2007 года Стартовала специальная акция! Найди десять ошибок в морфологическом словаре и получи любой наш COM-объект бесплатно. Ошибки высылать на sokirko@yandex.ru .
    Что-то я сомневаюсь, что ошибки в ударениях считаются Хотя, написать можно, у меня уже порядка дюжины подозрительных слов накопилось.

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 00:26 22-08-2008 | Исправлено: Ajaja, 10:32 22-08-2008
    lapidus2000

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Multilingual & Multivoice American English, Canadian French, Brazilian Portuguese, American Spanish, Argentinian Spanish, Chilean Spanish, Mexican Spanish, British English, Castilian Spanish, Catalan, Valencian, Galician, Dutch, French, German, Greek, Italian, Polish, Portuguese, Swedish,Turkish, Russian*, Finnish*, Danish*, Mandarin Chinese (*available during 2008)
     
     
    Language  
    American English 2 2
    British English 2 1
    Castilian Spanish 2 2
    Catalan 1 1
    Valencian 1  
    Galician 1  
    French 3 1
    German 2 1
    Italian 4 6
    Greek 2  
    Portuguese 1 1
    Swedish 1  
    Dutch 1 1
    Polish 1 1
    Brazilian Portuguese 2  
    Mandarin Chinese 2  
    Mexican Spanish 1  
    Chilean 1  
    Argentinean 1
    American Spanish 1 1
    Canadian French 1 1
    Turkish 1 1
    Danish (2008)
    Finnish (2008)
    Russian (2008)
     
    http://www.loquendo.com/en/technology/TTS.htm

    Всего записей: 82 | Зарегистр. 12-11-2006 | Отправлено: 21:26 28-08-2008 | Исправлено: lapidus2000, 21:29 28-08-2008
    SelenaNight



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Ждем с нетерпением, англицкий Dave по мне, так отлично получился, а вот поляки фигово говорят... квакают как наши Катя и Алена

    Всего записей: 335 | Зарегистр. 27-02-2006 | Отправлено: 22:11 28-08-2008
    Waasja

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    У меня недокачалось 2,5 Мб Алёны (файл Alyona22k_ID22.exe, размером 156 788 992 байт) с оф. сайта,  
    а докачки оф. сайт не поддерживает. Качать заново 150 Мб на недадёжном канале без возможности докачки пока не хочется.
     
    Поэтому прошу, если у кого-то есть возможность, выложить где нибудь последние 2,5 Мб файла Alyona22k_ID22.exe.
     
    Я предлагаю такую схему:
    1) Есть такая программа Segment Downloader v3.1.6.0 Beta, в которой кроме всего прочего есть возможность off-line-ремонта
     файлов. Вообще-то программа создавалась для докачки произвольных кусков файлов.
     Вот ссылка на неё http://rapidshare.com/files/76916770/segment_downloader_v3.1.6.0b.rar
    2) В программе Segment Downloader сначало необходимо создать файл сегментов (имеет расширение .seg).  
     В этом файле указывается какие части исходного файла нужно экспортировать.
     Для этого заходим в меню "Задание -> Новое задание".
     На вкладке "Общие" в поле "Докачиваемый файл" указать Ваш челый файл Alyona22k_ID22.exe (размер 156 788 992 байт).
     Перейти на вкладку "Список сегментов", нажать кнопку "Ручной ввод" и ввести в полях "Начало файла" и "конец файла"  
     соответстренно 154374272 и 156788992, нажать на клавиатуре Enter.
     На той же вкладке "Список сегментов" нажать кнопку "Сохранить" и сохранить полученный seg-файл под каким-нибудь именем.
     Теперь в окне "Новое задание" нажать "Отмена".
    3) Зайти в меню Сервис -> офф-лайн ремонт файлов.
    4) Перейти на вкладку "Экспорт данных".
    5) В поле "Файл" указать местоположение к Вашему целому файлу Alyona22k_ID22.exe (размер 156 788 992 байт).
    6) В поле "Список сегментов" указать путь к seg-файлу, который только-что Вы создали.
    7) В поле "Куда сохранить" указать имя и расположение sdf-файла в который будут экспорнированы необходимуе мне данные.
    8) Выслать мне sdf-файл на почту Walerka100(пёсик)yandex(точка)ru или выложить на какой нибудь uploader.
     
    Возможно есть более простой путь, который Вы знаете.
     
    Напишите пожалуйста md5 файла Alyona22k_ID22.exe (размер 156 788 992 байт).
     
    Заранее спасибо, если кто поможет.

    Всего записей: 16 | Зарегистр. 23-01-2008 | Отправлено: 07:31 04-09-2008
    Ajaja

    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Waasja

    Цитата:
    Возможно есть более простой путь, который Вы знаете.

    Проще докачать с помощью торрента.

    Всего записей: 1032 | Зарегистр. 17-06-2004 | Отправлено: 12:42 04-09-2008 | Исправлено: Ajaja, 12:44 04-09-2008
    evilone666



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    подскажите плз где можно достать полные версии движков
    Sin-Ji (Catonese)  
    Mei-Ling (Mandarin)                   
    Ya-Ling (Taiwanese Mandarin)?
    очень нужно, заранее спасибо
       

    Всего записей: 327 | Зарегистр. 03-11-2006 | Отправлено: 15:33 06-09-2008 | Исправлено: evilone666, 15:34 06-09-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    evilone666
     
    Если легально то стоит 45 баксов - download вариант Других вариантов в этой теме не найти вследствии ограничений правил пользования форума.
    Можeшь попробовать поискать в торрентах или в e-mule (в основном версии которые выпускались пару лет назад - с новыми не совместимы). Хотя наверняка ещё где-то лежат через http или ftp.
    По размерам эти голоса от ScаnSоft маленькие, можешь попробовать ещё варианты от NeoSpeech - Говорят качественнее (продаёт тот-же NехtUр).
     
    Added:
    Ан неет, про NеоSpееch развёл - оказывается они свернули все продажи запретив всем диллерам продавать их голоса ещё в августе. Причины не известны (но в сетях ещё можно найти - и наверняка это будет долго т.к. голоса на самом деле хорошие)

    Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 23:59 06-09-2008 | Исправлено: vikkiv, 00:07 07-09-2008
    Waasja

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    lapidus2000 (Цитата):
    Russian (2008)  
    http://www.loquendo.com/en/technology/TTS.htm
     
    Там даже нет обазца произношения для русского движка или я плохо ищу?
     
    И вообще, что слышно про этот новый русский голос.

    Всего записей: 16 | Зарегистр. 23-01-2008 | Отправлено: 09:24 07-09-2008
    hottabb

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Подкиньте усли у кого есть ссылку на JAWS for Windows с ключиком, под Висту,очень надо.

    Всего записей: 3 | Зарегистр. 26-01-2008 | Отправлено: 00:20 08-09-2008
    vikkiv



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    hottabb
    Держи. С ключём это не сюда - так что никоим образом несмогу помочь.

    Всего записей: 748 | Зарегистр. 10-11-2005 | Отправлено: 01:56 09-09-2008 | Исправлено: vikkiv, 02:57 10-09-2008
    xitsa



    Junior Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    Встретил ещё один TTS: eSpeak.
    Поддерживает множество языков, для русского надо отдельно выкачивать словарь ударений (оттуда же).

    Всего записей: 103 | Зарегистр. 25-04-2006 | Отправлено: 22:58 13-09-2008
    Stroodder



    Advanced Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    xitsa
    Образец речи в mp3 есть?

    Всего записей: 666 | Зарегистр. 21-10-2004 | Отправлено: 16:43 16-09-2008
    dvt67



    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    xitsa

    Цитата:
    Встретил ещё один TTS: eSpeak.

    Хорошо, конечно, что продукт фриварный. Но на офсайте пишут, что русский там реализован весьма  и весьма приблизительно.  
    Как он реально звучит, по сравнению с Колей и Аленой ? Кто нибудь пробовал ?

    Всего записей: 82 | Зарегистр. 28-10-2006 | Отправлено: 14:21 17-09-2008
    sdkeeper

    Newbie
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    Угу.. Я пробовал - благо скачивать не много (около 4-5 мб).. Голос убог и ужасен 8).. удалил.

    Всего записей: 9 | Зарегистр. 18-07-2008 | Отправлено: 17:24 18-09-2008
    evilone666



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    подскажите где можно достать словарей ударений к Аленке? очень понравился этот ттс
    спасибо
     
    п.с. частично пару словарей (те что на сру) на 1637 слов уже есть. есть ли еще? может кто-то делал для себя?

    Всего записей: 327 | Зарегистр. 03-11-2006 | Отправлено: 17:52 18-09-2008 | Исправлено: evilone666, 17:53 18-09-2008
    Sylvia



    Junior Member
    Редактировать | Профиль | Сообщение | ICQ | Цитировать | Сообщить модератору
    evilone666

    Цитата:
    подскажите где можно достать словарей ударений к Аленке? очень понравился этот ттс спасибо

    Вот словарь Ajaja + штук 400-500 слов добавлены мной, всего более 3800 слов - http://ifolder.ru/8184079
    См. http://abook-club.ru/forum/index.php?showtopic=2865&st=760, там много полезного про этот голос

    Всего записей: 118 | Зарегистр. 17-11-2005 | Отправлено: 18:22 18-09-2008 | Исправлено: Sylvia, 18:57 18-09-2008
    smash94

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    По поводу нового голосового движка Alyona22k вопрос возник: А как быть со встроеной автозаменой?
     
    Ну например:
     
    "13:25" произносится как: "тринадцать часов двадцать пять минут"
     
    а если я хочу чтобы оно произносило просто "тринадцать двадцать пять" безо всяких часов и минут, т.к. в тексте не всегда поставленные через двоеточие двузначные числа - это время. Это запросто могут быть какие-то координаты или типа того.
     
    Как подобные нюансы произношения настроить под себя?

    Всего записей: 56 | Зарегистр. 06-06-2006 | Отправлено: 21:22 21-09-2008 | Исправлено: smash94, 21:24 21-09-2008
    evilone666



    Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору
    а есть ли ттс класса "аленка" для украинского и беларусского языков?
    "аленка" на сегодня один из топовых ттс для русского языка или есть еще лучше?

    Всего записей: 327 | Зарегистр. 03-11-2006 | Отправлено: 02:42 25-09-2008
    smash94

    Junior Member
    Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору

    Цитата:
    "аленка" на сегодня один из топовых ттс для русского языка или есть еще лучше?
    По тембру голоса может и лучшая, наиболее "человечная"(голос естественно звучит), но ИМХО Николай проговаривает текст чётче и совершает меньше ошибок(не съедает слогов, реже ошибается с ударениями, именами собственными и т.д. и т.п.). Он диктор хоть и скрипучий, но практически безошибочный.
     
    Катерина сливает обоим из них(хуже Алёны по звучанию и хуже Николая по чёткости).

    Всего записей: 56 | Зарегистр. 06-06-2006 | Отправлено: 21:08 26-09-2008
    Открыть новую тему     Написать ответ в эту тему

    Страницы: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

    Компьютерный форум Ru.Board » Компьютеры » Программы » Microsoft Agent / Speech API (SAPI) / Text-to-Speech (TTS)


    Реклама на форуме Ru.Board.

    Powered by Ikonboard "v2.1.7b" © 2000 Ikonboard.com
    Modified by Ru.B0ard
    © Ru.B0ard 2000-2024

    BitCoin: 1NGG1chHtUvrtEqjeerQCKDMUi6S6CG4iC

    Рейтинг.ru