arnyc
Advanced Member | Редактировать | Профиль | Сообщение | Цитировать | Сообщить модератору Filalex2007 Цитата: После долгих поисков и проб разных программ, которые бы распознавали русскую речь и переводили бы ее в текст на достаточно высоком уровне, могу сказать, что такая только одна - Voco от ЦРТ. | 1. Неплохо распознаёт спокойный разговор на русском несколькими голосами или диктовку под микрофон онлайн-сервис Google Web Speech API Demo. Он также может распознать запись разговора с аудио файла. Для этого устанавливаем VAC, затем используем его 1-й дефолтный кабель: открываем Windows Sound Panel, назначаем Line 1 как Default device во вкладках Recording и Playback. В свойствах Мика Line 1 отмечаем "Listen to this device" и выбираем рабочие наушники для прослушки. Разрешаем ввод с Мика для Хрома в Настойках Винды и вверху на веб-странице Google Speech. Открываем десктопный аудио плеер и играем нужный файл с выводом звука на Line 1 или default speakers. В Хроме на веб-странице Google Speech кликаем иконку Мик, затем кликаем в текст-боксе для фокуса на нём. Плеер начинает стримить аудио на сервер Google через виртуальный Мик VAC, и в текст-боксе появляется распознанный текст. По окончании его можно скопировать, вставить в Word и отредактировать, заново слушая файл. 2. Пробуем Google Cloud Speech-to-Text. Продвинутое распознавание нескольких голосов с диктовки или аудио файла. Демо-файл с сайта до 1 мин разговора. После реги дают бесплатный кредит $300 в обмен на номер кредитной карты. Если кредит исчерпан, карта не дебитуется без апгрейда акка на Paid юзером. Список поддерживаемых языков периодически расширяется. 3. Ещё вариант: IBM Watson Text-to-Speech Demo. У этого веб-сервиса походу меньше выбор языков, нет русского, зато хорошо распознаёт другие популярные языки с Мика и аудио файла. Записи в неподдерживаемых аудио форматах надо сначала перекодировать в WAV. Для всех вариантов нужен быстрый интернет без затыков в режиме Upload. Чем медленнее и чётче разговор, и меньше акценты, тем точнее распознавание. Можно попробовать нажать Паузу в плеере после каждой фразы, если это повысит точность распознавания и уменьшит нужду в правках. | Всего записей: 1191 | Зарегистр. 28-05-2003 | Отправлено: 00:59 08-11-2019 | Исправлено: arnyc, 09:33 09-11-2019 |
|