Рубрика:
Облачные технологии /
Машинное обучение
|
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|
ВИЗИТКА
Сергей Болдин, системный администратор в энергетической компании, bsergey2@gmail.com
Amazon Polly – трансформация текста в голос
Одной из новых задач стало тестирование сервиса трансформации текста в голос от компании Amazon для дальнейшего использования в разрабатываемом приложении
Среди готовых решений текстово-голосового формата нашлись облачные сервисы от Amazon Polly и Microsoft Azure Text to Speech. Для начала мы пытаемся услышать четкость и внятность воспроизведения написанного текста, чтобы сделать вывод о дальнейшем использовании. Мы остановились на сервисе Amazon Polly [1], который преобразовывает текст в голос, позволяет сразу прослушать результат или сохранить его в аудиофайл, имеет клиентскую часть под Windows, позволяет подключить его на уровне кода под iOS, Android, Java, Phyton.
Чтобы произвести синтез написанного текста в голос, нужно на сайте AWS выбрать раздел Machine Learning, в котором выбрать Amazon Polly, перейти на его страницу, на вкладке Plain Text в текстовом поле вставить текст, выбрать язык, голос (мужской или женский), нажать кнопку Listen to speech для прослушивания (рис. 1) с веб-сервиса либо нажать кнопку Download MP3, чтобы сохранить аудиофайл.
В этом поле мы можем писать текст и прослушать его без каких-либо искажений, то есть как он есть. Но зачастую компьютер произносит слова и фразы не так, как нужно, не так, как хотелось бы. Придать машинному произношению реалистичности и каких-то эффектов можно в соседней вкладке в текстовом поле SSML с помощью разных тегов.
<...>
Подпишитесь на журнал Купите в Интернет-магазине
Facebook
Мой мир
Вконтакте
Одноклассники
Google+
|