Речевой Синтезатор eSpeak

Дата публикации:2009
Дата обновления:2022
Поделиться в Twitter Поделиться в F******k Поделиться в VKontakte Поделиться в Telegram Поделиться в Mastodon
Размер (Кб):3598
Автор(ы):Jonathan Duddington
Сайт проекта:http://espeak.sourceforge.net/
Версия:1.48.04
Дата:18-07-2022 03:29:47
Дистрибутив:

Описание

eSpeak - это компактный мультиязычный некоммерческий программный синтезатор речи, разработанный Джонатаном Дуддингтоном (англ. Jonathan Duddington). Синтезатор распространяется по свободной лицензии GNU GPL v3+ (GNU General Public License) и открыт для доработок и усовершенствований. Существует версия eSpeak для таких операционных систем, как Linux, Mac OS, Microsoft Windows и RISC OS, а также он просто доступен в виде исходного кода на языке C++.

eSpeak поддерживает 37 языков, а именно: Африкаанс, албанский, армянский, кантонский диалект, каталанский, хорватский, чешский, голландский, английский, эсперанто, финский, французский, немецкий, греческий, хинди, венгерский, исландский, индонезийский, итальянский, китайский (мандарин), курдский, латвийский, ложбан, македонский, норвежский, польский, португальский, румынский, русский, сербский, словацкий, испанский, суахили, шведский, тамильский, вьетнамский, валлийский. Поддержка всех этих языков включена в общий инсталляционный пакет. Однако многие языковые версии eSpeak находятся лишь на стадии становления, поэтому качество синтеза на некоторых языках далеко от естественной речи.

Установка

Версия eSpeak под операционную систему Microsoft Windows создана для работы совместно с Microsoft SAPI 5.x, поэтому если на вашем компьютере отсутствует пакет Microsoft SAPI 5.x, то, прежде чем устанавливать eSpeak Win, необходимо установить Microsoft SAPI версии 5.x.

Для установки самого синтезатора запустите файл установки синтезатора (setup_espeak.exe). Появится окно "Установка eSpeak" с вариантом продолжения и отмены операции. После нажатия на кнопку "Далее" появится окно с вариантом выбора каталога, в который будет установлен eSpeak. По умолчанию это каталог "C:\Program Files\eSpeak\" (в зависимости от настроек операционной системы буква диска может быть другой). Можно принять вариант по умолчанию или, при необходимости, изменить путь установки. После подтверждения пути установки синтезатора нажатием клавиши "Далее", откроется окно с текстом:

Select which voices to install or press Enter to accept defaults.
Enter voice names, eg: (for Portuguese)   pt,  or with a variant, eg: pt+f3)

Это сообщение можно перевести как "Выберите голоса для установки или нажмите клавишу Enter, чтобы принять вариант по умолчанию. Введите название голоса, например: (для португальского) pt, или дополнительно с этим вариантом, например: pt+f3".

В данном окне имеется пять полей редактирования для ввода текста, а также три клавиши: "Назад", "Далее" и "Отмена", между которыми можно перемещаться с помощью клавиши Tab. Поля редактирования предназначены для указания тех голосов eSpeak, которые хочет установить пользователь. Голоса различаются по языкам, а также в рамках каждого языка имеется вариант мужского и женского голоса. В свою очередь каждый мужской или женский голос eSpeak имеет несколько вариантов, которые отличаются оттенками речи. Возможно произвести одновременную установку голосов для разных языков, а в рамках одного языка установить до пяти мужских и пяти женских голосов.

Чтобы указать, какие именно голоса eSpeak требуется установить, надо прописать их вручную латинскими буквами в нижнем регистре. Язык голоса задаётся двумя буквами, например, английский - en, польский - pl, румынский - ro, русский - ru и так далее. Мужские голоса задаются только двумя буквами языка, например, "en" или "ru", а женские голоса задаются двумя буквами языка и прибавленными к ним символами "+f", например, "en+f" или "ru+f". Указание варианта мужского или женского голоса осуществляется путём прибавления его цифрового индекса, например, у мужских голосов это выглядет как "ru ru+2 ru+3 ru+4", а у женских как "ru+f1 ru+f2 ru+f3 ru+f4".

Если требуется установить два варианта одного и того же голоса, например, два варианта мужского русского, то их надо прописывать в разных полях редактирования. Если же требуется установить несколько разных голосов, например, по однаму мужскому и женскому голосу для русского и английского языков, то всё это прописывается в одном поле через двойной пробел, например, "ru ru+f2 en+2 en+f3".

Изначально мастер установки eSpeak предлагает вариант по умолчанию, при котором в первом поле редактирования прописаны мужской и женский голоса языка, установленного в системе, а также один мужской английский голос. Например, при русской локализации MS Windows вариант по умолчанию предлагает следующие параметры установки: "ru ru+f2 en", остальные четыри поля редактирования остаются пустыми. Можно согласиться с вариантом по умолчанию, или указать собственный вариант установки. После этого следует нажать на кнопку "Далее". В следующем окне вам будут показаны параметры установки. Можно вернуться назад для их редактирования, или приступить к процессу инсталляции, нажав на кнопку "Установить".

По завершению процесса инсталляции синтезатора следует закрыть мастер установки нажатием на кнопку "Завершить".

В дальнейшем, если возникнит потребность изменить параметры голосов eSpeak, например, добавить или удалить какие-либо языковые версии, или сменить одну вариацию голоса на другую, то это можно сделатьь, сново запустите файл "setup_espeak.exe" и пропишите в полях редактирования другие параметры голосов. Перед проведением данной операции удалять eSpeak не требуется.

Настройка JAWS

Для подключения eSpeak Win впишите в файл "JFW.ini", расположенный в папке JAWS, в раздел [Synthesizers] следующие строки:

Synth*Name=eSpeak
Synth*LongName=eSpeak
Synth*Driver=sapi5x

Вместо "*" (звездочки) поставьте порядковый номер добавляемого синтезатора в списке уже прописаных синтезаторов.

Выгрузите JAWS (Insert+F4, и загрузите его вновь. Если вы используете JAWS 9.0 и ниже, то в списке доступных синтезаторов (Insert+Control+S) должна появиться строка eSpeak. Переместитесь на эту строку при помощи клавиш со стрелками и нажмите Enter.

Часто этого бывает недостаточно, чтобы после такого выбора JAWS заговорил голосом eSpeak. Дело в том, что под данным пунктом в списке выбора синтезаторов будут скрываться все установленные SAPI5-совместимые синтезаторы, поэтому, чтобы выбрать именно голос eSpeak, нужно выполнить следующее:
Открыть основное меню JAWS (Insert + J), затем: Параметры, Голоса, Общие настройки. Здесь в комбинированном списке голосов выбрать eSpeak, произвести остальные настройки (скорость, пунктуация, громкость и прочее) и в JAWS ниже 10 нажать кнопку "Ok", а в JAWS 10 и выше пройти до кнопки "Сохранить как", далее указать имя голосового профеля для синтезатора eSpeak и нажать кнопку "Ok".

Для JAWS версии ниже 10 ,больше ничего предпринимать не требуется.

Для JAWS 10 и выше: после повторной перезагрузки JAWS в списке доступных голосовых профелей (Insert+Control+S) должна появиться строка с тем названием, которое вы указали при сохранении голосового профеля для eSpeak. Переместитесь на эту строку при помощи клавиш со стрелками и нажмите Enter. Если вы всё сделали правильно, компьютер заговорит голосом нового синтезатора.

Также установленные голоса eSpeak всегда доступны в качестве дикторов SAPI5 в соответствующем разделе настроек программы экранного доступа и операционной системы.

Установка дополнительных компонентов

Некоторые языки не обладают простыми и универсальными правилами построения граматной речи и eSpeak требуются дополнительные компоненты, чтобы производить качественный синтез на этих языках. Для того, чтобы избежать увеличения размера основного пакета eSpeak, эти компоненты распространяются отдельно. В частности, в русском языке нет общих правил, устанавливающих ударный слог в словах. В этих случаях eSpeak пытается определить ударение слова, но данное произношение часто не соответствует правильному. Для решения данной задачи существует специальный расширенный словарь произношения, который надо установить отдельно от основного пакета eSpeak.

Данный словарь представляет собой файл "ru_dict", который можно загрузить с официального сайта проекта или его копию с нашего сайта.

Распакованный словарь следует положить в папку eSpeak по пути "...\eSpeak\espeak-data\". Там уже имеется файл с аналогичным названием, но в несколько десятков раз меньше по размеру; следует заменить имеющийся файл новым. После этого качество русской речи станет заметно выше.


Дополнительно


Перевод для tiflocomp.ru подготовил Никита Цейковец по материалам официального сайта проекта ESpeak.


Метки


Распространение материалов сайта означает, что распространитель принял условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2024