Синтезаторы речи

На страницах этой рубрики разговор пойдет о таком важном элементе любой программы экранного доступа, как синтезатор речи. По большому счету, речь - это единственный универсальный способ взаимодействия программы с незрячим или слабовидящим пользователем. Брайлевские устройства вывода (дисплеи и принтеры) уступают речевому выводу информации и по скорости, и по доступности (так как требуют от пользователя умения читать рельефно-точечный шрифт). Кроме того, брайлевские устройства вывода являются сложными техническими устройствами и зачастую недешевы.

Речевые технологии для пользователей

  1. Использование голосов MBROLA в среде MS Windows
    Статья знакомит с проектом MBROLA и содержит подробную инструкцию по использованию дифонных баз и средств MBROLA совместно с синтезатором речи eSpeak в операционных системах MS Windows. Выполнив указанные в статье шаги, вы сможете воспользоваться богатой коллекцией дифонных баз MBROLA, созданных для различных языков мира.
  2. Обозначения языков в eSpeak
    В статье представлен перечень обозначений языков, используемых в настройках и командах синтезатора речи eSpeak.
  3. Введение или о синтезе речи просто и понятно
    Статья знакомит с речевыми технологиями и их реализациями в MS Windows.
  4. Установка Microsoft SAPI
    Краткая инструкция по установке пакетов MS SAPI 4 и MS SAPI 5, необходимых для поддержки речевых технологий в операционных системах MS Windows.
  5. Утилита для восстановления SAPI 5 ключей реестра
  6. Какие синтезаторы речи говорят по-русски

Речевые технологии для разработчиков

  1. Речевые технологии для разработчиков (вводная статья)
  2. Использование MS Speech API 4.0 в программах на FreeBASIC
    Поскольку компоненты MS Speech API 4 (MS SAPI 4) реализованы как серверы OLE автоматизации, то, взяв их в качестве примера, мы разберемся в том, как работать с подобными компонентами в программах на FreeBASIC.
  3. Использование MS Speech API 5.1 в программах на FreeBASIC
  4. Библиотека SAPI_DLL
    Библиотека SAPI_DLL создана для облегчения доступа к интерфейсам MS Speech API для синтеза речи по тексту. Для того что бы научить Ваше приложение "разговаривать", достаточно вызвать простые процедуры из SAPI_DLL.
  5. Управляющие теги для "речевых движков"
  6. Использование MS Agent в Visual Basic
  7. Speech API в Delphi (часть 1)
    Хотите чтобы Делфи заговорил - читайте эту страницу!
  8. Speech API в Delphi (часть 2)
  9. MS Agent и Delphi

Какие синтезаторы речи говорят по-русски

  1. «Олег» (RusEngineS5_22)

    Это некоммерческий синтезатор русской речи, совместимый с SAPI 5. Синтезатор обладает быстрой реакцией, высокой разборчивостью речи. Есть возможность редактировать словари ударений и подстановок, представленных в виде текстовых файлов.

  2. eSpeak

    eSpeak - это компактный мультиязычный некоммерческий программный синтезатор речи, разработанный Джонатаном Дуддингтоном (англ. Jonathan Duddington). Синтезатор поддерживает 37 языков, распространяется по свободной лицензии GNU GPL v3+ (GNU General Public License) и открыт для доработок и усовершенствований. Существует версия eSpeak для таких операционных систем, как Linux, Mac OS, Microsoft Windows и RISC OS, а также он просто доступен в виде исходного кода на языке C++. Для семейства ОС Windows eSpeak представлен как SAPI 5 -совместимый синтезатор.

  3. Newfon

    Этот синтезатор является адаптацией синтезатора речи Фонемафон для работы совместно с программой экранного доступа NVDA. Поддерживается синтез русской и украинской речи (на основе русских фонем).

  4. Chatterbox

    Это SAPI4-совместимый синтезатор речи, обладающий двумя голосами: русским и английским, что позволяет более-менее корректно озвучивать смешанные тексты. Синтезатор поддерживает два режима работы: исключительно русский и русско-английский.

  5. Капитан

    Синтезатор речи "Капитан" представляет собой MS SAPI4-совместимый русскоязычный синтезатор. Поддерживается один голос, обладающий удовлетворительной разборчивостью речи, но низкой естественностью звучания (то есть речь "механическая"). хорошая разборчивость речи и быстрая реакция делают синтезатор удобным для работы с программами экранного доступа.

  6. Speaking Mouse

    Качество речи этого синтезатора оставляет желать лучшего. Однако, он обладает двумя преимуществами: мгновенной реакцией и хорошей фонетической разборчивостью. То есть, если вам удастся привыкнуть к тому "кряканию", которое порождает этот синтезатор, то вы легко сможете определять на слух даже орфографические ошибки в читаемом тексте.
    Синтезатор предназначен исключительно для работы с программой экранного доступа JAWS for Windows.

  7. «Говорящая мышь» от Сергея Волкова

    Существенно переработаный синтезатор Speaking Mouse.
    Автор доработок: Сергей Волков.
    Добавлены некоторые настройки и словарь, исправлены ошибки.

  8. Digalo 2000 Russian (ELAN Speech)

    Этот синтезатор имеет высокую разборчивость и качество речи. Им удобно и приятно читать книги, однако он мало пригоден для полноценной работы с программами экранного доступа, так как очень нетороплив и медленно реагирует на запросы скринридера . Для работы требует компонент Microsoft SAPI версии 4

  9. ELAN Speech Cube(ELAN Speech)

    Этот синтезатор является развитием синтезатора Digalo и специфицирован для работы совместно с Microsoft SAPI 5. От предыдущей своей реализации отличается более высоким быстродействием. Для работы требуется Microsoft SAPI версии 5.x

  10. L&H tts 3000 Russian (Lernout & Hauspie)

    Несмотря на то, что этот синтезатор, как и Digalo, использует Microsoft SAPI, по качеству речи он значительно уступает Digalo, а по скорости работы - Speaking Mouse. Достоинствами этого синтезатора являются наличие двух голосов (мужского и женского). Поддерживает возможность редактировать произношение. Для работы необходим компонент Microsoft SAPI версии 4.

  11. Sakrament (ООО Сакрамент, г. Минск)

    Синтезатор включает в себя несколько голосов (мужских и женских), по естественности звучания уступает синтезатору Digalo. Для работы требуется Microsoft SAPI версии 5.x

  12. Речевой синтезатор "Иван"

    Этот синтезатор является разработанным в рамках проекта ТигрикС SAPI 4 совместимым вариантом голоса, известного под названием "Диктор".


Распространение материалов сайта означает, что распространитель принимает условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2010
Rambler's Top100