Синтезаторы речи

На страницах этой рубрики разговор пойдет о таком важном элементе любой программы экранного доступа, как синтезатор речи. По большому счету, речь - это единственный универсальный способ взаимодействия программы с незрячим или слабовидящим пользователем. Брайлевские устройства вывода (дисплеи и принтеры) уступают речевому выводу информации и по скорости, и по доступности (так как требуют от пользователя умения читать рельефно-точечный шрифт). Кроме того, брайлевские устройства вывода являются сложными техническими устройствами и зачастую недешевы.

Речевые технологии для пользователей

  1. Использование голосов MBROLA в среде MS Windows
    Статья знакомит с проектом MBROLA и содержит подробную инструкцию по использованию дифонных баз и средств MBROLA совместно с синтезатором речи eSpeak в операционных системах MS Windows. Выполнив указанные в статье шаги, вы сможете воспользоваться богатой коллекцией дифонных баз MBROLA, созданных для различных языков мира.
  2. Обозначения языков в eSpeak
    В статье представлен перечень обозначений языков, используемых в настройках и командах синтезатора речи eSpeak.
  3. Введение или о синтезе речи просто и понятно
    Любая программа экранного доступа, а также любая программа, предполагающая взаимодействовать с незрячим или слабовидящим пользователем, должна поддерживать невизуальные средства вывода информации. На сегодняшний день такими средствами являются либо речь, либо тактильное воздействие. Остановимся подробнее на речевом выводе информации...
  4. Установка Microsoft SAPI
    Краткая инструкция по установке пакетов MS SAPI 4 и MS SAPI 5, необходимых для поддержки речевых технологий в операционных системах MS Windows.
  5. Утилита для восстановления SAPI 5 ключей реестра
  6. Какие синтезаторы речи говорят по-русски

Речевые технологии для разработчиков

  1. Речевые технологии для разработчиков (вводная статья)
  2. Простой пример использования SAPI 5.x в программах на C/C++
    На примере простого консольного приложения ниже будет описан способ использования синтеза речи по тексту для MS SAPI 5.x. В примере приведен код для SAPI 5.1, но принципиальных отличий в использовании SAPI 5.3 (MS Windows Vista) и SAPI 5.4 (MS Windows 7) нет...
  3. Использование MS Speech API 4.0 в программах на FreeBASIC
    Поскольку компоненты MS Speech API 4 (MS SAPI 4) реализованы как серверы OLE автоматизации, то, взяв их в качестве примера, мы разберемся в том, как работать с подобными компонентами в программах на FreeBASIC...
  4. Использование MS Speech API 5.1 в программах на FreeBASIC
    Для взаимодействия с компонентами Microsoft Speech API 5.1 (MS SAPI 5.1) из программы на FreeBasic мы воспользуемся функциями библиотеки DispHelper...
  5. Библиотека SAPI_DLL
    Библиотека SAPI_DLL создана для облегчения доступа к интерфейсам MS Speech API для синтеза речи по тексту. Для того что бы научить Ваше приложение "разговаривать", достаточно вызвать простые процедуры из SAPI_DLL.
  6. Теги речевой разметки в SAPI 4
  7. Использование MS Agent в Visual Basic
  8. Speech API в Delphi (часть 1)
    Хотите чтобы Делфи заговорил - читайте эту страницу!
  9. Speech API в Delphi (часть 2)
  10. MS Agent и Delphi

Какие синтезаторы речи говорят по-русски

  1. «Олег» (RusEngineS5_22)

    Это некоммерческий синтезатор русской речи, совместимый с SAPI 5. Синтезатор обладает быстрой реакцией, высокой разборчивостью речи. Есть возможность редактировать словари ударений и подстановок, представленных в виде текстовых файлов.

  2. eSpeak

    eSpeak - это компактный мультиязычный некоммерческий программный синтезатор речи, разработанный Джонатаном Дуддингтоном (англ. Jonathan Duddington). Синтезатор поддерживает 37 языков, распространяется по свободной лицензии GNU GPL v3+ (GNU General Public License) и открыт для доработок и усовершенствований. Существует версия eSpeak для таких операционных систем, как Linux, Mac OS, Microsoft Windows и RISC OS, а также он просто доступен в виде исходного кода на языке C++. Для семейства ОС Windows eSpeak представлен как SAPI 5 -совместимый синтезатор.

  3. Newfon

    Этот синтезатор является адаптацией синтезатора речи Фонемафон для работы совместно с программой экранного доступа NVDA. Поддерживается синтез русской и украинской речи (на основе русских фонем).

  4. Капитан (версия для MS SAPI 5)

    Синтезатор речи "Капитан" представляет собой MS SAPI5-совместимый русскоязычный синтезатор. Кроме основного голоса, этот пакет способен поддерживать сторонние голоса (например, RHVoice и Newfon), предоставляя доступ к ним через интерфейсы MS SAPI5.

  5. Chatterbox

    Это SAPI4-совместимый синтезатор речи, обладающий двумя голосами: русским и английским, что позволяет более-менее корректно озвучивать смешанные тексты. Синтезатор поддерживает два режима работы: исключительно русский и русско-английский.

  6. Капитан

    Синтезатор речи "Капитан" представляет собой MS SAPI4-совместимый русскоязычный синтезатор. Поддерживается один голос, обладающий удовлетворительной разборчивостью речи, но низкой естественностью звучания (то есть речь "механическая"). хорошая разборчивость речи и быстрая реакция делают синтезатор удобным для работы с программами экранного доступа.

  7. Speaking Mouse

    Качество речи этого синтезатора оставляет желать лучшего. Однако, он обладает двумя преимуществами: мгновенной реакцией и хорошей фонетической разборчивостью. То есть, если вам удастся привыкнуть к тому "кряканию", которое порождает этот синтезатор, то вы легко сможете определять на слух даже орфографические ошибки в читаемом тексте.
    Синтезатор предназначен исключительно для работы с программой экранного доступа JAWS for Windows.

  8. «Говорящая мышь» от Сергея Волкова

    Существенно переработаный синтезатор Speaking Mouse.
    Автор доработок: Сергей Волков.
    Добавлены некоторые настройки и словарь, исправлены ошибки.

  9. Digalo 2000 Russian (ELAN Speech)

    Этот синтезатор имеет высокую разборчивость и качество речи. Им удобно и приятно читать книги, однако он мало пригоден для полноценной работы с программами экранного доступа, так как очень нетороплив и медленно реагирует на запросы скринридера . Для работы требует компонент Microsoft SAPI версии 4

  10. ELAN Speech Cube(ELAN Speech)

    Этот синтезатор является развитием синтезатора Digalo и специфицирован для работы совместно с Microsoft SAPI 5. От предыдущей своей реализации отличается более высоким быстродействием. Для работы требуется Microsoft SAPI версии 5.x

  11. L&H tts 3000 Russian (Lernout & Hauspie)

    Несмотря на то, что этот синтезатор, как и Digalo, использует Microsoft SAPI, по качеству речи он значительно уступает Digalo, а по скорости работы - Speaking Mouse. Достоинствами этого синтезатора являются наличие двух голосов (мужского и женского). Поддерживает возможность редактировать произношение. Для работы необходим компонент Microsoft SAPI версии 4.

  12. Sakrament (ООО Сакрамент, г. Минск)

    Синтезатор включает в себя несколько голосов (мужских и женских), по естественности звучания уступает синтезатору Digalo. Для работы требуется Microsoft SAPI версии 5.x

  13. Речевой синтезатор "Иван"

    Этот синтезатор является разработанным в рамках проекта ТигрикС SAPI 4 совместимым вариантом голоса, известного под названием "Диктор".


Распространение материалов сайта означает, что распространитель принимает условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2012
Rambler's Top100