Синтезаторы речи

На страницах этой рубрики разговор пойдет о таком важном элементе любой программы экранного доступа, как синтезатор речи. По большому счету, речь - это единственный универсальный способ взаимодействия программы с незрячим или слабовидящим пользователем. Брайлевские устройства вывода (дисплеи и принтеры) уступают речевому выводу информации и по скорости, и по доступности (так как требуют от пользователя умения читать рельефно-точечный шрифт). Кроме того, брайлевские устройства вывода являются сложными техническими устройствами и зачастую недешевы.

Речевые технологии для пользователей

  1. Установка Microsoft Speech Platform
    Microsoft Speech Platform (Речевая платформа Microsoft)- 'это набор программных модулей и средств разработки, позволяющих разработчикам создавать приложения и сервисы с поддержкой речевых технологий (распознавание речи и синтез речи по тексту), а пользователям взаимодействовать с такими приложениями...
  2. Использование голосов MBROLA в среде MS Windows
    Статья знакомит с проектом MBROLA и содержит подробную инструкцию по использованию дифонных баз и средств MBROLA совместно с синтезатором речи eSpeak в операционных системах MS Windows. Выполнив указанные в статье шаги, вы сможете воспользоваться богатой коллекцией дифонных баз MBROLA, созданных для различных языков мира.
  3. Обозначения языков в eSpeak
    В статье представлен перечень обозначений языков, используемых в настройках и командах синтезатора речи eSpeak.
  4. Введение или о синтезе речи просто и понятно
    Любая программа экранного доступа, а также любая программа, предполагающая взаимодействовать с незрячим или слабовидящим пользователем, должна поддерживать невизуальные средства вывода информации. На сегодняшний день такими средствами являются либо речь, либо тактильное воздействие. Остановимся подробнее на речевом выводе информации...
  5. Установка Microsoft SAPI
    Краткая инструкция по установке пакетов MS SAPI 4 и MS SAPI 5, необходимых для поддержки речевых технологий в операционных системах MS Windows.
  6. Утилита для восстановления SAPI 5 ключей реестра
    В процессе установки или удаления (деинсталляции) некоторых SAPI5-голосов в системном реестре Windows могут произойти изменения, которые приводят к неработоспособности оставшихся SAPI5-голосов. Для исправления подобных ошибок...

Речевые технологии для разработчиков

  1. Синтезирование речи из приложения Windows 8.1 через Windows.Media.SpeechSynthesis
    В Windows 8.1 Preview был введён новый API - Windows.Media.SpeechSynthesis, предназначенный для преобразования текста в речь. По задумке Microsoft, он может использоваться для создания голосовых подсказок пользователю, советов по навигации или любых других задач, требующих чтения текста вслух. На момент версии Windows 8.1 Preview, данный API предоставляет следующие возможности...
  2. Речевые технологии для разработчиков (вводная статья)
  3. Простой пример использования SAPI 5.x в программах на C/C++
    На примере простого консольного приложения ниже будет описан способ использования синтеза речи по тексту для MS SAPI 5.x. В примере приведен код для SAPI 5.1, но принципиальных отличий в использовании SAPI 5.3 (MS Windows Vista) и SAPI 5.4 (MS Windows 7) нет...
  4. Использование MS Speech API 4.0 в программах на FreeBASIC
    Поскольку компоненты MS Speech API 4 (MS SAPI 4) реализованы как серверы OLE автоматизации, то, взяв их в качестве примера, мы разберемся в том, как работать с подобными компонентами в программах на FreeBASIC...
  5. Использование MS Speech API 5.1 в программах на FreeBASIC
    Для взаимодействия с компонентами Microsoft Speech API 5.1 (MS SAPI 5.1) из программы на FreeBasic мы воспользуемся функциями библиотеки DispHelper...
  6. Библиотека SAPI_DLL
    Библиотека SAPI_DLL создана для облегчения доступа к интерфейсам MS Speech API для синтеза речи по тексту. Для того что бы научить Ваше приложение "разговаривать", достаточно вызвать простые процедуры из SAPI_DLL.
  7. Теги речевой разметки в SAPI 4
  8. Использование MS Agent в Visual Basic
  9. Speech API в Delphi (часть 1)
    Хотите чтобы Делфи заговорил - читайте эту страницу!
  10. Speech API в Delphi (часть 2)
  11. MS Agent и Delphi

Синтезаторы речи

  1. eSpeak
    eSpeak - это компактный мультиязычный некоммерческий программный синтезатор речи, разработанный Джонатаном Дуддингтоном (англ. Jonathan Duddington). Синтезатор поддерживает 37 языков, распространяется по свободной лицензии GNU GPL v3+ (GNU General Public License) и открыт для доработок и усовершенствований. Существует версия eSpeak для таких операционных систем, как Linux, Mac OS, Microsoft Windows и RISC OS, а также он доступен в виде исходного кода на языке C++. Для семейства ОС Windows eSpeak представлен как SAPI 5 -совместимый синтезатор.
  2. RHVoice
    синтезатор RHVoice и пакетов голосов к нему разработаны Ольгой Яковлевой для применения в операционных системах GNU/Linux, Microsoft Windows и на устройствах под управлением Android. На сегодняшний день это наилучший свободный синтезатор русской речи по соотношению отзывчивости и естественности звучания. Синтезатор представляет собой проект с открытым исходным кодом и распространяется бесплатно.
  3. Капитан (версия для MS SAPI 5)
    Синтезатор речи «Капитан» - это некоммерческий MS SAPI5-совместимый русскоязычный синтезатор. Основной голос (русский и псевдо-украинский языки) обладает удовлетворительной разборчивостью речи, но низкой естественностью звучания (то есть речь "механическая"). хорошая разборчивость речи и быстрая реакция делают синтезатор удобным для работы с программами экранного доступа. Кроме основного голоса, этот пакет способен поддерживать сторонние голоса (например, Newfon), предоставляя доступ к ним через интерфейсы MS SAPI5.
  4. Chatterbox
    Это некоммерческий SAPI 5-совместимый синтезатор речи, обладающий двумя голосами: русским и английским, что позволяет более-менее корректно озвучивать смешанные тексты. Синтезатор поддерживает два режима работы: исключительно русский и русско-английский.
  5. «Голос»
    Речевой синтезатор «Голос» способен читать тексты на русском и украинском языках, обладает относительно высокой естественностью речи, поддерживает пользовательский словарь. Синтезатор распространяется бесплатно и совместим с MS SAPI 5.x.
  6. Speaking Mouse
    Качество речи этого некоммерческого синтезатора оставляет желать лучшего. Однако, он обладает двумя преимуществами: мгновенной реакцией и хорошей разборчивостью. То есть, если вам удастся привыкнуть к тому "кряканию", которое порождает этот синтезатор, то вы легко сможете определять на слух даже орфографические ошибки в читаемом тексте.
    Синтезатор предназначен исключительно для работы с программой экранного доступа JAWS for Windows.
  7. «Говорящая мышь» от Сергея Волкова
    Существенно переработаная коммерческая версия синтезатора Speaking Mouse.
    Автор доработок: Сергей Волков.
    Добавлены некоторые настройки и словарь, исправлены ошибки.
  8. Newfon
    Этот синтезатор является адаптацией синтезатора речи «Фонемафон» для работы совместно с программой экранного доступа NVDA. Поддерживается синтез русской и украинской речи (на основе русских фонем).

Распространение материалов сайта означает, что распространитель принимает условия лицензионного соглашения.
Идея и реализация: © Владимир Довыденков и Анатолий Камынин,  2004-2018
Rambler's Top100