|
Эта статья интересна не только тем, что рассказывает об особенностях восприятия синтезированной речи незрячими пользователями компьютеров и смартфонов, но и тем, что в разговоре принимает участие один из разработчиков широко известной и популярной бесплатной программы экранного доступа NVDA (Прим. перевод.). Джейми Те (Jamie Teh ), инженер-программист из Брисбена, способен понимать речь со скоростью, которая для большинства людей звучит как тарабарщина. «На каком языке он говорит?» — часто спрашивает Джейми Те у людей, которые случайно слышат странные звуки, исходящие из его компьютера. «Иногда говорят что-то вроде: что это за шум? Или — это вода? На самом деле довольно забавно наблюдать за некоторыми реакциями», — говорит Тех. На слух для обычного человека эти звуки представляют собой неразборчивую белиберду. Большинство людей бывают крайне удивлены, когда им говорят, что это на самом деле английский язык, просто ускоренный примерно в 4-6 раз по сравнению со средней скоростью естественной человеческой речи. Вы можете уловить какие-нибудь слова? Запустите видео, на странице с оригинальным текстом, чтобы прослушать первую страницу книги «Гарри Поттер и философский камень» на английском языке, прочитанную со скоростью 900 слов в минуту и оцените свои способности. В то время как большинство людей не могут понять хотя бы одно слово, произносимое со скоростью 900 слов в минуту, для Те это что-то вроде скорочтения. Тех — незрячий. Он потерял зрение в младенчестве, когда врачам понадобилось удалить опухоли в обоих глазах. Как и многие незрячие люди, Те развил способность понимать речь с почти сверхчеловеческой скоростью, чтобы адаптироваться к современной жизни, наполненной визуальной информацией на экранах различных устройств. Для незрячих или слабовидящих людей использование технологии преобразования текста в речь, которая читает вслух контент с мобильного телефона, планшета или ноутбука, стало нормальной частью их повседневной жизни. Работая за компьютером, Те научился раздвигать границы того, насколько он может понимать быструю речь лучше, чем большинство. В то время как средний человек обычно говорит со скоростью около 100-150 слов в минуту, Тех будет проводить большую часть своего дня, слушая речь со скоростью около 900 слов в минуту. «Я использую очень высокую скорость речи», — говорит он. — «Я думаю, что большинство слепых людей, вероятно, используют около 400 (слов в минуту) или что-то в этом роде. Я предпочитаю 900 (слов в минуту) плюс. Моя работа требует, чтобы я обрабатывал много информации, поэтому я думаю, что это, вероятно, одна из причин, по которой я развил такую способность. Я также немного одержим эффективностью, это черта характера». Тех подчёркивает, что при скорости 900 слов в минуту он не воспринимает каждое слово: «Это похоже на то, что когда вы читаете свои электронные письма, вы на самом деле не читаете каждое слово, вы просто просматриваете свой почтовый ящик. Я могу изложить вам суть того, что там было сказано, и я могу сказать вам, интересно мне это или нет. Если я читаю статью внимательно, то уменьшаю скорость речи». Те и его друг детства Майкл Карран (Michael Curran ), который также является незрячим, потратили годы на разработку бесплатной программы экранного доступа с открытым исходным кодом, NVDA, которой сейчас пользуются 100 000 человек по всему миру. Те говорит, что существуют ограничения на то, насколько быстро может говорить человеческий или «естественный» голос: «Однако для того, чтобы читать с действительно высокой скоростью речи, вам нужно что-то более роботизированное. Роботизированные голоса — это те, которые имеют почти неестественное звучание, благодаря чему и обеспечивается такая высокая скорость речи. Для обычных людей это звучит совсем не так приятно, но меня не волнует звучание голоса, если это содержательная речь. Это похоже на то, что другая часть моего мозга обрабатывает эту информацию, я не могу это объяснить». Конечно, дело не в «роботизированном» звучании речи как таковом, а в том, что наибольшую скорость речи обеспечивают синтезаторы, обладающие минимально необходимой фонемной базы и основанные на простых методах формирования результата. Такие синтезаторы относятся первым поколениям программ для синтеза речи по тексту и были разработаны в своё время для менее производительных компьютеров, чем современные Пк или смартфоны (прим. перевод). Наука о сверхспособностяхОказывается, Тех прав. Он воспринимает сверхбыструю речь другой частью коры головного мозга, чем зрячие люди. Команда нейробиологов из Тюбингенского университета в Германии была первой в изучении того, как незрячие люди способны обрабатывать речь с такой высокой скоростью, выпустив исследовательскую работу на эту тему еще в 2010 году. Команда обнаружила, что незрячие люди способны понимать речь примерно в четыре раза быстрее, чем средние значения скорости естественной речи. Исследователи провели МРТ-сканирование мозга как зрячих, так и незрячих людей, когда они слушали сверхбыструю речь. Сканирование показало, что у незрячих людей часть коры головного мозга, которая обычно реагирует на зрительные сигналы, реагировала на речь. Адъюнкт-профессор Мак Шайн из Центра мозга и разума Сиднейского университета сказал, что это тот случай, когда мозг перестраивается и включает в работу неиспользуемые области. «В случае незрячего человека идея заключается в том, что он использует области своего мозга, отвечающие за визуальное восприятие, для обработки звуков, а не визуальных воздействий», — сказал Шайн. — «И теперь обработка звука (у незрячих) может происходить намного, намного быстрее, и они не отвлекаются на другие вещи. Зрительное восприятие — это довольно сложный процесс. И когда мы читаем текст, мы ограничены скоростью движения глаз, в то время как звуковую информацию можно передавать с любой скоростью, какая возможна. «Если вы незрячий человек и слушаете текст, преобразованный в речь, вы не ограничены возможностями своих глазных мышц. Теперь вы ограничены тем, как быстро вы можете протолкнуть информацию». Скорость, с которой незрячие люди могут понимать речь, вероятно, зависит от того, в каком возрасте они потеряли зрение, поскольку способность мозга формировать новые пути уменьшается с возрастом. Тайный язык в действии20-летняя студентка Брисбенского университета Тиана Оффорд родилась незрячей. Она постоянно применяет программное обеспечение для преобразования текста в речь на своём iPad. Оффорд говорит, что люди часто бывают крайне удивлены, когда слышат программу экранного доступа в действии. «Они не могут поверить, что я действительно понимаю, что там написано», — говорит Оффорд. — «Это почти как тайный язык. Никто из окружающих не может понять эту речь, если только они не являются незрячими. Таким образом, я могу читать всё, что захочу, и слушать всё, что захочу. Я могу зачитывать текстовые сообщения и отвечать на них в присутствии других людей. Мне просто нужно убедиться, что вокруг меня нет незрячих». Оффорд, которая изучает лингвистику в университете и свободно владеет тремя языками, говорит, что её способность воспринимать сверхбыструю речь очень помогает в учёбе: «Я могу слушать лекции с удвоенной скоростью или даже в два с половиной раза быстрее. Я также могу быстрее отвечать на экзаменационные вопросы, потому что способна быстро прочитать вопросы, если они представлены он-лайн. Я могу понять их быстрее, благодаря привычке воспринимать синтезированную речь на высокой скорости. Мне нетрудно быстро прочитать вопросы и сразу перейти к делу». Метки
|
|||||||||||||
Распространение материалов сайта означает, что распространитель принял условия лицензионного соглашения. Идея и реализация: © Владимир Довыденков и Анатолий Камынин, 2004-2024 |
Социальные сети