2008, 15

В. В. Митянок

Метод аппроксимации для определения числовых характеристик некоторых низкочастотных звуков человеческой речи

язык: русский

получена 15.05.2008, опубликована 04.08.2008

Скачать статью (PDF, 335 кб, ZIP), используйте команду браузера "Сохранить объект как..."
Для чтения и распечатки статьи используйте «Adobe Acrobat© Reader» версии 4.0 или выше. Эта программа является бесплатной, ее можно получить на веб-сайте компании Adobe© (http://www.adobe.com/).

АННОТАЦИЯ

Предложен метод распознавания звуковых сигналов, в основе которого лежит идея аппроксимации (почти) периодической функции набором мод с медленно (по сравнению с несущими частотами) меняющимися амплитудами. Метод применен к анализу 8 низкочастотных звуков человеческой речи, полученных от 8 респондентов. Создана база данных по амплитудам отдельных мод и на ее основе разработана система идентификации произнесенных звуков. Тестовые испытания созданной системы показали уровень распознаваемости звуков в 85-95 процентов.

Ключевые слова: распознавание речи, аппроксимация

11 страниц, 1 иллюстрация

Как сослаться на статью: В. В. Митянок. Метод аппроксимации для определения числовых характеристик некоторых низкочастотных звуков человеческой речи. Электронный журнал "Техническая акустика", http://ejta.org, 2008, 15.

ЛИТЕРАТУРА

1. Галунов В. И., Лобанов Б. М., Загоруйко Н. Г. Синтез и распознавание речи. Труды XIV сессии Российского акустического общества, 2004.
2. http:// intsys.msu.ru/invest/speech/research. Интеллектуальные системы. Официальный сайт кафедры МТИС и лаборатории проблем теоретической кибернетики механико-математического факультета МГУ.
3. Kuhl P. K., Iverson P. Linguistic experience and the «perceptual magnet effect». In Strange W. Speech perception and linguistic experiment, p. 121–154.
4. Галунов В. И., Гарбарук В. И. Акустическая теория речеобразования и системы фонетических признаков. Материалы международной конференции «100 лет экспериментальной фонетике в России», 1–4 февраля 2001 г.
5. Галунов В. И., Соловьев А. Н. Современные проблемы в области распознавания речи. Информационные технологии и вычислительные системы, №2, 2004.
6. Kraft D. Speech perception. J. Phonetics, vol. 7, p. 279–312, 1979.
7. http://www.auditech.ru; http://www.smartphone.ru; http://www.summatech.ru; http://www.sakrament.com; http://www.speechpro.ru; http://www.opencom.ru; http://www.istrasoft.ru/speech.html
8. Elinek F. Разработка экспериментального устройства, распознающего раздельно произнесенные слова. ТИИЭР, т. 73, №11, c. 91–99, 1985.
9. http://www.digest.univers.cv.ua/cnp_start.html
10. Галунов В. И. Современные речевые технологии. http://g-klishin.narod.ru/works.html
11. Дьяконов В. Абраменкова И. МАТЛАБ. Обработка сигналов и изображений. Специальный справочник. С.-П.: Питер, 2002.
12. http://www.prodav.narod.ru/wavelet
13. Зигмунд А. Тригонометрические ряды, т.1. Перев. с англ. М.: Мир. 1965.

Вячеслав Владимирович Митянок род. 17 сент. 1951 г. Окончил Белорусский гос. ун-т. в 1971 г. по специальности “Теоретическая физика”. Аспирантура АН Беларуси в 1971-1974 гг. Кандидат физико-математических наук с 1975 г. Доцент вычислительной техники.
В настоящее время - доцент математики Полесского гос ун-та, г. Пинск, Беларусь.

e-mail: mitsianok(at)mail.ru

Электронный журнал «Техническая акустика» ISSN 1819-2408

Языки

Поиск