Содержание: 2024 | 2023 | 2022 | 2021 | 2020 | 2019 | 2018 | 2017 | 2016 | 2015 | 2014 |2013 | 2012 | 2011 | 2010 | 2009 | 2008 | 2007 | 2006 | 2005 | 2004 | 2003 | 2002 | 2001
О физической структуре звуков З, ЗЬ, Ж, ЖЬ
язык: русский
получена 26.09.2014, опубликована 04.11.2014
Скачать статью (PDF, 224 кб, ZIP), используйте команду браузера "Сохранить объект как..."
Для чтения и распечатки статьи используйте «Adobe Acrobat© Reader» версии 4.0 или выше. Эта программа является бесплатной, ее можно получить на веб-сайте компании Adobe© (http://www.adobe.com/).
АННОТАЦИЯ
Метод аппроксимации применяется для разложения звуков З, ЗЬ, Ж, ЖЬ на моды с различными несущими частотами. Показано, что среди мод есть ведущие себя регулярно, есть хаотически вспыхивающие и тут же гаснущие, есть модулированные частотой первой из регулярных мод. Высказано предположение о том, что такое поведение мод приводит к явлению формант. Дано объяснение трудностям методов распознавания речи, основанных на преобразованиях Фурье. Предложено несколько вероятностных критериев, как для различения вышеуказанных звуков, так и для различения людей, произносящих эти звуки.
Ключевые слова: автоматическое распознавание речи, цифровая обработка сигналов, распознавание человеческого голоса.
15 страниц, 4 иллюстрации
Как сослаться на статью: В. В. Митянок. О физической структуре звуков З, ЗЬ, Ж, ЖЬ. Электронный журнал "Техническая акустика", http://ejta.org, 2014, 9.
ЛИТЕРАТУРА
1. Галунов В.И., Лобанов Б.М., Загоруйко Н.Г. Синтез и распознавание речи (попытка построения онтологии) // Акустика речи: материалы 14-й сессии российского акустического общества. Н.Новгород, 15 – 18 ноября 2004.
2. Лобанов Б.М. О развитии речевых технологий в Беларуси. // Речевые технологии. − 2008. − №1. − c. 49 − 59.
3. Сорокин В.Н. Фундаментальные исследования речи и прикладные задачи речевых технологий. // Речевые технологии. − 2008. − №1 − с. 18 − 48.
4. http://intsys.msu.ru/invest/speech/research. Интеллектуальные системы. Сайт кафедры МТИС и лаборатории теоретической кибернетики механико-математического ф-та МГУ.
5. Бабин Д.Н., Мазуренко И.Л., Холоденко А.Б. О перспективах создания системы автоматического распознавания слитной устной русской речи. // Интеллектуальные системы. − 2004 − Т.8, № 1 − 4. − с. 45 − 70.
6. Лобанов Б.М., Цирульник Л.И. Компьютерный синтез и клонирование речи / − Мн. : Белорусская наука, 2008. − 342 c.
7. Гецевич Ю.С., Лобанов Б.М. Система синтеза белорусской речи по тексту. // Речевые технологии. − 2010. − №1. − c. 91 − 100.
8. Митянок В.В., Коновалова Н.В. Применение фазового анализа звуков речи для распознавания человека по его голосу. [Электронный ресурс] //Техническая акустика. – Электрон. журн. − 2013. − №4. − Режим доступа: http://www.ejta.org, свободный.
9. Митянок В.В. О числовых характеристиках некоторых низкочастотных звуков человеческой речи [Электронный ресурс] // Техническая акустика. – Электрон. журн. − 2008. − №15. − Режим доступа: http://www.ejta.org, свободный.
10. Митянок В.В. Определение числовых характеристик высокочастотных звуков речи на основе аппроксимации гармоническими функциями. // Известия НАН Беларуси, сер. ф.-м.н. − 2009. − №2 − c. 111 − 118.
Вячеслав Владимирович Митянок, 1951 г.р., к.ф.-м.н., доцент кафедры высшей математики и информационных технологий Полесского гос ун-та. Обучался в 18-м интернате г. Москвы. В 1975 году защитил кандидатскую диссертацию по проблемам движения тел в общей теории относительности. Область научных интересов - теоретическая физика, теория переменных звезд, математическая обработка сигналов, автоматическое распознавание образов. e-mail: mitsianok(at)mail.ru |