Содержание: 2024 | 2023 | 2022 | 2021 | 2020 | 2019 | 2018 | 2017 | 2016 | 2015 | 2014 |2013 | 2012 | 2011 | 2010 | 2009 | 2008 | 2007 | 2006 | 2005 | 2004 | 2003 | 2002 | 2001
Применение фазового анализа звуков речи для распознавания человека по его голосу
язык: русский
получена 02.04.2013, опубликована 21.05.2013
Скачать статью (PDF, 209 кб, ZIP), используйте команду браузера "Сохранить объект как..."
Для чтения и распечатки статьи используйте «Adobe Acrobat© Reader» версии 4.0 или выше. Эта программа является бесплатной, ее можно получить на веб-сайте компании Adobe© (http://www.adobe.com/).
АННОТАЦИЯ
Метод аппроксимации используется для разложения различных звуков речи человека на составляющие их моды. Представлены данные о 5 конкретных звуках, полученных от 11 респондентов. Определена динамика амплитуд и фаз различных мод. Обнаружено, что фазы различных мод не являются независимыми случайными величинами, наоборот, между ними имеются зависимости, причем уникальные для каждого из респондентов. Это указывает на перспективу разработки компьютерной программы автоматической идентификации человека по его голосу на уровне, имеющем доказательную юридическую силу.
Ключевые слова: автоматическое распознавание речи, цифровая обработка сигналов, распознавание человека по голосу.
10 страниц, 4 иллюстрации
Как сослаться на статью: В. В. Митянок, Н. В. Коновалова. Применение фазового анализа звуков речи для распознавания человека по его голосу. Электронный журнал "Техническая акустика", http://ejta.org, 2013, 4.
ЛИТЕРАТУРА
1. Сорокин, В.Н. Распознавание личности по голосу: аналитический обзор / В.Н. Сорокин, В.В. Вьюгин, А.А. Тананыкин // Информационные процессы. – 2012. – Т12. – N.1. – С.1.
2. Способ контактно-разностной акустической идентификации личности: Пат. РФ 2451346. МПК G10L17/00 / Дворянкин С.В., Голубинский А.Н. – N2011116633/08; заявл. 27.04.2011; опубл.20.05.2012 // Бюлл. N14 – 11 с.
3. Способ аутентификации диктора по парольной фразе: Пат РФ 2422920 и РФ 2422921. МПК G10L15/00 / Столов Е. Л. – заявка N2009106368/09; заявл.24.02.2009; опубл. 27.06.2011 // Бюлл. N18, – заявка N2009130688; заявл.11.08.2009; опубл. 27.06.2011; Бюлл. // N18.
4. Митянок, В.В. О числовых характеристиках некоторых низкочастотных звуков человеческой речи [Электронный ресурс] // Техническая акустика. – Электрон. журн. – 2008. – 15. – Режим доступа: http://www.ejta.org, свободный.
5. Митянок, В.В. Определение числовых характеристик высокочастотных звуков речи на основе аппроксимации гармоническими функциями / В.В. Митянок // Известия НАН Беларуси, Сер.ф.-м.н. – 2009. – N2. – C. 111.
6. Калинина, В.Н. Математическая статистика / В.Н. Калинина, В.Ф. Панкин. – М: Изд-во «Дрофа», 2002. – 336 c.
7. Воскобойников, Ю.Е. Фильтрация сигналов и изображений: Фурье и вейвлет алгоритмы / Ю.Е. Воскобойников, А.В. Гочаков, А.Б. Колкер. – Новосибирск: Изд-во «СИБСТРИН», 2010. – 195 c.
Вячеслав Владимирович Митянок, 1951 г.р., к.ф.-м.н., доцент кафедры высшей математики и информационных технологий Полесского гос ун-та. Обучался в 18-м интернате г. Москвы. В 1975 году защитил кандидатскую диссертацию по проблемам движения тел в общей теории относительности. Область научных интересов - теоретическая физика, теория переменных звезд, математическая обработка сигналов, автоматическое распознавание образов. e-mail: mitsianok(at)mail.ru |
||
Нонна Владимировна Коновалова, к.ф.-м.н., доцент кафедры высшей математики и информационных технологий Полесского гос. ун-та. В 1992 году защитила кандидатскую диссертацию по динамике ряда органических веществ в живых организмах. Область научных интересов - биофизика, биохимические и биофизические процессы в организме человека. |