Кто-нибудь занимался получением мел-кепстральных коэффициентов сигнала.
Это, например, может использоваться для анализа речи.
Дело в том, что у меня уже в глазах рябит одни и теже формулы смотреть, которые записаны по-разному.
К сожалению, авторы либо небрежны и допускают ошибки, либо пропускают интересующую меня часть.
Суть алгоритма заключается в следующих этапах.
1. Берем wav-файл, считываем сэмплы, нормализуем их по максимальному значению, разбиваем их на фреймы по 128 мсек, например. Умножаем каждый фрейм на окно. У нас получится вектор векторов из амплитуд, т.е. double.
2. Далее, применяем дискретное преобразование Фурье - получаем тот же вектор векторов, но состоящий из комплексных чисел, соответствующих каждому семплу и содержащих амплитуду и фазу сигнала.
3. Длее вычисляем спектральную плотность для каждого семпла, т.е. получаем периодограмму (берем модуль каждого комплексного сигнала и возводим в квадрат, получаем double).
4. А вот дальше что делать не пойму. Надо перейти к мел-шкале, но как - не могу понять. Тут просто учитывается особенность человеческого уха, и есть формула перевода частоты в Герцах к частоте в мелах. Как это прикрутить к алгоритму - не понятно. Далее строится Банк фильтров, которые лучше пропускают низкочастотный сигналы и хуже высокочастотные. Формула есть - как ее применить не понятно из-за того, что не расписаны все переменные.
5. Дальше логарифмируем и должны получится мел-кепстральные коэффициенты. На сколько я понял, их заданное количество (рекомендуют 20-30) на фрейм.. (или на семпл?).. фильтров тоже заданное количество и тоже рекомендуют сделать около 20-30. Не понятно, есть свзь между ними или нет.
Я накидаю сюда ссылок, которые я смотрел, но они мне не помогли понять, как отфильтровать спектральную плотность и перейти к мел-шкале.
https://habrahabr.ru/post/144491/http://www.ccas.ru/avtorefe/0014dhttp://portal.tpu.ru/SHARED/s/STANKEVICHFV/publications/Tab/Thesis_Recognition_of_Musical_Instruments.pdfhttp://elib.spbstu.ru/dl/2/v17-5884.pdf/download/v17-5884.pdfhttp://practicalcryptography.com/miscellaneous/machine-learning/guide-mel-frequency-cepstral-coefficients-mfccs/