ОБЗОР СТРУКТУР АЛГОРИТМОВ ПОИСКА НА ОСНОВЕ ОТПЕЧАТКОВ АУДИОДАННЫХ
Научная публикация
ОБЗОР СТРУКТУР АЛГОРИТМОВ ПОИСКА НА ОСНОВЕ ОТПЕЧАТКОВ АУДИОДАННЫХ
Автор(ы): И. А. Веялкин, Д. В. Шиман
УДК: 004.23
Год издания: 2015
Дата загрузки: 03.02.2016
Загрузил(а): Левитская А. А.

Описание:
Выполнен обзор алгоритмов аудиопоиска и этапов реализации таких алгоритмов. Выявле-
ны ключевые особенности существующих методик аудиопоиска и указаны подходы к реше-
нию задачи распознавания образа в контексте аудиоданных. Проведен анализ параметров ал-
горитмов аудиопоиска, характеризующих область эффективного применения (контекст зада-
чи). В данной работе отмечены критерии устойчивости конкретного алгоритма или включен-
ных в него этапов к искажениям. Представлена информация об эффективности поиска и ее
зависимость от объема данных, а также экстремумы. Оценена скорость расчета отдельных па-
раметров, в частности метрик сравнения, необходимых для оценки подобия искомого фраг-
мента и конкретного вхождения во множество поиска. Предложены методики определения
степени достоверности результатов поиска, основанные на коэффициенте ложных срабатыва-
ний и коэффициенте ложных отказов.
Для проведения анализа за основу брались применяемые на практике в коммерческих про-
дуктах (таких как Shazam, MusicBrainz) алгоритмы. В статье описаны современные тенденции в
развитии существующих подходов, основанные на методах анализа данных, в том числе с при-
менением нейронных сетей, а также алгоритмов распознавания изображения. Последние, в свою
очередь, требуют преобразования способа представления данных. Двоичное представление
оцифрованного входного аудиосигнала можно интерпретировать как набор аудиопризнаков, ли-
бо изображений с набором визуальных признаков.

Использование электронных материалов, размещенных на данном сайте, осуществляется на договорной основе. Разрешается использовать ресурсы в единичном экземпляре и исключительно в личных целях.



Физико-математические науки и информатика