Reconocimiento de patrones rítmicos en señales de audio

 

Autor(es):
Marenco, Bernardo
Tipo:
Tesis de maestría
Tutor(es) / Supervisor(es):
Rocamora, Martín ; Bermolen, Paola
Versión:
Aceptado
Resumen:

En este trabajo se presenta una metodología para el reconocimiento automático de patrones rítmicos en señales de audio, usando cadenas ocultas de Markov como herramienta de clasificación. Los experimentos reportados se concentran en el ritmo del candombe, en particular en los patrones rítmicos de los tambores repique y piano. En el caso del repique, se busca identificar en el audio algunos patrones rítmicos, propuestos por Luis Jure en su trabajo “Principios generativos del toque de repique del candombe”. La implementación de la metodología utiliza audio sintético para el entrenamiento de las cadenas ocultas, y los resultados obtenidos en el reconocimiento son muy buenos si el audio que se quiere clasificar es también sintético, obteniendo más del 90 % de acierto en la clasificación. Si se usa audio sintético para entrenar y grabaciones reales para clasificar, el desempeño cae drásticamente, siendo menor a 10 % en las pruebas realizadas. Se discuten algunas alternativas para mejorar la clasificación en ese caso, una de las cuales es implementada. Aún así, la clasificación de audios reales no mejora demasiado, resultando apenas superior al 10 %. Para el tambor piano, el problema es identificar en el audio qué compases se corresponden con su patrón más típico (referido usualmente como base de piano) y cuáles no (lo que se conoce como piano repicado). En este caso, tanto el entrenamiento como la evaluación de desempeño se realizan con grabaciones reales, y en ese caso se logra un buen porcentaje en la clasificación (superior al 80 % en todas las pruebas realizadas).

Año:
2019
Idioma:
Español
Temas:
Procesamiento de audio
Cadenas ocultas de Markov
Candombe
MIR
Patrones rítmicos
PROCESOS DE MARKOV
PROCESAMIENTO DE LA SEÑAL
INSTRUMENTOS MUSICALES
Institución:
Universidad de la República
Repositorio:
COLIBRI
Enlace(s):
https://hdl.handle.net/20.500.12008/22291
Nivel de acceso:
Acceso abierto