Procesamiento multimodal de señales en la interpretación de música

Marenco, Bernardo - Fuentes, Magdalena - Lanzaro, Florencia

Supervisor(es): Rocamora, Martín - Gómez, Álvaro

Resumen:

En el presente proyecto se propone un enfoque multimodal para la transcripción de la música de percusión a partir de grabaciones de audio y video. Se utilizaron varias técnicas de procesamiento de señales de manera de derivar información útil de cada uno de los modos. Esto incluyó la detección automática de ciertos objetos de interés en el video y la determinación del instante en el que ocurre un golpe en el audio. Para el desarrollo del sistema multimodal se resolvió utilizar el enfoque de Feature-Level Fusion, en el cual la integración de la información proveniente de cada modo se realiza a nivel de características. Una vez fusionada la información de los distintos modos, se utilizaron técnicas de reconocimiento de patrones para diseñar un sistema de clasificación multimodal. Se realizaron pruebas usando cada modo por separado para evaluar las ventajas de usar un enfoque mutlimodal respecto a utilizar un único modo. Dichos experimentos reflejan que este enfoque es capaz de mejorar el desempeño alcanzado con cada fuente de informacióon por separado, mostrando las ventajas del método propuesto.


Detalles Bibliográficos
2015
Música de percusión
Procesamiento de la señal acústica
Español
Universidad de la República
COLIBRI
http://hdl.handle.net/20.500.12008/5222
Acceso abierto
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)