Análisis y aplicaciones sobre letras musicales del Río de la Plata

Ferraro Paolino, Andrés

Supervisor(es): Moncecchi, Guillermo - Cancela, Pablo

Resumen:

A partir del año 2015 el consumo de música por medio de soportes digitales superó el consumo en medios físicos, en gran parte debido al creciente uso de los servicios de música online. Dado el tamaño de las colecciones musicales que manejan estos servicios, es importante contar con sistemas capaces de categorizar y recomendar la música de forma automática. Es por esto que desde hace varios años se viene investigando sobre la clasificación y recomendación automática de canciones en el área de la recuperación de información musical, ya sea a partir de su contenido o de su contexto. En este trabajo se analizan distintas técnicas para representar las canciones basadas únicamente en sus letras, con el objetivo de encontrar aquella que permita obtener una representación que mantenga la similitud entre las letras de las canciones. Para evaluar el desempeño se utilizan las representaciones en distintas tareas de clasificación. Una parte importante de esta tesis es la recolección del corpus de datos utilizados, ya que el trabajo se enfoca en algunos géneros musicales relacionados con el Río de la Plata que actualmente no cuentan con un conjunto de datos para trabajar (por ejemplo: Tango, Milonga o Candombe). No hay muchos trabajos anteriores que se enfoquen en letras de canciones en español, por lo tanto, decidimos ofrecer parte del conjunto de datos abiertamente para favorecer la investigación sobre estos géneros musicales. Una vez obtenido el corpus de datos, es explorado mediante algunas técnicas basadas en aprendizaje no supervisado. Luego, se profundiza en técnicas basadas en redes neuronales recurrentes para obtener las representaciones de las letras. Por último, se utilizan las representaciones obtenidas para calcular similitud entre ellas, permitiendo explorar estos resultados a través de una interfaz web. Mediante la misma interfaz, también se puede navegar por el conjunto de datos recolectado, siendo un aporte para todos las personas que deseen conocer más sobre estos géneros musicales.


Detalles Bibliográficos
2018
Procesamiento del lenguaje natural
Aprendizaje automático
Recuperación de información musical
Redes neuronales profundas
Representación distribuida
MUSICA
REDES NEURALES
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/22286
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)