Comparing audio descriptors for singing voice detection in music audio files :: SILO. Sistema nacional de repositorios digitales. Uruguay

Conferencia Publicado

Comparing audio descriptors for singing voice detection in music audio files

Herrera, Perfecto - Rocamora, Martín

Resumen:

Given the relevance of the singing voice in popular western music, a system able to reliable identify those portions of a music audio file containing vocals would be very useful. In this work, we explore already used descriptors to perform this task and compare the performance of a statistical classifier using each kind of them, concluding that MFCC are the most appropriate. As an outcome of our study, an effective statistical classification system with a reduced set of descriptors for singing voice detection in music audio files is presented. The performance of the system is validated using independent datasets of popular music for training, validation and testing, reaching a classification performance of 78.5% on the testing set.

Detalles Bibliográficos
Fecha de publicación:	2007
Temas:	Procesamiento de Señales
Idioma	Inglés
Institución:	Universidad de la República
Repositorio:	COLIBRI
Enlace(s):	https://hdl.handle.net/20.500.12008/38794
Nivel de acceso:	Acceso abierto
Licencia:	Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)

Resultados similares

Separation and classification of harmonic sounds for singing voice detection
Autor(es):: Rocamora, Martín
Fecha de publicación:: (2012)

Wind instruments synthesis toolbox for generation of music audio signals with labeled partials
Autor(es):: Rocamora, Martín
Fecha de publicación:: (2009)

Singing voice detection in polyphonic music
Autor(es):: Rocamora, Martín
Fecha de publicación:: (2011)

Transient and steady-state component separation for audio signals
Autor(es):: Irigaray, Ignacio
Fecha de publicación:: (2014)

An audio-visual database of candombe performances for computational musicological studies
Autor(es):: Rocamora, Martín
Fecha de publicación:: (2015)

Tecnologías para el análisis del contenido musical de grabaciones de audio
Autor(es):: Rocamora, Martín
Fecha de publicación:: (2014)

Detection of ENF discontinuities using PLL for audio authenticity
Autor(es):: Fuentes, Magdalena
Fecha de publicación:: (2016)

Pitch tracking in polyphonic audio by clustering local fundamental frequency estimates
Autor(es):: Rocamora, Martín
Fecha de publicación:: (2011)

A multimodal approach for percussion music transcription from audio and video
Autor(es):: Marenco, Bernardo
Fecha de publicación:: (2015)

Visual music transcription of clarinet video recordings trained with audio-based labelled data
Autor(es):: Zinemanas, Pablo
Fecha de publicación:: (2017)

Audio source separation techniques including novel time-frequency representation tools
Autor(es):: Cancela, Pablo
Fecha de publicación:: (2015)

Reconocimiento de patrones rítmicos en música de percusión a partir de señales de audio
Autor(es):: Marenco, Bernardo
Fecha de publicación:: (2018)

Alineación audio-partitura para música ejecutada con flauta traversa.
Autor(es):: Braga Brum, Juan Pablo
Fecha de publicación:: (2018)

Reconocimiento de patrones rítmicos en señales de audio
Autor(es):: Marenco, Bernardo
Fecha de publicación:: (2019)

Tararira : query by singing system
Autor(es):: López, Ernesto
Fecha de publicación:: (2006)

Alineación entre audio y partitura para obras del repertorio de la flauta traversa.
Autor(es):: Braga Brum, Juan Pablo
Fecha de publicación:: (2018)

Fan chirp transform for music representation
Autor(es):: Cancela, Pablo
Fecha de publicación:: (2010)

An efficient multi-resolution spectral transform for music analysis
Autor(es):: Cancela, Pablo
Fecha de publicación:: (2009)

Pitch content visualization tools for music performance analysis
Autor(es):: Jure, Luis
Fecha de publicación:: (2012)

Leveraging pre-trained autoencoders for interpretable prototype learning of music audio.
Autor(es):: Alonso-Jiménez, Pablo
Fecha de publicación:: (2024)

An unsupervised point alignment detection algorithm
Autor(es):: Lezama, José
Fecha de publicación:: (2015)

Separación de Voz Cantada (Singing Voice Separation)
Autor(es):: Samas, Andrés
Fecha de publicación:: (2008)

Audio-based classroom activity detection for primary school lessons
Autor(es):: Ríos, Braulio
Fecha de publicación:: (2023)

Tools for detection and classification of piano drum patterns from candombe recordings
Autor(es):: Rocamora, Martín
Fecha de publicación:: (2014)

A Public dynamic PET brain database for lesion detection and quantification
Autor(es):: Martínez, Natalia
Fecha de publicación:: (2015)

Comparing different labeling strategies in anomalous power consumptions detection
Autor(es):: Rodríguez, Fernanda
Fecha de publicación:: (2015)

Reducing anomaly detection in images to detection in noise
Autor(es):: Davy, Axel
Fecha de publicación:: (2018)

Automatic object detection using shape information in ultrasound images
Autor(es):: Cancela, Pablo
Fecha de publicación:: (2003)

Detection of follicles in ultrasound videos of bovine ovaries
Autor(es):: Gómez, Alvaro
Fecha de publicación:: (2017)

A contrario detection of good continuation of points
Autor(es):: Morel, Jean-Michel
Fecha de publicación:: (2014)

Teaching practices analysis through audio signal processing
Autor(es):: Ríos, Braulio
Fecha de publicación:: (2023)

Monitoring earths surface dynamics with optical imagery
Autor(es):: Leprince, Sébastien
Fecha de publicación:: (2008)

A multiscale approach to InSAR time series analysis
Autor(es):: Simons, Mark
Fecha de publicación:: (2008)

Global solar irradiation assessment in Uruguay using tarpley model and GOES satellite images
Autor(es):: Alonso Suárez, Rodrigo
Fecha de publicación:: (2011)

Blind subpixel point spread function estimation from scaled image pairs
Autor(es):: Delbracio, Mauricio
Fecha de publicación:: (2012)

Non-parametric sub-pixel local point spread function estimation
Autor(es):: Almansa, Andrés
Fecha de publicación:: (2012)

Subpixel point spread function estimation from two photographs at different distances
Autor(es):: Almansa, Andrés
Fecha de publicación:: (2012)

Sparsity-based restoration of SMOS images in the presence of outliers
Autor(es):: Preciozzi, Javier
Fecha de publicación:: (2012)

Transient and steady-state component extration using nonlinear filtering
Autor(es):: Irigaray, Ignacio
Fecha de publicación:: (2013)

Boruvka meets nearest neighbors
Autor(es):: Tepper, Mariano
Fecha de publicación:: (2013)