Herramientas computacionales para el análisis del entorno sonoro urbano

Zinemanas, Pablo

Supervisor(es): Cancela, Pablo - González, Alice Elizabeth

Resumen:

Muchos centros urbanos presentan niveles de ruido que pueden ser molestos para sus habitantes, o incluso nocivos para la salud. El ruido puede interferir en la vida cotidiana modificando la conducta de las personas y afectando el descanso. La exposici on prolongada a niveles de intensidad de sonido elevados produce daños en la salud. Por esta razón el entorno sonoro constituye frecuentemente una problemática en las ciudades, que cada vez tiene mayor presencia en los reclamos de las comunidades y grupos ambientalistas, en la planificación gubernamental y en los estudios académicos. En los ultimos años ha surgido el interés por desarrollar tecnologías para el monitoreo y diagnóstico del entorno sonoro urbano, orientadas a facilitar la planificación y la gestión de la ciudad. Se basan en una red de sensores distribuidos que permiten registrar audio y estimar los niveles de ruido en tiempo real. Además, mediante el uso de tecnologías de procesamiento de señales y aprendizaje automático, se busca generar de forma automática una descripción del tipo de ambiente sonoro registrado, incluyendo las fuentes que lo componen. Esto permite a las autoridades aplicar medidas correctivas, o desarrollar planes de monitoreo y gestión usando información del entorno sonoro. En esta tesis se estudian herramientas computacionales para la caracterización de entornos sonoros urbanos. El foco del trabajo es la detección de eventos sonoros, lo que implica la clasificación de las fuentes presentes en el registro sonoro incluyendo su tiempo de inicio y duración. Se relevan las bases de datos disponibles y se concluye que es necesario crear propios de la ciudad de Montevideo. Esto conduce a la creación de la base de datos SonidosMVD, para lo que es preciso definir las clases de sonidos de interés y una taxonomía que las ordena. Muchos centros urbanos presentan niveles de ruido que pueden ser molestos para sus habitantes, o incluso nocivos para la salud. El ruido puede interferir en la vida cotidiana modificando la conducta de las personas y afectando el descanso. La exposici on prolongada a niveles de intensidad de sonido elevados produce daños en la salud. Por esta razón el entorno sonoro constituye frecuentemente una problemática en las ciudades, que cada vez tiene mayor presencia en los reclamos de las comunidades y grupos ambientalistas, en la planificación gubernamental y en los estudios académicos. En los ultimos años ha surgido el interés por desarrollar tecnologías para el monitoreo y diagnóstico del entorno sonoro urbano, orientadas a facilitar la planificación y la gestión de la ciudad. Se basan en una red de sensores distribuidos que permiten registrar audio y estimar los niveles de ruido en tiempo real. Además, mediante el uso de tecnologías de procesamiento de señales y aprendizaje automático, se busca generar de forma automática una descripción del tipo de ambiente sonoro registrado, incluyendo las fuentes que lo componen. Esto permite a las autoridades aplicar medidas correctivas, o desarrollar planes de monitoreo y gestión usando información del entorno sonoro. En esta tesis se estudian herramientas computacionales para la caracterización de entornos sonoros urbanos. El foco del trabajo es la detección de eventos sonoros, lo que implica la clasificación de las fuentes presentes en el registro sonoro incluyendo su tiempo de inicio y duración. Se relevan las bases de datos disponibles y se concluye que es necesario crear propios de la ciudad de Montevideo. Esto conduce a la creación de la base de datos SonidosMVD, para lo que es preciso definir las clases de sonidos de interés y una taxonomía que las ordena.Muchos centros urbanos presentan niveles de ruido que pueden ser molestos para sus habitantes, o incluso nocivos para la salud. El ruido puede interferir en la vida cotidiana modificando la conducta de las personas y afectando el descanso. La exposici on prolongada a niveles de intensidad de sonido elevados produce daños en la salud. Por esta razón el entorno sonoro constituye frecuentemente una problemática en las ciudades, que cada vez tiene mayor presencia en los reclamos de las comunidades y grupos ambientalistas, en la planificación gubernamental y en los estudios académicos. En los ultimos años ha surgido el interés por desarrollar tecnologías para el monitoreo y diagnóstico del entorno sonoro urbano, orientadas a facilitar la planificación y la gestión de la ciudad. Se basan en una red de sensores distribuidos que permiten registrar audio y estimar los niveles de ruido en tiempo real. Además, mediante el uso de tecnologías de procesamiento de señales y aprendizaje automático, se busca generar de forma automática una descripción del tipo de ambiente sonoro registrado, incluyendo las fuentes que lo componen. Esto permite a las autoridades aplicar medidas correctivas, o desarrollar planes de monitoreo y gestión usando información del entorno sonoro. En esta tesis se estudian herramientas computacionales para la caracterización de entornos sonoros urbanos. El foco del trabajo es la detección de eventos sonoros, lo que implica la clasificación de las fuentes presentes en el registro sonoro incluyendo su tiempo de inicio y duración. Se relevan las bases de datos disponibles y se concluye que es necesario crear propios de la ciudad de Montevideo. Esto conduce a la creación de la base de datos SonidosMVD, para lo que es preciso definir las clases de sonidos de interés y una taxonomía que las ordena. Por otro lado, se estudian las medidas de desempeño más utilizadas para este problema y se señalan los inconvenientes que surgen cuando se tiene un conjunto de datos muy desbalanceado. Se proponen nuevas medidas de desempeño que buscan ser más adecuadas para este problema. Se presentan experimentos de detección de eventos sonoros con distintos algoritmos de clasificación sobre distintos conjuntos de datos. En primer lugar se utilizan técnicas que involucran el procesamiento de señales para la extracción de características y reconocimiento de patrones para la clasificación. Luego, se presentan técnicas de aprendizaje profundo. Se diseña un modelo end-to-end, cuya entrada es la forma de onda de la señal y la salida es el vector de clasificación, y se muestra su utilidad para este problema. Esto se realiza concatenando dos redes: una para la extracción de características y otra para la clasificación. Se muestra que se pueden diseñar dichos modelos utilizando conocimiento sobre el problema para comenzar el entrenamiento desde un punto de vista inicial que ha demostrado brindar buenos resultados. Con este sistema se obtienen resultados de clasificación similares a los del estado el arte mientras que se disminuye el número de parámetros involucrados.


Detalles Bibliográficos
2019
Entorno sonoro urbano
Ruido
Sensores
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/21329
Acceso abierto
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC-BY-NC-ND)