Análisis automático de voz hablada para detección de dificultades en el aprendizaje de la lectura
Supervisor(es): Rocamora, Martín - Cancela, Pablo
Resumen:
Este trabajo busca realizar la automatización del análisis de los test de nominación automatizada rápida (RAN). El test RAN es un predictor de dificultades en la lectura muy utilizado. Esta técnica requiere grabar la voz de un niño nombrando una serie de palabras que se repiten en cierta secuencia conocida, y posteriormente, escuchar y analizar la grabación generada. Este análisis posterior dificulta la utilización masiva del test RAN ya que demanda considerable tiempo de análisis. La automatización del análisis de los test RAN podría posibilitar la implementación masiva de los mismos como herramienta de screening. El algoritmo que se implementó se basa en la idea de que el test usa elementos que se repiten a lo largo del mismo, es decir, se basa en la autosimilitud de la señal. Se implementa un detector de actividad vocal para identificar el inicio y fin de cada palabra, y se utiliza Dynamic Time Warping para comparar los segmentos de audio de voz identificados. Luego se reconstruye la secuencia de palabras utilizando Spectral Clustering, detección de outliers y distancia de edición. Finalmente se compara la secuencia obtenida con la secuencia de la matriz original del test RAN, detectando los errores cometidos.
2018 | |
Test RAN Aprendizaje de la lectura PROCESAMIENTO DEL HABLA |
|
Español | |
Universidad de la República | |
COLIBRI | |
http://hdl.handle.net/20.500.12008/18882 | |
Acceso abierto | |
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC - By-NC-ND) |
Sumario: | Este trabajo busca realizar la automatización del análisis de los test de nominación automatizada rápida (RAN). El test RAN es un predictor de dificultades en la lectura muy utilizado. Esta técnica requiere grabar la voz de un niño nombrando una serie de palabras que se repiten en cierta secuencia conocida, y posteriormente, escuchar y analizar la grabación generada. Este análisis posterior dificulta la utilización masiva del test RAN ya que demanda considerable tiempo de análisis. La automatización del análisis de los test RAN podría posibilitar la implementación masiva de los mismos como herramienta de screening. El algoritmo que se implementó se basa en la idea de que el test usa elementos que se repiten a lo largo del mismo, es decir, se basa en la autosimilitud de la señal. Se implementa un detector de actividad vocal para identificar el inicio y fin de cada palabra, y se utiliza Dynamic Time Warping para comparar los segmentos de audio de voz identificados. Luego se reconstruye la secuencia de palabras utilizando Spectral Clustering, detección de outliers y distancia de edición. Finalmente se compara la secuencia obtenida con la secuencia de la matriz original del test RAN, detectando los errores cometidos. |
---|