Aprendizaje profundo para la extracción de edificios en ciudades sin planificación urbana
Supervisor(es): Nesmachnow, Sergio - Toutouh, Jamal
Resumen:
Este proyecto estudia el problema de extracción de edificios, como subtarea de segmentación de imágenes, sobre ciudades o poblados con poca o nula planificación urbana. Para abordar del problema se seleccionaron las arquitecturas de redes neuronales profundas FCN, ResNet (y sus variantes) y U-Net, en conjunto con una serie de hiperparámetros (función de perdida, tasa de aprendizaje) con el n de encontrar los modelos que mejor se desempeñan en la tarea. Para este propósito se diseñó un proceso de selección progresivo y eliminatorio dividido en tres etapas y con dos criterios distintos de selección. Se definieron dos etapas adicionales que consisten en la calibración de los modelos elegidos y en el aplicado de votación de modelos para la clasificación de cada píxel de la imagen. Los resultados experimentales muestran un mejor rendimiento en general de las arquitecturas basadas en U-Net y la combinación de entropía cruzada con Tversky focalizado como función de pérdida. Los mejores desempeños alcanzaron un IoU de 0; 91 para el dataset de San José de las Matas, que fue generado exclusivamente con el propósito de validación de este trabajo. La obtención de resultados aceptables en la labor de extracción de edificios es el punto de partida para otras como la estimación de habitantes o la generación de la propia planificación urbana. En ese sentido, se tomo un área de estudio perteneciente a Montevideo (Uruguay) de la cual se tienen datos demográficos y se experimento estimando la población de la zona a partir de los edificios extraídos por los modelos. El producto del proceso de estimación aplicado tuvo un error de un 11,7% respecto a la estimación mas fiable para esa área en particular.
2021 | |
Aprendizaje automático Aprendizaje profundo Segmentación de imágenes Extracción de edificios Redes neuronales convolucionales FCN ResNet U-Net |
|
Español | |
Universidad de la República | |
COLIBRI | |
https://hdl.handle.net/20.500.12008/34130 | |
Acceso abierto | |
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0) |
Sumario: | Este proyecto estudia el problema de extracción de edificios, como subtarea de segmentación de imágenes, sobre ciudades o poblados con poca o nula planificación urbana. Para abordar del problema se seleccionaron las arquitecturas de redes neuronales profundas FCN, ResNet (y sus variantes) y U-Net, en conjunto con una serie de hiperparámetros (función de perdida, tasa de aprendizaje) con el n de encontrar los modelos que mejor se desempeñan en la tarea. Para este propósito se diseñó un proceso de selección progresivo y eliminatorio dividido en tres etapas y con dos criterios distintos de selección. Se definieron dos etapas adicionales que consisten en la calibración de los modelos elegidos y en el aplicado de votación de modelos para la clasificación de cada píxel de la imagen. Los resultados experimentales muestran un mejor rendimiento en general de las arquitecturas basadas en U-Net y la combinación de entropía cruzada con Tversky focalizado como función de pérdida. Los mejores desempeños alcanzaron un IoU de 0; 91 para el dataset de San José de las Matas, que fue generado exclusivamente con el propósito de validación de este trabajo. La obtención de resultados aceptables en la labor de extracción de edificios es el punto de partida para otras como la estimación de habitantes o la generación de la propia planificación urbana. En ese sentido, se tomo un área de estudio perteneciente a Montevideo (Uruguay) de la cual se tienen datos demográficos y se experimento estimando la población de la zona a partir de los edificios extraídos por los modelos. El producto del proceso de estimación aplicado tuvo un error de un 11,7% respecto a la estimación mas fiable para esa área en particular. |
---|