Conteo de multitudes a través de redes neuronales y aprendizaje profundo.

Gambone, Renzo

Supervisor(es): Etcheverry, Mathías - Musé, Pablo

Resumen:

Este trabajo es un acercamiento al área del conteo de multitudes, es decir, dada una imagen predecir correctamente cuántas personas hay en la misma, y opcionalmente brindar una noción de su posición en la imagen (en forma de un mapa de calor por ejemplo). Para resolver dicho problema se emplean técnicas de aprendizaje automático, más concretamente aprendizaje profundo orientado a la visión artificial. En este trabajo se estudió y plasmó en este informe cómo estas técnicas aplicadas al conteo de multitudes evolucionaron en la última década, posteriormente enfocándose en detallar las direcciones, técnicas y dificultades presentes en el estado del arte contemporáneo, así como también enumerando posibles direcciones en las que el mismo podría dirigirse en el futuro cercano (basadas en trabajos y arquitecturas emergentes y de gran promesa). Como parte de la experimentación se etiquetó un conjunto de datos a través de un módulo de taller, se evaluó la similitud entre las anotaciones realizadas, discutiendo sobre la dificultad de la tarea y el posible ruido en anotaciones de conjuntos ya existentes. También se evaluó el desempeño de varios modelos pre-entrenados en múltiples conjuntos de evaluación, discutiendo sobre particularidades, relaciones y anomalías encontradas en los resultados de sus métricas generales y algunos resultados destacados.


Detalles Bibliográficos
2023
Visión artificial
Conteo de multitudes
Aprendizaje profundo
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/39243
Acceso abierto
Licencia Creative Commons Atribución (CC - By 4.0)