Exploración del espacio latente de redes neuronales generativas antagónicas para la generación de rostros.
Supervisor(es): Nesmachnow, Sergio
Resumen:
El objetivo principal de este proyecto fue investigar experimentalmente la exploración del espacio latente de una Red Generativa Antagónica (GAN) de rostros humanos mediante ejecuciones de un algoritmo evolutivo. Si bien los módulos generadores de rostros sintéticos logran su cometido, se desconoce cómo los diferentes atributos están representados y codificados en el espacio latente, por lo que es sencillo generar un rostro aleatorio, pero no uno con las características deseadas. En este proyecto se buscó guiar la búsqueda hacia características de una persona y una raza objetivo. El algoritmo evolutivo consta de dos módulos principales, un generador de rostros sintéticos y un evaluador. El generador en este caso fue StyleGAN3 y fue la GAN sobre la cual se quiso hacer la exploración. El evaluador fue DeepFace, un módulo de reconocimiento facial y detección de atributos tales como la raza, la edad y el género. Si bien este módulo permite realizar experimentos con los tres atributos, este proyecto se centró en la raza. Con los resultados del evaluador fue posible medir la aptitud de cada imagen generada y determinar así cuales fueron las que se acercan más al objetivo deseado. Para obtener el valor de aptitud se tuvo en cuenta la similitud del rostro generado con el rostro objetivo y la presencia de rasgos de la raza objetivo. Las imágenes seleccionadas como las mejores se sometieron a combinaciones y mutaciones para dar lugar a la siguiente generación del algoritmo evolutivo. Los resultados de probar individualmente el generador y el evaluador presentaron cierto sesgo al generar y evaluar individuos de raza blanca y edad adulta. Este sesgo se evidencia con la predominancia de rostros generados y una mayor precisión al momento de la evaluación en individuos con estas características. De todos modos, los experimentos realizados del algoritmo evolutivo con instancias variadas en edad, género y raza presentaron buenos resultados indistintamente del individuo y raza objetivo. En todos los experimentos realizados hubo soluciones que se encontraron dentro de los rangos de similitud con el objetivo esperado y una alta probabilidad de tener características de la raza deseada. Además de la eficacia del algoritmo, también se evaluó qué tan distintas eran las soluciones entre sí y su similitud con fotografías alternativas de las personas objetivo.
2024 | |
Aprendizaje automático Algoritmos evolutivos genéticos Redes generativas antagónicas Reconocimiento facial Espacio latente |
|
Español | |
Universidad de la República | |
COLIBRI | |
https://hdl.handle.net/20.500.12008/43859 | |
Acceso abierto | |
Licencia Creative Commons Atribución (CC - By 4.0) |
Sumario: | El objetivo principal de este proyecto fue investigar experimentalmente la exploración del espacio latente de una Red Generativa Antagónica (GAN) de rostros humanos mediante ejecuciones de un algoritmo evolutivo. Si bien los módulos generadores de rostros sintéticos logran su cometido, se desconoce cómo los diferentes atributos están representados y codificados en el espacio latente, por lo que es sencillo generar un rostro aleatorio, pero no uno con las características deseadas. En este proyecto se buscó guiar la búsqueda hacia características de una persona y una raza objetivo. El algoritmo evolutivo consta de dos módulos principales, un generador de rostros sintéticos y un evaluador. El generador en este caso fue StyleGAN3 y fue la GAN sobre la cual se quiso hacer la exploración. El evaluador fue DeepFace, un módulo de reconocimiento facial y detección de atributos tales como la raza, la edad y el género. Si bien este módulo permite realizar experimentos con los tres atributos, este proyecto se centró en la raza. Con los resultados del evaluador fue posible medir la aptitud de cada imagen generada y determinar así cuales fueron las que se acercan más al objetivo deseado. Para obtener el valor de aptitud se tuvo en cuenta la similitud del rostro generado con el rostro objetivo y la presencia de rasgos de la raza objetivo. Las imágenes seleccionadas como las mejores se sometieron a combinaciones y mutaciones para dar lugar a la siguiente generación del algoritmo evolutivo. Los resultados de probar individualmente el generador y el evaluador presentaron cierto sesgo al generar y evaluar individuos de raza blanca y edad adulta. Este sesgo se evidencia con la predominancia de rostros generados y una mayor precisión al momento de la evaluación en individuos con estas características. De todos modos, los experimentos realizados del algoritmo evolutivo con instancias variadas en edad, género y raza presentaron buenos resultados indistintamente del individuo y raza objetivo. En todos los experimentos realizados hubo soluciones que se encontraron dentro de los rangos de similitud con el objetivo esperado y una alta probabilidad de tener características de la raza deseada. Además de la eficacia del algoritmo, también se evaluó qué tan distintas eran las soluciones entre sí y su similitud con fotografías alternativas de las personas objetivo. |
---|