Assessment of data augmentation techniques with synthetic images in uncommon datasets cases

Repetto Ferrero, Andrés Mauricio - León Moreira, Federico De

Resumen:

El siguiente trabajo final se centra en el área de la Computer Vision (CV) haciendo foco en el uso de imágenes y en los problemas de clasificación relacionados con ellas. Se propone la generación de datos sintéticos a través de técnicas modernas generativas de Inteligencia Artificial (IA) para imágenes, como los modelos de difusión, como una alternativa a las técnicas convencionales de Data Augmentation. Se corrobora que los modelos entrenados con una combinación de datos reales y sintéticos pueden superar a los entrenados sólo con datos reales. Ésta mejora, sin embargo, mostró variaciones significativas dependiendo del conjunto de datos y de la técnica generativa empleada. En un dataset particular, caracterizado por su simplicidad y uniformidad, el rendimiento demostró ser bueno. Por otro lado, en conjuntos de datos más variados, raros o especializados, los desafíos en la adaptación de los modelos generativos resaltaron la necesidad de un análisis cuidadoso. El conocimiento previo de los modelos generativos en los conceptos utilizados en el ajuste fino resultó ser crucial para obtener imágenes sintéticas de calidad. Esto subraya la importancia de entrenar los modelos generativos en una amplia variedad de datos para que puedan reproducir los conceptos necesarios de manera efectiva. En resumen, los datos sintéticos sirven en algunos casos como una herramienta valiosa para mejorar la eficiencia de los modelos de ML en tareas de CV, particularmente con conjuntos de datos complejos debido a las características específicas dentro de sus clases o el desbalanceo de las mismas.


Detalles Bibliográficos
2023
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
APRENDIZAJE PROFUNDO
INTELIGENCIA ARTIFICIAL
Inglés
Universidad ORT Uruguay
RAD
http://hdl.handle.net/20.500.11968/6579
Acceso abierto
_version_ 1807261360833167360
author Repetto Ferrero, Andrés Mauricio
author2 León Moreira, Federico De
author2_role author
author_facet Repetto Ferrero, Andrés Mauricio
León Moreira, Federico De
author_role author
bitstream.checksum.fl_str_mv f8df27961d02cc618a688bd95548758e
f29091bd2f463a4d99431f212a1e65c4
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
bitstream.url.fl_str_mv https://rad.ort.edu.uy/bitstreams/b0da968d-087c-4db8-8502-249b04df545c/download
https://rad.ort.edu.uy/bitstreams/efa9c1c0-9319-4d11-b655-0aad81d6e887/download
collection RAD
dc.contributor.advisor.none.fl_str_mv Franz Mayr Ojeda
dc.contributor.tribunal.none.fl_str_mv Braberman, Víctor Adrián
Olloniego Rocca, Juan Andrés
dc.creator.none.fl_str_mv Repetto Ferrero, Andrés Mauricio
León Moreira, Federico De
dc.date.issued.none.fl_str_mv 2023
dc.description.abstract.none.fl_txt_mv El siguiente trabajo final se centra en el área de la Computer Vision (CV) haciendo foco en el uso de imágenes y en los problemas de clasificación relacionados con ellas. Se propone la generación de datos sintéticos a través de técnicas modernas generativas de Inteligencia Artificial (IA) para imágenes, como los modelos de difusión, como una alternativa a las técnicas convencionales de Data Augmentation. Se corrobora que los modelos entrenados con una combinación de datos reales y sintéticos pueden superar a los entrenados sólo con datos reales. Ésta mejora, sin embargo, mostró variaciones significativas dependiendo del conjunto de datos y de la técnica generativa empleada. En un dataset particular, caracterizado por su simplicidad y uniformidad, el rendimiento demostró ser bueno. Por otro lado, en conjuntos de datos más variados, raros o especializados, los desafíos en la adaptación de los modelos generativos resaltaron la necesidad de un análisis cuidadoso. El conocimiento previo de los modelos generativos en los conceptos utilizados en el ajuste fino resultó ser crucial para obtener imágenes sintéticas de calidad. Esto subraya la importancia de entrenar los modelos generativos en una amplia variedad de datos para que puedan reproducir los conceptos necesarios de manera efectiva. En resumen, los datos sintéticos sirven en algunos casos como una herramienta valiosa para mejorar la eficiencia de los modelos de ML en tareas de CV, particularmente con conjuntos de datos complejos debido a las características específicas dentro de sus clases o el desbalanceo de las mismas.
dc.description.none.fl_txt_mv Incluye bibliografía y anexos.
dc.format.extent.none.fl_str_mv 71 p. diagrs., fot., tbls.
dc.identifier.citation.none.fl_str_mv Repetto Ferrero, A. M., & León Moreira, F. D. (2023). Assessment of data augmentation techniques with synthetic images in uncommon datasets cases (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.
dc.identifier.uri.none.fl_str_mv http://hdl.handle.net/20.500.11968/6579
dc.language.iso.none.fl_str_mv Inglés.
eng
dc.publisher.none.fl_str_mv Universidad ORT Uruguay
dc.relation.other.none.fl_str_mv https://sisbibliotecas.ort.edu.uy/bib/95045
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:RAD
instname:Universidad ORT Uruguay
instacron:Universidad ORT
dc.subject.none.fl_str_mv PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
APRENDIZAJE PROFUNDO
INTELIGENCIA ARTIFICIAL
dc.title.none.fl_str_mv Assessment of data augmentation techniques with synthetic images in uncommon datasets cases
dc.type.none.fl_str_mv Trabajo final de carrera
info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
description Incluye bibliografía y anexos.
eu_rights_str_mv openAccess
format bachelorThesis
id RAD_07727951b359c4172496c3cd002b70ab
identifier_str_mv Repetto Ferrero, A. M., & León Moreira, F. D. (2023). Assessment of data augmentation techniques with synthetic images in uncommon datasets cases (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.
instacron_str Universidad ORT
institution Universidad ORT
instname_str Universidad ORT Uruguay
language eng
language_invalid_str_mv Inglés.
network_acronym_str RAD
network_name_str RAD
oai_identifier_str oai:rad.ort.edu.uy:20.500.11968/6579
publishDate 2023
publisher.none.fl_str_mv Universidad ORT Uruguay
reponame_str RAD
repository.mail.fl_str_mv rodriguez_v@ort.edu.uy
repository.name.fl_str_mv RAD - Universidad ORT Uruguay
repository_id_str 3927
spelling Franz Mayr OjedaBraberman, Víctor AdriánOlloniego Rocca, Juan AndrésRepetto Ferrero, Andrés MauricioLeón Moreira, Federico De2023Incluye bibliografía y anexos.El siguiente trabajo final se centra en el área de la Computer Vision (CV) haciendo foco en el uso de imágenes y en los problemas de clasificación relacionados con ellas. Se propone la generación de datos sintéticos a través de técnicas modernas generativas de Inteligencia Artificial (IA) para imágenes, como los modelos de difusión, como una alternativa a las técnicas convencionales de Data Augmentation. Se corrobora que los modelos entrenados con una combinación de datos reales y sintéticos pueden superar a los entrenados sólo con datos reales. Ésta mejora, sin embargo, mostró variaciones significativas dependiendo del conjunto de datos y de la técnica generativa empleada. En un dataset particular, caracterizado por su simplicidad y uniformidad, el rendimiento demostró ser bueno. Por otro lado, en conjuntos de datos más variados, raros o especializados, los desafíos en la adaptación de los modelos generativos resaltaron la necesidad de un análisis cuidadoso. El conocimiento previo de los modelos generativos en los conceptos utilizados en el ajuste fino resultó ser crucial para obtener imágenes sintéticas de calidad. Esto subraya la importancia de entrenar los modelos generativos en una amplia variedad de datos para que puedan reproducir los conceptos necesarios de manera efectiva. En resumen, los datos sintéticos sirven en algunos casos como una herramienta valiosa para mejorar la eficiencia de los modelos de ML en tareas de CV, particularmente con conjuntos de datos complejos debido a las características específicas dentro de sus clases o el desbalanceo de las mismas.71 p. diagrs., fot., tbls.Repetto Ferrero, A. M., & León Moreira, F. D. (2023). Assessment of data augmentation techniques with synthetic images in uncommon datasets cases (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.http://hdl.handle.net/20.500.11968/6579Inglés.engUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/95045PROYECTOS-MDBIG DATAAPRENDIZAJE AUTOMÁTICOAPRENDIZAJE PROFUNDOINTELIGENCIA ARTIFICIALAssessment of data augmentation techniques with synthetic images in uncommon datasets casesTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3704https://rad.ort.edu.uy/bitstreams/b0da968d-087c-4db8-8502-249b04df545c/downloadf8df27961d02cc618a688bd95548758eMD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf19535888https://rad.ort.edu.uy/bitstreams/efa9c1c0-9319-4d11-b655-0aad81d6e887/downloadf29091bd2f463a4d99431f212a1e65c4MD5120.500.11968/65792024-07-22 15:57:42.168oai:rad.ort.edu.uy:20.500.11968/6579https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T15:57:42RAD - Universidad ORT Uruguayfalse
spellingShingle Assessment of data augmentation techniques with synthetic images in uncommon datasets cases
Repetto Ferrero, Andrés Mauricio
PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
APRENDIZAJE PROFUNDO
INTELIGENCIA ARTIFICIAL
status_str publishedVersion
title Assessment of data augmentation techniques with synthetic images in uncommon datasets cases
title_full Assessment of data augmentation techniques with synthetic images in uncommon datasets cases
title_fullStr Assessment of data augmentation techniques with synthetic images in uncommon datasets cases
title_full_unstemmed Assessment of data augmentation techniques with synthetic images in uncommon datasets cases
title_short Assessment of data augmentation techniques with synthetic images in uncommon datasets cases
title_sort Assessment of data augmentation techniques with synthetic images in uncommon datasets cases
topic PROYECTOS-MD
BIG DATA
APRENDIZAJE AUTOMÁTICO
APRENDIZAJE PROFUNDO
INTELIGENCIA ARTIFICIAL
url http://hdl.handle.net/20.500.11968/6579