Assessment of data augmentation techniques with synthetic images in uncommon datasets cases
Resumen:
El siguiente trabajo final se centra en el área de la Computer Vision (CV) haciendo foco en el uso de imágenes y en los problemas de clasificación relacionados con ellas. Se propone la generación de datos sintéticos a través de técnicas modernas generativas de Inteligencia Artificial (IA) para imágenes, como los modelos de difusión, como una alternativa a las técnicas convencionales de Data Augmentation. Se corrobora que los modelos entrenados con una combinación de datos reales y sintéticos pueden superar a los entrenados sólo con datos reales. Ésta mejora, sin embargo, mostró variaciones significativas dependiendo del conjunto de datos y de la técnica generativa empleada. En un dataset particular, caracterizado por su simplicidad y uniformidad, el rendimiento demostró ser bueno. Por otro lado, en conjuntos de datos más variados, raros o especializados, los desafíos en la adaptación de los modelos generativos resaltaron la necesidad de un análisis cuidadoso. El conocimiento previo de los modelos generativos en los conceptos utilizados en el ajuste fino resultó ser crucial para obtener imágenes sintéticas de calidad. Esto subraya la importancia de entrenar los modelos generativos en una amplia variedad de datos para que puedan reproducir los conceptos necesarios de manera efectiva. En resumen, los datos sintéticos sirven en algunos casos como una herramienta valiosa para mejorar la eficiencia de los modelos de ML en tareas de CV, particularmente con conjuntos de datos complejos debido a las características específicas dentro de sus clases o el desbalanceo de las mismas.
2023 | |
PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO APRENDIZAJE PROFUNDO INTELIGENCIA ARTIFICIAL |
|
Inglés | |
Universidad ORT Uruguay | |
RAD | |
http://hdl.handle.net/20.500.11968/6579 | |
Acceso abierto |
_version_ | 1807261360833167360 |
---|---|
author | Repetto Ferrero, Andrés Mauricio |
author2 | León Moreira, Federico De |
author2_role | author |
author_facet | Repetto Ferrero, Andrés Mauricio León Moreira, Federico De |
author_role | author |
bitstream.checksum.fl_str_mv | f8df27961d02cc618a688bd95548758e f29091bd2f463a4d99431f212a1e65c4 |
bitstream.checksumAlgorithm.fl_str_mv | MD5 MD5 |
bitstream.url.fl_str_mv | https://rad.ort.edu.uy/bitstreams/b0da968d-087c-4db8-8502-249b04df545c/download https://rad.ort.edu.uy/bitstreams/efa9c1c0-9319-4d11-b655-0aad81d6e887/download |
collection | RAD |
dc.contributor.advisor.none.fl_str_mv | Franz Mayr Ojeda |
dc.contributor.tribunal.none.fl_str_mv | Braberman, Víctor Adrián Olloniego Rocca, Juan Andrés |
dc.creator.none.fl_str_mv | Repetto Ferrero, Andrés Mauricio León Moreira, Federico De |
dc.date.issued.none.fl_str_mv | 2023 |
dc.description.abstract.none.fl_txt_mv | El siguiente trabajo final se centra en el área de la Computer Vision (CV) haciendo foco en el uso de imágenes y en los problemas de clasificación relacionados con ellas. Se propone la generación de datos sintéticos a través de técnicas modernas generativas de Inteligencia Artificial (IA) para imágenes, como los modelos de difusión, como una alternativa a las técnicas convencionales de Data Augmentation. Se corrobora que los modelos entrenados con una combinación de datos reales y sintéticos pueden superar a los entrenados sólo con datos reales. Ésta mejora, sin embargo, mostró variaciones significativas dependiendo del conjunto de datos y de la técnica generativa empleada. En un dataset particular, caracterizado por su simplicidad y uniformidad, el rendimiento demostró ser bueno. Por otro lado, en conjuntos de datos más variados, raros o especializados, los desafíos en la adaptación de los modelos generativos resaltaron la necesidad de un análisis cuidadoso. El conocimiento previo de los modelos generativos en los conceptos utilizados en el ajuste fino resultó ser crucial para obtener imágenes sintéticas de calidad. Esto subraya la importancia de entrenar los modelos generativos en una amplia variedad de datos para que puedan reproducir los conceptos necesarios de manera efectiva. En resumen, los datos sintéticos sirven en algunos casos como una herramienta valiosa para mejorar la eficiencia de los modelos de ML en tareas de CV, particularmente con conjuntos de datos complejos debido a las características específicas dentro de sus clases o el desbalanceo de las mismas. |
dc.description.none.fl_txt_mv | Incluye bibliografía y anexos. |
dc.format.extent.none.fl_str_mv | 71 p. diagrs., fot., tbls. |
dc.identifier.citation.none.fl_str_mv | Repetto Ferrero, A. M., & León Moreira, F. D. (2023). Assessment of data augmentation techniques with synthetic images in uncommon datasets cases (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. |
dc.identifier.uri.none.fl_str_mv | http://hdl.handle.net/20.500.11968/6579 |
dc.language.iso.none.fl_str_mv | Inglés. eng |
dc.publisher.none.fl_str_mv | Universidad ORT Uruguay |
dc.relation.other.none.fl_str_mv | https://sisbibliotecas.ort.edu.uy/bib/95045 |
dc.rights.none.fl_str_mv | info:eu-repo/semantics/openAccess |
dc.source.none.fl_str_mv | reponame:RAD instname:Universidad ORT Uruguay instacron:Universidad ORT |
dc.subject.none.fl_str_mv | PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO APRENDIZAJE PROFUNDO INTELIGENCIA ARTIFICIAL |
dc.title.none.fl_str_mv | Assessment of data augmentation techniques with synthetic images in uncommon datasets cases |
dc.type.none.fl_str_mv | Trabajo final de carrera info:eu-repo/semantics/bachelorThesis |
dc.type.version.none.fl_str_mv | info:eu-repo/semantics/publishedVersion |
description | Incluye bibliografía y anexos. |
eu_rights_str_mv | openAccess |
format | bachelorThesis |
id | RAD_07727951b359c4172496c3cd002b70ab |
identifier_str_mv | Repetto Ferrero, A. M., & León Moreira, F. D. (2023). Assessment of data augmentation techniques with synthetic images in uncommon datasets cases (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería. |
instacron_str | Universidad ORT |
institution | Universidad ORT |
instname_str | Universidad ORT Uruguay |
language | eng |
language_invalid_str_mv | Inglés. |
network_acronym_str | RAD |
network_name_str | RAD |
oai_identifier_str | oai:rad.ort.edu.uy:20.500.11968/6579 |
publishDate | 2023 |
publisher.none.fl_str_mv | Universidad ORT Uruguay |
reponame_str | RAD |
repository.mail.fl_str_mv | rodriguez_v@ort.edu.uy |
repository.name.fl_str_mv | RAD - Universidad ORT Uruguay |
repository_id_str | 3927 |
spelling | Franz Mayr OjedaBraberman, Víctor AdriánOlloniego Rocca, Juan AndrésRepetto Ferrero, Andrés MauricioLeón Moreira, Federico De2023Incluye bibliografía y anexos.El siguiente trabajo final se centra en el área de la Computer Vision (CV) haciendo foco en el uso de imágenes y en los problemas de clasificación relacionados con ellas. Se propone la generación de datos sintéticos a través de técnicas modernas generativas de Inteligencia Artificial (IA) para imágenes, como los modelos de difusión, como una alternativa a las técnicas convencionales de Data Augmentation. Se corrobora que los modelos entrenados con una combinación de datos reales y sintéticos pueden superar a los entrenados sólo con datos reales. Ésta mejora, sin embargo, mostró variaciones significativas dependiendo del conjunto de datos y de la técnica generativa empleada. En un dataset particular, caracterizado por su simplicidad y uniformidad, el rendimiento demostró ser bueno. Por otro lado, en conjuntos de datos más variados, raros o especializados, los desafíos en la adaptación de los modelos generativos resaltaron la necesidad de un análisis cuidadoso. El conocimiento previo de los modelos generativos en los conceptos utilizados en el ajuste fino resultó ser crucial para obtener imágenes sintéticas de calidad. Esto subraya la importancia de entrenar los modelos generativos en una amplia variedad de datos para que puedan reproducir los conceptos necesarios de manera efectiva. En resumen, los datos sintéticos sirven en algunos casos como una herramienta valiosa para mejorar la eficiencia de los modelos de ML en tareas de CV, particularmente con conjuntos de datos complejos debido a las características específicas dentro de sus clases o el desbalanceo de las mismas.71 p. diagrs., fot., tbls.Repetto Ferrero, A. M., & León Moreira, F. D. (2023). Assessment of data augmentation techniques with synthetic images in uncommon datasets cases (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.http://hdl.handle.net/20.500.11968/6579Inglés.engUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/95045PROYECTOS-MDBIG DATAAPRENDIZAJE AUTOMÁTICOAPRENDIZAJE PROFUNDOINTELIGENCIA ARTIFICIALAssessment of data augmentation techniques with synthetic images in uncommon datasets casesTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTinfo:eu-repo/semantics/openAccessFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaTHUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3704https://rad.ort.edu.uy/bitstreams/b0da968d-087c-4db8-8502-249b04df545c/downloadf8df27961d02cc618a688bd95548758eMD53ORIGINALMaterial completo.pdfMaterial completo.pdfdescriptionapplication/pdf19535888https://rad.ort.edu.uy/bitstreams/efa9c1c0-9319-4d11-b655-0aad81d6e887/downloadf29091bd2f463a4d99431f212a1e65c4MD5120.500.11968/65792024-07-22 15:57:42.168oai:rad.ort.edu.uy:20.500.11968/6579https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-07-22T15:57:42RAD - Universidad ORT Uruguayfalse |
spellingShingle | Assessment of data augmentation techniques with synthetic images in uncommon datasets cases Repetto Ferrero, Andrés Mauricio PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO APRENDIZAJE PROFUNDO INTELIGENCIA ARTIFICIAL |
status_str | publishedVersion |
title | Assessment of data augmentation techniques with synthetic images in uncommon datasets cases |
title_full | Assessment of data augmentation techniques with synthetic images in uncommon datasets cases |
title_fullStr | Assessment of data augmentation techniques with synthetic images in uncommon datasets cases |
title_full_unstemmed | Assessment of data augmentation techniques with synthetic images in uncommon datasets cases |
title_short | Assessment of data augmentation techniques with synthetic images in uncommon datasets cases |
title_sort | Assessment of data augmentation techniques with synthetic images in uncommon datasets cases |
topic | PROYECTOS-MD BIG DATA APRENDIZAJE AUTOMÁTICO APRENDIZAJE PROFUNDO INTELIGENCIA ARTIFICIAL |
url | http://hdl.handle.net/20.500.11968/6579 |