Experiencia de usuario a partir de grabación de video usando Computer Vision

Mandirola Ulrich, Marcelo Pablo - Santos Rosales, Pío Danilo dos - Patrón Rizzo, Héctor Leandro

Supervisor(es): Olloniego Rocca, Juan Andrés

Resumen:

En la era digital actual, el creciente uso de aplicaciones móviles presenta un desafío considerable en términos de análisis y comprensión de interacciones humano-dispositivo. Esta tesis se enfoca en dos aspectos cruciales de este análisis: la detección de acciones en videos de interacciones y la agrupación de pantallas en conjuntos semánticamente similares. Para abordar estos desafíos, se emplean técnicas avanzadas de procesamiento de imágenes y aprendizaje profundo. Por un lado, se utilizan redes convolucionales 2D y 3D para detectar acciones especificas con precisión. Por otro lado, se propone un enfoque innovador que combina clustering sobre modelos de clasificación de imágenes, de detección de componentes y de traducción de imagen a texto para agrupar los frames de video en conjuntos que compartan características visuales y semánticas similares. Estas contribuciones tienen el potencial de impulsar avances significativos en campos como la inteligencia artificial y la visión por computadora, así como mejorar la comprensión de las interacciones usuario-dispositivo en entornos móviles.


Detalles Bibliográficos
2024
PROYECTOS-MD
INTELIGENCIA ARTIFICIAL
APRENDIZAJE AUTOMÁTICO
EXPERIENCIA DE USUARIO
PROCESAMIENTO DE IMÁGENES
INTERFAZ DE USUARIO
Español
Universidad ORT Uruguay
RAD
https://hdl.handle.net/20.500.11968/7034
http://hdl.handle.net/20.500.11968/7034
Acceso abierto
Acceso abierto
_version_ 1816774023136149504
author Mandirola Ulrich, Marcelo Pablo
author2 Santos Rosales, Pío Danilo dos
Patrón Rizzo, Héctor Leandro
author2_role author
author
author_facet Mandirola Ulrich, Marcelo Pablo
Santos Rosales, Pío Danilo dos
Patrón Rizzo, Héctor Leandro
author_role author
bitstream.checksum.fl_str_mv bc1a4f0d44106ae9e421c326c9c6821f
56c22020921d7f38f614ed9daf12f324
bitstream.checksumAlgorithm.fl_str_mv MD5
MD5
bitstream.url.fl_str_mv https://rad.ort.edu.uy/bitstreams/c258153f-d633-422b-ae63-f45a3478b8f4/download
https://rad.ort.edu.uy/bitstreams/c4f0bc00-95e7-4cc3-bf9a-7e92e1414036/download
collection RAD
dc.contributor.tribunal.none.fl_str_mv Visca Zanoni, Ramiro Eugenio
Cecilia Delgado, Leonardo Raúl
dc.creator.advisor.none.fl_str_mv Olloniego Rocca, Juan Andrés
dc.creator.none.fl_str_mv Mandirola Ulrich, Marcelo Pablo
Santos Rosales, Pío Danilo dos
Patrón Rizzo, Héctor Leandro
dc.date.accessioned.none.fl_str_mv 2024-08-23T14:45:43Z
dc.date.available.none.fl_str_mv 2024-08-23T14:45:43Z
dc.date.issued.none.fl_str_mv 2024
dc.description.abstract.none.fl_txt_mv En la era digital actual, el creciente uso de aplicaciones móviles presenta un desafío considerable en términos de análisis y comprensión de interacciones humano-dispositivo. Esta tesis se enfoca en dos aspectos cruciales de este análisis: la detección de acciones en videos de interacciones y la agrupación de pantallas en conjuntos semánticamente similares. Para abordar estos desafíos, se emplean técnicas avanzadas de procesamiento de imágenes y aprendizaje profundo. Por un lado, se utilizan redes convolucionales 2D y 3D para detectar acciones especificas con precisión. Por otro lado, se propone un enfoque innovador que combina clustering sobre modelos de clasificación de imágenes, de detección de componentes y de traducción de imagen a texto para agrupar los frames de video en conjuntos que compartan características visuales y semánticas similares. Estas contribuciones tienen el potencial de impulsar avances significativos en campos como la inteligencia artificial y la visión por computadora, así como mejorar la comprensión de las interacciones usuario-dispositivo en entornos móviles.
dc.description.none.fl_txt_mv Incluye bibliografía y anexos.
dc.format.extent.none.fl_str_mv 133 p. diagrs.,maps., grafs.
dc.format.mimetype.none.fl_str_mv PDF
dc.identifier.citation.none.fl_str_mv Mandirola Ulrich, M. P., Santos Rosales, P. D. dos & Patrón Rizzo, H. L. (2024). Experiencia de usuario a partir de grabación de video usando Computer Vision (Trabajo final) Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7034
dc.identifier.uri.none.fl_str_mv https://hdl.handle.net/20.500.11968/7034
http://hdl.handle.net/20.500.11968/7034
dc.language.iso.none.fl_str_mv spa
dc.publisher.none.fl_str_mv Universidad ORT Uruguay
dc.relation.other.none.fl_str_mv https://sisbibliotecas.ort.edu.uy/bib/95831
dc.rights.license.none.fl_str_mv Acceso abierto
dc.rights.none.fl_str_mv info:eu-repo/semantics/openAccess
dc.source.none.fl_str_mv reponame:RAD
instname:Universidad ORT Uruguay
instacron:Universidad ORT
dc.subject.none.fl_str_mv PROYECTOS-MD
INTELIGENCIA ARTIFICIAL
APRENDIZAJE AUTOMÁTICO
EXPERIENCIA DE USUARIO
PROCESAMIENTO DE IMÁGENES
INTERFAZ DE USUARIO
dc.title.none.fl_str_mv Experiencia de usuario a partir de grabación de video usando Computer Vision
dc.type.none.fl_str_mv Trabajo final de carrera
info:eu-repo/semantics/bachelorThesis
dc.type.version.none.fl_str_mv info:eu-repo/semantics/publishedVersion
description Incluye bibliografía y anexos.
eu_rights_str_mv openAccess
format bachelorThesis
id RAD_244a289909886f2f341971afd214782b
identifier_str_mv Mandirola Ulrich, M. P., Santos Rosales, P. D. dos & Patrón Rizzo, H. L. (2024). Experiencia de usuario a partir de grabación de video usando Computer Vision (Trabajo final) Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7034
instacron_str Universidad ORT
institution Universidad ORT
instname_str Universidad ORT Uruguay
language spa
network_acronym_str RAD
network_name_str RAD
oai_identifier_str oai:rad.ort.edu.uy:20.500.11968/7034
publishDate 2024
publisher.none.fl_str_mv Universidad ORT Uruguay
reponame_str RAD
repository.mail.fl_str_mv rodriguez_v@ort.edu.uy
repository.name.fl_str_mv RAD - Universidad ORT Uruguay
repository_id_str 3927
rights_invalid_str_mv Acceso abierto
spelling Visca Zanoni, Ramiro EugenioCecilia Delgado, Leonardo RaúlMandirola Ulrich, Marcelo PabloSantos Rosales, Pío Danilo dosPatrón Rizzo, Héctor LeandroOlloniego Rocca, Juan Andrés2024-08-23T14:45:43Z2024-08-23T14:45:43Z2024Incluye bibliografía y anexos.En la era digital actual, el creciente uso de aplicaciones móviles presenta un desafío considerable en términos de análisis y comprensión de interacciones humano-dispositivo. Esta tesis se enfoca en dos aspectos cruciales de este análisis: la detección de acciones en videos de interacciones y la agrupación de pantallas en conjuntos semánticamente similares. Para abordar estos desafíos, se emplean técnicas avanzadas de procesamiento de imágenes y aprendizaje profundo. Por un lado, se utilizan redes convolucionales 2D y 3D para detectar acciones especificas con precisión. Por otro lado, se propone un enfoque innovador que combina clustering sobre modelos de clasificación de imágenes, de detección de componentes y de traducción de imagen a texto para agrupar los frames de video en conjuntos que compartan características visuales y semánticas similares. Estas contribuciones tienen el potencial de impulsar avances significativos en campos como la inteligencia artificial y la visión por computadora, así como mejorar la comprensión de las interacciones usuario-dispositivo en entornos móviles.133 p. diagrs.,maps., grafs.PDFMandirola Ulrich, M. P., Santos Rosales, P. D. dos & Patrón Rizzo, H. L. (2024). Experiencia de usuario a partir de grabación de video usando Computer Vision (Trabajo final) Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7034https://hdl.handle.net/20.500.11968/7034http://hdl.handle.net/20.500.11968/7034spaUniversidad ORT Uruguayhttps://sisbibliotecas.ort.edu.uy/bib/95831info:eu-repo/semantics/openAccessAcceso abiertoPROYECTOS-MDINTELIGENCIA ARTIFICIALAPRENDIZAJE AUTOMÁTICOEXPERIENCIA DE USUARIOPROCESAMIENTO DE IMÁGENESINTERFAZ DE USUARIOExperiencia de usuario a partir de grabación de video usando Computer VisionTrabajo final de carrerainfo:eu-repo/semantics/bachelorThesisinfo:eu-repo/semantics/publishedVersionreponame:RADinstname:Universidad ORT Uruguayinstacron:Universidad ORTFI - Master en Big Data - MDFacultad de IngenieríaMasterMaster en Big DataTrabajo finalTrabajo final (Master). Universidad ORT Uruguay, Facultad de IngenieríaORIGINALMaterial completo.pdfMaterial completo.pdfapplication/pdf4038719https://rad.ort.edu.uy/bitstreams/c258153f-d633-422b-ae63-f45a3478b8f4/downloadbc1a4f0d44106ae9e421c326c9c6821fMD51THUMBNAILMaterial completo.pdf.jpgMaterial completo.pdf.jpgGenerated Thumbnailimage/jpeg3614https://rad.ort.edu.uy/bitstreams/c4f0bc00-95e7-4cc3-bf9a-7e92e1414036/download56c22020921d7f38f614ed9daf12f324MD5220.500.11968/70342024-11-22 15:17:20.783oai:rad.ort.edu.uy:20.500.11968/7034https://rad.ort.edu.uyUniversidadhttps://www.ort.edu.uy/https://rad.ort.edu.uy/server/oai/requestrodriguez_v@ort.edu.uyUruguayopendoar:39272024-11-22T15:17:20RAD - Universidad ORT Uruguayfalse
spellingShingle Experiencia de usuario a partir de grabación de video usando Computer Vision
Mandirola Ulrich, Marcelo Pablo
PROYECTOS-MD
INTELIGENCIA ARTIFICIAL
APRENDIZAJE AUTOMÁTICO
EXPERIENCIA DE USUARIO
PROCESAMIENTO DE IMÁGENES
INTERFAZ DE USUARIO
status_str publishedVersion
title Experiencia de usuario a partir de grabación de video usando Computer Vision
title_full Experiencia de usuario a partir de grabación de video usando Computer Vision
title_fullStr Experiencia de usuario a partir de grabación de video usando Computer Vision
title_full_unstemmed Experiencia de usuario a partir de grabación de video usando Computer Vision
title_short Experiencia de usuario a partir de grabación de video usando Computer Vision
title_sort Experiencia de usuario a partir de grabación de video usando Computer Vision
topic PROYECTOS-MD
INTELIGENCIA ARTIFICIAL
APRENDIZAJE AUTOMÁTICO
EXPERIENCIA DE USUARIO
PROCESAMIENTO DE IMÁGENES
INTERFAZ DE USUARIO
url https://hdl.handle.net/20.500.11968/7034
http://hdl.handle.net/20.500.11968/7034