Generador automático de índices en videos

Campiotti, María Jimena - Oyharzabal, Leonardo - Schiaffino, Bruno - Taboas, María Belén

Supervisor(es): López, Antonio

Resumen:

Cuando una persona quiere localizar cierto contenido en un libro, recurre a su índice sin dudarlo; sería algo poco común que alguien recorriera página por página hasta encontrar lo que busca. Sin embargo, al pensar en un video, resulta normal tener que recorrer su línea de tiempo para ubicar el momento que se quiere ver. Por otro lado, teniendo en cuenta el enorme crecimiento de las plataformas de videos actuales, se torna inviable identificar los momentos de interés de forma manual para la gran cantidad de videos disponibles. Hoy en día, el amplio desarrollo en el campo de la inteligencia artificial permite que una máquina imite las funciones cognitivas de los humanos, como aprender o resolver problemas. En particular, existen herramientas que logran reconocer el contenido de videos, imágenes y audio. Esta tarea de reconocimiento es precisamente la que una persona deberá ejecutar manualmente para la creación de un índice. Este proyecto persigue justamente ese objetivo, emular lo que un humano haría a la hora de construir un índice para un video, con la ventaja de realizarlo de forma automática. En consecuencia, se desarrolla un prototipo de software que analiza videos en busca de objetos, personas, acciones, lugares, diálogos y toda clase de información que pueda ser de interés para un usuario. Todo esto, consumiendo servicios provistos por gigantes de la industria tales como Google o Amazon. Con la información obtenida se produce un conjunto de etiquetas asociadas a instantes de tiempo en el video, conformando así, un índice. Adicionalmente, se implementan mecanismos que pretenden elevar la calidad de las etiquetas generadas. Esto se hace, en primer lugar, a través del filtrado de aquellas que son intrascendentes o erróneas. Sumado a esto, se utiliza el servicio de búsquedas de Google para determinar la relevancia de una etiqueta en base a la cantidad de resultados obtenidos para su búsqueda, descartando las que retornen pocos resultados. Por último, se busca fortalecer el prototipo utilizando la retroalimentación de los usuarios. Estos pueden indicarle al sistema las etiquetas que le resulten más interesantes para cierta categoría de video y así, se dejan sentadas las bases para explotar esta información en trabajos a futuro. Finalmente, los resultados obtenidos reflejan que el objetivo de crear índices para videos de forma automática se cumplió satisfactoriamente. La combinación y el procesamiento adecuado de la información adquirida permite identificar etiquetas que resultan útiles a la hora de explorar el contenido de un video. Luego, las aplicaciones que consuman estos resultados podrán presentar los índices para que los usuarios se sirvan de ellos. Asimismo, se detecta un gran potencial para la expansión del prototipo con el fin de enriquecer las etiquetas que forman parte de los índices.


Detalles Bibliográficos
2018
Video
Indice
INTELIGENCIA ARTIFICIAL
Español
Universidad de la República
COLIBRI
http://hdl.handle.net/20.500.12008/18530
Acceso abierto
Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC - By-NC-ND)
Resumen:
Sumario:Cuando una persona quiere localizar cierto contenido en un libro, recurre a su índice sin dudarlo; sería algo poco común que alguien recorriera página por página hasta encontrar lo que busca. Sin embargo, al pensar en un video, resulta normal tener que recorrer su línea de tiempo para ubicar el momento que se quiere ver. Por otro lado, teniendo en cuenta el enorme crecimiento de las plataformas de videos actuales, se torna inviable identificar los momentos de interés de forma manual para la gran cantidad de videos disponibles. Hoy en día, el amplio desarrollo en el campo de la inteligencia artificial permite que una máquina imite las funciones cognitivas de los humanos, como aprender o resolver problemas. En particular, existen herramientas que logran reconocer el contenido de videos, imágenes y audio. Esta tarea de reconocimiento es precisamente la que una persona deberá ejecutar manualmente para la creación de un índice. Este proyecto persigue justamente ese objetivo, emular lo que un humano haría a la hora de construir un índice para un video, con la ventaja de realizarlo de forma automática. En consecuencia, se desarrolla un prototipo de software que analiza videos en busca de objetos, personas, acciones, lugares, diálogos y toda clase de información que pueda ser de interés para un usuario. Todo esto, consumiendo servicios provistos por gigantes de la industria tales como Google o Amazon. Con la información obtenida se produce un conjunto de etiquetas asociadas a instantes de tiempo en el video, conformando así, un índice. Adicionalmente, se implementan mecanismos que pretenden elevar la calidad de las etiquetas generadas. Esto se hace, en primer lugar, a través del filtrado de aquellas que son intrascendentes o erróneas. Sumado a esto, se utiliza el servicio de búsquedas de Google para determinar la relevancia de una etiqueta en base a la cantidad de resultados obtenidos para su búsqueda, descartando las que retornen pocos resultados. Por último, se busca fortalecer el prototipo utilizando la retroalimentación de los usuarios. Estos pueden indicarle al sistema las etiquetas que le resulten más interesantes para cierta categoría de video y así, se dejan sentadas las bases para explotar esta información en trabajos a futuro. Finalmente, los resultados obtenidos reflejan que el objetivo de crear índices para videos de forma automática se cumplió satisfactoriamente. La combinación y el procesamiento adecuado de la información adquirida permite identificar etiquetas que resultan útiles a la hora de explorar el contenido de un video. Luego, las aplicaciones que consuman estos resultados podrán presentar los índices para que los usuarios se sirvan de ellos. Asimismo, se detecta un gran potencial para la expansión del prototipo con el fin de enriquecer las etiquetas que forman parte de los índices.