Identificación de opiniones de diferentes fuentes en textos en español :: SILO. Sistema nacional de repositorios digitales. Uruguay

Tesis de doctorado Aceptado

Identificación de opiniones de diferentes fuentes en textos en español

Rosá Furman, Aiala

Supervisor(es): Minel, Jean-Luc - Wonsever, Dina

Resumen:

Este documento presenta un estudio de las expresiones que transmiten opiniones de diferentes fuentes en textos en español. El trabajo incluye la definición de un modelo para los predicados de opinión y sus argumentos (la fuente, el asunto y el mensaje), la creación de un léxico de predicados de opinión que tienen asociada nformación proveniente del modelo y la realización de tres sistemas informáticos. Desarrollamos un primer sistema, basado en reglas contextuales, que obtiene valores de medida F parcial (incluyendo entre los elementos correctos los elementos reconocidos en forma parcial) satisfactorios: 92 % para el predicado, 81 % para la fuente, 75 % para el asunto, 89 % para el mensaje y 85 % para la opinión completa. En particular, para el reconocimiento de la fuente se obtuvo un 79 % de medida F exacta (sin incluir elementos reconocidos en forma parcial). El segundo sistema desarrollado se basa en el modelo Conditional Random Fields (CRF) y se realizó solo para el reconocimiento de las fuentes. El sistema alcanza un valor de medida F exacta de 76 %. Un tercer sistema, que combina las dos técnicas anteriores incorporando la salida del sistema de reglas para el reconocimiento de fuentes como un nuevo atributo del sistema basado en CRF, mejora sensiblemente los resultados obtenidos por los dos sistemas anteriores: 83 % de medida F exacta. En cuanto al reconocimiento de las fuentes de las opiniones, nuestro sistema obtiene resultados muy satisfactorios (83 % de medida F exacta), si tomamos como referencia trabajos realizados para otros idiomas que pueden considerarse similares al nuestro, si bien presentan varias diferencias en su enfoque y su alcance.

Estos trabajos alcanzan valores de medida F (exacta o parcial) que se sitúan entre 63 % y 89,5 %. Por otro lado, durante el desarrollo de esta tesis generamos diversos recursos de utilidad para el procesamiento automático del español: un léxico de predicados de opinión, un corpus de 13.000 palabras anotado con las opiniones y sus elementos y un corpus de 40.000 palabras anotado con los predicados de opinión y sus fuentes.

Detalles Bibliográficos
Fecha de publicación:	2011
Temas:	Procesamiento del Lenguaje Natural Minería de Opiniones Discurso Reproducido Reglas Contextuales Conditional Random Fields
Idioma	Español
Institución:	Universidad de la República
Repositorio:	COLIBRI
Enlace(s):	http://hdl.handle.net/20.500.12008/2980
Nivel de acceso:	Acceso abierto
Licencia:	Licencia Creative Commons Atribución – No Comercial – Sin Derivadas (CC BY-NC-ND 4.0)

Resultados similares

Integración de proposiciones de infinitivo al sistema ClaTex
Autor(es):: Rosá Furman, Aiala
Fecha de publicación:: (2007)

Identificación automática del asunto de opiniones en texto en idioma español :Informe final
Autor(es):: Zeballos, Yasim
Fecha de publicación:: (2013)

Generación de un diccionario y herramientas de análisis morfológico para el español
Autor(es):: Rosá Furman, Aiala
Fecha de publicación:: (2005)

Factividad de los eventos referidos en textos
Autor(es):: Wonsever, Dina
Fecha de publicación:: (2009)

Determinación de la factividad de los eventos mencionados en el texto.
Autor(es):: Fernández, Esteban
Fecha de publicación:: (2013)

SIBILA :Esquema de anotación de eventos
Autor(es):: Wonsever, Dina
Fecha de publicación:: (2008)

Reglas contextuales y modelos de estado finito
Autor(es):: Moncecchi, Guillermo
Fecha de publicación:: (2004)

Analysis of Rabin's irreducibility test for polynomials over finite fields
Autor(es):: Panario, Daniel
Fecha de publicación:: (2001)

Herramientas para traducción automática Guaraní - Español
Autor(es):: Borges, Yanina
Fecha de publicación:: (2019)

Identificación de discurso de odio en redes sociales
Autor(es):: Kunc, Lucas
Fecha de publicación:: (2020)

Extracción automática de pistas para la generación de crucigramas a partir de textos en inglés.
Autor(es):: Collazo Gil, Arturo
Fecha de publicación:: (2023)

Detección de antonimia en español con redes neuronales parasiamesas
Autor(es):: Camacho, Juan
Fecha de publicación:: (2022)

Construcción de recursos para traducción automática guaraní-español
Autor(es):: Giossa, Nicolás
Fecha de publicación:: (2021)

La acción político-discrursiva del empresariado paulista en al coyuntura de crisis del segundo mandato de Dilma Rousseff
Autor(es):: Fernandes, Humberto
Fecha de publicación:: (2019)

Generador de reglas de negocio
Autor(es):: Belén, Marcelo
Fecha de publicación:: (2005)

La Regla Verde: una herramienta para el manejo del campo natural.
Autor(es):: JAURENA, M.
Fecha de publicación:: (2018)

Procesamiento de Lenguaje Natural (PLN) para la reconstrucción de textos a partir de imágenes correspondientes a archivos históricos de la década del 70
Autor(es):: Stabile, Javier
Fecha de publicación:: (2020)

Informe final del proyecto: Desarrollo de herramientas de apoyo a la enseñanza de lenguas aplicando técnicas de Inteligencia Artificial
Autor(es):: Rosá Furman, Aiala
Fecha de publicación:: (2023)

Los nombres de la historia: la construcción mítica de Artigas y la Revolución Oriental en libros de texto escolares de Historia y Ciencias Sociales de Uruguay (1980-2016). Un estudio desde el análisis del discurso de la Escuela Francesa
Autor(es):: Cardozo González, Santiago
Fecha de publicación:: (2019)

Inducción del sentido de las palabras para el Idioma español.
Autor(es):: Lastra, Rodrigo
Fecha de publicación:: (2019)

Diseño e implementación de un motor de reglas dinámicas usando especificaciones GeneXus
Autor(es):: Silveira, Luciano
Fecha de publicación:: (2010)

Sobre medios de comunicación, opinión pública y cuestión social
Autor(es):: Bonetti, Emilio
Fecha de publicación:: (2008)

Estudio de sesgos en representaciones vectoriales de palabras.
Autor(es):: Cánepa Romero, María Fernanda
Fecha de publicación:: (2023)

Clusterización de interacciones
Autor(es):: Maschi Fernández, Luciana Sofía
Fecha de publicación:: (2023)

Restauración democrática y opinión pública en el Uruguay
Autor(es):: Canzani, Agustín
Fecha de publicación:: (1989)

Evaluación y simplificación de textos para enseñanza de inglés
Autor(es):: Noel Musso, Andrés Alexandre
Fecha de publicación:: (2022)

Opinión ciudadana sobre el aborto: Uruguay y América Latina
Autor(es):: Rossi, Máximo
Fecha de publicación:: (2010)

Gender differences in opinions about market solutions and government interventions: the case of uruguayan economists
Autor(es):: Amarante, Verónica
Fecha de publicación:: (2022)

Opinión pública y Mercosur : conocimiento y apoyo de los uruguayos al proceso de integración regional
Autor(es):: Estrades, Carmen
Fecha de publicación:: (2006)

Esquema de anotación de expresiones y marcas temporales. Proyecto TEMANTEX
Autor(es):: Wonsever, Dina
Fecha de publicación:: (2011)

Construcción de un indicador de incertidumbre económica en base a las noticias de prensa
Autor(es):: Crocco, Nicolás
Fecha de publicación:: (2019)

Redes neuronales con aplicaciones a procesamiento de lenguaje natural
Autor(es):: Robaina Passeggi, Santiago
Fecha de publicación:: (2022)

La responsabilidad social Empresarial en Uruguay: la visión desde la opinión pública
Autor(es):: Piani, Giorgina
Fecha de publicación:: (2007)

La opinión pública montevideana a cuatro años de la restauración democrática
Autor(es):: González, Luis Eduardo
Fecha de publicación:: (1988)

Generación de datos sintéticos para traducción automática entre español y guaraní.
Autor(es):: Baladón, Alexis
Fecha de publicación:: (2024)

30 años de opinión pública en Uruguay
Autor(es):: Queirolo, Rosario
Fecha de publicación:: (2021)

Identificación automática de tópicos para el Observatorio de Medios del Uruguay
Autor(es):: Carballal, Francisco
Fecha de publicación:: (2022)

Gender differences in opinions about market solutions and government interventions: the case of Uruguayan economists
Autor(es):: Amarante, Verónica
Fecha de publicación:: (2022)

Definición de una arquitectura de referencia para anonimizar documentos
Autor(es):: Vico, Horacio
Fecha de publicación:: (2013)

Citaciones en las sentencias de la base de jurisprudencia nacional
Autor(es):: Fulloni, Andrés
Fecha de publicación:: (2020)