Comportamiento de Graph Convolutional Networks (GCN) ante datos con ruido.

Cuturi Grignola, María Paz - Padula Lenna, Facundo

Supervisor(es): Rodríguez Bocca, Pablo - Marotta, Adriana - Moncecchi, Guillermo - Tansini, Libertad

Resumen:

Los modelos de aprendizaje profundo para grafos han mejorado el estado del arte en muchas tareas. A pesar de su reciente éxito, existen pocas investigaciones acerca de su robustez. En esta tesis se estudia el comportamiento de Graph Convolutional Networks (GCNs) ante datos con ruido para la tarea de clasificación de nodos. Se utiliza el cálculo de meta-gradientes para introducir ruido en las aristas y los atributos, esencialmente tratando al grafo como un hiperparámetro a optimizar. Se estudia la cantidad de aristas y atributos que hay que modificar para reducir el accuracy de la clasificación en un 5%, considerando las modificaciones con impacto máximo y mínimo. Nuestros experimentos muestran que el impacto del ruido varía mucho dependiendo de los datos modificados, indicando que no todas las aristas ni todos los atributos inciden de la misma forma en la clasificación de un nodo. En los casos estudiados el impacto al introducir ruido en aristas es mayor que el impacto al introducir ruido en atributos de los nodos. Nuestros resultados pueden servir de guía para estudiar qué determina que una arista o atributo tenga mayor o menor impacto en la clasificación de un nodo, y en general para estimar la robustez de un problema de clasificación frente a ruido en los datos.


Detalles Bibliográficos
2020
Graph convolutional networks
Impacto del ruido
Meta-gradientes
Español
Universidad de la República
COLIBRI
https://hdl.handle.net/20.500.12008/25235
Acceso abierto
Licencia Creative Commons Atribución - No Comercial - Sin Derivadas (CC - By-NC-ND 4.0)
Resumen:
Sumario:Los modelos de aprendizaje profundo para grafos han mejorado el estado del arte en muchas tareas. A pesar de su reciente éxito, existen pocas investigaciones acerca de su robustez. En esta tesis se estudia el comportamiento de Graph Convolutional Networks (GCNs) ante datos con ruido para la tarea de clasificación de nodos. Se utiliza el cálculo de meta-gradientes para introducir ruido en las aristas y los atributos, esencialmente tratando al grafo como un hiperparámetro a optimizar. Se estudia la cantidad de aristas y atributos que hay que modificar para reducir el accuracy de la clasificación en un 5%, considerando las modificaciones con impacto máximo y mínimo. Nuestros experimentos muestran que el impacto del ruido varía mucho dependiendo de los datos modificados, indicando que no todas las aristas ni todos los atributos inciden de la misma forma en la clasificación de un nodo. En los casos estudiados el impacto al introducir ruido en aristas es mayor que el impacto al introducir ruido en atributos de los nodos. Nuestros resultados pueden servir de guía para estudiar qué determina que una arista o atributo tenga mayor o menor impacto en la clasificación de un nodo, y en general para estimar la robustez de un problema de clasificación frente a ruido en los datos.