Mejora de la clasificación de gráficos con agrupación diferenciable basada en la atención de nodos de borde y redes neuronales de gráficos de varias distancias GNN – 7 minutos
Screenshot 2024 05 18 At 5.56.16 Pm.png

Graph Neural Networks GNN son herramientas avanzadas para la clasificación de gráficos, que aprovechan la agregación de vecindarios para actualizar las representaciones de nodos de forma iterativa. Este proceso captura la estructura del gráfico local y global, facilitando la clasificación de nodos y las tareas de predicción de enlaces. La agrupación de gráficos eficaz es esencial para reducir el tamaño y aprender representaciones, clasificadas en agrupación global y jerárquica. Los métodos jerárquicos, como las estrategias basadas en TopK y basadas en clústeres, tienen como objetivo conservar las características estructurales, pero enfrentan desafíos como la posible pérdida de información y el suavizado excesivo. Los enfoques recientes incorporan mecanismos de autoatención para abordar estos problemas, aunque persisten desafíos como el gasto computacional y la importancia de los bordes.

Investigadores de la Universidad Normal de Beijing, la Universidad Central de Finanzas y Economía, la Universidad Normal de Zhejiang y la Universidad de York han desarrollado un nuevo método de agrupación jerárquica para GNN llamado Agrupación diferenciable basada en la atención del nodo de borde (ENADPool). A diferencia de los métodos tradicionales, ENADPool utiliza mecanismos de atención y agrupación estricta para comprimir las características de los nodos y las fortalezas de los bordes, abordando los problemas con una agregación uniforme. Además, introdujeron un modelo GNN multidistancia (MD-GNN) para reducir el suavizado excesivo al permitir que los nodos reciban información de vecinos a varias distancias. El diseño de ENADPool elimina la necesidad de cálculos de atención separados, lo que mejora la eficiencia. Los experimentos muestran que MD-GNN combinado con ENADPool mejora efectivamente el rendimiento de clasificación de gráficos.

El estudio revisa los trabajos existentes relacionados con GNN, incluidas las redes convolucionales de gráficos, las operaciones de agrupación y los mecanismos de atención. Los GNN, clasificados en espectrales y espaciales, destacan en el análisis de datos gráficos. Los métodos espectrales, como ChebNet, utilizan la matriz laplaciana, mientras que los métodos espaciales, como GraphSAGE, agregan información de nodos locales. Ambos enfrentan problemas de suavizado excesivo, abordados por modelos como MixHop y N-GCN. Para la clasificación a nivel de gráfico, las operaciones de agrupación, clasificadas en métodos globales y jerárquicos, son cruciales. La agrupación jerárquica, como DiffPool, agrupa nodos, pero tiene limitaciones que aborda ABDPool, que utiliza mecanismos de atención. La atención gráfica, utilizada en GAT y GaAN, asigna pesos a los nodos según su importancia.

ENADPool es un método de agrupación jerárquica basado en clústeres que asigna nodos a clústeres únicos, calcula la importancia de los nodos mediante mecanismos de atención y comprime las características de los nodos y la conectividad de borde para capas posteriores. Implica tres pasos: asignación estricta de nodos, atención basada en nodos y atención basada en bordes, lo que da como resultado características de nodos comprimidos ponderados y matrices de adyacencia. El modelo MD-GNN mitiga el suavizado excesivo al agregar información de nodos desde diferentes distancias y reconstruir la topología del gráfico para capturar detalles estructurales completos. Este enfoque mejora la eficacia de ENADPool y mejora la representación gráfica.

El estudio compara el modelo ENADPool y MD-GNN con otros métodos de aprendizaje profundo de gráficos utilizando conjuntos de datos de referencia como D&D, PROTEINS, NCI1/NCI109, FRANKENSTEIN y REDDIT-B. Las líneas de base incluyen métodos jerárquicos (por ejemplo, SAGPool(H), ASAPool, DiffPool, ABDPool) y métodos de agrupación global (por ejemplo, DGCNN, SAGPool(G), KerGNN, GCKN). Utilizando una validación cruzada de 10 veces, los investigadores evalúan los modelos e informan la precisión promedio y la desviación estándar. Su arquitectura emplea dos capas de agrupación con MD-GNN para incrustaciones y asignaciones de nodos, optimizadas con activación, abandono y clasificadores auxiliares de ReLU durante el entrenamiento. El método tiene un rendimiento superior debido a la asignación estricta de nodos, la importancia basada en la atención para nodos y bordes, la integración MD-GNN y la representación efectiva de características.

En conclusión, ENADPool comprime las características de los nodos y la conectividad de los bordes en estructuras jerárquicas utilizando mecanismos de atención después de cada paso de agrupación, identificando efectivamente la importancia de los nodos y los bordes. Este enfoque aborda las deficiencias de los métodos de agrupación tradicionales que utilizan asignaciones de nodos poco claras y agregación uniforme de características. Además, el modelo MD-GNN mitiga el problema del suavizado excesivo al permitir que los nodos reciban información de vecinos a varias distancias.


Revisar la Papel. Todo el crédito por esta investigación va a los investigadores de este proyecto. Además, no olvides seguirnos en Gorjeo. Únete a nuestro Canal de telegramas, Canal de discordiay LinkedIn Grarriba.

Si te gusta nuestro trabajo, te encantará nuestro Boletin informativo..

No olvides unirte a nuestro SubReddit de 42k+ ML


A Sana Hassan, pasante de consultoría en Marktechpost y estudiante de doble titulación en IIT Madras, le apasiona aplicar la tecnología y la inteligencia artificial para abordar los desafíos del mundo real. Con un gran interés en resolver problemas prácticos, aporta una nueva perspectiva a la intersección de la IA y las soluciones de la vida real.