Louis/Thèse/Projets annexes/VGAE avec (Gromov-)Wasserstein.md
Louis Lacoste 96346a3c8c
vault backup: 2026-06-10 15:18:06
Affected files:
.obsidian/plugins/obsidian-tasks-plugin/main.js
.obsidian/plugins/obsidian-tasks-plugin/manifest.json
.obsidian/workspace.json
Thèse/Articles/Review papier colBiSBM.md
Thèse/Packages/R/colSBM.md
Thèse/Projets annexes/Application colBiSBM réseaux d'optimisation de NN.md
Thèse/Projets annexes/VGAE avec (Gromov-)Wasserstein.md
Thèse/Résolution des problèmes/Problème avec renv.md
2026-06-10 15:18:06 +02:00

61 lines
2.4 KiB
Markdown

---
title: Variational Graph AutoEncoder with Wasserstein
categories:
- convolution
- machine learning
- vae
- graphes
author:
- Julian Agudelo Acosta
- Louis Lacoste
---
{{< include /_macros.tex >}}
Suite à la discussion avec Julian j'inscris ce que l'on s'est dit.
# TODO
- [ ] Mettre au propre mes expés VGAE 🆔 ej7w4j ⛔ p0n5me 📅 2026-07-01
- [ ] Discuter avec Julian pour préparer un papier d'études d'archis de VGAE pour #JDSE 📅 2026-07-02
- [ ] 🔺 AVOIR SOUMIS aux #JDSE avant le **==28 August 2026==** 📅 2026-08-28
# Idée principale
Les VAE avec convolution de graphes (GCN) permettent d'apprendre une représentation latente des noeuds d'un graphe basée sur les interactions entre noeuds.
**Objectif** : apprendre un même encodeur et donc un espace latent structuré pour clusteriser une collection de réseaux sur la base de la structure.
*Sous-objectif* : pouvoir prendre en compte des covariables (Fused Wasserstein ?).
## Principe du VAE:
Soit $Y$ une matrice d'adjacence (ou de bi-adjacence pour les graphes bipartites), $X$ une matrice de covariables.
Soit $D_1$ la matrice des degrés en ligne, $D_2$ la matrice des degrés en colonne.
$\widetilde{Y} = D_1^{-1/2} Y D_2^{-1/2}$
**à compléter**
# Apprentissage contrastif
Puisque l'on voudrait marquer la séparation entre différentes structures de réseaux, on pourrait vouloir faire de l'[apprentissage contrastif pour V(G)AE](https://u9534056.medium.com/an-overview-of-contrastive-learning-fa520f5f2c23).
## Hypersphère méga cool
Il faut creuser : forcer les contraintes des *embeddings* à vivre sur la surface d'une hypersphère car, d'après Julian et la littérature, par rapport à un espace euclidien cela permet d'avoir :
- position latente bornée : stabilisation de l'apprentissage et évite l'explosion dans une ou plusieurs directions.
- couverture "uniforme" de la sphère : tendance à faciliter l'apprentissage contrastif, avec l'idée de bien séparer les graphes aux structures différentes.
[Première source](https://www.envisioning.com/vocab/hyperspherical-representation-learning)
Le softmax est remplacée par la loi de von Mises-Fisher. D'après [Wikipédia](https://fr.wikipedia.org/wiki/Loi_de_von_Mises-Fisher#Relation_avec_la_loi_normale) équivalent de la loi normale multivariée à covariance isotrope restreinte à l'hypersphère unité.