Bilan semaine 27 2025 : 30 juin - 4 juillet

colBiSBM
inférence
GNN
Auteur·rice
Affiliation

Louis Lacoste

MIA Paris-Saclay, INRAE, AgroParisTech, Université Paris-Saclay

Date de publication

30 juin 2025

Modifié

6 octobre 2025

TODO List

  • Pour clustering de collections sur données réelles :
    → L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).

    • ❓Je n’arrive plus à reproduire le bug pour l’inférence…
    • S’assurer que ça marche et relancer
  • Creuser et explorer avec easy16s !

  • ✅ Ajouter le tableau de comparaison du VGAE avec colBiSBM

  • Calcul du score F1Revérifier que j’entraîne correctement le VGAE car résultats de généralisation trop bons sur les autres réseaux Doré, ce qui est étonnant

  • Regarder la liste des cours du MathSV et de l’Université Paris-Saclay.

  • Dé-bugger les simulations :

    • ⌛ Inférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.
      • ⌛Bon le bug ne se reproduit plus… les jobs sont juste trop longs (> 120h) j’ai relancé, il ne reste que 182/972 conditions.
  • Plutôt regarder pour introduire un modèle \delta-colBiSBM. Kmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.

  • Faire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu
Reference 1

Inférence et microbes

  • Lancer colBiSBM sur OTU\times Sample → problème du chargement en mémoire des données à voir
  • Lancer colSBM sur OTU\times OTU
  • ✅ Creuser TabNet de Christophe Regouby
  • TabNet pratiquer les exercices
  • Regarder SPARTA Rennes
  • Lire Papiers compositional data (Aitchison et al. intro)
  • Lire article multi-niveaux Saint-Clair
  • Ecrire et étudier les modèles pour différents niveaux taxonomiques. \begin{align*} i \rightarrow &~N^1_i \subseteq N^2_i \subseteq N^3_i & \text{Taxonomie}\\ Z^0_i \overset{?}{=} & Z^1_i \overset{?}{=} Z^2_i \overset{?}{=} Z^3_i & \text{Groupes fonctionnels} \end{align*}

Causalité

Plus sur le temps long, à regarder

  • GT causalité
  • Daria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)

Lectures en cours 📚

OT

  • Mazelet, Flamary, et Thirion (s. d.) Intéressant pour le transport optimal entre graphes de tailles différentes
  • Nenna (s. d.b) Pour comprendre le problème d’OT régularisé pour l’entropie.
  • Nenna (s. d.a)

Inférence de graphes

  • Morton et al. (2021) VAE with Multinomial Logistic Normal distribution using Isometric Log Ratio tranform. Plus rapide que les autres méthodes et performances équivalentes

  • Aitchison (1982)

  • ❗📖 Payne et al. (2023) sur MixMPLN

Causalité

A discuter

Congés P&S

  • ✅ Quand est-ce qu’on ne se voit pas ? Et donc quand est-ce qu’on se voit après ?
  • ✅ Calendrier partagé

Thèse

  • ✅ Que prévoir pour le CSI

    • 👍 Un petit rapport
    • 👍 Une présentation
  • 👨‍🏫 Demander à Pierre Comment valider les enseignements comme formations Adum ?

  • ✅ Des recommandations de formations, voir les cours du MathSV

Interprétation écologiques résultats de Baldock

  • ⌛ Point avec Elisa, oui on relance

Inférence

  • pbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)

Combine networks at different taxonomic levels

  • Inférence + GREMLINS

Les références

Aitchison, J. 1982. « The Statistical Analysis of Compositional Data ». Journal of the Royal Statistical Society. Series B (Methodological) 44 (2): 139‑77. https://www.jstor.org/stable/2345821.
Bystrova, Daria. s. d. « Causal Discovery ».
Mazelet, Sonia, Rémi Flamary, et Bertrand Thirion. s. d. « Unsupervised Learning for Optimal Transport Plan Prediction Between Unbalanced Graphs ».
Morton, James T., Justin Silverman, Gleb Tikhonov, Harri Lähdesmäki, et Rich Bonneau. 2021. « Scalable Estimation of Microbial Co-Occurrence Networks with Variational Autoencoders ». bioRxiv : the preprint server for biology. https://doi.org/10.1101/2021.11.09.467939.
Nenna, Luca. s. d.a. « Lecture 1 Monge and Kantorovich Problems: From Primal to Dual ».
———. s. d.b. « Lecture 2: Entropic Optimal Transport ».
Payne, Andrea, Anjali Silva, Steven J. Rothstein, Paul D. McNicholas, et Sanjeena Subedi. 2023. « Finite Mixtures of Multivariate Poisson-Log Normal Factor Analyzers for Clustering Count Data ». 13 novembre 2023. https://doi.org/10.48550/arXiv.2311.07762.