Bilan semaine 45 2025 : 03 novembre - 06 novembre

colBiSBM
inférence
GNN
Auteur·rice
Affiliation

Louis Lacoste

MIA Paris-Saclay, INRAE, AgroParisTech, Université Paris-Saclay

Date de publication

3 novembre 2025

Modifié

9 février 2026

TODO List

  • Finir le papier :

    • ❓ Fait ? Re-structurer le plan, mon plan, Donnet et Barbillon, échelle méso et comparaison inter réseau et noeuds non partagés.
    • ✅ Partie Baldock: Ajouter l’ordre des modèles préférés et vérifier mais BICLsep < BICL pirho < BICL iid
    • ✅ Toutes les simus en annexe. Envoyer Info transfer en annexe et remplacer par Network partitioning
  • Codes pour le papier :

    • Nettoyer les scripts
    • Faire un joli README
    • ❓Faire des notebooks
  • Maitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC

  • Maitriser SparCC

  • Faire LBM sur niveau taxonomique grossier, initialiser avec le résultat pour un niveau plus fin et ainsi de suite.

  • Clustering unipartite j’ai cassé une fonction de distance à vérifier et réparer

  • Pour clustering de collections sur données réelles :
    → L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).

  • 👶 (délégué à Mona) Clustering sur Doré :

    • Regarder pour les couples date+nom les études et le nombre de réseaux analysables (Possible demander à Élisa)

      • ⌛ Chamberlain et al semble intéressant à regarder ! Voir le Rmarkdown
    • Clusteriser sur la base des noms et voir parmi les réseaux Européens (désagrégés ?)

    • Si M > 10, alors voir si je retrouve les mêmes résultats que dans les études.

    • Regarder Largest gap sur réseaux Doré

    • ⌛ Essayer clustering sur supinfo

      • CAH et Kmeans tendent vers faire K = 13 clusters sur les supinfos
      • Enrichir avec des métriques sur les réseaux (nestedness, connectance autres ?)
      • Demander à Elisa pour la signification des métadonnées
      • Demander à Elisa une fois vu cohérences de groupe voir pour interprétation écologiques ?
      • Algo de clustering sur les groupes trouvés

Inférence et microbes

Bibliographie: à lire, à faire

  • Lire article multi-niveaux Saint-Clair
  • ✅ Papier Julie Negative Binomiale
  • 🆕 🔎 Trouver des papiers:
    • LBM Negative Binomial
    • Network inference through sample comparison
  • Idée des groupes sur la base de distance phylogénétique:
    • En train de comprendre les distances que phyloseq permet de calculer sur notre exemple
    • En train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html
    • Parametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)
    • Lire Papier UniFrac

Réflexion

  • easy16s : se renseigner sur
    • \alpha, \beta diversité
    • Heatmap
  • Regarder SPARTA Rennes
  • Ecrire et étudier les modèles pour différents niveaux taxonomiques.
  • 🆕 Regarder NetComi
  • 🆕 Regarder OneNet car aggrégation plus robuste
  • 🆕 Réfléchir sens d’aggréger les données ou de les diviser

Écrire et faire tourner

  • Lancer colBiSBM sur OTU\times Sample → problème du chargement en mémoire des données à voir
  • Lancer colSBM sur OTU\times OTU
  • TabNet pratiquer les exercices
  • 🆕 SparCC à différent niveaux
  • 🆕 SBM à différent niveaux
  • 🆕⌛ Tree-PLN à différents niveaux

Causalité

Plus sur le temps long, à regarder

  • GT causalité
  • Daria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)

A discuter

  • 🆕 Voir pour des Réseaux / GDR ou aller
  • 🆕 Chercher des cours à suivre

Biblio à faire

  • Regarder Transport optimal graphes bipartite.

Lectures en cours 📚

HDR Vincent Brault

  • ⌛ Chap 2 : Creuser l’idée de maximiser l’énergie libre, très intéressant regarder le critère CARI et lire Robert et al 2021. Actuellement p32 du manuscrit
  • Chap 3

OT

  • Mazelet, Flamary, et Thirion (s. d.) Intéressant pour le transport optimal entre graphes de tailles différentes | Regarder si regularization entropique ne marche pas bien pour le graphe.
  • Nenna (s. d.b) Pour comprendre le problème d’OT régularisé pour l’entropie.
  • Nenna (s. d.a)

Inférence de graphes

  • Aitchison (1982), en cours

  • ❗📖 Payne et al. (2023) sur MixMPLN

Causalité

Largest Gaps

  • ❗📖 Brault et Channarond (2023)
  • ❗📖 Channarond, Daudin, et Robin (2012) le papier qui introduit le Largest Gaps

Les références

Aitchison, J. 1982. « The Statistical Analysis of Compositional Data ». Journal of the Royal Statistical Society. Series B (Methodological) 44 (2): 139‑77. https://www.jstor.org/stable/2345821.
Brault, Vincent, et Antoine Channarond. 2023. « Fast and Consistent Algorithm for the Latent Block Model ». 9 mars 2023. https://doi.org/10.48550/arXiv.1610.09005.
Bystrova, Daria. s. d. « Causal Discovery ».
Channarond, Antoine, Jean-Jacques Daudin, et Stéphane Robin. 2012. « Classification and Estimation in the Stochastic Blockmodel Based on the Empirical Degrees ». Electronic Journal of Statistics 6 (janvier). https://doi.org/10.1214/12-ejs753.
Mazelet, Sonia, Rémi Flamary, et Bertrand Thirion. s. d. « Unsupervised Learning for Optimal Transport Plan Prediction Between Unbalanced Graphs ».
Nenna, Luca. s. d.a. « Lecture 1 Monge and Kantorovich Problems: From Primal to Dual ».
———. s. d.b. « Lecture 2: Entropic Optimal Transport ».
Payne, Andrea, Anjali Silva, Steven J. Rothstein, Paul D. McNicholas, et Sanjeena Subedi. 2023. « Finite Mixtures of Multivariate Poisson-Log Normal Factor Analyzers for Clustering Count Data ». 13 novembre 2023. https://doi.org/10.48550/arXiv.2311.07762.