--- title: "Bilan semaine 27 2025 : 30 juin - 4 juillet" categories: [colBiSBM, inférence, GNN] date: 2025-06-30 date-modified: last-modified bibliography: references.bib --- ## TODO List - Pour clustering de collections sur données réelles : → L'intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs $(Q_1,Q_2)$. - ❓Je n'arrive plus à reproduire le bug pour l'inférence... - S'assurer que ça marche et relancer - Creuser et explorer avec easy16s ! - ✅ Ajouter le tableau de comparaison du VGAE avec colBiSBM - Revérifier que j'entraîne correctement le VGAE car résultats de généralisation trop bons sur les autres réseaux Doré, ce qui est étonnant - Regarder la liste des cours du MathSV et de l'Université Paris-Saclay. - Dé-bugger les simulations : - ⌛ Inférence : Relancer simus d'inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j'ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d'autres problèmes que juste le plan de parallélisation. - ⌛Bon le bug ne se reproduit plus... les jobs sont juste trop longs (> 120h) j'ai relancé, il ne reste que 182/972 conditions. - **Plutôt regarder pour introduire un modèle $\delta$-colBiSBM**. Kmeans sur la densité des réseaux subdoré pour pré-partitionner et *clusteriser*. Car densités déséquilibrées. :::{#ref-kmeans-vae} - Faire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l'espace latent J'ai commencé à regarder un peu ::: ### Inférence et microbes - Lancer *colBiSBM* sur $OTU\times Sample$ → problème du chargement en mémoire des données à voir - Lancer *colSBM* sur $OTU\times OTU$ - ✅ Creuser [TabNet](https://raw.githubusercontent.com/cregouby/R-toulouse-tabnet/main/Tabnet_RR2023_fr_pdf.pdf) de Christophe Regouby - TabNet pratiquer les [exercices](https://github.com/cregouby/Tutoriel_torch) - Regarder **SPARTA** Rennes - Lire Papiers compositional data (Aitchison et al. intro) - Lire article multi-niveaux Saint-Clair - Ecrire et étudier les modèles pour différents niveaux taxonomiques. \begin{align*} i \rightarrow &~N^1_i \subseteq N^2_i \subseteq N^3_i & \text{Taxonomie}\\ Z^0_i \overset{?}{=} & Z^1_i \overset{?}{=} Z^2_i \overset{?}{=} Z^3_i & \text{Groupes fonctionnels} \end{align*} #### Causalité Plus sur le temps long, à regarder - GT causalité - Daria Bystrova lire présentation @bystrovaCausalDiscovery (Meek rules, V-structure) ## Lectures en cours 📚 ### OT - ⌛ @mazeletUnsupervisedLearningOptimal Intéressant pour le transport optimal entre graphes de tailles différentes - ⌛ @nennaLecture2Entropic Pour comprendre le problème d'OT régularisé pour l'entropie. - ⌛ @nennaLecture1Monge ### Inférence de graphes - ✅ @Morton2021.11.09.467939 VAE with Multinomial Logistic Normal distribution using Isometric Log Ratio tranform. Plus rapide que les autres méthodes et performances équivalentes - ⌛ @aitchisonStatisticalAnalysisCompositional1982a - ❗📖 @payneFiniteMixturesMultivariate2023 sur MixMPLN ### Causalité - ❗📖 @bystrovaCausalDiscovery ## A discuter ### Congés P&S - ✅ Quand est-ce qu'on ne se voit pas ? Et donc quand est-ce qu'on se voit après ? - ✅ Calendrier partagé ### Thèse - ✅ Que prévoir pour le CSI - 👍 Un petit rapport - 👍 Une présentation - 👨‍🏫 **Demander à Pierre** Comment valider les enseignements comme formations Adum ? - ✅ Des recommandations de formations, voir les cours du MathSV ### Interprétation écologiques résultats de Baldock - ⌛ Point avec Elisa, **oui on relance** ### Inférence - pbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU ...) > Combine networks at different taxonomic levels - Inférence + GREMLINS