diff --git a/suivi/2025-20/2025-20.qmd b/suivi/2025-20/2025-20.qmd index f850efb..4c512d1 100644 --- a/suivi/2025-20/2025-20.qmd +++ b/suivi/2025-20/2025-20.qmd @@ -5,13 +5,21 @@ categories: [colBiSBM, inférence] ## TOP PRIORITÉ -- Débugguer les simulations : +- Pour clustering de collections sur données réelles : + - Relâcher la pénalité pour les coupes pour proposer modèles. + - Calculer le BIC-L avec bonne pénalité pour détecter partitions prometteuses. + - Ré-ajuster les bonnes partitions. + +- Dé-bugger pourquoi `BipartiteInnerProductDecoder.forward() -> NaN` + +- Dé-bugger les simulations : - Clustering : Relancer simulations de clustering avec $M = 30$ où $M_i = 10, \forall i$. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille $M = 30$ avec $M_1 = M_2 = M_3 = 10$. ~~-> BUG, dois creuser mais juste des problèmes techniques.~~ Le bug venait probablement d'une inadéquation entre la version de *future* et *future.callr*, les résultats temporaires sont encourageants. +:::{.callout-note collapse="true"} | epsilon|model |ARI |nb_collections | |-------:|:-----|:---------------|:---------------| | 0.1|iid |0.41 $\pm$ 0.12 |2.8 $\pm$ 0.44 | @@ -30,10 +38,31 @@ categories: [colBiSBM, inférence] | 0.4|pi |1 |3 | | 0.4|pirho |0.86 $\pm$ 0.11 |3.33 $\pm$ 0.41 | | 0.4|rho |0.99 $\pm$ 0.01 |3.29 $\pm$ 0.29 | +::: - Inférence : Relancer simus d'inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j'ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d'autres problèmes que juste le plan de parallélisation. +- Vérifier si problème de version tidyverse pour vapply sur l'**inférence**. + +- Si problème de parallélisation vient de pb de version *future.callr* le signaler à MIGALE. + +### Présentations LSD, JdS et ML@Aussois + +- ~~PRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides~~ et voir avec PB et SD. +- Quel plan ? +- Quels résultats ? Baldock, Traveset ... (sub-Doré) + +- Mettre le détails des formules et des algos pour VE et sélection de modèle en +annexe. +- Préciser simplement que l'on utilise un algo VE et un critère type BIC. +- Pas la peine de préciser l'algo de clustering +- Indiquer sur une slide le problème de support pour $\pi\rho$ à faire s'il y a +le temps. +- Résultats sur les réseaux Baldock, regarder le positionnement par bloc des +espèces communes, regarder les probas d'appartenance aux blocs par espèces +communes et par réseau. + ### Applications - Kmeans sur la densité des réseaux subdoré pour pré-partitionner et *clusteriser*. @@ -46,28 +75,22 @@ J'ai commencé à regarder un peu ::: -### Présentations LSD, JdS et ML@Aussois - -- ~~PRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides~~ et voir avec PB et SD. -- Quel plan ? -- Quels résultats ? Baldock, Traveset ... (sub-Doré) - - ### Inférence et microbes -- Lire Papiers compositional data (Aitchison et al. intro) +- Human Gut Compendium télécharger et analyser les données. +- Lancer *colBiSBM* sur $OTU\times Sample$ - Se renseigner techniques d'inférence de réseaux : - covariance (base corrélation et seuil) - GraphicalLASSO - Co-occurence +- Lancer *colSBM* sur $OTU\times OTU$ +- Creuser [TabNet](https://raw.githubusercontent.com/cregouby/R-toulouse-tabnet/main/Tabnet_RR2023_fr_pdf.pdf) de Christophe Regouby et les [exercices](https://github.com/cregouby/Tutoriel_torch) +- Regarder **SPARTA** Rennes +- Lire Papiers compositional data (Aitchison et al. intro) - Lire article multi-niveaux Saint-Clair ## A discuter -- Voir pour TT période du 11 au 14 août -- Voir pour date CSI car congés avec parents prévu du 29/08 au 12/09. - - ## A faire ### Inférence