these-recap-hebdo/suivi/2025-45/2025-45.qmd
Louis 4dbc745461
All checks were successful
ci/woodpecker/push/woodpecker Pipeline was successful
Ajout UniFrac
2025-11-07 15:54:23 +01:00

125 lines
No EOL
4.7 KiB
Text

---
title: "Bilan semaine 45 2025 : 03 novembre - 06 novembre"
categories: [colBiSBM, inférence, GNN]
date: 2025 11 03
date-modified: last-modified
bibliography: references.bib
---
## TODO List
- Finir le papier :
- ❓ Fait ? Re-structurer le plan, mon plan, Donnet et Barbillon, échelle méso et comparaison inter réseau et noeuds non partagés.
- ✅ Partie Baldock: Ajouter l'ordre des modèles préférés et vérifier mais BICLsep < BICL pirho < BICL iid
- ✅ Toutes les simus en annexe. Envoyer Info transfer en annexe et remplacer par Network partitioning
- Codes pour le papier :
- Nettoyer les scripts
- Faire un joli README
- ❓Faire des notebooks
- Maitriser graphtools de Peixoto pour essayer d'utiliser l'arbre taxonomique sur graphe de cooccurence inférer par SparCC
- Maitriser SparCC
- Faire LBM sur niveau taxonomique grossier, initialiser avec le résultat pour un niveau plus fin et ainsi de suite.
- Clustering unipartite j'ai cassé une fonction de distance à vérifier et réparer
- Pour clustering de collections sur données ~~réelles~~ :
&rarr; L'intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs $(Q_1,Q_2)$.
- 👶 (délégué à Mona) Clustering sur Doré :
- Regarder pour les couples date+nom les études et le nombre de réseaux analysables (Possible demander à Élisa)
- ⌛ Chamberlain et al semble intéressant à regarder ! Voir le Rmarkdown
- Clusteriser sur la base des noms et voir parmi les réseaux Européens (désagrégés ?)
- Si M > 10, alors voir si je retrouve les mêmes résultats que dans les études.
- Regarder *Largest gap* sur réseaux Doré
- ⌛ Essayer *clustering* sur `supinfo`
- CAH et Kmeans tendent vers faire $K = 13$ clusters sur les supinfos
- Enrichir avec des métriques sur les réseaux (nestedness, connectance autres ?)
- Demander à Elisa pour la signification des métadonnées
- Demander à Elisa une fois vu cohérences de groupe voir pour interprétation écologiques ?
- Algo de clustering sur les groupes trouvés
### Inférence et microbes
#### Bibliographie: à lire, à faire
- Lire article multi-niveaux Saint-Clair
- ✅ Papier Julie Negative Binomiale
- 🆕 🔎 Trouver des papiers:
- LBM Negative Binomial
- Network inference through sample comparison
- Idée des groupes sur la base de distance phylogénétique:
- En train de comprendre les distances que phyloseq permet de calculer sur notre exemple
- En train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html
- Parametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)
- Lire Papier UniFrac
#### Réflexion
- easy16s : se renseigner sur
- $\alpha$, $\beta$ diversité
- Heatmap
- Regarder **SPARTA** Rennes
- Ecrire et étudier les modèles pour différents niveaux taxonomiques.
- 🆕 Regarder NetComi
- 🆕 Regarder OneNet car aggrégation plus robuste
- 🆕 Réfléchir sens d'aggréger les données ou de les diviser
#### Écrire et faire tourner
- Lancer *colBiSBM* sur $OTU\times Sample$ &rarr; problème du chargement en mémoire des données à voir
- Lancer *colSBM* sur $OTU\times OTU$
- TabNet pratiquer les [exercices](https://github.com/cregouby/Tutoriel_torch)
- 🆕 SparCC à différent niveaux
- 🆕 SBM à différent niveaux
- 🆕⌛ Tree-PLN à différents niveaux
#### Causalité
Plus sur le temps long, à regarder
- GT causalité
- Daria Bystrova lire présentation @bystrovaCausalDiscovery (Meek rules, V-structure)
## A discuter
- 🆕 Voir pour des Réseaux / GDR ou aller
- 🆕 Chercher des cours à suivre
## Biblio à faire
- Regarder Transport optimal graphes bipartite.
## Lectures en cours 📚
### HDR Vincent Brault
- ⌛ Chap 2 : Creuser l'idée de maximiser l'énergie libre, très intéressant regarder le critère CARI et lire Robert et al 2021. Actuellement p32 du manuscrit
- Chap 3
### OT
- ⌛ @mazeletUnsupervisedLearningOptimal Intéressant pour le transport optimal entre graphes de tailles différentes | Regarder si regularization entropique ne marche pas bien pour le graphe.
- ⌛ @nennaLecture2Entropic Pour comprendre le problème d'OT régularisé pour l'entropie.
- ⌛ @nennaLecture1Monge
### Inférence de graphes
- ⌛ @aitchisonStatisticalAnalysisCompositional1982a, en cours
- ❗📖 @payneFiniteMixturesMultivariate2023 sur MixMPLN
### Causalité
- ❗📖 @bystrovaCausalDiscovery
### Largest Gaps
- ❗📖 @braultFastConsistentAlgorithm2023
- ❗📖 @channarondClassificationEstimationStochastic2012 le papier qui introduit le *Largest Gaps*