140 lines
No EOL
5.1 KiB
Text
140 lines
No EOL
5.1 KiB
Text
---
|
|
title: "Bilan semaine 28 2025 : 07 juillet - 11 juillet"
|
|
categories: [colBiSBM, inférence, GNN]
|
|
date: 2025-07-07
|
|
date-modified: last-modified
|
|
bibliography: references.bib
|
|
---
|
|
|
|
## TODO List
|
|
|
|
- Pour clustering de collections sur données ~~réelles~~ :
|
|
→ L'intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs $(Q_1,Q_2)$.
|
|
- ❓Je n'arrive plus à reproduire le bug pour l'inférence...
|
|
- S'assurer que ça marche et relancer
|
|
|
|
- Creuser et explorer avec easy16s !
|
|
|
|
- ⌛ **Calcul du score F1**Revérifier que j'entraîne correctement le VGAE car résultats de généralisation trop bons sur les autres réseaux Doré, ce qui est étonnant
|
|
- Ajouter au tableau comparatif sep BiSBM
|
|
- Regarder les codes Mangal database pour $\delta$
|
|
- Voir $\delta$ mais additif
|
|
|
|
:::{.callout-note}
|
|
### $\delta$ additif Bernoulli
|
|
En Bernoulli pas de forme analytique non plus :
|
|
Pour $\alpha_{qr}$:
|
|
$$ \sum_{m=1}^M \sum_{i=1}^{n_1^m} \sum_{j=1}^{n_2^m} \tau_{iq}^{1,m}\tau_{jr}^{2,m}(\frac{X_{ij}^m}{\alpha_{qr}} + \frac{(1-X_{ij}^m)}{\alpha_{qr} + \delta_m -1}) = 0$$
|
|
$$\Leftrightarrow \sum_m \frac{e^m_{qr}}{\alpha_{qr}} + \frac{1}{\alpha_{qr}+\delta_m-1} (n^m_{qr}-e^m_{qr}) = 0$$
|
|
|
|
Et pour $\delta_m$:
|
|
$$ \sum_{i=1}^{n_1^m} \sum_{j=1}^{n_2^m} \sum_{q=1}^{Q_1} \sum_{r=1}^{Q_2} \tau_{iq}^{1,m}\tau_{jr}^{2,m}(\frac{X_{ij}^m}{\delta_{m}} + \frac{(1-X_{ij}^m)}{\alpha_{qr} + \delta_m -1}) = 0$$
|
|
:::
|
|
|
|
:::{.callout-note}
|
|
### $\delta$ additif Poisson
|
|
Forme analytique mais risque de confusion ?
|
|
$$\widehat{\delta_m} = \frac{\sum_{q,r} e^m_{qr}}{\sum_{q,r} n^m_{qr}},~\widehat{\alpha_{qr}} = \frac{\sum_{m} e^m_{qr}}{\sum_{m} n^m_{qr}} $$
|
|
|
|
:::
|
|
|
|
- Attente retour Pierre pour faire d'autres clustering
|
|
|
|
- Implémenter décodeur Anti Scalaire
|
|
|
|
- Regarder la liste des cours du MathSV et de l'Université Paris-Saclay.
|
|
|
|
- Dé-bugger les simulations :
|
|
|
|
- ⌛ Inférence : Relancer simus d'inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j'ai relancé avec M = 4 au lieu de M = 2.
|
|
En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d'autres problèmes que juste le plan de parallélisation.
|
|
- ⌛Bon le bug ne se reproduit plus... les jobs sont juste trop longs (> 120h) j'ai relancé, il ne reste que 43/972 conditions.
|
|
|
|
- ⌛ **Plutôt regarder pour introduire un modèle $\delta$-colBiSBM**.
|
|
- Ajouter le produit par $\delta$ là où nécessaire
|
|
- Ajouter les modèles $\delta$, $\delta\pi, \dots$ et les blocs conditionnels
|
|
- Ajouter les tests unitaires adéquats et les vérifier
|
|
|
|
- Regarder *Largest gap* sur réseaux Doré
|
|
|
|
- Essayer *clustering* sur `supinfo`
|
|
|
|
- Homogénéiser notations dans les supplementaries
|
|
|
|
:::{#ref-kmeans-vae}
|
|
|
|
- Faire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l'espace latent
|
|
J'ai commencé à regarder un peu
|
|
|
|
:::
|
|
|
|
### Inférence et microbes
|
|
|
|
- Lancer *colBiSBM* sur $OTU\times Sample$ → problème du chargement en mémoire des données à voir
|
|
- Lancer *colSBM* sur $OTU\times OTU$
|
|
- TabNet pratiquer les [exercices](https://github.com/cregouby/Tutoriel_torch)
|
|
- Regarder **SPARTA** Rennes
|
|
- Lire Papiers compositional data (Aitchison et al. intro)
|
|
- Lire article multi-niveaux Saint-Clair
|
|
- Ecrire et étudier les modèles pour différents niveaux taxonomiques.
|
|
\begin{align*}
|
|
i \rightarrow &~N^1_i \subseteq N^2_i \subseteq N^3_i & \text{Taxonomie}\\
|
|
Z^0_i \overset{?}{=} & Z^1_i \overset{?}{=} Z^2_i \overset{?}{=} Z^3_i & \text{Groupes fonctionnels}
|
|
\end{align*}
|
|
|
|
#### Causalité
|
|
|
|
Plus sur le temps long, à regarder
|
|
|
|
- GT causalité
|
|
- Daria Bystrova lire présentation @bystrovaCausalDiscovery (Meek rules, V-structure)
|
|
|
|
## Biblio à faire
|
|
|
|
- Regarder Transport optimal graphes bipartite.
|
|
- HDR VB, chapitre de modèle à blocs latents, bcp travaillé sur bipartite
|
|
OT, comparaison clustering, adaption ARI, *Largest Gap*
|
|
|
|
## Lectures en cours 📚
|
|
|
|
### OT
|
|
- ⌛ @mazeletUnsupervisedLearningOptimal Intéressant pour le transport optimal entre graphes de tailles différentes | Regarder si regularization entropique ne marche pas bien pour le graphe.
|
|
- ⌛ @nennaLecture2Entropic Pour comprendre le problème d'OT régularisé pour l'entropie.
|
|
- ⌛ @nennaLecture1Monge
|
|
|
|
### Inférence de graphes
|
|
|
|
- ⌛ @aitchisonStatisticalAnalysisCompositional1982a, en cours
|
|
|
|
- ❗📖 @payneFiniteMixturesMultivariate2023 sur MixMPLN
|
|
|
|
### Causalité
|
|
|
|
- ❗📖 @bystrovaCausalDiscovery
|
|
|
|
### Largest Gaps
|
|
|
|
- ✅ @braultGeneralisationLalgorithmeLargest petit résumé de l'algo de @braultFastConsistentAlgorithm2023
|
|
- ❗📖 @braultFastConsistentAlgorithm2023
|
|
- ❗📖 @channarondClassificationEstimationStochastic2012 le papier qui introduit le *Largest Gaps*
|
|
|
|
## A discuter
|
|
|
|
### Congés P&S
|
|
|
|
### Thèse
|
|
|
|
- Faire préz CSI
|
|
- Faire rapport CSI
|
|
|
|
### Interprétation écologiques résultats de Baldock
|
|
|
|
- ⌛ Point avec Elisa, **oui on relance**
|
|
|
|
### Inférence
|
|
|
|
- pbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU ...)
|
|
|
|
> Combine networks at different taxonomic levels
|
|
|
|
- Inférence + GREMLINS |