these-recap-hebdo/suivi/2025-19/2025-19.qmd
Louis 5cd1e6bffa
All checks were successful
ci/woodpecker/push/woodpecker Pipeline was successful
ML@Aussois ✔️
2025-05-09 13:59:55 +02:00

149 lines
No EOL
4.9 KiB
Text

---
title: "Bilan semaine 19 2025 : 5 mai - 9 mai"
categories: [colBiSBM, inférence]
date: 2025 05 09
---
## TOP PRIORITÉ
- Débugguer les simulations :
- Clustering : Relancer simulations de clustering avec $M = 30$ où $M_i = 10, \forall i$. En attente retour MIGALE
Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues.
Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille $M = 30$ avec $M_1 = M_2 = M_3 = 10$. -> BUG, dois creuser mais juste des problèmes techniques
- Inférence : Relancer simus d'inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j'ai relancé avec M = 4 au lieu de M = 2.
En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques
### Applications
- Kmeans sur la densité des réseaux subdoré pour pré-partitionner et *clusteriser*.
Car densités déséquilibrées.
:::{#ref-kmeans-vae}
- Faire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l'espace latent
:::
### Présentations LSD, JdS et ML@Aussois
- PRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.
- Quel plan ?
- Quels résultats ? Baldock, Traveset ... (sub-Doré)
### Inférence et microbes
- Lire Papiers compositional data (Aitchison et al. intro)
- Se renseigner techniques d'inférence de réseaux :
- covariance (base corrélation et seuil)
- GraphicalLASSO
- Co-occurence
- Lire article multi-niveaux Saint-Clair
## A discuter
- Voir pour TT période du 11 au 14 août
## A faire
### Inférence
- Papier pour comprendre données
- Faust et al. lu
- Abdill et al.
- Bashan et al.
- pbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU ...)
> Combine networks at different taxonomic levels
- Inférence + GREMLINS
### Rédaction article
- Relire intro St Clair
- S'inspirer structure pour mon intro
- Trouver biblio intro
- Rédiger l'intro
- Dire résultats nettement meilleurs et variabilités inférieures.
## J'ai fait
### CSI (en attente contacts PB et SD)
- Est-ce à moi de contacter Saint-Clair et Sonia/Elisa ? *Pierre et Sophie gèrent*
- Pierre Gérard a dit oui, il attend les détails
- Quand : *fin juin début juillet*
- Liste potentielle :
- (Saint-Clair)
- Mahendra
- Elisa/Sonia
- Pierre Gérard
### Finist'R
- S'inscrire
### ML at Aussois
- S'inscrire avec abstract court
- Demander la bourse
- Détails d'inscriptions : *Je demande une bourse et je m'inscris avec la demande de bourse, Pierre et Sophie font la lettre de recommendation*
## A continuer
### Applications
- Idée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d'urbanisation
> Sophie a fait une appli qui marche bien et va dans le sens de l'analyse faite
(à savoir pas d'effet du gradien d'urbanisation). À continuer pour l'intégrer dans l'article !
### Axe inférence
- Lire biblio fournie Julie, Inférence de réseaux : co-occurence
> J'ai lu Faust et al.
> Je lis Abdill et al.
## Repoussés ou abandonnés
- Résultats simus NA **Erreur pour certaines conditions** : Pour NA robustness générer `nb_rep` collections de taille $M=2$ et prélever
$\epsilon_{max}n_r n_c$ liens à retirer puis pour les $\epsilon < \epsilon_{max}$ prélever dans la liste des indices afin d'avoir des perturbations emboitées.
Il faut que j'ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code).
Implémenté les missing steps.
> Je n'arrive pas à comprendre les erreurs qui arrivent
- Lire Biological Networks - François Képès
- Regarder les applications pour les collections de réseaux recommender system *Pas pertinents et trop gros*
:::{#lst-reco-systems lst-cap="Recommender systems data"}
Par exemple :
- [Liste de recommendation data](https://cseweb.ucsd.edu/~jmcauley/datasets.html)
:::
### Papier plus multi-applications
- Données d'Elisa herbivore ?
- Données urbanisations ?
### Autour de l'article et du package
- Créer des vignettes illustrant par exemple des cas de simulations. **Possible de mettre l'exemple d'application de Sophie sur les réseaux avec gradient d'urbanisation**.
### Simulations article
- Comparer sur clustering unipartite avec versions symétriser des par blocs des matrices d'adjacences.
- Corriger structure de simus :
- Pour noisy $\alpha$ :
- Logit pour envoyer la gaussienne vers (0,1)
- Beta contrainte dans (0,1)
- Pour noisy links : Générer `nb_clustering` collections de taille M puis prélever $\epsilon_{max}n_r n_c$ liens à inverser puis pour les $\epsilon < \epsilon_{max}$ prélever dans la liste des indices afin d'avoir des perturbations emboitées.