From 2ef273a26019f621049812095b4380a1768faf77 Mon Sep 17 00:00:00 2001 From: Louis Date: Mon, 5 May 2025 17:12:37 +0200 Subject: [PATCH] Ajout --- suivi/2025-18/2025-18.qmd | 31 ++- suivi/2025-18/figs/partition-iid.svg | 403 +++++++++++++++++++++++++++ suivi/2025-19/2025-19.qmd | 89 ++++++ 3 files changed, 512 insertions(+), 11 deletions(-) create mode 100644 suivi/2025-18/figs/partition-iid.svg create mode 100644 suivi/2025-19/2025-19.qmd diff --git a/suivi/2025-18/2025-18.qmd b/suivi/2025-18/2025-18.qmd index 4243d5e..812ba51 100644 --- a/suivi/2025-18/2025-18.qmd +++ b/suivi/2025-18/2025-18.qmd @@ -1,14 +1,11 @@ --- title: "Bilan semaine 18 2025 : 28 avril - 2 mai" categories: [colBiSBM, inférence] +date: 2025 05 02 --- ## A faire -### JdS - -- colDEM CSE - ### Stratégie suite : Inférence - Lire biblio fournie Julie, Inférence de réseaux : co-occurence @@ -36,12 +33,6 @@ categories: [colBiSBM, inférence] ### Simulations article - -- Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral - -- Ajouter simu clustering métriques nb sous-collections obtenues. -Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille $M = 30$ avec $M_1 = M_2 = M_3 = 10$. - - Comparer sur clustering unipartite avec versions symétriser des par blocs des matrices d'adjacences. - Corriger structure de simus : @@ -63,7 +54,19 @@ Car densités déséquilibrées. ## J'ai fait +### JdS +- colDEM CSE + + +### Clustering exhaustif Baldock + +- Le clustering de toutes les 52 partitions s'est fait en 5h30 ! (Mémoïsation) + +- Pour iid la meilleure partition avec $BICL=-9466.911$ contre $BICL_{algo} = -9466.873 \pm 0.02205$ trouvé avec l'algo +![best_iid](figs/partition-iid.svg) + +- Pour $\pi\rho$ la meilleure partition avec $BICL = en cours$ contre $BICL_{algo} =-9497.92 \pm 0.00009$ ## A continuer @@ -82,4 +85,10 @@ En attente résultats MIGALE - Idée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d'urbanisation > Sophie a fait une appli qui marche bien et va dans le sens de l'analyse faite -(à savoir pas d'effet du gradien d'urbanisation). À continuer pour l'intégrer dans l'article ! \ No newline at end of file +(à savoir pas d'effet du gradien d'urbanisation). À continuer pour l'intégrer dans l'article ! + +### Simulations article + +- Relancer simulations de clustering avec $M = 30$ où $M_i = 10, \forall i$. En attente retour MIGALE +Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. +Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille $M = 30$ avec $M_1 = M_2 = M_3 = 10$. \ No newline at end of file diff --git a/suivi/2025-18/figs/partition-iid.svg b/suivi/2025-18/figs/partition-iid.svg new file mode 100644 index 0000000..85c1ddb --- /dev/null +++ b/suivi/2025-18/figs/partition-iid.svg @@ -0,0 +1,403 @@ + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +0.5 +0.27 +0.26 +0.02 + + +1 +2 + + + + +1 +2 + + + + +0.95 + + +Baldock2011_TB+Baldock2011_JN + + + + + + + +0.00 +0.25 +0.50 +0.75 +1.00 +Column proportions + + + + +0.98 + + +0.00 +0.25 +0.50 +0.75 +1.00 + + + + + +Row proportions + + +Baldock2011_TB+Baldock2011_JN + +alpha + + + + + + + + + + + +0.00 +0.25 +0.50 +0.75 +1.00 + +Column block + + + + +1 +2 + +Row block + + + + +1 +2 + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +0.35 +0.4 +0.35 +0.05 +0.23 +0.51 +0.28 +0.17 +0.04 +0.03 +0.19 +0.07 +0.02 +0.01 +0 + + +1 +2 +3 + + + + + + + + +1 +2 +3 +4 +5 + + + + + + + + + + + + + + + + + + + + + + +0.13 +0.13 +0.12 +0.37 +0.39 +0.37 +0.32 +0.46 +0.47 +0.44 +0.5 + + +Baldock2019_Reading +Baldock2019_Leeds +Baldock2019_Edinburgh +Baldock2019_Bristol + + + + + + + + + + +0.00 +0.25 +0.50 +0.75 +1.00 +Column proportions + + + + + + + + + + + + + + +0.12 +0.17 +0.14 +0.88 +0.84 +0.78 +0.84 + + +0.00 +0.25 +0.50 +0.75 +1.00 + + + + + +Row proportions + + + + + +Baldock2019_Bristol +Baldock2019_Edinburgh +Baldock2019_Leeds +Baldock2019_Reading + +alpha + + + + + + + + + + + +0.00 +0.25 +0.50 +0.75 +1.00 + +Column block + + + + + + + + + + +1 +2 +3 +4 +5 + +Row block + + + + + + +1 +2 +3 +Best partition + + \ No newline at end of file diff --git a/suivi/2025-19/2025-19.qmd b/suivi/2025-19/2025-19.qmd new file mode 100644 index 0000000..e72594d --- /dev/null +++ b/suivi/2025-19/2025-19.qmd @@ -0,0 +1,89 @@ +--- +title: "Bilan semaine 19 2025 : 5 mai - 9 mai" +categories: [colBiSBM, inférence] +--- + +## A faire + +### ML at Aussois + +- Détails d'inscriptions + +### Stratégie suite : Inférence + +- Papier pour comprendre données + +- pbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU ...) + +> Combine networks at different taxonomic levels + +- Inférence + GREMLINS + +### Rédaction article + +- Relire intro St Clair +- S'inspirer structure pour mon intro +- Trouver biblio intro +- Rédiger l'intro +- Regarder les applications pour les collections de réseaux recommender system +- Lire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson + +- Dire résultats nettement meilleurs et variabilités inférieures. + +- Intégrer les retours de Sophie + +### Simulations article + +- Comparer sur clustering unipartite avec versions symétriser des par blocs des matrices d'adjacences. + +- Corriger structure de simus : + - Pour noisy $\alpha$ : + - Logit pour envoyer la gaussienne vers (0,1) + - Beta contrainte dans (0,1) + - Pour noisy links : Générer `nb_clustering` collections de taille M puis prélever $\epsilon_{max}n_r n_c$ liens à inverser puis pour les $\epsilon < \epsilon_{max}$ prélever dans la liste des indices afin d'avoir des perturbations emboitées. + +### Applications + +- Kmeans sur la densité des réseaux subdoré pour pré-partitionner et *clusteriser*. +Car densités déséquilibrées. + +![](figs/density-subdore.png) + +### Autour de l'article et du package + +- Créer des vignettes illustrant par exemple des cas de simulations. **Possible de mettre l'exemple d'application de Sophie sur les réseaux avec gradient d'urbanisation**. + +## J'ai fait + + +## A continuer + + - Résultats simus NA **Erreur pour certaines conditions** : Pour NA robustness générer `nb_rep` collections de taille $M=2$ et prélever +$\epsilon_{max}n_r n_c$ liens à retirer puis pour les $\epsilon < \epsilon_{max}$ prélever dans la liste des indices afin d'avoir des perturbations emboitées. +Il faut que j'ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). +Implémenté les missing steps *en attente des résultats MIGALE*. + +- Lire Biological Networks - François Képès + +- Relancer simus d'inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j'ai relancé avec M = 4 au lieu de M = 2. +En attente résultats MIGALE + +### Applications + +- Idée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d'urbanisation + +> Sophie a fait une appli qui marche bien et va dans le sens de l'analyse faite +(à savoir pas d'effet du gradien d'urbanisation). À continuer pour l'intégrer dans l'article ! + +### Simulations article + +- Relancer simulations de clustering avec $M = 30$ où $M_i = 10, \forall i$. En attente retour MIGALE +Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. +Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille $M = 30$ avec $M_1 = M_2 = M_3 = 10$. + +### Axe inférence + + +- Lire biblio fournie Julie, Inférence de réseaux : co-occurence + +> J'ai commencé à lire Faust et al. \ No newline at end of file