diff --git a/index.html b/index.html index f7ac73f..7e8cb86 100644 --- a/index.html +++ b/index.html @@ -180,7 +180,7 @@ window.Quarto = { +
Catégories
Tous (11)
colBiSBM (11)
GNN (4)
inférence (6)
@@ -210,7 +210,7 @@ window.Quarto = {
Date de publication
-

28 mai 2025

+

10 juin 2025

@@ -228,7 +228,42 @@ window.Quarto = {
-
+
+ + + +
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+

diff --git a/listings.json b/listings.json index dda641e..f89fd9e 100644 --- a/listings.json +++ b/listings.json @@ -2,6 +2,7 @@ { "listing": "/index.html", "items": [ + "/suivi/2025-24/2025-24.html", "/suivi/2025-22/2025-22.html", "/suivi/2025-21/2025-21.html", "/suivi/2025-20/2025-20.html", diff --git a/search.json b/search.json index 12d6dbe..ca0be2f 100644 --- a/search.json +++ b/search.json @@ -112,46 +112,67 @@ "text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nPour sub doré en attente MIGALE augmenter le nbre de répèt de la procédure." }, { - "objectID": "suivi/2025-18/2025-18.html", - "href": "suivi/2025-18/2025-18.html", - "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", + "objectID": "suivi/2025-24/2025-24.html", + "href": "suivi/2025-24/2025-24.html", + "title": "Bilan semaine 24 2025 : 10 juin - 13 juin", "section": "", - "text": "Lire biblio fournie Julie, Inférence de réseaux : co-occurence\nPapier pour comprendre données\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\n\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\nIntégrer les retours de Sophie\n\n\n\n\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." + "text": "Pour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n▶️ Je commence à coder ça\n\nIdée de Sophie : alterner descendant et ascendant → prometteur aussi\n\nJ’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances.\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}" }, { - "objectID": "suivi/2025-18/2025-18.html#a-faire", - "href": "suivi/2025-18/2025-18.html#a-faire", - "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", + "objectID": "suivi/2025-24/2025-24.html#todo-list", + "href": "suivi/2025-24/2025-24.html#todo-list", + "title": "Bilan semaine 24 2025 : 10 juin - 13 juin", "section": "", - "text": "Lire biblio fournie Julie, Inférence de réseaux : co-occurence\nPapier pour comprendre données\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\n\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\nIntégrer les retours de Sophie\n\n\n\n\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." + "text": "Pour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n▶️ Je commence à coder ça\n\nIdée de Sophie : alterner descendant et ascendant → prometteur aussi\n\nJ’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances.\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}" }, { - "objectID": "suivi/2025-18/2025-18.html#jai-fait", - "href": "suivi/2025-18/2025-18.html#jai-fait", - "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", - "section": "J’ai fait", - "text": "J’ai fait\n\nJdS\n\ncolDEM CSE\n\n\n\nClustering exhaustif Baldock\n\nLe clustering de toutes les 52 partitions s’est fait en 5h30 ! (Mémoïsation)\nPour iid la meilleure partition avec BICL=-9466.911 contre BICL_{algo} = -9466.873 \\pm 0.02205 trouvé avec l’algo \nPour \\pi\\rho la meilleure partition avec BICL = -9497.92 contre BICL_{algo} =-9497.92 \\pm 0.00009" + "objectID": "suivi/2025-24/2025-24.html#a-discuter", + "href": "suivi/2025-24/2025-24.html#a-discuter", + "title": "Bilan semaine 24 2025 : 10 juin - 13 juin", + "section": "A discuter", + "text": "A discuter\n\nInférence\n\nPapier pour comprendre données\n\nFaust et al.\nAbdill et al.\nBashan et al.\n\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\nRédaction article\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nDire résultats nettement meilleurs et variabilités inférieures." }, { - "objectID": "suivi/2025-18/2025-18.html#a-continuer", - "href": "suivi/2025-18/2025-18.html#a-continuer", - "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", + "objectID": "suivi/2025-24/2025-24.html#a-continuer", + "href": "suivi/2025-24/2025-24.html#a-continuer", + "title": "Bilan semaine 24 2025 : 10 juin - 13 juin", "section": "A continuer", - "text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nLire Biological Networks - François Képès\nRelancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE\n\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nSimulations article\n\nRelancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10." + "text": "A continuer\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nAxe inférence\n\nLire biblio fournie Julie, Inférence de réseaux : co-occurence\n\n\nJ’ai lu Faust et al.  Je lis Abdill et al." }, { - "objectID": "suivi/2025-13/2025-13.html", - "href": "suivi/2025-13/2025-13.html", - "title": "Bilan semaine 13 2025 : 17-21 mars", - "section": "", - "text": "Cette semaine j’ai :\n\nFini d’intégrer à colSBM tous les changements (clustering dérecursifier pour uni et bipartites& cli …) et contacter Saint-Clair pour passer colSBM sous GrossSBM.\nRelancer et obtenus les résultats pour le clustering sur les réseaux Baldock\n\n\n\n\nBaldock iid\n\n\n\n\n\nBaldock pi\n\n\n\n\n\nBaldock rho\n\n\n\n\n\nBaldock pirho\n\n\n\nRelancer et obtenus les résultats pour les simus ajoutant du bruits sur les structures et liens\n\nPour noisy \\alpha:\n\nPlan de simulation 2 collections (d\\in (1,2)) avec M = 30 soit 15 réseaux par type. n_r = n_c = 120 et \\pi_1 = \\begin{pmatrix} 0.5, 0.3, 0.2\\end{pmatrix},~\n \\rho_1 = \\begin{pmatrix}0.4, 0.3, 0.2, 0.1\\end{pmatrix},~\n \\alpha_1 = \\begin{pmatrix}\n 0.85& 0.4& 0.2& 0.15\\\\\n 0.6& 0.2& 0.15& 0.15\\\\\n 0.2& 0.15& 0.15& 0.7\n \\end{pmatrix}\n \\pi_2 = (0.5, 0.3, 0.2),~\n \\rho_2 = (0.45, 0.3, 0.25),~\n \\alpha_2 = \\begin{pmatrix}\n 0.65& 0.15& 0.15\\\\\n 0.15& 0.8& 0.15\\\\\n 0.15& 0.15& 0.4\n \\end{pmatrix}\n\\epsilon \\in (0, 0.01, \\dots 0.05) qui est l’écart-type d’une \\mathcal{N}_{Q_1^d \\times Q_2^d}(0,\\epsilon^2) = vec(N^m), \\forall m \\in (1,\\dots, M). Et \\forall m, X^m \\sim LBM_{n_r,n_c}(Q_1^d, Q_2^d, \\alpha_d + N^m, \\pi_d, \\rho_d)\nRésultats : \n\nPour noisy links:\n\nPlan de simu M = 30, n_r = n_c = 120. \\pi_1 = \\begin{pmatrix} 0.5, 0.3, 0.2\\end{pmatrix},~\n \\rho_1 = \\begin{pmatrix}0.4, 0.3, 0.2, 0.1\\end{pmatrix},~\n \\alpha_1 = \\begin{pmatrix}\n 0.85& 0.4& 0.2& 0.05\\\\\n 0.6& 0.2& 0.05& 0.05\\\\\n 0.2& 0.05& 0.05& 0.7\n \\end{pmatrix}\n \\pi_2 = (0.5, 0.3, 0.2),~\n \\rho_2 = (0.45, 0.3, 0.25),~\n \\alpha_2 = \\begin{pmatrix}\n 0.65& 0.05& 0.05\\\\\n 0.05& 0.8& 0.05\\\\\n 0.05& 0.05& 0.4\n \\end{pmatrix}\n\\epsilon \\in (0, 0.05, \\dots 0.5), indices de la matrice = sample.int(n_r \\times n_c, size = n_r \\times n_c \\times \\epsilon). Les indices tirés inverse la valeur du lien (1 -> 0, 0 -> 1)\n\n\n\n\n\n\n\n\n\nClear links\n\n\n\n\n\n\n\nNoisy links\n\n\n\n\n\n\nFigure 1\n\n\n\n\nRelancer simulations robustesse aux NAs\nChanger les plots résultats NAs pour faire sous-plots comparant sep vs model." + "objectID": "suivi/2025-24/2025-24.html#repoussés-ou-abandonnés", + "href": "suivi/2025-24/2025-24.html#repoussés-ou-abandonnés", + "title": "Bilan semaine 24 2025 : 10 juin - 13 juin", + "section": "Repoussés ou abandonnés", + "text": "Repoussés ou abandonnés\n\n\n\n\n\n\nDéplier pour voir\n\n\n\n\n\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps.\n\n\nJe n’arrive pas à comprendre les erreurs qui arrivent\n\n\nLire Biological Networks - François Képès\nRegarder les applications pour les collections de réseaux recommender system Pas pertinents et trop gros\n\n\n\n\nListing 1: Recommender systems data\n\n\nPar exemple :\n\nListe de recommendation data\n\n\n\n\n\nPapier plus multi-applications\n\nDonnées d’Elisa herbivore ?\nDonnées urbanisations ?\n\n\n\nAutour de l’article et du package\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation.\n\n\n\nSimulations article\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées." }, { - "objectID": "index.html", - "href": "index.html", - "title": "Journal suivi de la thèse", + "objectID": "suivi/2025-17/2025-17.html", + "href": "suivi/2025-17/2025-17.html", + "title": "Bilan semaine 17 2025 : 24 avril - 25 avril", "section": "", - "text": "Bilan semaine 22 2025 : 26 mai - 30 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n28 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 21 2025 : 26 mai - 30 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n23 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 20 2025 : 12 mai - 16 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n16 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 19 2025 : 5 mai - 9 mai\n\n\n\ncolBiSBM\n\ninférence\n\n\n\n\n\n\n\n\n\n9 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 18 2025 : 28 avril - 2 mai\n\n\n\ncolBiSBM\n\ninférence\n\n\n\n\n\n\n\n\n\n2 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 17 2025 : 24 avril - 25 avril\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n25 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 16 2025\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n18 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 15 2025 : 31 mars-4 avril\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n4 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 14 2025 : 24-28 mars\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n28 mars 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 13 2025 : 17-21 mars\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n17 mars 2025\n\n\nLouis Lacoste\n\n\n\n\n\nAucun article correspondant" + "text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\n\n\n\n\n\nRelancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral\nAjouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10.\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser.\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." + }, + { + "objectID": "suivi/2025-17/2025-17.html#a-faire", + "href": "suivi/2025-17/2025-17.html#a-faire", + "title": "Bilan semaine 17 2025 : 24 avril - 25 avril", + "section": "", + "text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\n\n\n\n\n\nRelancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral\nAjouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10.\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser.\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." + }, + { + "objectID": "suivi/2025-17/2025-17.html#jai-fait", + "href": "suivi/2025-17/2025-17.html#jai-fait", + "title": "Bilan semaine 17 2025 : 24 avril - 25 avril", + "section": "J’ai fait", + "text": "J’ai fait\n\nCréer un README descriptif du dépôt des codes pour l’article.\nRemonter figure sélection de modèle dans le corps de l’article\nEnrichir légende de la figure 7 et 8\nSupprimer p_NA des autres cadrans des proportions de NA\nBasculer le code du clustering pour utiliser hclust et mis l’argument method de hclust avec single par défaut\nAjouter pipeline qui knit README.Rmd à chaque merge dans main colSBM" + }, + { + "objectID": "suivi/2025-17/2025-17.html#a-continuer", + "href": "suivi/2025-17/2025-17.html#a-continuer", + "title": "Bilan semaine 17 2025 : 24 avril - 25 avril", + "section": "A continuer", + "text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nLire Biological Networks - François Képès\nJ’ai esquissé des bouts d’intro\nRelancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE\n\n\nCorrection méthodo\n\nIdée Pierre : Regarder la contribution au BICL de la collection des réseaux et comparer au sep BICL pour essayer de repérer les outliers. En regardant la vbound (pas la pénalité) de chaque réseau dans le joint vs sa vbound dans le sep -> Résultats : pas de différences majeures entre les réseaux avec le rapport vbound_joint/vbound_sep, les outliers ne sont pas marqués.\nRegarder si plutôt que k médioid possible meilleurs résultats avec d’autres distances hclust avec min, max etc… -> L’algo PAM donne des clusters équilibrés sans séparer les outliers Je regarde avec plutôt des hclust avec métrique single pour séparer les outliers.\nVoir si in fine possible de repérer des outliers à partir de ces nouvelles métriques\nRegarder la répartition de densité dans les réseaux sub-doré -> déséquilibrée\n\n\nEn faisant des clusterings par densité on constate qu'avec un modèle iid pour des réseaux dont la densité est entre :\n- 0 et 0.05 : Baldock et Souza tout le monde se retrouvait ensemble avec *Partitioning around medoids*\n\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nLancer clustering auteur par auteur du sub-Doré : 5 collections différentes dans l’idée.\nUne fois fait, Sophie ne trouve pas que ce soit le plus pertinent pour illustrer le clustering. Plus intéressant de garder le clustering de données simulées (M = 30) et se servir des exemples dessous et des parcours exhaustif des possibilités de partitionnement comme comparatif.\n\nBaldock\n\n\n\nAlluvial Baldock\n\n\n\n\nGibson\n\n\n\nAlluvial Gibson\n\n\n\n\nSouza\n\n\n\nAlluvial Souza\n\n\n\n\nTraveset\n\n\n\nAlluvial Traveset\n\n\n\n\nTrojelsgaard\n\n\n\nAlluvial Trojelgaard" }, { "objectID": "suivi/2025-19/2025-19.html", @@ -203,32 +224,46 @@ "text": "Repoussés ou abandonnés\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps.\n\n\nJe n’arrive pas à comprendre les erreurs qui arrivent\n\n\nLire Biological Networks - François Képès\nRegarder les applications pour les collections de réseaux recommender system Pas pertinents et trop gros\n\n\n\n\nListing 1: Recommender systems data\n\n\nPar exemple :\n\nListe de recommendation data\n\n\n\n\n\nPapier plus multi-applications\n\nDonnées d’Elisa herbivore ?\nDonnées urbanisations ?\n\n\n\nAutour de l’article et du package\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation.\n\n\n\nSimulations article\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées." }, { - "objectID": "suivi/2025-17/2025-17.html", - "href": "suivi/2025-17/2025-17.html", - "title": "Bilan semaine 17 2025 : 24 avril - 25 avril", + "objectID": "index.html", + "href": "index.html", + "title": "Journal suivi de la thèse", "section": "", - "text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\n\n\n\n\n\nRelancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral\nAjouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10.\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser.\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." + "text": "Bilan semaine 24 2025 : 10 juin - 13 juin\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n13 juin 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 22 2025 : 26 mai - 30 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n28 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 21 2025 : 26 mai - 30 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n23 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 20 2025 : 12 mai - 16 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n16 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 19 2025 : 5 mai - 9 mai\n\n\n\ncolBiSBM\n\ninférence\n\n\n\n\n\n\n\n\n\n9 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 18 2025 : 28 avril - 2 mai\n\n\n\ncolBiSBM\n\ninférence\n\n\n\n\n\n\n\n\n\n2 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 17 2025 : 24 avril - 25 avril\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n25 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 16 2025\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n18 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 15 2025 : 31 mars-4 avril\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n4 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 14 2025 : 24-28 mars\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n28 mars 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 13 2025 : 17-21 mars\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n17 mars 2025\n\n\nLouis Lacoste\n\n\n\n\n\nAucun article correspondant" }, { - "objectID": "suivi/2025-17/2025-17.html#a-faire", - "href": "suivi/2025-17/2025-17.html#a-faire", - "title": "Bilan semaine 17 2025 : 24 avril - 25 avril", + "objectID": "suivi/2025-13/2025-13.html", + "href": "suivi/2025-13/2025-13.html", + "title": "Bilan semaine 13 2025 : 17-21 mars", "section": "", - "text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\n\n\n\n\n\nRelancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral\nAjouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10.\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser.\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." + "text": "Cette semaine j’ai :\n\nFini d’intégrer à colSBM tous les changements (clustering dérecursifier pour uni et bipartites& cli …) et contacter Saint-Clair pour passer colSBM sous GrossSBM.\nRelancer et obtenus les résultats pour le clustering sur les réseaux Baldock\n\n\n\n\nBaldock iid\n\n\n\n\n\nBaldock pi\n\n\n\n\n\nBaldock rho\n\n\n\n\n\nBaldock pirho\n\n\n\nRelancer et obtenus les résultats pour les simus ajoutant du bruits sur les structures et liens\n\nPour noisy \\alpha:\n\nPlan de simulation 2 collections (d\\in (1,2)) avec M = 30 soit 15 réseaux par type. n_r = n_c = 120 et \\pi_1 = \\begin{pmatrix} 0.5, 0.3, 0.2\\end{pmatrix},~\n \\rho_1 = \\begin{pmatrix}0.4, 0.3, 0.2, 0.1\\end{pmatrix},~\n \\alpha_1 = \\begin{pmatrix}\n 0.85& 0.4& 0.2& 0.15\\\\\n 0.6& 0.2& 0.15& 0.15\\\\\n 0.2& 0.15& 0.15& 0.7\n \\end{pmatrix}\n \\pi_2 = (0.5, 0.3, 0.2),~\n \\rho_2 = (0.45, 0.3, 0.25),~\n \\alpha_2 = \\begin{pmatrix}\n 0.65& 0.15& 0.15\\\\\n 0.15& 0.8& 0.15\\\\\n 0.15& 0.15& 0.4\n \\end{pmatrix}\n\\epsilon \\in (0, 0.01, \\dots 0.05) qui est l’écart-type d’une \\mathcal{N}_{Q_1^d \\times Q_2^d}(0,\\epsilon^2) = vec(N^m), \\forall m \\in (1,\\dots, M). Et \\forall m, X^m \\sim LBM_{n_r,n_c}(Q_1^d, Q_2^d, \\alpha_d + N^m, \\pi_d, \\rho_d)\nRésultats : \n\nPour noisy links:\n\nPlan de simu M = 30, n_r = n_c = 120. \\pi_1 = \\begin{pmatrix} 0.5, 0.3, 0.2\\end{pmatrix},~\n \\rho_1 = \\begin{pmatrix}0.4, 0.3, 0.2, 0.1\\end{pmatrix},~\n \\alpha_1 = \\begin{pmatrix}\n 0.85& 0.4& 0.2& 0.05\\\\\n 0.6& 0.2& 0.05& 0.05\\\\\n 0.2& 0.05& 0.05& 0.7\n \\end{pmatrix}\n \\pi_2 = (0.5, 0.3, 0.2),~\n \\rho_2 = (0.45, 0.3, 0.25),~\n \\alpha_2 = \\begin{pmatrix}\n 0.65& 0.05& 0.05\\\\\n 0.05& 0.8& 0.05\\\\\n 0.05& 0.05& 0.4\n \\end{pmatrix}\n\\epsilon \\in (0, 0.05, \\dots 0.5), indices de la matrice = sample.int(n_r \\times n_c, size = n_r \\times n_c \\times \\epsilon). Les indices tirés inverse la valeur du lien (1 -> 0, 0 -> 1)\n\n\n\n\n\n\n\n\n\nClear links\n\n\n\n\n\n\n\nNoisy links\n\n\n\n\n\n\nFigure 1\n\n\n\n\nRelancer simulations robustesse aux NAs\nChanger les plots résultats NAs pour faire sous-plots comparant sep vs model." }, { - "objectID": "suivi/2025-17/2025-17.html#jai-fait", - "href": "suivi/2025-17/2025-17.html#jai-fait", - "title": "Bilan semaine 17 2025 : 24 avril - 25 avril", + "objectID": "suivi/2025-18/2025-18.html", + "href": "suivi/2025-18/2025-18.html", + "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", + "section": "", + "text": "Lire biblio fournie Julie, Inférence de réseaux : co-occurence\nPapier pour comprendre données\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\n\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\nIntégrer les retours de Sophie\n\n\n\n\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." + }, + { + "objectID": "suivi/2025-18/2025-18.html#a-faire", + "href": "suivi/2025-18/2025-18.html#a-faire", + "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", + "section": "", + "text": "Lire biblio fournie Julie, Inférence de réseaux : co-occurence\nPapier pour comprendre données\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\n\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\nIntégrer les retours de Sophie\n\n\n\n\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." + }, + { + "objectID": "suivi/2025-18/2025-18.html#jai-fait", + "href": "suivi/2025-18/2025-18.html#jai-fait", + "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", "section": "J’ai fait", - "text": "J’ai fait\n\nCréer un README descriptif du dépôt des codes pour l’article.\nRemonter figure sélection de modèle dans le corps de l’article\nEnrichir légende de la figure 7 et 8\nSupprimer p_NA des autres cadrans des proportions de NA\nBasculer le code du clustering pour utiliser hclust et mis l’argument method de hclust avec single par défaut\nAjouter pipeline qui knit README.Rmd à chaque merge dans main colSBM" + "text": "J’ai fait\n\nJdS\n\ncolDEM CSE\n\n\n\nClustering exhaustif Baldock\n\nLe clustering de toutes les 52 partitions s’est fait en 5h30 ! (Mémoïsation)\nPour iid la meilleure partition avec BICL=-9466.911 contre BICL_{algo} = -9466.873 \\pm 0.02205 trouvé avec l’algo \nPour \\pi\\rho la meilleure partition avec BICL = -9497.92 contre BICL_{algo} =-9497.92 \\pm 0.00009" }, { - "objectID": "suivi/2025-17/2025-17.html#a-continuer", - "href": "suivi/2025-17/2025-17.html#a-continuer", - "title": "Bilan semaine 17 2025 : 24 avril - 25 avril", + "objectID": "suivi/2025-18/2025-18.html#a-continuer", + "href": "suivi/2025-18/2025-18.html#a-continuer", + "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", "section": "A continuer", - "text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nLire Biological Networks - François Képès\nJ’ai esquissé des bouts d’intro\nRelancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE\n\n\nCorrection méthodo\n\nIdée Pierre : Regarder la contribution au BICL de la collection des réseaux et comparer au sep BICL pour essayer de repérer les outliers. En regardant la vbound (pas la pénalité) de chaque réseau dans le joint vs sa vbound dans le sep -> Résultats : pas de différences majeures entre les réseaux avec le rapport vbound_joint/vbound_sep, les outliers ne sont pas marqués.\nRegarder si plutôt que k médioid possible meilleurs résultats avec d’autres distances hclust avec min, max etc… -> L’algo PAM donne des clusters équilibrés sans séparer les outliers Je regarde avec plutôt des hclust avec métrique single pour séparer les outliers.\nVoir si in fine possible de repérer des outliers à partir de ces nouvelles métriques\nRegarder la répartition de densité dans les réseaux sub-doré -> déséquilibrée\n\n\nEn faisant des clusterings par densité on constate qu'avec un modèle iid pour des réseaux dont la densité est entre :\n- 0 et 0.05 : Baldock et Souza tout le monde se retrouvait ensemble avec *Partitioning around medoids*\n\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nLancer clustering auteur par auteur du sub-Doré : 5 collections différentes dans l’idée.\nUne fois fait, Sophie ne trouve pas que ce soit le plus pertinent pour illustrer le clustering. Plus intéressant de garder le clustering de données simulées (M = 30) et se servir des exemples dessous et des parcours exhaustif des possibilités de partitionnement comme comparatif.\n\nBaldock\n\n\n\nAlluvial Baldock\n\n\n\n\nGibson\n\n\n\nAlluvial Gibson\n\n\n\n\nSouza\n\n\n\nAlluvial Souza\n\n\n\n\nTraveset\n\n\n\nAlluvial Traveset\n\n\n\n\nTrojelsgaard\n\n\n\nAlluvial Trojelgaard" + "text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nLire Biological Networks - François Képès\nRelancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE\n\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nSimulations article\n\nRelancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10." }, { "objectID": "suivi/2025-15/2025-15.html", diff --git a/suivi/2025-24/2025-24.html b/suivi/2025-24/2025-24.html new file mode 100644 index 0000000..2b70d40 --- /dev/null +++ b/suivi/2025-24/2025-24.html @@ -0,0 +1,817 @@ + + + + + + + + + + +Bilan semaine 24 2025 : 10 juin - 13 juin – Suivi de la thèse + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
+
+ +
+ +
+
+
+

Bilan semaine 24 2025 : 10 juin - 13 juin

+
+
colBiSBM
+
inférence
+
GNN
+
+
+
+ +
+
Auteur·rice
+
Affiliation
+ +
+

Louis Lacoste

+
+
+

+ MIA Paris-Saclay, INRAE, AgroParisTech, Université Paris-Saclay +

+
+
+ +
+ + +
+
Date de publication
+
+

13 juin 2025

+
+
+ + +
+ + +
+ + + + +
+ + + + + +
+

TODO List

+
    +
  • Pour clustering de collections sur données réelles :
    +→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).

    +
      +
    • Faire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement
    • +
    • Si plusieurs clustering possibles les tester et sélectionner le meilleur
    • +
    • Ré-ajuster les bonnes partitions.
    • +
    • ▶️ Je commence à coder ça
    • +
  • +
  • Idée de Sophie : alterner descendant et ascendant → prometteur aussi

    +
      +
    • J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances.
    • +
  • +
  • Pour les deux propositions données simulées tester diverses distances.

  • +
  • Dé-bugger les simulations :

    +
      +
    • Inférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.
    • +
  • +
  • Vérifier si problème de version tidyverse pour vapply sur l’inférence.

  • +
  • Si problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.

  • +
+
+

Applications

+
    +
  • Kmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.
  • +
+
+
+
+
    +
  • Faire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu
  • +
+
+
+Reference 1 +
+
+
+
    +
  • Comparer les perfs du VAE sur Baldock avec colBiSBM par exemple
  • +
+
+
+

Inférence et microbes

+
    +
  • Lancer colBiSBM sur OTU\times Sample → problème du chargement en mémoire des données à voir
  • +
  • Se renseigner techniques d’inférence de réseaux : +
      +
    • covariance (base corrélation et seuil)
    • +
    • GraphicalLASSO
    • +
    • Co-occurence
    • +
  • +
  • Lancer colSBM sur OTU\times OTU
  • +
  • Creuser TabNet de Christophe Regouby et les exercices
  • +
  • Regarder SPARTA Rennes
  • +
  • Lire Papiers compositional data (Aitchison et al. intro)
  • +
  • Lire article multi-niveaux Saint-Clair
  • +
  • Demander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)
  • +
  • Ecrire et étudier les modèles pour différents niveaux taxonomiques. \begin{align*} +i \rightarrow &~N^1_i \subseteq N^2_i \subseteq N^3_i & \text{Taxonomie}\\ +Z^0_i \overset{?}{=} & Z^1_i \overset{?}{=} Z^2_i \overset{?}{=} Z^3_i & \text{Groupes fonctionnels} +\end{align*}
  • +
+
+
+
+

A discuter

+
+

Inférence

+
    +
  • Papier pour comprendre données +
      +
    • Faust et al.
    • +
    • Abdill et al.
    • +
    • Bashan et al.
    • +
  • +
  • pbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)
  • +
+
+

Combine networks at different taxonomic levels

+
+
    +
  • Inférence + GREMLINS
  • +
+
+
+

Rédaction article

+
    +
  • Relire intro St Clair
  • +
  • S’inspirer structure pour mon intro
  • +
  • Trouver biblio intro
  • +
  • Rédiger l’intro
  • +
  • Dire résultats nettement meilleurs et variabilités inférieures.
  • +
+
+
+
+

A continuer

+
+

Applications

+
    +
  • Idée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation
  • +
+
+

Sophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !

+
+
+
+

Axe inférence

+
    +
  • Lire biblio fournie Julie, Inférence de réseaux : co-occurence
  • +
+
+

J’ai lu Faust et al.  Je lis Abdill et al.

+
+
+
+
+

Repoussés ou abandonnés

+
+ +
+
+
    +
  • Résultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \epsilon_{max}n_r n_c liens à retirer puis pour les \epsilon < \epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps.
  • +
+
+

Je n’arrive pas à comprendre les erreurs qui arrivent

+
+
    +
  • Lire Biological Networks - François Képès

  • +
  • Regarder les applications pour les collections de réseaux recommender system Pas pertinents et trop gros

  • +
+
+
+
+Listing 1: Recommender systems data +
+
+

Par exemple :

+ +
+
+
+
+

Papier plus multi-applications

+
    +
  • Données d’Elisa herbivore ?
  • +
  • Données urbanisations ?
  • +
+
+
+

Autour de l’article et du package

+
    +
  • Créer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation.
  • +
+
+
+

Simulations article

+
    +
  • Comparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.

  • +
  • Corriger structure de simus :

    +
      +
    • Pour noisy \alpha : +
        +
      • Logit pour envoyer la gaussienne vers (0,1)
      • +
      • Beta contrainte dans (0,1)
      • +
    • +
    • Pour noisy links : Générer nb_clustering collections de taille M puis prélever \epsilon_{max}n_r n_c liens à inverser puis pour les \epsilon < \epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.
    • +
  • +
+
+
+
+
+ + +
+ +
+ +
+ + + + + \ No newline at end of file