401 lines
No EOL
83 KiB
JSON
401 lines
No EOL
83 KiB
JSON
[
|
||
{
|
||
"objectID": "suivi/2025-21/2025-21.html",
|
||
"href": "suivi/2025-21/2025-21.html",
|
||
"title": "Bilan semaine 21 2025 : 26 mai - 30 mai",
|
||
"section": "",
|
||
"text": "✅ Corriger pour les simus dans l’article : écrire N = \\#\\text{ de répétitions}\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n\nIdée de Sophie : alterner descendant et ascendant → prometteur aussi\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n\n\n\n\n✅ A l’oral pourquoi des réseaux : car de plus en plus disponibles et idée derrière, la structure fonctionnelle permet de comprendre les caractéristiques de l’écosystème décrit\n✅ Chercher des réfs pour les méthodes (Hoff Latent Position Model, Nowicki pour LBM, une review pour les métriques voir thèses St Clair et Emré)\n✅ Sur slide méthodes différencier métriques micro et macro et dire oralement que nous méso\n❎ Indiquer sur une slide le problème de support pour \\pi\\rho à faire s’il y a le temps.\n✅ Résultats sur les réseaux Baldock, regarder le positionnement par bloc des espèces communes, regarder les probas d’appartenance aux blocs par espèces communes et par réseau ➡️ Bourdons\n✅ Intégrer les retours de Sophie\nAttente retours Pierre\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-21/2025-21.html#top-priorité",
|
||
"href": "suivi/2025-21/2025-21.html#top-priorité",
|
||
"title": "Bilan semaine 21 2025 : 26 mai - 30 mai",
|
||
"section": "",
|
||
"text": "✅ Corriger pour les simus dans l’article : écrire N = \\#\\text{ de répétitions}\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n\nIdée de Sophie : alterner descendant et ascendant → prometteur aussi\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n\n\n\n\n✅ A l’oral pourquoi des réseaux : car de plus en plus disponibles et idée derrière, la structure fonctionnelle permet de comprendre les caractéristiques de l’écosystème décrit\n✅ Chercher des réfs pour les méthodes (Hoff Latent Position Model, Nowicki pour LBM, une review pour les métriques voir thèses St Clair et Emré)\n✅ Sur slide méthodes différencier métriques micro et macro et dire oralement que nous méso\n❎ Indiquer sur une slide le problème de support pour \\pi\\rho à faire s’il y a le temps.\n✅ Résultats sur les réseaux Baldock, regarder le positionnement par bloc des espèces communes, regarder les probas d’appartenance aux blocs par espèces communes et par réseau ➡️ Bourdons\n✅ Intégrer les retours de Sophie\nAttente retours Pierre\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-21/2025-21.html#a-discuter",
|
||
"href": "suivi/2025-21/2025-21.html#a-discuter",
|
||
"title": "Bilan semaine 21 2025 : 26 mai - 30 mai",
|
||
"section": "A discuter",
|
||
"text": "A discuter"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-21/2025-21.html#a-faire",
|
||
"href": "suivi/2025-21/2025-21.html#a-faire",
|
||
"title": "Bilan semaine 21 2025 : 26 mai - 30 mai",
|
||
"section": "A faire",
|
||
"text": "A faire\n\nInférence\n\nPapier pour comprendre données\n\nFaust et al.\nAbdill et al.\nBashan et al.\n\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\nRédaction article\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nDire résultats nettement meilleurs et variabilités inférieures."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-21/2025-21.html#a-continuer",
|
||
"href": "suivi/2025-21/2025-21.html#a-continuer",
|
||
"title": "Bilan semaine 21 2025 : 26 mai - 30 mai",
|
||
"section": "A continuer",
|
||
"text": "A continuer\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nAxe inférence\n\nLire biblio fournie Julie, Inférence de réseaux : co-occurence\n\n\nJ’ai lu Faust et al. Je lis Abdill et al."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-21/2025-21.html#repoussés-ou-abandonnés",
|
||
"href": "suivi/2025-21/2025-21.html#repoussés-ou-abandonnés",
|
||
"title": "Bilan semaine 21 2025 : 26 mai - 30 mai",
|
||
"section": "Repoussés ou abandonnés",
|
||
"text": "Repoussés ou abandonnés\n\n\n\n\n\n\nDéplier pour voir\n\n\n\n\n\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps.\n\n\nJe n’arrive pas à comprendre les erreurs qui arrivent\n\n\nLire Biological Networks - François Képès\nRegarder les applications pour les collections de réseaux recommender system Pas pertinents et trop gros\n\n\n\n\nListing 1: Recommender systems data\n\n\nPar exemple :\n\nListe de recommendation data\n\n\n\n\n\nPapier plus multi-applications\n\nDonnées d’Elisa herbivore ?\nDonnées urbanisations ?\n\n\n\nAutour de l’article et du package\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation.\n\n\n\nSimulations article\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-20/2025-20.html",
|
||
"href": "suivi/2025-20/2025-20.html",
|
||
"title": "Bilan semaine 20 2025 : 12 mai - 16 mai",
|
||
"section": "",
|
||
"text": "Pour clustering de collections sur données réelles :\n\nRelâcher la pénalité pour les coupes pour proposer modèles.\n\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n\nDonnées simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n\n\n\n\nPRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.\nQuel plan ?\nQuels résultats ? Baldock, Traveset … (sub-Doré)\nPas la peine de préciser l’algo de clustering\nIndiquer sur une slide le problème de support pour \\pi\\rho à faire s’il y a le temps.\nRésultats sur les réseaux Baldock, regarder le positionnement par bloc des espèces communes, regarder les probas d’appartenance aux blocs par espèces communes et par réseau.\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-20/2025-20.html#top-priorité",
|
||
"href": "suivi/2025-20/2025-20.html#top-priorité",
|
||
"title": "Bilan semaine 20 2025 : 12 mai - 16 mai",
|
||
"section": "",
|
||
"text": "Pour clustering de collections sur données réelles :\n\nRelâcher la pénalité pour les coupes pour proposer modèles.\n\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n\nDonnées simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n\n\n\n\nPRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.\nQuel plan ?\nQuels résultats ? Baldock, Traveset … (sub-Doré)\nPas la peine de préciser l’algo de clustering\nIndiquer sur une slide le problème de support pour \\pi\\rho à faire s’il y a le temps.\nRésultats sur les réseaux Baldock, regarder le positionnement par bloc des espèces communes, regarder les probas d’appartenance aux blocs par espèces communes et par réseau.\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-20/2025-20.html#a-discuter",
|
||
"href": "suivi/2025-20/2025-20.html#a-discuter",
|
||
"title": "Bilan semaine 20 2025 : 12 mai - 16 mai",
|
||
"section": "A discuter",
|
||
"text": "A discuter"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-20/2025-20.html#a-faire",
|
||
"href": "suivi/2025-20/2025-20.html#a-faire",
|
||
"title": "Bilan semaine 20 2025 : 12 mai - 16 mai",
|
||
"section": "A faire",
|
||
"text": "A faire\n\nInférence\n\nPapier pour comprendre données\n\nFaust et al.\nAbdill et al.\nBashan et al.\n\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\nRédaction article\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nDire résultats nettement meilleurs et variabilités inférieures."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-20/2025-20.html#jai-fait",
|
||
"href": "suivi/2025-20/2025-20.html#jai-fait",
|
||
"title": "Bilan semaine 20 2025 : 12 mai - 16 mai",
|
||
"section": "J’ai fait",
|
||
"text": "J’ai fait\n\nDé-bugger les simulations :\n\nClustering : Relancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10. -> BUG, dois creuser mais juste des problèmes techniques. Le bug venait probablement d’une inadéquation entre la version de future et future.callr, les résultats temporaires sont encourageants. J’ai mis les résultats dans l’article.\n\n\n\nPrésentations LSD, JdS et ML@Aussois\n\nPRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.\nQuel plan ?\nQuels résultats ? Baldock, Traveset … (sub-Doré)\nMettre le détails des formules et des algos pour VE et sélection de modèle en annexe.\nPréciser simplement que l’on utilise un algo VE et un critère type BIC.\n\n\n\nVGAE\n\nDé-bugger pourquoi BipartiteInnerProductDecoder.forward() -> NaN -> C’était parce que les features en entrée n’était pas normalisée par les couches de convolutions. Les meilleurs résultats d’AUC et de précisions que j’obtiens par VGAE sont autour de 0.80.\n\n\n\nInférence et microbes\n\nHuman Gut Compendium télécharger et préparé les données. Mises au format edgelist et liste de matrices et extrait les infos supplémentaires. → trop lourd en RAM pour tourner sur machine perso (optim colSBM…) ## A continuer\n\n\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nAxe inférence\n\nLire biblio fournie Julie, Inférence de réseaux : co-occurence\n\n\nJ’ai lu Faust et al. Je lis Abdill et al."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-20/2025-20.html#repoussés-ou-abandonnés",
|
||
"href": "suivi/2025-20/2025-20.html#repoussés-ou-abandonnés",
|
||
"title": "Bilan semaine 20 2025 : 12 mai - 16 mai",
|
||
"section": "Repoussés ou abandonnés",
|
||
"text": "Repoussés ou abandonnés\n\n\n\n\n\n\nDéplier pour voir\n\n\n\n\n\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps.\n\n\nJe n’arrive pas à comprendre les erreurs qui arrivent\n\n\nLire Biological Networks - François Képès\nRegarder les applications pour les collections de réseaux recommender system Pas pertinents et trop gros\n\n\n\n\nListing 1: Recommender systems data\n\n\nPar exemple :\n\nListe de recommendation data\n\n\n\n\n\nPapier plus multi-applications\n\nDonnées d’Elisa herbivore ?\nDonnées urbanisations ?\n\n\n\nAutour de l’article et du package\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation.\n\n\n\nSimulations article\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-25/2025-25.html",
|
||
"href": "suivi/2025-25/2025-25.html",
|
||
"title": "Bilan semaine 25 2025 : 16 juin - 20 juin",
|
||
"section": "",
|
||
"text": "Pour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\n✅ Si plusieurs clustering possibles les tester et sélectionner le meilleur\n✅ Ré-ajuster les bonnes partitions.\n⌛ En train de corriger le bug commun à l’inférence\n\n✅ Oui c’est bien le cas Clustering descendant & ascendant : vérifier qu’au cours du temps le BICL_{asc} \\geq BICL_{desc}\nCreuser et explorer avec easy16s !\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\nDé-bugger les simulations :\n\n⌛ Inférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\n✅ Non ça n’a pas l’air d’être ça. Vérifier si problème de version tidyverse pour vapply sur l’inférence.\n\n\n✅ Il suffisait de faire la màj soit même… Si problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO ou CCLasso\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-25/2025-25.html#todo-list",
|
||
"href": "suivi/2025-25/2025-25.html#todo-list",
|
||
"title": "Bilan semaine 25 2025 : 16 juin - 20 juin",
|
||
"section": "",
|
||
"text": "Pour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\n✅ Si plusieurs clustering possibles les tester et sélectionner le meilleur\n✅ Ré-ajuster les bonnes partitions.\n⌛ En train de corriger le bug commun à l’inférence\n\n✅ Oui c’est bien le cas Clustering descendant & ascendant : vérifier qu’au cours du temps le BICL_{asc} \\geq BICL_{desc}\nCreuser et explorer avec easy16s !\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\nDé-bugger les simulations :\n\n⌛ Inférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\n✅ Non ça n’a pas l’air d’être ça. Vérifier si problème de version tidyverse pour vapply sur l’inférence.\n\n\n✅ Il suffisait de faire la màj soit même… Si problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO ou CCLasso\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-25/2025-25.html#lecture-en-cours",
|
||
"href": "suivi/2025-25/2025-25.html#lecture-en-cours",
|
||
"title": "Bilan semaine 25 2025 : 16 juin - 20 juin",
|
||
"section": "Lecture en cours",
|
||
"text": "Lecture en cours\n\nOT\n\n⌛ Mazelet, Flamary, et Thirion (s. d.) Intéressant pour le transport optimal entre graphes de tailles différentes\n⌛ Nenna (s. d.b) Pour comprendre le problème d’OT régularisé pour l’entropie.\n⌛ Nenna (s. d.a)\n\n\n\nInférence de graphes\n\n⌛ Matchado et al. (2021)"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-25/2025-25.html#a-discuter",
|
||
"href": "suivi/2025-25/2025-25.html#a-discuter",
|
||
"title": "Bilan semaine 25 2025 : 16 juin - 20 juin",
|
||
"section": "A discuter",
|
||
"text": "A discuter\n\nInférence\n\nPapier pour comprendre données\n\nFaust et al.\nAbdill et al.\nBashan et al.\n\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\nRédaction article\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nDire résultats nettement meilleurs et variabilités inférieures."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-15/2025-15.html",
|
||
"href": "suivi/2025-15/2025-15.html",
|
||
"title": "Bilan semaine 15 2025 : 31 mars-4 avril",
|
||
"section": "",
|
||
"text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\nExtraire les nombres de liens communs et déplacer le tableau en annexes en faisant juste un paragraphe dans le corps de texte.\n\nPour VENDREDI\n\nRédiger et modifier les cadres de simulations dans le papier pour qu’ils soient raccord avec les données obtenues.\nÉtoffer la partie simulations studies en mettant plusieurs points pour présenter les simus et les résultats succintement.\n\n\nje pense qu’il faudrait étoffer en mettrant plusieurs points répartis en paragraphe. genre vérif selection de modèle verif clustering réseau, verif transfer leraning et de dire les résultats en qq mots\n\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-15/2025-15.html#a-faire",
|
||
"href": "suivi/2025-15/2025-15.html#a-faire",
|
||
"title": "Bilan semaine 15 2025 : 31 mars-4 avril",
|
||
"section": "",
|
||
"text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\nExtraire les nombres de liens communs et déplacer le tableau en annexes en faisant juste un paragraphe dans le corps de texte.\n\nPour VENDREDI\n\nRédiger et modifier les cadres de simulations dans le papier pour qu’ils soient raccord avec les données obtenues.\nÉtoffer la partie simulations studies en mettant plusieurs points pour présenter les simus et les résultats succintement.\n\n\nje pense qu’il faudrait étoffer en mettrant plusieurs points répartis en paragraphe. genre vérif selection de modèle verif clustering réseau, verif transfer leraning et de dire les résultats en qq mots\n\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-15/2025-15.html#jai-fait",
|
||
"href": "suivi/2025-15/2025-15.html#jai-fait",
|
||
"title": "Bilan semaine 15 2025 : 31 mars-4 avril",
|
||
"section": "J’ai fait",
|
||
"text": "J’ai fait\n\nClustering sub-doré pas de stabilité à la répétition malheureusement \nVérifier si les Baldock anglais ont des espèces en communs “Do they involve common species?”. Oui environ 70/250 soit plus de 20%.\nPrésenter le réseau Afrique du Sud dès l’intro des réseaux anglais de Baldock"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-15/2025-15.html#a-continuer",
|
||
"href": "suivi/2025-15/2025-15.html#a-continuer",
|
||
"title": "Bilan semaine 15 2025 : 31 mars-4 avril",
|
||
"section": "A continuer",
|
||
"text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nJ’ai lancé le clustering iid ascendant sur données sub-Doré. en attente des résultats MIGALE"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-18/2025-18.html",
|
||
"href": "suivi/2025-18/2025-18.html",
|
||
"title": "Bilan semaine 18 2025 : 28 avril - 2 mai",
|
||
"section": "",
|
||
"text": "Lire biblio fournie Julie, Inférence de réseaux : co-occurence\nPapier pour comprendre données\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\n\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\nIntégrer les retours de Sophie\n\n\n\n\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-18/2025-18.html#a-faire",
|
||
"href": "suivi/2025-18/2025-18.html#a-faire",
|
||
"title": "Bilan semaine 18 2025 : 28 avril - 2 mai",
|
||
"section": "",
|
||
"text": "Lire biblio fournie Julie, Inférence de réseaux : co-occurence\nPapier pour comprendre données\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\n\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\nIntégrer les retours de Sophie\n\n\n\n\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-18/2025-18.html#jai-fait",
|
||
"href": "suivi/2025-18/2025-18.html#jai-fait",
|
||
"title": "Bilan semaine 18 2025 : 28 avril - 2 mai",
|
||
"section": "J’ai fait",
|
||
"text": "J’ai fait\n\nJdS\n\ncolDEM CSE\n\n\n\nClustering exhaustif Baldock\n\nLe clustering de toutes les 52 partitions s’est fait en 5h30 ! (Mémoïsation)\nPour iid la meilleure partition avec BICL=-9466.911 contre BICL_{algo} = -9466.873 \\pm 0.02205 trouvé avec l’algo \nPour \\pi\\rho la meilleure partition avec BICL = -9497.92 contre BICL_{algo} =-9497.92 \\pm 0.00009"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-18/2025-18.html#a-continuer",
|
||
"href": "suivi/2025-18/2025-18.html#a-continuer",
|
||
"title": "Bilan semaine 18 2025 : 28 avril - 2 mai",
|
||
"section": "A continuer",
|
||
"text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nLire Biological Networks - François Képès\nRelancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE\n\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nSimulations article\n\nRelancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-13/2025-13.html",
|
||
"href": "suivi/2025-13/2025-13.html",
|
||
"title": "Bilan semaine 13 2025 : 17-21 mars",
|
||
"section": "",
|
||
"text": "Cette semaine j’ai :\n\nFini d’intégrer à colSBM tous les changements (clustering dérecursifier pour uni et bipartites& cli …) et contacter Saint-Clair pour passer colSBM sous GrossSBM.\nRelancer et obtenus les résultats pour le clustering sur les réseaux Baldock\n\n\n\n\nBaldock iid\n\n\n\n\n\nBaldock pi\n\n\n\n\n\nBaldock rho\n\n\n\n\n\nBaldock pirho\n\n\n\nRelancer et obtenus les résultats pour les simus ajoutant du bruits sur les structures et liens\n\nPour noisy \\alpha:\n\nPlan de simulation 2 collections (d\\in (1,2)) avec M = 30 soit 15 réseaux par type. n_r = n_c = 120 et \\pi_1 = \\begin{pmatrix} 0.5, 0.3, 0.2\\end{pmatrix},~\n \\rho_1 = \\begin{pmatrix}0.4, 0.3, 0.2, 0.1\\end{pmatrix},~\n \\alpha_1 = \\begin{pmatrix}\n 0.85& 0.4& 0.2& 0.15\\\\\n 0.6& 0.2& 0.15& 0.15\\\\\n 0.2& 0.15& 0.15& 0.7\n \\end{pmatrix}\n \\pi_2 = (0.5, 0.3, 0.2),~\n \\rho_2 = (0.45, 0.3, 0.25),~\n \\alpha_2 = \\begin{pmatrix}\n 0.65& 0.15& 0.15\\\\\n 0.15& 0.8& 0.15\\\\\n 0.15& 0.15& 0.4\n \\end{pmatrix}\n\\epsilon \\in (0, 0.01, \\dots 0.05) qui est l’écart-type d’une \\mathcal{N}_{Q_1^d \\times Q_2^d}(0,\\epsilon^2) = vec(N^m), \\forall m \\in (1,\\dots, M). Et \\forall m, X^m \\sim LBM_{n_r,n_c}(Q_1^d, Q_2^d, \\alpha_d + N^m, \\pi_d, \\rho_d)\nRésultats : \n\nPour noisy links:\n\nPlan de simu M = 30, n_r = n_c = 120. \\pi_1 = \\begin{pmatrix} 0.5, 0.3, 0.2\\end{pmatrix},~\n \\rho_1 = \\begin{pmatrix}0.4, 0.3, 0.2, 0.1\\end{pmatrix},~\n \\alpha_1 = \\begin{pmatrix}\n 0.85& 0.4& 0.2& 0.05\\\\\n 0.6& 0.2& 0.05& 0.05\\\\\n 0.2& 0.05& 0.05& 0.7\n \\end{pmatrix}\n \\pi_2 = (0.5, 0.3, 0.2),~\n \\rho_2 = (0.45, 0.3, 0.25),~\n \\alpha_2 = \\begin{pmatrix}\n 0.65& 0.05& 0.05\\\\\n 0.05& 0.8& 0.05\\\\\n 0.05& 0.05& 0.4\n \\end{pmatrix}\n\\epsilon \\in (0, 0.05, \\dots 0.5), indices de la matrice = sample.int(n_r \\times n_c, size = n_r \\times n_c \\times \\epsilon). Les indices tirés inverse la valeur du lien (1 -> 0, 0 -> 1)\n\n\n\n\n\n\n\n\n\nClear links\n\n\n\n\n\n\n\nNoisy links\n\n\n\n\n\n\nFigure 1\n\n\n\n\nRelancer simulations robustesse aux NAs\nChanger les plots résultats NAs pour faire sous-plots comparant sep vs model."
|
||
},
|
||
{
|
||
"objectID": "index.html",
|
||
"href": "index.html",
|
||
"title": "Journal suivi de la thèse",
|
||
"section": "",
|
||
"text": "Bilan semaine 24 2025 : 10 juin - 13 juin\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n13 juin 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 25 2025 : 16 juin - 20 juin\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n13 juin 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 22 2025 : 26 mai - 30 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n28 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 21 2025 : 26 mai - 30 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n23 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 20 2025 : 12 mai - 16 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n16 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 19 2025 : 5 mai - 9 mai\n\n\n\ncolBiSBM\n\ninférence\n\n\n\n\n\n\n\n\n\n9 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 18 2025 : 28 avril - 2 mai\n\n\n\ncolBiSBM\n\ninférence\n\n\n\n\n\n\n\n\n\n2 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 17 2025 : 24 avril - 25 avril\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n25 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 16 2025\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n18 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 15 2025 : 31 mars-4 avril\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n4 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 14 2025 : 24-28 mars\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n28 mars 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 13 2025 : 17-21 mars\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n17 mars 2025\n\n\nLouis Lacoste\n\n\n\n\n\nAucun article correspondant"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-19/2025-19.html",
|
||
"href": "suivi/2025-19/2025-19.html",
|
||
"title": "Bilan semaine 19 2025 : 5 mai - 9 mai",
|
||
"section": "",
|
||
"text": "Débugguer les simulations :\n\nClustering : Relancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10. -> BUG, dois creuser mais juste des problèmes techniques. Le bug venait probablement d’une inadéquation entre la version de future et future.callr, les résultats temporaires sont encourageant.\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\n\n\n\nPRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.\nQuel plan ?\nQuels résultats ? Baldock, Traveset … (sub-Doré)\n\n\n\n\n\nLire Papiers compositional data (Aitchison et al. intro)\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLire article multi-niveaux Saint-Clair"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-19/2025-19.html#top-priorité",
|
||
"href": "suivi/2025-19/2025-19.html#top-priorité",
|
||
"title": "Bilan semaine 19 2025 : 5 mai - 9 mai",
|
||
"section": "",
|
||
"text": "Débugguer les simulations :\n\nClustering : Relancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10. -> BUG, dois creuser mais juste des problèmes techniques. Le bug venait probablement d’une inadéquation entre la version de future et future.callr, les résultats temporaires sont encourageant.\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\n\n\n\nPRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.\nQuel plan ?\nQuels résultats ? Baldock, Traveset … (sub-Doré)\n\n\n\n\n\nLire Papiers compositional data (Aitchison et al. intro)\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLire article multi-niveaux Saint-Clair"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-19/2025-19.html#a-discuter",
|
||
"href": "suivi/2025-19/2025-19.html#a-discuter",
|
||
"title": "Bilan semaine 19 2025 : 5 mai - 9 mai",
|
||
"section": "A discuter",
|
||
"text": "A discuter\n\nVoir pour TT période du 11 au 14 août\nVoir pour date CSI car congés avec parents prévu du 29/08 au 12/09."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-19/2025-19.html#a-faire",
|
||
"href": "suivi/2025-19/2025-19.html#a-faire",
|
||
"title": "Bilan semaine 19 2025 : 5 mai - 9 mai",
|
||
"section": "A faire",
|
||
"text": "A faire\n\nInférence\n\nPapier pour comprendre données\n\nFaust et al.\nAbdill et al.\nBashan et al.\n\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\nRédaction article\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nDire résultats nettement meilleurs et variabilités inférieures."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-19/2025-19.html#jai-fait",
|
||
"href": "suivi/2025-19/2025-19.html#jai-fait",
|
||
"title": "Bilan semaine 19 2025 : 5 mai - 9 mai",
|
||
"section": "J’ai fait",
|
||
"text": "J’ai fait\n\nCSI (en attente contacts PB et SD)\n\nEst-ce à moi de contacter Saint-Clair et Sonia/Elisa ? Pierre et Sophie gèrent\nPierre Gérard a dit oui, il attend les détails\nQuand : fin juin début juillet\nListe potentielle :\n\n(Saint-Clair)\nMahendra\nElisa/Sonia\nPierre Gérard\n\n\n\n\nFinist’R\n\nS’inscrire\n\n\n\nML at Aussois\n\nS’inscrire avec abstract court\nDemander la bourse\nDétails d’inscriptions : Je demande une bourse et je m’inscris avec la demande de bourse, Pierre et Sophie font la lettre de recommendation\n\n\n\nPrésentation\n\nJ’ai traduis en anglais ma présentation : Lien"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-19/2025-19.html#a-continuer",
|
||
"href": "suivi/2025-19/2025-19.html#a-continuer",
|
||
"title": "Bilan semaine 19 2025 : 5 mai - 9 mai",
|
||
"section": "A continuer",
|
||
"text": "A continuer\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nAxe inférence\n\nLire biblio fournie Julie, Inférence de réseaux : co-occurence\n\n\nJ’ai lu Faust et al. Je lis Abdill et al."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-19/2025-19.html#repoussés-ou-abandonnés",
|
||
"href": "suivi/2025-19/2025-19.html#repoussés-ou-abandonnés",
|
||
"title": "Bilan semaine 19 2025 : 5 mai - 9 mai",
|
||
"section": "Repoussés ou abandonnés",
|
||
"text": "Repoussés ou abandonnés\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps.\n\n\nJe n’arrive pas à comprendre les erreurs qui arrivent\n\n\nLire Biological Networks - François Képès\nRegarder les applications pour les collections de réseaux recommender system Pas pertinents et trop gros\n\n\n\n\nListing 1: Recommender systems data\n\n\nPar exemple :\n\nListe de recommendation data\n\n\n\n\n\nPapier plus multi-applications\n\nDonnées d’Elisa herbivore ?\nDonnées urbanisations ?\n\n\n\nAutour de l’article et du package\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation.\n\n\n\nSimulations article\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-17/2025-17.html",
|
||
"href": "suivi/2025-17/2025-17.html",
|
||
"title": "Bilan semaine 17 2025 : 24 avril - 25 avril",
|
||
"section": "",
|
||
"text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\n\n\n\n\n\nRelancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral\nAjouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10.\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser.\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-17/2025-17.html#a-faire",
|
||
"href": "suivi/2025-17/2025-17.html#a-faire",
|
||
"title": "Bilan semaine 17 2025 : 24 avril - 25 avril",
|
||
"section": "",
|
||
"text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\n\n\n\n\n\nRelancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral\nAjouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10.\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser.\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-17/2025-17.html#jai-fait",
|
||
"href": "suivi/2025-17/2025-17.html#jai-fait",
|
||
"title": "Bilan semaine 17 2025 : 24 avril - 25 avril",
|
||
"section": "J’ai fait",
|
||
"text": "J’ai fait\n\nCréer un README descriptif du dépôt des codes pour l’article.\nRemonter figure sélection de modèle dans le corps de l’article\nEnrichir légende de la figure 7 et 8\nSupprimer p_NA des autres cadrans des proportions de NA\nBasculer le code du clustering pour utiliser hclust et mis l’argument method de hclust avec single par défaut\nAjouter pipeline qui knit README.Rmd à chaque merge dans main colSBM"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-17/2025-17.html#a-continuer",
|
||
"href": "suivi/2025-17/2025-17.html#a-continuer",
|
||
"title": "Bilan semaine 17 2025 : 24 avril - 25 avril",
|
||
"section": "A continuer",
|
||
"text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nLire Biological Networks - François Képès\nJ’ai esquissé des bouts d’intro\nRelancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE\n\n\nCorrection méthodo\n\nIdée Pierre : Regarder la contribution au BICL de la collection des réseaux et comparer au sep BICL pour essayer de repérer les outliers. En regardant la vbound (pas la pénalité) de chaque réseau dans le joint vs sa vbound dans le sep -> Résultats : pas de différences majeures entre les réseaux avec le rapport vbound_joint/vbound_sep, les outliers ne sont pas marqués.\nRegarder si plutôt que k médioid possible meilleurs résultats avec d’autres distances hclust avec min, max etc… -> L’algo PAM donne des clusters équilibrés sans séparer les outliers Je regarde avec plutôt des hclust avec métrique single pour séparer les outliers.\nVoir si in fine possible de repérer des outliers à partir de ces nouvelles métriques\nRegarder la répartition de densité dans les réseaux sub-doré -> déséquilibrée\n\n\nEn faisant des clusterings par densité on constate qu'avec un modèle iid pour des réseaux dont la densité est entre :\n- 0 et 0.05 : Baldock et Souza tout le monde se retrouvait ensemble avec *Partitioning around medoids*\n\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nLancer clustering auteur par auteur du sub-Doré : 5 collections différentes dans l’idée.\nUne fois fait, Sophie ne trouve pas que ce soit le plus pertinent pour illustrer le clustering. Plus intéressant de garder le clustering de données simulées (M = 30) et se servir des exemples dessous et des parcours exhaustif des possibilités de partitionnement comme comparatif.\n\nBaldock\n\n\n\nAlluvial Baldock\n\n\n\n\nGibson\n\n\n\nAlluvial Gibson\n\n\n\n\nSouza\n\n\n\nAlluvial Souza\n\n\n\n\nTraveset\n\n\n\nAlluvial Traveset\n\n\n\n\nTrojelsgaard\n\n\n\nAlluvial Trojelgaard"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-24/2025-24.html",
|
||
"href": "suivi/2025-24/2025-24.html",
|
||
"title": "Bilan semaine 24 2025 : 10 juin - 13 juin",
|
||
"section": "",
|
||
"text": "✅ Préparer la séance intro à Git pour le 13 juin. La séance s’est très bien passée\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n✅ C’est bon j’ai une fonction qui tourne, mais lentement ⌛\n⏳Simulations en train de tourner\n❗L’approche que j’ai en mettant la pénalité à 0 peut favoriser de séparer trop les réseaux et donc il faudrait refusionner. ➡️ mais le d&a ne fonctionne qu’en iid\n\n✅ Idée de Sophie : alterner descendant et ascendant → prometteur aussi. J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.\n\n✅ Il y avait un bug dans la fenêtre glissant où la condition d’arrêt quand le BICL n’augmentait plus était mal détectée. Corrigé\n :::{layout-ncol=“2”} \n :::\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n✅ Réparé mauvais placement des légendes, des valeurs etc.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-24/2025-24.html#todo-list",
|
||
"href": "suivi/2025-24/2025-24.html#todo-list",
|
||
"title": "Bilan semaine 24 2025 : 10 juin - 13 juin",
|
||
"section": "",
|
||
"text": "✅ Préparer la séance intro à Git pour le 13 juin. La séance s’est très bien passée\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n✅ C’est bon j’ai une fonction qui tourne, mais lentement ⌛\n⏳Simulations en train de tourner\n❗L’approche que j’ai en mettant la pénalité à 0 peut favoriser de séparer trop les réseaux et donc il faudrait refusionner. ➡️ mais le d&a ne fonctionne qu’en iid\n\n✅ Idée de Sophie : alterner descendant et ascendant → prometteur aussi. J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.\n\n✅ Il y avait un bug dans la fenêtre glissant où la condition d’arrêt quand le BICL n’augmentait plus était mal détectée. Corrigé\n :::{layout-ncol=“2”} \n :::\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n✅ Réparé mauvais placement des légendes, des valeurs etc.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-24/2025-24.html#lecture-en-cours",
|
||
"href": "suivi/2025-24/2025-24.html#lecture-en-cours",
|
||
"title": "Bilan semaine 24 2025 : 10 juin - 13 juin",
|
||
"section": "Lecture en cours",
|
||
"text": "Lecture en cours\n\nOT\n\nMazelet, Flamary, et Thirion (s. d.) Intéressant pour le transport optimal entre graphes de tailles différentes\n\nNenna (s. d.) Pour comprendre le problème d’OT régularisé pour l’entropie."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-24/2025-24.html#a-discuter",
|
||
"href": "suivi/2025-24/2025-24.html#a-discuter",
|
||
"title": "Bilan semaine 24 2025 : 10 juin - 13 juin",
|
||
"section": "A discuter",
|
||
"text": "A discuter\n\nInférence\n\nPapier pour comprendre données\n\nFaust et al.\nAbdill et al.\nBashan et al.\n\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\nRédaction article\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nDire résultats nettement meilleurs et variabilités inférieures."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-24/2025-24.html#a-continuer",
|
||
"href": "suivi/2025-24/2025-24.html#a-continuer",
|
||
"title": "Bilan semaine 24 2025 : 10 juin - 13 juin",
|
||
"section": "A continuer",
|
||
"text": "A continuer\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nAxe inférence\n\nLire biblio fournie Julie, Inférence de réseaux : co-occurence\n\n\nJ’ai lu Faust et al. Je lis Abdill et al."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-24/2025-24.html#repoussés-ou-abandonnés",
|
||
"href": "suivi/2025-24/2025-24.html#repoussés-ou-abandonnés",
|
||
"title": "Bilan semaine 24 2025 : 10 juin - 13 juin",
|
||
"section": "Repoussés ou abandonnés",
|
||
"text": "Repoussés ou abandonnés\n\n\n\n\n\n\nDéplier pour voir\n\n\n\n\n\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps.\n\n\nJe n’arrive pas à comprendre les erreurs qui arrivent\n\n\nLire Biological Networks - François Képès\nRegarder les applications pour les collections de réseaux recommender system Pas pertinents et trop gros\n\n\n\n\nListing 1: Recommender systems data\n\n\nPar exemple :\n\nListe de recommendation data\n\n\n\n\n\nPapier plus multi-applications\n\nDonnées d’Elisa herbivore ?\nDonnées urbanisations ?\n\n\n\nAutour de l’article et du package\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation.\n\n\n\nSimulations article\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-14/2025-14.html",
|
||
"href": "suivi/2025-14/2025-14.html",
|
||
"title": "Bilan semaine 14 2025 : 24-28 mars",
|
||
"section": "",
|
||
"text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nAgrandir la collection d’application, pas seulement Baldock mais aussi Trojelsgaard par ex\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nPrésenter le réseau Afrique du Sud dès l’intro des réseaux anglais de Baldock\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\nRédiger et modifier les cadres de simulations dans le papier pour qu’ils soient raccord avec les données obtenues.\nLancer clustering iid ascendant sur données sub-Doré.\nVérifier si les Baldock anglais ont des espèces en communs “Do they involve common species?”."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-14/2025-14.html#a-faire",
|
||
"href": "suivi/2025-14/2025-14.html#a-faire",
|
||
"title": "Bilan semaine 14 2025 : 24-28 mars",
|
||
"section": "",
|
||
"text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nAgrandir la collection d’application, pas seulement Baldock mais aussi Trojelsgaard par ex\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nPrésenter le réseau Afrique du Sud dès l’intro des réseaux anglais de Baldock\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\nRédiger et modifier les cadres de simulations dans le papier pour qu’ils soient raccord avec les données obtenues.\nLancer clustering iid ascendant sur données sub-Doré.\nVérifier si les Baldock anglais ont des espèces en communs “Do they involve common species?”."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-14/2025-14.html#jai-fait",
|
||
"href": "suivi/2025-14/2025-14.html#jai-fait",
|
||
"title": "Bilan semaine 14 2025 : 24-28 mars",
|
||
"section": "J’ai fait",
|
||
"text": "J’ai fait\n\nCorriger structure de simus :\n\nPour NA robustness\n\nDéfinir dans la section 3 :\n\n\nRemark that for iid-colBiSBM, \\pi_q, \\rho_r > 0, and thus the blocks exist and are represented in all networks. For the other models, some blocks may not exist in some networks and this is why \\pi_q^m, \\rho_r^m \\geq 0. Using S^{(1)} and S^{(2)} we can define the restricted parameters for each network and we denote them as \\widetilde{\\bm{\\pi}}^m, \\widetilde{\\bm{\\rho}}^m and \\widetilde{\\bm{\\alpha}}^m. The restrictions thus indicate the blocks that are represented in the network m.\n\n\nÉcrire la partie preuve pour identif \\pi-colBiSBM et \\rho-colBiSBM. Identif : \\pi et \\rho en attente retours Pierre et Sophie\nSaint-Clair va passer colSBM sous GrossSBM\nAgrandir la collection d’application, pas seulement Baldock mais aussi Trojelsgaard par ex : Collection agrandie avec Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson, en attente MIGALE. Clustering instable"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-14/2025-14.html#a-continuer",
|
||
"href": "suivi/2025-14/2025-14.html#a-continuer",
|
||
"title": "Bilan semaine 14 2025 : 24-28 mars",
|
||
"section": "A continuer",
|
||
"text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nPour sub doré en attente MIGALE augmenter le nbre de répèt de la procédure."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-16/2025-16.html",
|
||
"href": "suivi/2025-16/2025-16.html",
|
||
"title": "Bilan semaine 16 2025",
|
||
"section": "",
|
||
"text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\nIdée Pierre : Regarder la contribution au BICL de la collection des réseaux et comparer au sep BICL pour essayer de repérer les outliers."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-16/2025-16.html#a-faire",
|
||
"href": "suivi/2025-16/2025-16.html#a-faire",
|
||
"title": "Bilan semaine 16 2025",
|
||
"section": "",
|
||
"text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\nIdée Pierre : Regarder la contribution au BICL de la collection des réseaux et comparer au sep BICL pour essayer de repérer les outliers."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-16/2025-16.html#jai-fait",
|
||
"href": "suivi/2025-16/2025-16.html#jai-fait",
|
||
"title": "Bilan semaine 16 2025",
|
||
"section": "J’ai fait",
|
||
"text": "J’ai fait\n\nJ’ai lancé le clustering iid ascendant sur données sub-Doré. Résultats stables mais 27 collections formées donc pas de mise en commun des structures…\nRédiger et modifier les cadres de simulations dans le papier pour qu’ils soient raccord avec les données obtenues.\nÉtoffer la partie simulations studies en mettant plusieurs points pour présenter les simus et les résultats succintement.\n\n\nje pense qu’il faudrait étoffer en mettrant plusieurs points répartis en paragraphe. genre vérif selection de modèle verif clustering réseau, verif transfer leraning et de dire les résultats en qq mots\n\n\nComment faire pour l’inscription JdS (paiement, coldem …) : voir avec Christelle\nCSI : St Clair, Sonia ou Elisa et Pierre Gérard"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-16/2025-16.html#a-continuer",
|
||
"href": "suivi/2025-16/2025-16.html#a-continuer",
|
||
"title": "Bilan semaine 16 2025",
|
||
"section": "A continuer",
|
||
"text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nLire Biological Networks - François Képès\nJ’ai esquissé des bouts d’intro"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-22/2025-22.html",
|
||
"href": "suivi/2025-22/2025-22.html",
|
||
"title": "Bilan semaine 22 2025 : 26 mai - 30 mai",
|
||
"section": "",
|
||
"text": "Pour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n\nIdée de Sophie : alterner descendant et ascendant → prometteur aussi\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n\n\n\n\nAttente retours Pierre\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-22/2025-22.html#top-priorité",
|
||
"href": "suivi/2025-22/2025-22.html#top-priorité",
|
||
"title": "Bilan semaine 22 2025 : 26 mai - 30 mai",
|
||
"section": "",
|
||
"text": "Pour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n\nIdée de Sophie : alterner descendant et ascendant → prometteur aussi\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n\n\n\n\nAttente retours Pierre\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-22/2025-22.html#a-discuter",
|
||
"href": "suivi/2025-22/2025-22.html#a-discuter",
|
||
"title": "Bilan semaine 22 2025 : 26 mai - 30 mai",
|
||
"section": "A discuter",
|
||
"text": "A discuter"
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-22/2025-22.html#a-faire",
|
||
"href": "suivi/2025-22/2025-22.html#a-faire",
|
||
"title": "Bilan semaine 22 2025 : 26 mai - 30 mai",
|
||
"section": "A faire",
|
||
"text": "A faire\n\nInférence\n\nPapier pour comprendre données\n\nFaust et al.\nAbdill et al.\nBashan et al.\n\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\nRédaction article\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nDire résultats nettement meilleurs et variabilités inférieures."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-22/2025-22.html#a-continuer",
|
||
"href": "suivi/2025-22/2025-22.html#a-continuer",
|
||
"title": "Bilan semaine 22 2025 : 26 mai - 30 mai",
|
||
"section": "A continuer",
|
||
"text": "A continuer\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nAxe inférence\n\nLire biblio fournie Julie, Inférence de réseaux : co-occurence\n\n\nJ’ai lu Faust et al. Je lis Abdill et al."
|
||
},
|
||
{
|
||
"objectID": "suivi/2025-22/2025-22.html#repoussés-ou-abandonnés",
|
||
"href": "suivi/2025-22/2025-22.html#repoussés-ou-abandonnés",
|
||
"title": "Bilan semaine 22 2025 : 26 mai - 30 mai",
|
||
"section": "Repoussés ou abandonnés",
|
||
"text": "Repoussés ou abandonnés\n\n\n\n\n\n\nDéplier pour voir\n\n\n\n\n\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps.\n\n\nJe n’arrive pas à comprendre les erreurs qui arrivent\n\n\nLire Biological Networks - François Képès\nRegarder les applications pour les collections de réseaux recommender system Pas pertinents et trop gros\n\n\n\n\nListing 1: Recommender systems data\n\n\nPar exemple :\n\nListe de recommendation data\n\n\n\n\n\nPapier plus multi-applications\n\nDonnées d’Elisa herbivore ?\nDonnées urbanisations ?\n\n\n\nAutour de l’article et du package\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation.\n\n\n\nSimulations article\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées."
|
||
}
|
||
] |