diff --git a/index.html b/index.html index c8c7fca..aac599e 100644 --- a/index.html +++ b/index.html @@ -228,7 +228,7 @@ window.Quarto = {
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+

diff --git a/search.json b/search.json index b13adfe..d7a4934 100644 --- a/search.json +++ b/search.json @@ -4,21 +4,21 @@ "href": "suivi/2025-20/2025-20.html", "title": "Bilan semaine 20 2025 : 12 mai - 16 mai", "section": "", - "text": "Débugguer les simulations :\n\nClustering : Relancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10. -> BUG, dois creuser mais juste des problèmes techniques. Le bug venait probablement d’une inadéquation entre la version de future et future.callr, les résultats temporaires sont encourageants.\n\n\n\n\n\nepsilon\nmodel\nARI\nnb_collections\n\n\n\n\n0.1\niid\n0.41 \\pm 0.12\n2.8 \\pm 0.44\n\n\n0.1\npi\n0.03 \\pm 0.03\n1.8 \\pm 0.42\n\n\n0.1\npirho\n0.04 \\pm 0.02\n3.3 \\pm 0.54\n\n\n0.1\nrho\n0.09 \\pm 0.04\n3.5 \\pm 0.58\n\n\n0.2\niid\n0.91 \\pm 0.06\n2.8 \\pm 0.13\n\n\n0.2\npi\n0.59 \\pm 0.12\n3 \\pm 0.55\n\n\n0.2\npirho\n0.57 \\pm 0.14\n4.5 \\pm 0.67\n\n\n0.2\nrho\n0.55 \\pm 0.23\n2.8 \\pm 0.8\n\n\n0.3\niid\n1\n3\n\n\n0.3\npi\n0.97 \\pm 0.01\n3.57 \\pm 0.2\n\n\n0.3\npirho\n0.94 \\pm 0.03\n4 \\pm 0.32\n\n\n0.3\nrho\n0.89 \\pm 0.09\n3 \\pm 0.32\n\n\n0.4\niid\n1\n3\n\n\n0.4\npi\n1\n3\n\n\n0.4\npirho\n0.86 \\pm 0.11\n3.33 \\pm 0.41\n\n\n0.4\nrho\n0.99 \\pm 0.01\n3.29 \\pm 0.29\n\n\n\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\n\n\n\nPRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.\nQuel plan ?\nQuels résultats ? Baldock, Traveset … (sub-Doré)\n\n\n\n\n\nLire Papiers compositional data (Aitchison et al. intro)\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLire article multi-niveaux Saint-Clair" + "text": "Pour clustering de collections sur données réelles :\n\nRelâcher la pénalité pour les coupes pour proposer modèles.\nCalculer le BIC-L avec bonne pénalité pour détecter partitions prometteuses.\nRé-ajuster les bonnes partitions.\n\nDé-bugger pourquoi BipartiteInnerProductDecoder.forward() -> NaN\nDé-bugger les simulations :\n\nClustering : Relancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10. -> BUG, dois creuser mais juste des problèmes techniques. Le bug venait probablement d’une inadéquation entre la version de future et future.callr, les résultats temporaires sont encourageants.\n\n\n\n\n\n\n\n\nNote\n\n\n\n\n\n\n\n\nepsilon\nmodel\nARI\nnb_collections\n\n\n\n\n0.1\niid\n0.41 \\pm 0.12\n2.8 \\pm 0.44\n\n\n0.1\npi\n0.03 \\pm 0.03\n1.8 \\pm 0.42\n\n\n0.1\npirho\n0.04 \\pm 0.02\n3.3 \\pm 0.54\n\n\n0.1\nrho\n0.09 \\pm 0.04\n3.5 \\pm 0.58\n\n\n0.2\niid\n0.91 \\pm 0.06\n2.8 \\pm 0.13\n\n\n0.2\npi\n0.59 \\pm 0.12\n3 \\pm 0.55\n\n\n0.2\npirho\n0.57 \\pm 0.14\n4.5 \\pm 0.67\n\n\n0.2\nrho\n0.55 \\pm 0.23\n2.8 \\pm 0.8\n\n\n0.3\niid\n1\n3\n\n\n0.3\npi\n0.97 \\pm 0.01\n3.57 \\pm 0.2\n\n\n0.3\npirho\n0.94 \\pm 0.03\n4 \\pm 0.32\n\n\n0.3\nrho\n0.89 \\pm 0.09\n3 \\pm 0.32\n\n\n0.4\niid\n1\n3\n\n\n0.4\npi\n1\n3\n\n\n0.4\npirho\n0.86 \\pm 0.11\n3.33 \\pm 0.41\n\n\n0.4\nrho\n0.99 \\pm 0.01\n3.29 \\pm 0.29\n\n\n\n\n\n\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n\n\n\n\nPRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.\nQuel plan ?\nQuels résultats ? Baldock, Traveset … (sub-Doré)\nMettre le détails des formules et des algos pour VE et sélection de modèle en annexe.\nPréciser simplement que l’on utilise un algo VE et un critère type BIC.\nPas la peine de préciser l’algo de clustering\nIndiquer sur une slide le problème de support pour \\pi\\rho à faire s’il y a le temps.\nRésultats sur les réseaux Baldock, regarder le positionnement par bloc des espèces communes, regarder les probas d’appartenance aux blocs par espèces communes et par réseau.\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\n\n\n\nHuman Gut Compendium télécharger et analyser les données.\nLancer colBiSBM sur OTU\\times Sample\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair" }, { "objectID": "suivi/2025-20/2025-20.html#top-priorité", "href": "suivi/2025-20/2025-20.html#top-priorité", "title": "Bilan semaine 20 2025 : 12 mai - 16 mai", "section": "", - "text": "Débugguer les simulations :\n\nClustering : Relancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10. -> BUG, dois creuser mais juste des problèmes techniques. Le bug venait probablement d’une inadéquation entre la version de future et future.callr, les résultats temporaires sont encourageants.\n\n\n\n\n\nepsilon\nmodel\nARI\nnb_collections\n\n\n\n\n0.1\niid\n0.41 \\pm 0.12\n2.8 \\pm 0.44\n\n\n0.1\npi\n0.03 \\pm 0.03\n1.8 \\pm 0.42\n\n\n0.1\npirho\n0.04 \\pm 0.02\n3.3 \\pm 0.54\n\n\n0.1\nrho\n0.09 \\pm 0.04\n3.5 \\pm 0.58\n\n\n0.2\niid\n0.91 \\pm 0.06\n2.8 \\pm 0.13\n\n\n0.2\npi\n0.59 \\pm 0.12\n3 \\pm 0.55\n\n\n0.2\npirho\n0.57 \\pm 0.14\n4.5 \\pm 0.67\n\n\n0.2\nrho\n0.55 \\pm 0.23\n2.8 \\pm 0.8\n\n\n0.3\niid\n1\n3\n\n\n0.3\npi\n0.97 \\pm 0.01\n3.57 \\pm 0.2\n\n\n0.3\npirho\n0.94 \\pm 0.03\n4 \\pm 0.32\n\n\n0.3\nrho\n0.89 \\pm 0.09\n3 \\pm 0.32\n\n\n0.4\niid\n1\n3\n\n\n0.4\npi\n1\n3\n\n\n0.4\npirho\n0.86 \\pm 0.11\n3.33 \\pm 0.41\n\n\n0.4\nrho\n0.99 \\pm 0.01\n3.29 \\pm 0.29\n\n\n\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\n\n\n\nPRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.\nQuel plan ?\nQuels résultats ? Baldock, Traveset … (sub-Doré)\n\n\n\n\n\nLire Papiers compositional data (Aitchison et al. intro)\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLire article multi-niveaux Saint-Clair" + "text": "Pour clustering de collections sur données réelles :\n\nRelâcher la pénalité pour les coupes pour proposer modèles.\nCalculer le BIC-L avec bonne pénalité pour détecter partitions prometteuses.\nRé-ajuster les bonnes partitions.\n\nDé-bugger pourquoi BipartiteInnerProductDecoder.forward() -> NaN\nDé-bugger les simulations :\n\nClustering : Relancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10. -> BUG, dois creuser mais juste des problèmes techniques. Le bug venait probablement d’une inadéquation entre la version de future et future.callr, les résultats temporaires sont encourageants.\n\n\n\n\n\n\n\n\nNote\n\n\n\n\n\n\n\n\nepsilon\nmodel\nARI\nnb_collections\n\n\n\n\n0.1\niid\n0.41 \\pm 0.12\n2.8 \\pm 0.44\n\n\n0.1\npi\n0.03 \\pm 0.03\n1.8 \\pm 0.42\n\n\n0.1\npirho\n0.04 \\pm 0.02\n3.3 \\pm 0.54\n\n\n0.1\nrho\n0.09 \\pm 0.04\n3.5 \\pm 0.58\n\n\n0.2\niid\n0.91 \\pm 0.06\n2.8 \\pm 0.13\n\n\n0.2\npi\n0.59 \\pm 0.12\n3 \\pm 0.55\n\n\n0.2\npirho\n0.57 \\pm 0.14\n4.5 \\pm 0.67\n\n\n0.2\nrho\n0.55 \\pm 0.23\n2.8 \\pm 0.8\n\n\n0.3\niid\n1\n3\n\n\n0.3\npi\n0.97 \\pm 0.01\n3.57 \\pm 0.2\n\n\n0.3\npirho\n0.94 \\pm 0.03\n4 \\pm 0.32\n\n\n0.3\nrho\n0.89 \\pm 0.09\n3 \\pm 0.32\n\n\n0.4\niid\n1\n3\n\n\n0.4\npi\n1\n3\n\n\n0.4\npirho\n0.86 \\pm 0.11\n3.33 \\pm 0.41\n\n\n0.4\nrho\n0.99 \\pm 0.01\n3.29 \\pm 0.29\n\n\n\n\n\n\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n\n\n\n\nPRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.\nQuel plan ?\nQuels résultats ? Baldock, Traveset … (sub-Doré)\nMettre le détails des formules et des algos pour VE et sélection de modèle en annexe.\nPréciser simplement que l’on utilise un algo VE et un critère type BIC.\nPas la peine de préciser l’algo de clustering\nIndiquer sur une slide le problème de support pour \\pi\\rho à faire s’il y a le temps.\nRésultats sur les réseaux Baldock, regarder le positionnement par bloc des espèces communes, regarder les probas d’appartenance aux blocs par espèces communes et par réseau.\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\n\n\n\nHuman Gut Compendium télécharger et analyser les données.\nLancer colBiSBM sur OTU\\times Sample\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair" }, { "objectID": "suivi/2025-20/2025-20.html#a-discuter", "href": "suivi/2025-20/2025-20.html#a-discuter", "title": "Bilan semaine 20 2025 : 12 mai - 16 mai", "section": "A discuter", - "text": "A discuter\n\nVoir pour TT période du 11 au 14 août\nVoir pour date CSI car congés avec parents prévu du 29/08 au 12/09." + "text": "A discuter" }, { "objectID": "suivi/2025-20/2025-20.html#a-faire", diff --git a/suivi/2025-20/2025-20.html b/suivi/2025-20/2025-20.html index eac707c..661d0f1 100644 --- a/suivi/2025-20/2025-20.html +++ b/suivi/2025-20/2025-20.html @@ -193,8 +193,8 @@ window.Quarto = {
  • TOP PRIORITÉ
  • A discuter
  • @@ -223,11 +223,30 @@ window.Quarto = {

    TOP PRIORITÉ

      -
    • Débugguer les simulations :

      +
    • Pour clustering de collections sur données réelles :

      +
        +
      • Relâcher la pénalité pour les coupes pour proposer modèles.
      • +
      • Calculer le BIC-L avec bonne pénalité pour détecter partitions prometteuses.
      • +
      • Ré-ajuster les bonnes partitions.
      • +
    • +
    • Dé-bugger pourquoi BipartiteInnerProductDecoder.forward() -> NaN

    • +
    • Dé-bugger les simulations :

      • Clustering : Relancer simulations de clustering avec M = 30M_i = 10, \forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10. -> BUG, dois creuser mais juste des problèmes techniques. Le bug venait probablement d’une inadéquation entre la version de future et future.callr, les résultats temporaires sont encourageants.
    +
    + +
    +
    @@ -336,9 +355,27 @@ window.Quarto = {
    +
    +
    +
      -
    • Inférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.
    • +
    • Inférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.

    • +
    • Vérifier si problème de version tidyverse pour vapply sur l’inférence.

    • +
    • Si problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.

    +
    +

    Présentations LSD, JdS et ML@Aussois

    +
      +
    • PRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.

    • +
    • Quel plan ?

    • +
    • Quels résultats ? Baldock, Traveset … (sub-Doré)

    • +
    • Mettre le détails des formules et des algos pour VE et sélection de modèle en annexe.

    • +
    • Préciser simplement que l’on utilise un algo VE et un critère type BIC.

    • +
    • Pas la peine de préciser l’algo de clustering

    • +
    • Indiquer sur une slide le problème de support pour \pi\rho à faire s’il y a le temps.

    • +
    • Résultats sur les réseaux Baldock, regarder le positionnement par bloc des espèces communes, regarder les probas d’appartenance aux blocs par espèces communes et par réseau.

    • +
    +

    Applications

      @@ -357,34 +394,27 @@ Reference 1
-
-

Présentations LSD, JdS et ML@Aussois

-
    -
  • PRÉSENTATION JDS (LSD), durée introuvable, adapter en anglais les slides et voir avec PB et SD.
  • -
  • Quel plan ?
  • -
  • Quels résultats ? Baldock, Traveset … (sub-Doré)
  • -
-

Inférence et microbes

    -
  • Lire Papiers compositional data (Aitchison et al. intro)
  • +
  • Human Gut Compendium télécharger et analyser les données.
  • +
  • Lancer colBiSBM sur OTU\times Sample
  • Se renseigner techniques d’inférence de réseaux :
    • covariance (base corrélation et seuil)
    • GraphicalLASSO
    • Co-occurence
  • +
  • Lancer colSBM sur OTU\times OTU
  • +
  • Creuser TabNet de Christophe Regouby et les exercices
  • +
  • Regarder SPARTA Rennes
  • +
  • Lire Papiers compositional data (Aitchison et al. intro)
  • Lire article multi-niveaux Saint-Clair

A discuter

-
    -
  • Voir pour TT période du 11 au 14 août
  • -
  • Voir pour date CSI car congés avec parents prévu du 29/08 au 12/09.
  • -

A faire

@@ -444,7 +474,7 @@ Reference 1

Repoussés ou abandonnés

- -
+
  • Résultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \epsilon_{max}n_r n_c liens à retirer puis pour les \epsilon < \epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps.