diff --git a/index.html b/index.html index 9f47fed..769c453 100644 --- a/index.html +++ b/index.html @@ -210,7 +210,7 @@ window.Quarto = {
Date de publication
-

11 juin 2025

+

15 juin 2025

@@ -228,10 +228,10 @@ window.Quarto = {
-
+
@@ -248,7 +248,7 @@ window.Quarto = {
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+

diff --git a/search.json b/search.json index 00ddd91..38e05db 100644 --- a/search.json +++ b/search.json @@ -116,14 +116,14 @@ "href": "suivi/2025-24/2025-24.html", "title": "Bilan semaine 24 2025 : 10 juin - 13 juin", "section": "", - "text": "❗Préparer la séance intro à Git pour le 13 juin.\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n▶️ Je commence à coder ça ➡️ Je stocke la première étape de clustering pour moins galérer\n\nIdée de Sophie : alterner descendant et ascendant → prometteur aussi\n\nJ’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n✅ Réparé mauvais placement des légendes, des valeurs etc. ### Applications\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}" + "text": "❗Préparer la séance intro à Git pour le 13 juin.\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n✅ C’est bon j’ai une fonction qui tourne, mais lentement ⌛\n\n✅ Idée de Sophie : alterner descendant et ascendant → prometteur aussi. J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.\n\n✅ Il y avait un bug dans la fenêtre glissant où la condition d’arrêt quand le BICL n’augmentait plus était mal détectée. Corrigé\n\n\n\n9 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\n\n\nTEMPORAIRE 30 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n✅ Réparé mauvais placement des légendes, des valeurs etc.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}" }, { "objectID": "suivi/2025-24/2025-24.html#todo-list", "href": "suivi/2025-24/2025-24.html#todo-list", "title": "Bilan semaine 24 2025 : 10 juin - 13 juin", "section": "", - "text": "❗Préparer la séance intro à Git pour le 13 juin.\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n▶️ Je commence à coder ça ➡️ Je stocke la première étape de clustering pour moins galérer\n\nIdée de Sophie : alterner descendant et ascendant → prometteur aussi\n\nJ’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n✅ Réparé mauvais placement des légendes, des valeurs etc. ### Applications\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}" + "text": "❗Préparer la séance intro à Git pour le 13 juin.\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n✅ C’est bon j’ai une fonction qui tourne, mais lentement ⌛\n\n✅ Idée de Sophie : alterner descendant et ascendant → prometteur aussi. J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.\n\n✅ Il y avait un bug dans la fenêtre glissant où la condition d’arrêt quand le BICL n’augmentait plus était mal détectée. Corrigé\n\n\n\n9 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\n\n\nTEMPORAIRE 30 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n✅ Réparé mauvais placement des légendes, des valeurs etc.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}" }, { "objectID": "suivi/2025-24/2025-24.html#lecture-en-cours", diff --git a/suivi/2025-24/2025-24.html b/suivi/2025-24/2025-24.html index 4558db6..c148b6e 100644 --- a/suivi/2025-24/2025-24.html +++ b/suivi/2025-24/2025-24.html @@ -214,6 +214,7 @@ window.Quarto = {
  • A continuer
  • Repoussés ou abandonnés
  • @@ -244,19 +245,31 @@ window.Quarto = {

    TODO List

      -
    • ❗Préparer la séance intro à Git pour le 13 juin.

    • -
    • Pour clustering de collections sur données réelles :
      -→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).

      +
    • ❗Préparer la séance intro à Git pour le 13 juin.
    • +
    • Pour clustering de collections sur données réelles :
      +→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).
      • Faire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement
      • Si plusieurs clustering possibles les tester et sélectionner le meilleur
      • Ré-ajuster les bonnes partitions.
      • -
      • ▶️ Je commence à coder ça ➡️ Je stocke la première étape de clustering pour moins galérer
      • +
      • ✅ C’est bon j’ai une fonction qui tourne, mais lentement ⌛
    • -
    • Idée de Sophie : alterner descendant et ascendant → prometteur aussi

      +
    • ✅ Idée de Sophie : alterner descendant et ascendant → prometteur aussi. J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.
    • +
    +

    ✅ Il y avait un bug dans la fenêtre glissant où la condition d’arrêt quand le BICL n’augmentait plus était mal détectée. Corrigé

    +
    +
    +

    +
    9 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante
    +
    +
    +
    +
    +

    +
    TEMPORAIRE 30 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante
    +
    +
      -
    • J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.
    • -
  • Pour les deux propositions données simulées tester diverses distances.

  • Dé-bugger les simulations :

      @@ -264,8 +277,12 @@ window.Quarto = {
  • Vérifier si problème de version tidyverse pour vapply sur l’inférence.

  • Si problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.

  • -
  • ✅ Réparé mauvais placement des légendes, des valeurs etc. ### Applications

  • -
  • Kmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.

  • +
  • ✅ Réparé mauvais placement des légendes, des valeurs etc.

  • + +
    +

    Applications

    +
      +
    • Kmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.
    @@ -282,6 +299,7 @@ Reference 1
    • Comparer les perfs du VAE sur Baldock avec colBiSBM par exemple
    +

    Inférence et microbes

      @@ -350,8 +368,8 @@ Z^0_i \overset{?}{=} & Z^1_i \overset{?}{=} Z^2_i \overset{?}{=} Z^3_i &

    A continuer

    -
    -

    Applications

    +
    +

    Applications

    • Idée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation
    diff --git a/suivi/2025-24/figs/ari-clustering-desc&asc30.png b/suivi/2025-24/figs/ari-clustering-desc&asc30.png new file mode 100644 index 0000000..a4bbd8a Binary files /dev/null and b/suivi/2025-24/figs/ari-clustering-desc&asc30.png differ diff --git a/suivi/2025-24/figs/ari-clustering-desc&asc9.png b/suivi/2025-24/figs/ari-clustering-desc&asc9.png new file mode 100644 index 0000000..ffbf58a Binary files /dev/null and b/suivi/2025-24/figs/ari-clustering-desc&asc9.png differ