diff --git a/index.html b/index.html index ed1ef37..643cbbd 100644 --- a/index.html +++ b/index.html @@ -210,7 +210,7 @@ window.Quarto = {
Date de publication
-

15 juin 2025

+

16 juin 2025

@@ -228,7 +228,7 @@ window.Quarto = {
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+

diff --git a/search.json b/search.json index cf81efb..9afe0e2 100644 --- a/search.json +++ b/search.json @@ -116,14 +116,14 @@ "href": "suivi/2025-24/2025-24.html", "title": "Bilan semaine 24 2025 : 10 juin - 13 juin", "section": "", - "text": "❗Préparer la séance intro à Git pour le 13 juin.\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n✅ C’est bon j’ai une fonction qui tourne, mais lentement ⌛\n⏳Simulations en train de tourner\n❗L’approche que j’ai en mettant la pénalité à 0 peut favoriser de séparer trop les réseaux et donc il faudrait refusionner. ➡️ mais le d&a ne fonctionne qu’en iid\n\n✅ Idée de Sophie : alterner descendant et ascendant → prometteur aussi. J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.\n\n✅ Il y avait un bug dans la fenêtre glissant où la condition d’arrêt quand le BICL n’augmentait plus était mal détectée. Corrigé\n\n\n\n9 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\n\n\nTEMPORAIRE 30 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n✅ Réparé mauvais placement des légendes, des valeurs etc.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}" + "text": "✅ Préparer la séance intro à Git pour le 13 juin. La séance s’est très bien passée\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n✅ C’est bon j’ai une fonction qui tourne, mais lentement ⌛\n⏳Simulations en train de tourner\n❗L’approche que j’ai en mettant la pénalité à 0 peut favoriser de séparer trop les réseaux et donc il faudrait refusionner. ➡️ mais le d&a ne fonctionne qu’en iid\n\n✅ Idée de Sophie : alterner descendant et ascendant → prometteur aussi. J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.\n\n✅ Il y avait un bug dans la fenêtre glissant où la condition d’arrêt quand le BICL n’augmentait plus était mal détectée. Corrigé\n\n\n\n9 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\n\n\nTEMPORAIRE 30 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n✅ Réparé mauvais placement des légendes, des valeurs etc.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}" }, { "objectID": "suivi/2025-24/2025-24.html#todo-list", "href": "suivi/2025-24/2025-24.html#todo-list", "title": "Bilan semaine 24 2025 : 10 juin - 13 juin", "section": "", - "text": "❗Préparer la séance intro à Git pour le 13 juin.\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n✅ C’est bon j’ai une fonction qui tourne, mais lentement ⌛\n⏳Simulations en train de tourner\n❗L’approche que j’ai en mettant la pénalité à 0 peut favoriser de séparer trop les réseaux et donc il faudrait refusionner. ➡️ mais le d&a ne fonctionne qu’en iid\n\n✅ Idée de Sophie : alterner descendant et ascendant → prometteur aussi. J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.\n\n✅ Il y avait un bug dans la fenêtre glissant où la condition d’arrêt quand le BICL n’augmentait plus était mal détectée. Corrigé\n\n\n\n9 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\n\n\nTEMPORAIRE 30 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n✅ Réparé mauvais placement des légendes, des valeurs etc.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}" + "text": "✅ Préparer la séance intro à Git pour le 13 juin. La séance s’est très bien passée\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n\nFaire le hclust avec diverses distances et voir si les coupes proposées diffèrent sensiblement\nSi plusieurs clustering possibles les tester et sélectionner le meilleur\nRé-ajuster les bonnes partitions.\n✅ C’est bon j’ai une fonction qui tourne, mais lentement ⌛\n⏳Simulations en train de tourner\n❗L’approche que j’ai en mettant la pénalité à 0 peut favoriser de séparer trop les réseaux et donc il faudrait refusionner. ➡️ mais le d&a ne fonctionne qu’en iid\n\n✅ Idée de Sophie : alterner descendant et ascendant → prometteur aussi. J’ai codé le fichier de simulations et débugguer le vecteur de clustering ▶️ à voir les performances. ➡️ la simu à 9 réseaux (bcp de variabilité a priori) est lancée attente résultats ➡️ Je tombe sur un bug déjà rencontré dans les simus d’inférence. j’ai lancé sans parallélisation pour essayer de comprendre le bug.\n\n✅ Il y avait un bug dans la fenêtre glissant où la condition d’arrêt quand le BICL n’augmentait plus était mal détectée. Corrigé\n\n\n\n9 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\n\n\nTEMPORAIRE 30 réseaux - ARI pour le clustering avec modèles iid, procédure descendante et descendante&ascendante\n\n\n\nPour les deux propositions données simulées tester diverses distances.\nDé-bugger les simulations :\n\nInférence : Relancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE -> BUG, dois creuser mais juste des problèmes techniques -> Visiblement il y a d’autres problèmes que juste le plan de parallélisation.\n\nVérifier si problème de version tidyverse pour vapply sur l’inférence.\nSi problème de parallélisation vient de pb de version future.callr le signaler à MIGALE.\n✅ Réparé mauvais placement des légendes, des valeurs etc.\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\nFaire GNN-VAE Doré et sub-Doré avec kmeans et clustering sur l’espace latent J’ai commencé à regarder un peu\n\n\n\nReference 1\n\n\n\n\nComparer les perfs du VAE sur Baldock avec colBiSBM par exemple\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nSe renseigner techniques d’inférence de réseaux :\n\ncovariance (base corrélation et seuil)\nGraphicalLASSO\nCo-occurence\n\nLancer colSBM sur OTU\\times OTU\nCreuser TabNet de Christophe Regouby et les exercices\nRegarder SPARTA Rennes\nLire Papiers compositional data (Aitchison et al. intro)\nLire article multi-niveaux Saint-Clair\nDemander à JA si elle connaît des réseaux d’interactions connus par les experts (idée d’intégrer une connaissance experte et de voir les différences de structure par rapport à celle attendue)\nEcrire et étudier les modèles pour différents niveaux taxonomiques. \\begin{align*}\ni \\rightarrow &~N^1_i \\subseteq N^2_i \\subseteq N^3_i & \\text{Taxonomie}\\\\\nZ^0_i \\overset{?}{=} & Z^1_i \\overset{?}{=} Z^2_i \\overset{?}{=} Z^3_i & \\text{Groupes fonctionnels}\n\\end{align*}" }, { "objectID": "suivi/2025-24/2025-24.html#lecture-en-cours", diff --git a/suivi/2025-24/2025-24.html b/suivi/2025-24/2025-24.html index e7cdcb6..2beb071 100644 --- a/suivi/2025-24/2025-24.html +++ b/suivi/2025-24/2025-24.html @@ -245,7 +245,7 @@ window.Quarto = {

TODO List

    -
  • ❗Préparer la séance intro à Git pour le 13 juin.
  • +
  • ✅ Préparer la séance intro à Git pour le 13 juin. La séance s’est très bien passée
  • Pour clustering de collections sur données réelles :
    → L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).