diff --git a/index.html b/index.html index 84f06c7..a519092 100644 --- a/index.html +++ b/index.html @@ -195,7 +195,7 @@ window.Quarto = {
  • Journaux
  • -
    Catégories
    Tous (27)
    colBiSBM (27)
    covariables (1)
    GNN (20)
    identifiabilité (1)
    inférence (22)
    +
    Catégories
    Tous (28)
    colBiSBM (28)
    covariables (1)
    GNN (21)
    identifiabilité (1)
    inférence (23)
    @@ -225,14 +225,14 @@ window.Quarto = {
    Date de publication
    -

    24 février 2026

    +

    16 mars 2026

    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    @@ -264,7 +264,41 @@ Agenda

    Journaux

    -
    +
    + + + +
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    -
    +
    @@ -1108,7 +1142,7 @@ Louis Lacoste
    -
    +
    -
    +

    Baldock iid

    diff --git a/listings.json b/listings.json index dcc24a5..18633a2 100644 --- a/listings.json +++ b/listings.json @@ -2,6 +2,7 @@ { "listing": "/index.html", "items": [ + "/suivi/2026-12/2026-12.html", "/suivi/2026-9/2026-9.html", "/suivi/2026-7/2026-7.html", "/suivi/2026-8/2026-8.html", diff --git a/search.json b/search.json index a1a89c4..453657a 100644 --- a/search.json +++ b/search.json @@ -11,7 +11,7 @@ "href": "index.html#journaux", "title": "Journal suivi de la thèse", "section": "Journaux", - "text": "Journaux\n\n\n\n\n\n\n\n\n\n\nBilan semaine 9 2026 : 23 février - 27 février\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n23 févr. 2026\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 7 2026 : 09 février - 13 février\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\ncovariables\n\nidentifiabilité\n\n\n\n\n\n\n\n\n\n13 févr. 2026\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 8 2026 : 16 février - 20 février\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n13 févr. 2026\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 6 2026 : 02 février - 06 février\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n6 févr. 2026\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 51 2025 : 15 décembre - 19 décembre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n19 déc. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 50 2025 : 08 décembre - 12 décembre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n12 déc. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 45 2025 : 03 novembre - 06 novembre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n3 nov. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 44 2025 : 27 octobre - 31 octobre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n27 oct. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 43 2025 : 20 octobre - 24 octobre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n20 oct. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 38 2025 : 15 septembre - 19 septembre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n19 sept. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 35 2025 : 25 août - 29 août\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n29 août 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 33 2025 : 11 août - 15 août\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n14 août 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 29 2025 : 15 juillet - 18 juillet\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n15 juil. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 28 2025 : 07 juillet - 11 juillet\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n7 juil. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 27 2025 : 30 juin - 4 juillet\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n30 juin 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 25 2025 : 16 juin - 20 juin\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n20 juin 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 24 2025 : 10 juin - 13 juin\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n13 juin 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 22 2025 : 26 mai - 30 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n28 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 21 2025 : 26 mai - 30 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n23 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 20 2025 : 12 mai - 16 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n16 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 19 2025 : 5 mai - 9 mai\n\n\n\ncolBiSBM\n\ninférence\n\n\n\n\n\n\n\n\n\n9 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 18 2025 : 28 avril - 2 mai\n\n\n\ncolBiSBM\n\ninférence\n\n\n\n\n\n\n\n\n\n2 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 17 2025 : 24 avril - 25 avril\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n25 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 16 2025\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n18 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 15 2025 : 31 mars-4 avril\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n4 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 14 2025 : 24-28 mars\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n28 mars 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 13 2025 : 17-21 mars\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n17 mars 2025\n\n\nLouis Lacoste\n\n\n\n\n\nAucun article correspondant" + "text": "Journaux\n\n\n\n\n\n\n\n\n\n\nBilan semaine 9 2026 : 16 mars - 20 mars\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n16 mars 2026\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 9 2026 : 23 février - 27 février\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n23 févr. 2026\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 7 2026 : 09 février - 13 février\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\ncovariables\n\nidentifiabilité\n\n\n\n\n\n\n\n\n\n13 févr. 2026\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 8 2026 : 16 février - 20 février\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n13 févr. 2026\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 6 2026 : 02 février - 06 février\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n6 févr. 2026\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 51 2025 : 15 décembre - 19 décembre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n19 déc. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 50 2025 : 08 décembre - 12 décembre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n12 déc. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 45 2025 : 03 novembre - 06 novembre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n3 nov. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 44 2025 : 27 octobre - 31 octobre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n27 oct. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 43 2025 : 20 octobre - 24 octobre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n20 oct. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 38 2025 : 15 septembre - 19 septembre\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n19 sept. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 35 2025 : 25 août - 29 août\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n29 août 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 33 2025 : 11 août - 15 août\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n14 août 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 29 2025 : 15 juillet - 18 juillet\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n15 juil. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 28 2025 : 07 juillet - 11 juillet\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n7 juil. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 27 2025 : 30 juin - 4 juillet\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n30 juin 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 25 2025 : 16 juin - 20 juin\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n20 juin 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 24 2025 : 10 juin - 13 juin\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n13 juin 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 22 2025 : 26 mai - 30 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n28 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 21 2025 : 26 mai - 30 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n23 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 20 2025 : 12 mai - 16 mai\n\n\n\ncolBiSBM\n\ninférence\n\nGNN\n\n\n\n\n\n\n\n\n\n16 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 19 2025 : 5 mai - 9 mai\n\n\n\ncolBiSBM\n\ninférence\n\n\n\n\n\n\n\n\n\n9 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 18 2025 : 28 avril - 2 mai\n\n\n\ncolBiSBM\n\ninférence\n\n\n\n\n\n\n\n\n\n2 mai 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 17 2025 : 24 avril - 25 avril\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n25 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 16 2025\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n18 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 15 2025 : 31 mars-4 avril\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n4 avr. 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 14 2025 : 24-28 mars\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n28 mars 2025\n\n\nLouis Lacoste\n\n\n\n\n\n\n\n\n\n\n\n\nBilan semaine 13 2025 : 17-21 mars\n\n\n\ncolBiSBM\n\n\n\n\n\n\n\n\n\n17 mars 2025\n\n\nLouis Lacoste\n\n\n\n\n\nAucun article correspondant" }, { "objectID": "suivi/2025-17/2025-17.html", @@ -371,65 +371,65 @@ "text": "Lectures en cours 📚\n\nHDR Vincent Brault\n\n⌛ Chap 2 : Creuser l’idée de maximiser l’énergie libre, très intéressant regarder le critère CARI et lire Robert et al 2021. Actuellement p32 du manuscrit\nChap 3\n\n\n\nOT\n\n⌛ Mazelet, Flamary, et Thirion (s. d.) Intéressant pour le transport optimal entre graphes de tailles différentes | Regarder si regularization entropique ne marche pas bien pour le graphe.\n⌛ Nenna (s. d.b) Pour comprendre le problème d’OT régularisé pour l’entropie.\n⌛ Nenna (s. d.a)\n\n\n\nInférence de graphes\n\n⌛ Aitchison (1982), en cours\n❗📖 Payne et al. (2023) sur MixMPLN\n\n\n\nCausalité\n\n❗📖 Bystrova (s. d.)\n\n\n\nLargest Gaps\n\n❗📖 Brault et Channarond (2023)\n❗📖 Channarond, Daudin, et Robin (2012) le papier qui introduit le Largest Gaps" }, { - "objectID": "suivi/2025-18/2025-18.html", - "href": "suivi/2025-18/2025-18.html", - "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", + "objectID": "suivi/2025-14/2025-14.html", + "href": "suivi/2025-14/2025-14.html", + "title": "Bilan semaine 14 2025 : 24-28 mars", "section": "", - "text": "Lire biblio fournie Julie, Inférence de réseaux : co-occurence\nPapier pour comprendre données\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\n\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\nIntégrer les retours de Sophie\n\n\n\n\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." + "text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nAgrandir la collection d’application, pas seulement Baldock mais aussi Trojelsgaard par ex\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nPrésenter le réseau Afrique du Sud dès l’intro des réseaux anglais de Baldock\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\nRédiger et modifier les cadres de simulations dans le papier pour qu’ils soient raccord avec les données obtenues.\nLancer clustering iid ascendant sur données sub-Doré.\nVérifier si les Baldock anglais ont des espèces en communs “Do they involve common species?”." }, { - "objectID": "suivi/2025-18/2025-18.html#a-faire", - "href": "suivi/2025-18/2025-18.html#a-faire", - "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", + "objectID": "suivi/2025-14/2025-14.html#a-faire", + "href": "suivi/2025-14/2025-14.html#a-faire", + "title": "Bilan semaine 14 2025 : 24-28 mars", "section": "", - "text": "Lire biblio fournie Julie, Inférence de réseaux : co-occurence\nPapier pour comprendre données\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\n\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\nIntégrer les retours de Sophie\n\n\n\n\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." + "text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nAgrandir la collection d’application, pas seulement Baldock mais aussi Trojelsgaard par ex\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nPrésenter le réseau Afrique du Sud dès l’intro des réseaux anglais de Baldock\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\nRédiger et modifier les cadres de simulations dans le papier pour qu’ils soient raccord avec les données obtenues.\nLancer clustering iid ascendant sur données sub-Doré.\nVérifier si les Baldock anglais ont des espèces en communs “Do they involve common species?”." }, { - "objectID": "suivi/2025-18/2025-18.html#jai-fait", - "href": "suivi/2025-18/2025-18.html#jai-fait", - "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", + "objectID": "suivi/2025-14/2025-14.html#jai-fait", + "href": "suivi/2025-14/2025-14.html#jai-fait", + "title": "Bilan semaine 14 2025 : 24-28 mars", "section": "J’ai fait", - "text": "J’ai fait\n\nJdS\n\ncolDEM CSE\n\n\n\nClustering exhaustif Baldock\n\nLe clustering de toutes les 52 partitions s’est fait en 5h30 ! (Mémoïsation)\nPour iid la meilleure partition avec BICL=-9466.911 contre BICL_{algo} = -9466.873 \\pm 0.02205 trouvé avec l’algo \nPour \\pi\\rho la meilleure partition avec BICL = -9497.92 contre BICL_{algo} =-9497.92 \\pm 0.00009" + "text": "J’ai fait\n\nCorriger structure de simus :\n\nPour NA robustness\n\nDéfinir dans la section 3 :\n\n\nRemark that for iid-colBiSBM, \\pi_q, \\rho_r > 0, and thus the blocks exist and are represented in all networks. For the other models, some blocks may not exist in some networks and this is why \\pi_q^m, \\rho_r^m \\geq 0. Using S^{(1)} and S^{(2)} we can define the restricted parameters for each network and we denote them as \\widetilde{\\bm{\\pi}}^m, \\widetilde{\\bm{\\rho}}^m and \\widetilde{\\bm{\\alpha}}^m. The restrictions thus indicate the blocks that are represented in the network m.\n\n\nÉcrire la partie preuve pour identif \\pi-colBiSBM et \\rho-colBiSBM. Identif : \\pi et \\rho en attente retours Pierre et Sophie\nSaint-Clair va passer colSBM sous GrossSBM\nAgrandir la collection d’application, pas seulement Baldock mais aussi Trojelsgaard par ex : Collection agrandie avec Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson, en attente MIGALE. Clustering instable" }, { - "objectID": "suivi/2025-18/2025-18.html#a-continuer", - "href": "suivi/2025-18/2025-18.html#a-continuer", - "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", + "objectID": "suivi/2025-14/2025-14.html#a-continuer", + "href": "suivi/2025-14/2025-14.html#a-continuer", + "title": "Bilan semaine 14 2025 : 24-28 mars", "section": "A continuer", - "text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nLire Biological Networks - François Képès\nRelancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE\n\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nSimulations article\n\nRelancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10." + "text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nPour sub doré en attente MIGALE augmenter le nbre de répèt de la procédure." }, { - "objectID": "suivi/2025-50/2025-50.html", - "href": "suivi/2025-50/2025-50.html", - "title": "Bilan semaine 50 2025 : 08 décembre - 12 décembre", + "objectID": "suivi/2026-7/2026-7.html", + "href": "suivi/2026-7/2026-7.html", + "title": "Bilan semaine 7 2026 : 09 février - 13 février", "section": "", - "text": "⚠️ IL Y A UNE TYPO SUR LE SIGNE DE L’ENTROPIE POUR LE PAPIER: - \\mathcal{H} au lieu de +\\mathcal{H}\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nFaire tourner clustering sur Trojelsgaard\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\nFaire LBM sur niveau taxonomique grossier, initialiser avec le résultat pour un niveau plus fin et ainsi de suite.\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n👶 (délégué à Mona) Clustering sur Doré :\n\nRegarder pour les couples date+nom les études et le nombre de réseaux analysables (Possible demander à Élisa)\n\n⌛ Chamberlain et al semble intéressant à regarder ! Voir le Rmarkdown\n\nClusteriser sur la base des noms et voir parmi les réseaux Européens (désagrégés ?)\nSi M > 10, alors voir si je retrouve les mêmes résultats que dans les études.\nRegarder Largest gap sur réseaux Doré\n⌛ Essayer clustering sur supinfo\n\nCAH et Kmeans tendent vers faire K = 13 clusters sur les supinfos\nEnrichir avec des métriques sur les réseaux (nestedness, connectance autres ?)\nDemander à Elisa pour la signification des métadonnées\nDemander à Elisa une fois vu cohérences de groupe voir pour interprétation écologiques ?\nAlgo de clustering sur les groupes trouvés\n\n\n\n\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\nPlusieurs possibilités pour la définition de \\rho_r^j\n\n\nDénominateur pas correct, ne somme pas à 1.\n\\rho_r^j = \\frac{\\exp{\\beta_r X_j\\mathbf{1}_{\\{r\\neq R\\}}}}{1+\\sum_{s=1}^{R-1} \\beta_s X_j}, \\beta_R = 0 et \\rho_R^{j} = \\frac{1}{1+\\sum_{s=1}^{R-1} \\beta_s X_j} (pas de compréhension intuitive)\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j \\mathbb{1}_{r\\neq R} - \\log (1+\\sum_{s=1}^{R-1} \\beta_s X_j))]\n\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j}{1+\\sum_{s=1}^{R-1} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\frac{1}{1+\\sum_{s=1}^{R-1} \\beta_s X_j} \\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_R^j \\bigr) X_j\\biggr]\n\\end{align*}\n❓ Gradient mesure l’écart entre probas a posteriori et la proba a priori du groupe de référence ?\nConclusion: Il manque l’exponentielle cette formulation ne somme pas à 1.\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" + "text": "Petites opérations sur les OTUs (regarder la matrice dans les yeux):\n\nRanger les OTUs par variances (i.e. sd(OTU_j))\n\nHMC sur-dispersés (au-dessus bissectrice)\nEnterotype phyloseq sous-disp\n\nRegarder la proportion de 1. taxon rares, 2. zeros.\nFaire des coupures selon niveaux taxonomiques et regarder si \\mathbb{V}_{\\text{intra}} \\approx \\mathbb{V}_{\\text{inter}}\nBonus: faire ça dans qmd et voir si forge permet gitlab pages\n\n✅ Avec blockmodels, codé un LBM-Séquentiel. Des différences contrastées…\n\nTODO Ajouter lien vers notebooks résultats\n\nRelire Peixoto (2014)\n\nRegarder les gens qui citent les travaux de Peixoto\n\n⌛ En cours Implémentation blockmodels LBM avec covariables sur proportions (voir Équation 1)\n\n\n\n\n\n\n\nIdées\n\n\n\n\nTravailler sur Fungus Tree network\n⌛Demander à PB et SD, ils regardent : Comparaison covar prop avec GREMLINS multipartite sur (log(dist_phylo), fungus-tree)\nTrouver manière de faire un compromis : \\ell(Y,Z,W;\\theta) - \\lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?\n⌛ Mise à jour partielle des \\tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \\tau à chaque itération. Et échantillonnage stratifié selon l’arbre ?\n\n⌛ Simulations avec n_2 croissant lancée sur Migale\nRéimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\\times(\\tau^{(1)})^{\\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.\n\n\n\n\n\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\n👶 (délégué à Mona) Clustering sur Doré :\n\nAjouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.\n\n\n\n\n\n✅ En préparation d’un fichier (réu avec JBL à 10h45 le 06/02/2026). Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \\pmb\\pi et \\pmb{\\rho} en utilisant les \\pmb B^{\\top}\\pmb X et en renvoyant l’ELBO adaptée.\n\n😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !\n😢 Besoin de réfléchir a une bonne implémentation.\n\n\n\n\n\\begin{align*}\n\\pmb{\\beta}_{r}& = \\begin{pmatrix}\n \\beta_{r,0}\\\\\n \\vdots\\\\\n \\beta_{r,p}\n\\end{pmatrix}, & X_{j,\\bullet} = \\begin{pmatrix}\n 1 = x_{0,j} & x_{1,j} & \\dots & x_{p,j}\n\\end{pmatrix}\\\\\nX_{j,\\bullet} \\pmb{\\beta}_r& = \\beta_{r,0} x_{0,j} + \\beta_{r,1} x_{1,j} + \\dots + \\beta_{r,p} x_{p,j} & \\approx \\log(\\rho_r^j) \\\\\nB & = \\begin{pmatrix}\n\\pmb{\\beta}_1 \\dots \\pmb{\\beta}_r \\dots \\pmb{\\beta}_R\n\\end{pmatrix} & X_{j,\\bullet}B \\approx \\log(\\pmb{\\rho}^j) \\\\\nX B & \\approx \\log((\\pmb{\\rho}^j)_{j=1,\\dots,n_2}) = \\log(\\pmb{\\Rho})\\\\\n\\end{align*} Et pour les probas en lignes du LBM \\begin{align*}\n\\pmb{\\gamma}_{q}& = \\begin{pmatrix}\n \\gamma_{q,0}\\\\\n \\vdots\\\\\n \\gamma_{q,d}\n\\end{pmatrix}, & V_{i,\\bullet} = \\begin{pmatrix}\n 1 = v_{0,i} & v_{1,i} & \\dots & v_{d,i}\n\\end{pmatrix}\\\\\nV_{i,\\bullet} \\pmb{\\gamma}_q & = \\gamma_{q,0} v_{0,i} + \\gamma_{q,1} v_{1,i} + \\dots + \\gamma_{q,d} v_{d,i} & \\approx \\log(\\pi_q^i) \\\\\n\\Gamma & = \\begin{pmatrix}\n\\gamma_1 \\dots \\pmb{\\gamma}_q \\dots \\pmb{\\gamma}_Q\n\\end{pmatrix} & V_{i,\\bullet} \\Gamma \\approx \\log(\\pmb{\\pi}^i) \\\\\nV \\Gamma & \\approx \\log((\\pmb{\\pi}^i)_{i=1,\\dots,n_1}) = \\log(\\pmb{\\Pi})\n\n\n\\end{align*}\n\n\n\nSoient B,B^{\\prime} avec B_{\\bullet,R} = B^{\\prime}_{\\bullet,R} = \\vec{0}_{p+1} et X de rang plein tel que X^{\\top}X soit inversible.\n\\begin{align*}\n&\\sigma(XB) = \\sigma(XB^{\\prime})\\\\\n&\\implies \\exists C = \\begin{pmatrix}c_1 \\\\ \\vdots \\\\ c_j \\\\ \\vdots \\\\ c_{n_2}\\end{pmatrix} \\in \\mathbb{R}^{n_2}, X B = X B^{\\prime} + C \\pmb{1}_{R}^{\\top} \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, (X B)_{j,r} = (X B^{\\prime})_{j,r} + (C \\pmb{1}_{R}^{\\top})_{j,r} \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall r\\in\\{1\\dots,R\\}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\beta_{k,r} = \\sum_{k=1}^{p+1} x_{j,k} \\beta^{\\prime}_{k,r} + c_j\\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\beta_{k,R} = \\sum_{k=1}^{p+1} x_{j,k} \\beta^{\\prime}_{k,R} + c_j \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\times 0 = \\sum_{k=1}^{p+1} x_{j,k} \\times 0 + c_j \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, 0 = 0 + c_j \\implies c_j = 0 \\\\\n&\\implies C = \\begin{pmatrix} 0 \\\\ \\vdots \\\\ 0 \\end{pmatrix} \\text{and thus}, XB = XB^{\\prime} \\\\\n& \\implies (X^{\\top} X)^{-1}X^{\\top} X B = (X^{\\top} X)^{-1}X^{\\top} X B^{\\prime} \\implies B=B^{\\prime}\n\\end{align*}\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\\tag{1}\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" }, { - "objectID": "suivi/2025-50/2025-50.html#todo-list", - "href": "suivi/2025-50/2025-50.html#todo-list", - "title": "Bilan semaine 50 2025 : 08 décembre - 12 décembre", + "objectID": "suivi/2026-7/2026-7.html#todo-list", + "href": "suivi/2026-7/2026-7.html#todo-list", + "title": "Bilan semaine 7 2026 : 09 février - 13 février", "section": "", - "text": "⚠️ IL Y A UNE TYPO SUR LE SIGNE DE L’ENTROPIE POUR LE PAPIER: - \\mathcal{H} au lieu de +\\mathcal{H}\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nFaire tourner clustering sur Trojelsgaard\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\nFaire LBM sur niveau taxonomique grossier, initialiser avec le résultat pour un niveau plus fin et ainsi de suite.\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n👶 (délégué à Mona) Clustering sur Doré :\n\nRegarder pour les couples date+nom les études et le nombre de réseaux analysables (Possible demander à Élisa)\n\n⌛ Chamberlain et al semble intéressant à regarder ! Voir le Rmarkdown\n\nClusteriser sur la base des noms et voir parmi les réseaux Européens (désagrégés ?)\nSi M > 10, alors voir si je retrouve les mêmes résultats que dans les études.\nRegarder Largest gap sur réseaux Doré\n⌛ Essayer clustering sur supinfo\n\nCAH et Kmeans tendent vers faire K = 13 clusters sur les supinfos\nEnrichir avec des métriques sur les réseaux (nestedness, connectance autres ?)\nDemander à Elisa pour la signification des métadonnées\nDemander à Elisa une fois vu cohérences de groupe voir pour interprétation écologiques ?\nAlgo de clustering sur les groupes trouvés\n\n\n\n\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\nPlusieurs possibilités pour la définition de \\rho_r^j\n\n\nDénominateur pas correct, ne somme pas à 1.\n\\rho_r^j = \\frac{\\exp{\\beta_r X_j\\mathbf{1}_{\\{r\\neq R\\}}}}{1+\\sum_{s=1}^{R-1} \\beta_s X_j}, \\beta_R = 0 et \\rho_R^{j} = \\frac{1}{1+\\sum_{s=1}^{R-1} \\beta_s X_j} (pas de compréhension intuitive)\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j \\mathbb{1}_{r\\neq R} - \\log (1+\\sum_{s=1}^{R-1} \\beta_s X_j))]\n\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j}{1+\\sum_{s=1}^{R-1} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\frac{1}{1+\\sum_{s=1}^{R-1} \\beta_s X_j} \\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_R^j \\bigr) X_j\\biggr]\n\\end{align*}\n❓ Gradient mesure l’écart entre probas a posteriori et la proba a priori du groupe de référence ?\nConclusion: Il manque l’exponentielle cette formulation ne somme pas à 1.\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" + "text": "Petites opérations sur les OTUs (regarder la matrice dans les yeux):\n\nRanger les OTUs par variances (i.e. sd(OTU_j))\n\nHMC sur-dispersés (au-dessus bissectrice)\nEnterotype phyloseq sous-disp\n\nRegarder la proportion de 1. taxon rares, 2. zeros.\nFaire des coupures selon niveaux taxonomiques et regarder si \\mathbb{V}_{\\text{intra}} \\approx \\mathbb{V}_{\\text{inter}}\nBonus: faire ça dans qmd et voir si forge permet gitlab pages\n\n✅ Avec blockmodels, codé un LBM-Séquentiel. Des différences contrastées…\n\nTODO Ajouter lien vers notebooks résultats\n\nRelire Peixoto (2014)\n\nRegarder les gens qui citent les travaux de Peixoto\n\n⌛ En cours Implémentation blockmodels LBM avec covariables sur proportions (voir Équation 1)\n\n\n\n\n\n\n\nIdées\n\n\n\n\nTravailler sur Fungus Tree network\n⌛Demander à PB et SD, ils regardent : Comparaison covar prop avec GREMLINS multipartite sur (log(dist_phylo), fungus-tree)\nTrouver manière de faire un compromis : \\ell(Y,Z,W;\\theta) - \\lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?\n⌛ Mise à jour partielle des \\tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \\tau à chaque itération. Et échantillonnage stratifié selon l’arbre ?\n\n⌛ Simulations avec n_2 croissant lancée sur Migale\nRéimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\\times(\\tau^{(1)})^{\\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.\n\n\n\n\n\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\n👶 (délégué à Mona) Clustering sur Doré :\n\nAjouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.\n\n\n\n\n\n✅ En préparation d’un fichier (réu avec JBL à 10h45 le 06/02/2026). Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \\pmb\\pi et \\pmb{\\rho} en utilisant les \\pmb B^{\\top}\\pmb X et en renvoyant l’ELBO adaptée.\n\n😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !\n😢 Besoin de réfléchir a une bonne implémentation.\n\n\n\n\n\\begin{align*}\n\\pmb{\\beta}_{r}& = \\begin{pmatrix}\n \\beta_{r,0}\\\\\n \\vdots\\\\\n \\beta_{r,p}\n\\end{pmatrix}, & X_{j,\\bullet} = \\begin{pmatrix}\n 1 = x_{0,j} & x_{1,j} & \\dots & x_{p,j}\n\\end{pmatrix}\\\\\nX_{j,\\bullet} \\pmb{\\beta}_r& = \\beta_{r,0} x_{0,j} + \\beta_{r,1} x_{1,j} + \\dots + \\beta_{r,p} x_{p,j} & \\approx \\log(\\rho_r^j) \\\\\nB & = \\begin{pmatrix}\n\\pmb{\\beta}_1 \\dots \\pmb{\\beta}_r \\dots \\pmb{\\beta}_R\n\\end{pmatrix} & X_{j,\\bullet}B \\approx \\log(\\pmb{\\rho}^j) \\\\\nX B & \\approx \\log((\\pmb{\\rho}^j)_{j=1,\\dots,n_2}) = \\log(\\pmb{\\Rho})\\\\\n\\end{align*} Et pour les probas en lignes du LBM \\begin{align*}\n\\pmb{\\gamma}_{q}& = \\begin{pmatrix}\n \\gamma_{q,0}\\\\\n \\vdots\\\\\n \\gamma_{q,d}\n\\end{pmatrix}, & V_{i,\\bullet} = \\begin{pmatrix}\n 1 = v_{0,i} & v_{1,i} & \\dots & v_{d,i}\n\\end{pmatrix}\\\\\nV_{i,\\bullet} \\pmb{\\gamma}_q & = \\gamma_{q,0} v_{0,i} + \\gamma_{q,1} v_{1,i} + \\dots + \\gamma_{q,d} v_{d,i} & \\approx \\log(\\pi_q^i) \\\\\n\\Gamma & = \\begin{pmatrix}\n\\gamma_1 \\dots \\pmb{\\gamma}_q \\dots \\pmb{\\gamma}_Q\n\\end{pmatrix} & V_{i,\\bullet} \\Gamma \\approx \\log(\\pmb{\\pi}^i) \\\\\nV \\Gamma & \\approx \\log((\\pmb{\\pi}^i)_{i=1,\\dots,n_1}) = \\log(\\pmb{\\Pi})\n\n\n\\end{align*}\n\n\n\nSoient B,B^{\\prime} avec B_{\\bullet,R} = B^{\\prime}_{\\bullet,R} = \\vec{0}_{p+1} et X de rang plein tel que X^{\\top}X soit inversible.\n\\begin{align*}\n&\\sigma(XB) = \\sigma(XB^{\\prime})\\\\\n&\\implies \\exists C = \\begin{pmatrix}c_1 \\\\ \\vdots \\\\ c_j \\\\ \\vdots \\\\ c_{n_2}\\end{pmatrix} \\in \\mathbb{R}^{n_2}, X B = X B^{\\prime} + C \\pmb{1}_{R}^{\\top} \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, (X B)_{j,r} = (X B^{\\prime})_{j,r} + (C \\pmb{1}_{R}^{\\top})_{j,r} \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall r\\in\\{1\\dots,R\\}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\beta_{k,r} = \\sum_{k=1}^{p+1} x_{j,k} \\beta^{\\prime}_{k,r} + c_j\\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\beta_{k,R} = \\sum_{k=1}^{p+1} x_{j,k} \\beta^{\\prime}_{k,R} + c_j \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\times 0 = \\sum_{k=1}^{p+1} x_{j,k} \\times 0 + c_j \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, 0 = 0 + c_j \\implies c_j = 0 \\\\\n&\\implies C = \\begin{pmatrix} 0 \\\\ \\vdots \\\\ 0 \\end{pmatrix} \\text{and thus}, XB = XB^{\\prime} \\\\\n& \\implies (X^{\\top} X)^{-1}X^{\\top} X B = (X^{\\top} X)^{-1}X^{\\top} X B^{\\prime} \\implies B=B^{\\prime}\n\\end{align*}\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\\tag{1}\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" }, { - "objectID": "suivi/2025-50/2025-50.html#a-discuter", - "href": "suivi/2025-50/2025-50.html#a-discuter", - "title": "Bilan semaine 50 2025 : 08 décembre - 12 décembre", + "objectID": "suivi/2026-7/2026-7.html#a-discuter", + "href": "suivi/2026-7/2026-7.html#a-discuter", + "title": "Bilan semaine 7 2026 : 09 février - 13 février", "section": "A discuter", "text": "A discuter\n\n🆕 Voir pour des Réseaux / GDR ou aller\n🆕 Chercher des cours à suivre" }, { - "objectID": "suivi/2025-50/2025-50.html#biblio-à-faire", - "href": "suivi/2025-50/2025-50.html#biblio-à-faire", - "title": "Bilan semaine 50 2025 : 08 décembre - 12 décembre", + "objectID": "suivi/2026-7/2026-7.html#biblio-à-faire", + "href": "suivi/2026-7/2026-7.html#biblio-à-faire", + "title": "Bilan semaine 7 2026 : 09 février - 13 février", "section": "Biblio à faire", "text": "Biblio à faire\n\nRegarder Transport optimal graphes bipartite." }, { - "objectID": "suivi/2025-50/2025-50.html#lectures-en-cours", - "href": "suivi/2025-50/2025-50.html#lectures-en-cours", - "title": "Bilan semaine 50 2025 : 08 décembre - 12 décembre", + "objectID": "suivi/2026-7/2026-7.html#lectures-en-cours", + "href": "suivi/2026-7/2026-7.html#lectures-en-cours", + "title": "Bilan semaine 7 2026 : 09 février - 13 février", "section": "Lectures en cours 📚", "text": "Lectures en cours 📚\n\nHDR Vincent Brault\n\n⌛ Chap 2 : Creuser l’idée de maximiser l’énergie libre, très intéressant regarder le critère CARI et lire Robert et al 2021. Actuellement p32 du manuscrit\nChap 3\n\n\n\nOT\n\n⌛ Mazelet, Flamary, et Thirion (s. d.) Intéressant pour le transport optimal entre graphes de tailles différentes | Regarder si regularization entropique ne marche pas bien pour le graphe.\n⌛ Nenna (s. d.b) Pour comprendre le problème d’OT régularisé pour l’entropie.\n⌛ Nenna (s. d.a)\n\n\n\nInférence de graphes\n\n⌛ Aitchison (1982), en cours\n❗📖 Payne et al. (2023) sur MixMPLN\n\n\n\nCausalité\n\n❗📖 Bystrova (s. d.)\n\n\n\nLargest Gaps\n\n❗📖 Brault et Channarond (2023)\n❗📖 Channarond, Daudin, et Robin (2012) le papier qui introduit le Largest Gaps" }, @@ -476,67 +476,102 @@ "text": "Repoussés ou abandonnés\n\n\n\n\n\n\nDéplier pour voir\n\n\n\n\n\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps.\n\n\nJe n’arrive pas à comprendre les erreurs qui arrivent\n\n\nLire Biological Networks - François Képès\nRegarder les applications pour les collections de réseaux recommender system Pas pertinents et trop gros\n\n\n\n\nListing 1: Recommender systems data\n\n\nPar exemple :\n\nListe de recommendation data\n\n\n\n\n\nPapier plus multi-applications\n\nDonnées d’Elisa herbivore ?\nDonnées urbanisations ?\n\n\n\nAutour de l’article et du package\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation.\n\n\n\nSimulations article\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées." }, { - "objectID": "suivi/2026-7/2026-7.html", - "href": "suivi/2026-7/2026-7.html", - "title": "Bilan semaine 7 2026 : 09 février - 13 février", + "objectID": "suivi/2025-50/2025-50.html", + "href": "suivi/2025-50/2025-50.html", + "title": "Bilan semaine 50 2025 : 08 décembre - 12 décembre", "section": "", - "text": "Petites opérations sur les OTUs (regarder la matrice dans les yeux):\n\nRanger les OTUs par variances (i.e. sd(OTU_j))\n\nHMC sur-dispersés (au-dessus bissectrice)\nEnterotype phyloseq sous-disp\n\nRegarder la proportion de 1. taxon rares, 2. zeros.\nFaire des coupures selon niveaux taxonomiques et regarder si \\mathbb{V}_{\\text{intra}} \\approx \\mathbb{V}_{\\text{inter}}\nBonus: faire ça dans qmd et voir si forge permet gitlab pages\n\n✅ Avec blockmodels, codé un LBM-Séquentiel. Des différences contrastées…\n\nTODO Ajouter lien vers notebooks résultats\n\nRelire Peixoto (2014)\n\nRegarder les gens qui citent les travaux de Peixoto\n\n⌛ En cours Implémentation blockmodels LBM avec covariables sur proportions (voir Équation 1)\n\n\n\n\n\n\n\nIdées\n\n\n\n\nTravailler sur Fungus Tree network\n⌛Demander à PB et SD, ils regardent : Comparaison covar prop avec GREMLINS multipartite sur (log(dist_phylo), fungus-tree)\nTrouver manière de faire un compromis : \\ell(Y,Z,W;\\theta) - \\lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?\n⌛ Mise à jour partielle des \\tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \\tau à chaque itération. Et échantillonnage stratifié selon l’arbre ?\n\n⌛ Simulations avec n_2 croissant lancée sur Migale\nRéimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\\times(\\tau^{(1)})^{\\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.\n\n\n\n\n\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\n👶 (délégué à Mona) Clustering sur Doré :\n\nAjouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.\n\n\n\n\n\n✅ En préparation d’un fichier (réu avec JBL à 10h45 le 06/02/2026). Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \\pmb\\pi et \\pmb{\\rho} en utilisant les \\pmb B^{\\top}\\pmb X et en renvoyant l’ELBO adaptée.\n\n😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !\n😢 Besoin de réfléchir a une bonne implémentation.\n\n\n\n\n\\begin{align*}\n\\pmb{\\beta}_{r}& = \\begin{pmatrix}\n \\beta_{r,0}\\\\\n \\vdots\\\\\n \\beta_{r,p}\n\\end{pmatrix}, & X_{j,\\bullet} = \\begin{pmatrix}\n 1 = x_{0,j} & x_{1,j} & \\dots & x_{p,j}\n\\end{pmatrix}\\\\\nX_{j,\\bullet} \\pmb{\\beta}_r& = \\beta_{r,0} x_{0,j} + \\beta_{r,1} x_{1,j} + \\dots + \\beta_{r,p} x_{p,j} & \\approx \\log(\\rho_r^j) \\\\\nB & = \\begin{pmatrix}\n\\pmb{\\beta}_1 \\dots \\pmb{\\beta}_r \\dots \\pmb{\\beta}_R\n\\end{pmatrix} & X_{j,\\bullet}B \\approx \\log(\\pmb{\\rho}^j) \\\\\nX B & \\approx \\log((\\pmb{\\rho}^j)_{j=1,\\dots,n_2}) = \\log(\\pmb{\\Rho})\\\\\n\\end{align*} Et pour les probas en lignes du LBM \\begin{align*}\n\\pmb{\\gamma}_{q}& = \\begin{pmatrix}\n \\gamma_{q,0}\\\\\n \\vdots\\\\\n \\gamma_{q,d}\n\\end{pmatrix}, & V_{i,\\bullet} = \\begin{pmatrix}\n 1 = v_{0,i} & v_{1,i} & \\dots & v_{d,i}\n\\end{pmatrix}\\\\\nV_{i,\\bullet} \\pmb{\\gamma}_q & = \\gamma_{q,0} v_{0,i} + \\gamma_{q,1} v_{1,i} + \\dots + \\gamma_{q,d} v_{d,i} & \\approx \\log(\\pi_q^i) \\\\\n\\Gamma & = \\begin{pmatrix}\n\\gamma_1 \\dots \\pmb{\\gamma}_q \\dots \\pmb{\\gamma}_Q\n\\end{pmatrix} & V_{i,\\bullet} \\Gamma \\approx \\log(\\pmb{\\pi}^i) \\\\\nV \\Gamma & \\approx \\log((\\pmb{\\pi}^i)_{i=1,\\dots,n_1}) = \\log(\\pmb{\\Pi})\n\n\n\\end{align*}\n\n\n\nSoient B,B^{\\prime} avec B_{\\bullet,R} = B^{\\prime}_{\\bullet,R} = \\vec{0}_{p+1} et X de rang plein tel que X^{\\top}X soit inversible.\n\\begin{align*}\n&\\sigma(XB) = \\sigma(XB^{\\prime})\\\\\n&\\implies \\exists C = \\begin{pmatrix}c_1 \\\\ \\vdots \\\\ c_j \\\\ \\vdots \\\\ c_{n_2}\\end{pmatrix} \\in \\mathbb{R}^{n_2}, X B = X B^{\\prime} + C \\pmb{1}_{R}^{\\top} \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, (X B)_{j,r} = (X B^{\\prime})_{j,r} + (C \\pmb{1}_{R}^{\\top})_{j,r} \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall r\\in\\{1\\dots,R\\}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\beta_{k,r} = \\sum_{k=1}^{p+1} x_{j,k} \\beta^{\\prime}_{k,r} + c_j\\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\beta_{k,R} = \\sum_{k=1}^{p+1} x_{j,k} \\beta^{\\prime}_{k,R} + c_j \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\times 0 = \\sum_{k=1}^{p+1} x_{j,k} \\times 0 + c_j \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, 0 = 0 + c_j \\implies c_j = 0 \\\\\n&\\implies C = \\begin{pmatrix} 0 \\\\ \\vdots \\\\ 0 \\end{pmatrix} \\text{and thus}, XB = XB^{\\prime} \\\\\n& \\implies (X^{\\top} X)^{-1}X^{\\top} X B = (X^{\\top} X)^{-1}X^{\\top} X B^{\\prime} \\implies B=B^{\\prime}\n\\end{align*}\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\\tag{1}\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" + "text": "⚠️ IL Y A UNE TYPO SUR LE SIGNE DE L’ENTROPIE POUR LE PAPIER: - \\mathcal{H} au lieu de +\\mathcal{H}\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nFaire tourner clustering sur Trojelsgaard\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\nFaire LBM sur niveau taxonomique grossier, initialiser avec le résultat pour un niveau plus fin et ainsi de suite.\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n👶 (délégué à Mona) Clustering sur Doré :\n\nRegarder pour les couples date+nom les études et le nombre de réseaux analysables (Possible demander à Élisa)\n\n⌛ Chamberlain et al semble intéressant à regarder ! Voir le Rmarkdown\n\nClusteriser sur la base des noms et voir parmi les réseaux Européens (désagrégés ?)\nSi M > 10, alors voir si je retrouve les mêmes résultats que dans les études.\nRegarder Largest gap sur réseaux Doré\n⌛ Essayer clustering sur supinfo\n\nCAH et Kmeans tendent vers faire K = 13 clusters sur les supinfos\nEnrichir avec des métriques sur les réseaux (nestedness, connectance autres ?)\nDemander à Elisa pour la signification des métadonnées\nDemander à Elisa une fois vu cohérences de groupe voir pour interprétation écologiques ?\nAlgo de clustering sur les groupes trouvés\n\n\n\n\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\nPlusieurs possibilités pour la définition de \\rho_r^j\n\n\nDénominateur pas correct, ne somme pas à 1.\n\\rho_r^j = \\frac{\\exp{\\beta_r X_j\\mathbf{1}_{\\{r\\neq R\\}}}}{1+\\sum_{s=1}^{R-1} \\beta_s X_j}, \\beta_R = 0 et \\rho_R^{j} = \\frac{1}{1+\\sum_{s=1}^{R-1} \\beta_s X_j} (pas de compréhension intuitive)\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j \\mathbb{1}_{r\\neq R} - \\log (1+\\sum_{s=1}^{R-1} \\beta_s X_j))]\n\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j}{1+\\sum_{s=1}^{R-1} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\frac{1}{1+\\sum_{s=1}^{R-1} \\beta_s X_j} \\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_R^j \\bigr) X_j\\biggr]\n\\end{align*}\n❓ Gradient mesure l’écart entre probas a posteriori et la proba a priori du groupe de référence ?\nConclusion: Il manque l’exponentielle cette formulation ne somme pas à 1.\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" }, { - "objectID": "suivi/2026-7/2026-7.html#todo-list", - "href": "suivi/2026-7/2026-7.html#todo-list", - "title": "Bilan semaine 7 2026 : 09 février - 13 février", + "objectID": "suivi/2025-50/2025-50.html#todo-list", + "href": "suivi/2025-50/2025-50.html#todo-list", + "title": "Bilan semaine 50 2025 : 08 décembre - 12 décembre", "section": "", - "text": "Petites opérations sur les OTUs (regarder la matrice dans les yeux):\n\nRanger les OTUs par variances (i.e. sd(OTU_j))\n\nHMC sur-dispersés (au-dessus bissectrice)\nEnterotype phyloseq sous-disp\n\nRegarder la proportion de 1. taxon rares, 2. zeros.\nFaire des coupures selon niveaux taxonomiques et regarder si \\mathbb{V}_{\\text{intra}} \\approx \\mathbb{V}_{\\text{inter}}\nBonus: faire ça dans qmd et voir si forge permet gitlab pages\n\n✅ Avec blockmodels, codé un LBM-Séquentiel. Des différences contrastées…\n\nTODO Ajouter lien vers notebooks résultats\n\nRelire Peixoto (2014)\n\nRegarder les gens qui citent les travaux de Peixoto\n\n⌛ En cours Implémentation blockmodels LBM avec covariables sur proportions (voir Équation 1)\n\n\n\n\n\n\n\nIdées\n\n\n\n\nTravailler sur Fungus Tree network\n⌛Demander à PB et SD, ils regardent : Comparaison covar prop avec GREMLINS multipartite sur (log(dist_phylo), fungus-tree)\nTrouver manière de faire un compromis : \\ell(Y,Z,W;\\theta) - \\lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?\n⌛ Mise à jour partielle des \\tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \\tau à chaque itération. Et échantillonnage stratifié selon l’arbre ?\n\n⌛ Simulations avec n_2 croissant lancée sur Migale\nRéimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\\times(\\tau^{(1)})^{\\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.\n\n\n\n\n\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\n👶 (délégué à Mona) Clustering sur Doré :\n\nAjouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.\n\n\n\n\n\n✅ En préparation d’un fichier (réu avec JBL à 10h45 le 06/02/2026). Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \\pmb\\pi et \\pmb{\\rho} en utilisant les \\pmb B^{\\top}\\pmb X et en renvoyant l’ELBO adaptée.\n\n😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !\n😢 Besoin de réfléchir a une bonne implémentation.\n\n\n\n\n\\begin{align*}\n\\pmb{\\beta}_{r}& = \\begin{pmatrix}\n \\beta_{r,0}\\\\\n \\vdots\\\\\n \\beta_{r,p}\n\\end{pmatrix}, & X_{j,\\bullet} = \\begin{pmatrix}\n 1 = x_{0,j} & x_{1,j} & \\dots & x_{p,j}\n\\end{pmatrix}\\\\\nX_{j,\\bullet} \\pmb{\\beta}_r& = \\beta_{r,0} x_{0,j} + \\beta_{r,1} x_{1,j} + \\dots + \\beta_{r,p} x_{p,j} & \\approx \\log(\\rho_r^j) \\\\\nB & = \\begin{pmatrix}\n\\pmb{\\beta}_1 \\dots \\pmb{\\beta}_r \\dots \\pmb{\\beta}_R\n\\end{pmatrix} & X_{j,\\bullet}B \\approx \\log(\\pmb{\\rho}^j) \\\\\nX B & \\approx \\log((\\pmb{\\rho}^j)_{j=1,\\dots,n_2}) = \\log(\\pmb{\\Rho})\\\\\n\\end{align*} Et pour les probas en lignes du LBM \\begin{align*}\n\\pmb{\\gamma}_{q}& = \\begin{pmatrix}\n \\gamma_{q,0}\\\\\n \\vdots\\\\\n \\gamma_{q,d}\n\\end{pmatrix}, & V_{i,\\bullet} = \\begin{pmatrix}\n 1 = v_{0,i} & v_{1,i} & \\dots & v_{d,i}\n\\end{pmatrix}\\\\\nV_{i,\\bullet} \\pmb{\\gamma}_q & = \\gamma_{q,0} v_{0,i} + \\gamma_{q,1} v_{1,i} + \\dots + \\gamma_{q,d} v_{d,i} & \\approx \\log(\\pi_q^i) \\\\\n\\Gamma & = \\begin{pmatrix}\n\\gamma_1 \\dots \\pmb{\\gamma}_q \\dots \\pmb{\\gamma}_Q\n\\end{pmatrix} & V_{i,\\bullet} \\Gamma \\approx \\log(\\pmb{\\pi}^i) \\\\\nV \\Gamma & \\approx \\log((\\pmb{\\pi}^i)_{i=1,\\dots,n_1}) = \\log(\\pmb{\\Pi})\n\n\n\\end{align*}\n\n\n\nSoient B,B^{\\prime} avec B_{\\bullet,R} = B^{\\prime}_{\\bullet,R} = \\vec{0}_{p+1} et X de rang plein tel que X^{\\top}X soit inversible.\n\\begin{align*}\n&\\sigma(XB) = \\sigma(XB^{\\prime})\\\\\n&\\implies \\exists C = \\begin{pmatrix}c_1 \\\\ \\vdots \\\\ c_j \\\\ \\vdots \\\\ c_{n_2}\\end{pmatrix} \\in \\mathbb{R}^{n_2}, X B = X B^{\\prime} + C \\pmb{1}_{R}^{\\top} \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, (X B)_{j,r} = (X B^{\\prime})_{j,r} + (C \\pmb{1}_{R}^{\\top})_{j,r} \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall r\\in\\{1\\dots,R\\}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\beta_{k,r} = \\sum_{k=1}^{p+1} x_{j,k} \\beta^{\\prime}_{k,r} + c_j\\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\beta_{k,R} = \\sum_{k=1}^{p+1} x_{j,k} \\beta^{\\prime}_{k,R} + c_j \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, \\sum_{k=1}^{p+1} x_{j,k} \\times 0 = \\sum_{k=1}^{p+1} x_{j,k} \\times 0 + c_j \\\\\n&\\implies \\exists C \\in \\mathbb{R}^{n_2}, \\forall j\\in\\{1,\\dots,n_2\\}, 0 = 0 + c_j \\implies c_j = 0 \\\\\n&\\implies C = \\begin{pmatrix} 0 \\\\ \\vdots \\\\ 0 \\end{pmatrix} \\text{and thus}, XB = XB^{\\prime} \\\\\n& \\implies (X^{\\top} X)^{-1}X^{\\top} X B = (X^{\\top} X)^{-1}X^{\\top} X B^{\\prime} \\implies B=B^{\\prime}\n\\end{align*}\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\\tag{1}\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" + "text": "⚠️ IL Y A UNE TYPO SUR LE SIGNE DE L’ENTROPIE POUR LE PAPIER: - \\mathcal{H} au lieu de +\\mathcal{H}\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nFaire tourner clustering sur Trojelsgaard\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\nFaire LBM sur niveau taxonomique grossier, initialiser avec le résultat pour un niveau plus fin et ainsi de suite.\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nPour clustering de collections sur données réelles :\n→ L’intuition de Pierre semble être confirmé, les dissimilarités semblent arrêter de varier sensiblement pour de grandes valeurs (Q_1,Q_2).\n👶 (délégué à Mona) Clustering sur Doré :\n\nRegarder pour les couples date+nom les études et le nombre de réseaux analysables (Possible demander à Élisa)\n\n⌛ Chamberlain et al semble intéressant à regarder ! Voir le Rmarkdown\n\nClusteriser sur la base des noms et voir parmi les réseaux Européens (désagrégés ?)\nSi M > 10, alors voir si je retrouve les mêmes résultats que dans les études.\nRegarder Largest gap sur réseaux Doré\n⌛ Essayer clustering sur supinfo\n\nCAH et Kmeans tendent vers faire K = 13 clusters sur les supinfos\nEnrichir avec des métriques sur les réseaux (nestedness, connectance autres ?)\nDemander à Elisa pour la signification des métadonnées\nDemander à Elisa une fois vu cohérences de groupe voir pour interprétation écologiques ?\nAlgo de clustering sur les groupes trouvés\n\n\n\n\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\nPlusieurs possibilités pour la définition de \\rho_r^j\n\n\nDénominateur pas correct, ne somme pas à 1.\n\\rho_r^j = \\frac{\\exp{\\beta_r X_j\\mathbf{1}_{\\{r\\neq R\\}}}}{1+\\sum_{s=1}^{R-1} \\beta_s X_j}, \\beta_R = 0 et \\rho_R^{j} = \\frac{1}{1+\\sum_{s=1}^{R-1} \\beta_s X_j} (pas de compréhension intuitive)\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j \\mathbb{1}_{r\\neq R} - \\log (1+\\sum_{s=1}^{R-1} \\beta_s X_j))]\n\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j}{1+\\sum_{s=1}^{R-1} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\frac{1}{1+\\sum_{s=1}^{R-1} \\beta_s X_j} \\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_R^j \\bigr) X_j\\biggr]\n\\end{align*}\n❓ Gradient mesure l’écart entre probas a posteriori et la proba a priori du groupe de référence ?\nConclusion: Il manque l’exponentielle cette formulation ne somme pas à 1.\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" }, { - "objectID": "suivi/2026-7/2026-7.html#a-discuter", - "href": "suivi/2026-7/2026-7.html#a-discuter", - "title": "Bilan semaine 7 2026 : 09 février - 13 février", + "objectID": "suivi/2025-50/2025-50.html#a-discuter", + "href": "suivi/2025-50/2025-50.html#a-discuter", + "title": "Bilan semaine 50 2025 : 08 décembre - 12 décembre", "section": "A discuter", "text": "A discuter\n\n🆕 Voir pour des Réseaux / GDR ou aller\n🆕 Chercher des cours à suivre" }, { - "objectID": "suivi/2026-7/2026-7.html#biblio-à-faire", - "href": "suivi/2026-7/2026-7.html#biblio-à-faire", - "title": "Bilan semaine 7 2026 : 09 février - 13 février", + "objectID": "suivi/2025-50/2025-50.html#biblio-à-faire", + "href": "suivi/2025-50/2025-50.html#biblio-à-faire", + "title": "Bilan semaine 50 2025 : 08 décembre - 12 décembre", "section": "Biblio à faire", "text": "Biblio à faire\n\nRegarder Transport optimal graphes bipartite." }, { - "objectID": "suivi/2026-7/2026-7.html#lectures-en-cours", - "href": "suivi/2026-7/2026-7.html#lectures-en-cours", - "title": "Bilan semaine 7 2026 : 09 février - 13 février", + "objectID": "suivi/2025-50/2025-50.html#lectures-en-cours", + "href": "suivi/2025-50/2025-50.html#lectures-en-cours", + "title": "Bilan semaine 50 2025 : 08 décembre - 12 décembre", "section": "Lectures en cours 📚", "text": "Lectures en cours 📚\n\nHDR Vincent Brault\n\n⌛ Chap 2 : Creuser l’idée de maximiser l’énergie libre, très intéressant regarder le critère CARI et lire Robert et al 2021. Actuellement p32 du manuscrit\nChap 3\n\n\n\nOT\n\n⌛ Mazelet, Flamary, et Thirion (s. d.) Intéressant pour le transport optimal entre graphes de tailles différentes | Regarder si regularization entropique ne marche pas bien pour le graphe.\n⌛ Nenna (s. d.b) Pour comprendre le problème d’OT régularisé pour l’entropie.\n⌛ Nenna (s. d.a)\n\n\n\nInférence de graphes\n\n⌛ Aitchison (1982), en cours\n❗📖 Payne et al. (2023) sur MixMPLN\n\n\n\nCausalité\n\n❗📖 Bystrova (s. d.)\n\n\n\nLargest Gaps\n\n❗📖 Brault et Channarond (2023)\n❗📖 Channarond, Daudin, et Robin (2012) le papier qui introduit le Largest Gaps" }, { - "objectID": "suivi/2025-14/2025-14.html", - "href": "suivi/2025-14/2025-14.html", - "title": "Bilan semaine 14 2025 : 24-28 mars", + "objectID": "suivi/2025-18/2025-18.html", + "href": "suivi/2025-18/2025-18.html", + "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", "section": "", - "text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nAgrandir la collection d’application, pas seulement Baldock mais aussi Trojelsgaard par ex\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nPrésenter le réseau Afrique du Sud dès l’intro des réseaux anglais de Baldock\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\nRédiger et modifier les cadres de simulations dans le papier pour qu’ils soient raccord avec les données obtenues.\nLancer clustering iid ascendant sur données sub-Doré.\nVérifier si les Baldock anglais ont des espèces en communs “Do they involve common species?”." + "text": "Lire biblio fournie Julie, Inférence de réseaux : co-occurence\nPapier pour comprendre données\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\n\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\nIntégrer les retours de Sophie\n\n\n\n\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." }, { - "objectID": "suivi/2025-14/2025-14.html#a-faire", - "href": "suivi/2025-14/2025-14.html#a-faire", - "title": "Bilan semaine 14 2025 : 24-28 mars", + "objectID": "suivi/2025-18/2025-18.html#a-faire", + "href": "suivi/2025-18/2025-18.html#a-faire", + "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", "section": "", - "text": "Relire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nAgrandir la collection d’application, pas seulement Baldock mais aussi Trojelsgaard par ex\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nPrésenter le réseau Afrique du Sud dès l’intro des réseaux anglais de Baldock\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\nRédiger et modifier les cadres de simulations dans le papier pour qu’ils soient raccord avec les données obtenues.\nLancer clustering iid ascendant sur données sub-Doré.\nVérifier si les Baldock anglais ont des espèces en communs “Do they involve common species?”." + "text": "Lire biblio fournie Julie, Inférence de réseaux : co-occurence\nPapier pour comprendre données\npbs : variance, bcp de zero, covariables, offset et taxonomie (Reseaux arretes differents niveaux : Genre, OTU …)\n\n\nCombine networks at different taxonomic levels\n\n\nInférence + GREMLINS\n\n\n\n\n\nRelire intro St Clair\nS’inspirer structure pour mon intro\nTrouver biblio intro\nRédiger l’intro\nRegarder les applications pour les collections de réseaux recommender system\nLire les papiers de Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson\nDire résultats nettement meilleurs et variabilités inférieures.\nIntégrer les retours de Sophie\n\n\n\n\n\nComparer sur clustering unipartite avec versions symétriser des par blocs des matrices d’adjacences.\nCorriger structure de simus :\n\nPour noisy \\alpha :\n\nLogit pour envoyer la gaussienne vers (0,1)\nBeta contrainte dans (0,1)\n\nPour noisy links : Générer nb_clustering collections de taille M puis prélever \\epsilon_{max}n_r n_c liens à inverser puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées.\n\n\n\n\n\n\nKmeans sur la densité des réseaux subdoré pour pré-partitionner et clusteriser. Car densités déséquilibrées.\n\n\n\n\n\n\nCréer des vignettes illustrant par exemple des cas de simulations. Possible de mettre l’exemple d’application de Sophie sur les réseaux avec gradient d’urbanisation." }, { - "objectID": "suivi/2025-14/2025-14.html#jai-fait", - "href": "suivi/2025-14/2025-14.html#jai-fait", - "title": "Bilan semaine 14 2025 : 24-28 mars", + "objectID": "suivi/2025-18/2025-18.html#jai-fait", + "href": "suivi/2025-18/2025-18.html#jai-fait", + "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", "section": "J’ai fait", - "text": "J’ai fait\n\nCorriger structure de simus :\n\nPour NA robustness\n\nDéfinir dans la section 3 :\n\n\nRemark that for iid-colBiSBM, \\pi_q, \\rho_r > 0, and thus the blocks exist and are represented in all networks. For the other models, some blocks may not exist in some networks and this is why \\pi_q^m, \\rho_r^m \\geq 0. Using S^{(1)} and S^{(2)} we can define the restricted parameters for each network and we denote them as \\widetilde{\\bm{\\pi}}^m, \\widetilde{\\bm{\\rho}}^m and \\widetilde{\\bm{\\alpha}}^m. The restrictions thus indicate the blocks that are represented in the network m.\n\n\nÉcrire la partie preuve pour identif \\pi-colBiSBM et \\rho-colBiSBM. Identif : \\pi et \\rho en attente retours Pierre et Sophie\nSaint-Clair va passer colSBM sous GrossSBM\nAgrandir la collection d’application, pas seulement Baldock mais aussi Trojelsgaard par ex : Collection agrandie avec Baldock Traveset Souza Cordeniz Trojelsgaard et Gibson, en attente MIGALE. Clustering instable" + "text": "J’ai fait\n\nJdS\n\ncolDEM CSE\n\n\n\nClustering exhaustif Baldock\n\nLe clustering de toutes les 52 partitions s’est fait en 5h30 ! (Mémoïsation)\nPour iid la meilleure partition avec BICL=-9466.911 contre BICL_{algo} = -9466.873 \\pm 0.02205 trouvé avec l’algo \nPour \\pi\\rho la meilleure partition avec BICL = -9497.92 contre BICL_{algo} =-9497.92 \\pm 0.00009" }, { - "objectID": "suivi/2025-14/2025-14.html#a-continuer", - "href": "suivi/2025-14/2025-14.html#a-continuer", - "title": "Bilan semaine 14 2025 : 24-28 mars", + "objectID": "suivi/2025-18/2025-18.html#a-continuer", + "href": "suivi/2025-18/2025-18.html#a-continuer", + "title": "Bilan semaine 18 2025 : 28 avril - 2 mai", "section": "A continuer", - "text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nPour sub doré en attente MIGALE augmenter le nbre de répèt de la procédure." + "text": "A continuer\n\nRésultats simus NA Erreur pour certaines conditions : Pour NA robustness générer nb_rep collections de taille M=2 et prélever \\epsilon_{max}n_r n_c liens à retirer puis pour les \\epsilon < \\epsilon_{max} prélever dans la liste des indices afin d’avoir des perturbations emboitées. Il faut que j’ajoute un mécanisme pour reprendre des conditions qui ont plantés et que je skip dans le future_lapply les conditions déjà traitées (pour avoir la même seed quand je vais exécuter le code). Implémenté les missing steps en attente des résultats MIGALE.\nLire Biological Networks - François Képès\nRelancer simus d’inférence avec n = 240 pour voir si la qualité augmenter (se rassurer). En fait on est déjà à 240, j’ai relancé avec M = 4 au lieu de M = 2. En attente résultats MIGALE\n\n\nApplications\n\nIdée Sophie: Regarder clustering de données plantes-pollinisateur selon gradient d’urbanisation\n\n\nSophie a fait une appli qui marche bien et va dans le sens de l’analyse faite (à savoir pas d’effet du gradien d’urbanisation). À continuer pour l’intégrer dans l’article !\n\n\n\nSimulations article\n\nRelancer simulations de clustering avec M = 30 où M_i = 10, \\forall i. En attente retour MIGALE Relancer simus clustering avec VEM steps = 10 000 et plus nombreux init pour spectral. Ajouter simu clustering métriques nb sous-collections obtenues. Vérifier les résultats obtenus si ARI = 0. Et augmenter la taille M = 30 avec M_1 = M_2 = M_3 = 10." + }, + { + "objectID": "suivi/2026-12/2026-12.html", + "href": "suivi/2026-12/2026-12.html", + "title": "Bilan semaine 9 2026 : 16 mars - 20 mars", + "section": "", + "text": "Faire tourner clustering colBiSBM sur les clusters dégagés par Mona et l’accompagner sur la rédaction de son poster\nPréparer ma présentation (voir le bloc ci-après) pour Rochebrune et donner un titre :\n\n“Comparing networks, a challenging task?” (NUL/20)\n“High and low: comparing networks, a burden for the mind what works and what don’t(?)”\n\nFinir implémentation dans sbm de blockmodels avec covariables sur les noeuds\nBricoler une pipeline sbm |> nnet::multinom comme performance de référence pour l’introduction de covariables\nComprendre pourquoi l’idée géniale de Sophie est remise en question\nCorriger les copies des 1As\n\n\n\n\n\n\n\nIdées présentation Rochebrune\n\n\n\n\ncolBiSBM: ce qui marche (et à la fin la galère du clustering)\nTransition sur les OTUs et motivations de pourquoi c’est galère (#OTU>>#Sample, dépendance par la phylogénie …)\nMotivation du co-clustering (LBM), trouver des groupes d’échantillons et d’OTUs qui exhibent des comportement différents (pathologies, sols particuliers, échantillon alimentaire avec une flore d’intérêt …)\nPremière idée: LBM séquentiel, faire repartir des \\tau^{l} pour initialiser les \\tau^{l+1} selon l’arbre phylogénétique\n\nIdées: faciliter l’exploration du paysage de l’ELBO en se plaçant dans une région de paramètres qui a du sens phylo et donc en sortir indiquerait un signal dans les données.\nProblèmes: ne résout pas le problème de la dimensionnalité en les OTUs\nComme implém., performances pas incroyable et signal peu clair.\n\nDeuxième idée: SBM et LBM avec covariables sur les noeuds. Reconstruire des positions dans un espace phylogénétique à partir des matrices de distances phylogénétique (et donc en accord avec l’arbre). Mais aussi modèle plus large pour prendre en compte diverses situations (trouver des exemples d’autres données?).\n\nIdées: possible de former les groupes a priori selon les tendances dans les covariables (reflet de la phylogénie) et mettre à jour selon les données\nQuasiment implémenté dans {blockmodels} et dans {sbm} (j’aimerai pouvoir dire le jour de ma présentation que c’est dispo sur la version de développement, il va falloir charbonner de mon côté).\nThéoriquement: on a l’identifiabilité (ou pas vu la pratique?)\nProblèmes: Ne résoud pas les problèmes de calculs, en pratique on ne retrouve pas les bons coefficients (label-switching?)\n\nTroisième idée: Utiliser la structure de l’arbre phylogénétique pour encoder une relation des positions latentes dans un Latent Position Model (LPM).\n\nDétail: pour chaque couche l, chaque individu de la couche i et son ancêtre j=Ancestor(i) (CITER LES PAPIERS A L’ORIGINE DE L’IDEE), on écrit \\gamma_{l,i} = \\gamma_{l-1,j=Ancestor(i)} + \\delta_{l,i} = \\gamma_{0} + \\sum_{k\\in Ancestry(i)} \\delta_{l,k} (puisque qu’on a un unique ancêtre dans chaque couche l), les noeuds qui partagent un ancêtre commun partage la position latente à ce niveau et lui ajoute un décalage \\delta.\nRemarque: Peut-être possible de gérer les cas de transferts horizontaux en élargissant le concept de lignée ancestrale?\nIdée: (casquette de biologiste) possible d’avoir dans une même lignée phylogénétique des individus qui se spécialisent voire qui développent une convergence évolutive et acquièrent des traits phénotypiques qui ressemblent à d’autres familles. Dans ce cas, le \\delta_{l,i} rapprochent le \\gamma_{l,i} d’un \\gamma_{l, i^{\\prime}} qui a le trait commun.\nProblème: les calculs seraient ils simplifiés? pas sûr. Et je n’y ai pas encore touché.\n\nUtiliser les Hierarchical SBM et LBM de Peixoto dans son package graphtools pour initialiser l’arbre liant les couches avec l’arbre phylogénétique.\n\n\n\n\n\n\n\nPetites opérations sur les OTUs (regarder la matrice dans les yeux):\n\nRanger les OTUs par variances (i.e. sd(OTU_j))\n\nHMC sur-dispersés (au-dessus bissectrice)\nEnterotype phyloseq sous-disp\n\nRegarder la proportion de 1. taxon rares, 2. zeros.\nFaire des coupures selon niveaux taxonomiques et regarder si \\mathbb{V}_{\\text{intra}} \\approx \\mathbb{V}_{\\text{inter}}\nBonus: faire ça dans qmd et voir si forge permet gitlab pages\n\nRelire Peixoto (2014)\n\nRegarder les gens qui citent les travaux de Peixoto\nUtiliser graphtools en initialisant la recherche Nested avec le partitionnement donné par l’arbre phylogénétique.\n\n\n\n\n\n\n\n\nIdées\n\n\n\n\nTrouver manière de faire un compromis : \\ell(Y,Z,W;\\theta) - \\lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?\n⌛ Mise à jour partielle des \\tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \\tau à chaque itération. Et échantillonnage stratifié selon l’arbre ?\n\n⌛ Simulations avec n_2 croissant lancée sur Migale\nRéimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\\times(\\tau^{(1)})^{\\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.\n\n\n\n\n\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\n👶 (délégué à Mona) Clustering sur Doré :\n\nAjouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.\n\n\n\n\n\n\n⌛ (En cours) Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \\pmb\\pi et \\pmb{\\rho} en utilisant les \\pmb B^{\\top}\\pmb X et en renvoyant l’ELBO adaptée.\n\n😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !\n😢 Besoin de réfléchir a une bonne implémentation.\n\n\nJ’ai codé l’optimisation et les transferts mais il faut que je vérifie que tout fonctionne\n\n✅ Appliqué multipartite sur \\forall i, OTU_i \\times Sample: \n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\n🆕 SparCC à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" + }, + { + "objectID": "suivi/2026-12/2026-12.html#todo-list", + "href": "suivi/2026-12/2026-12.html#todo-list", + "title": "Bilan semaine 9 2026 : 16 mars - 20 mars", + "section": "", + "text": "Faire tourner clustering colBiSBM sur les clusters dégagés par Mona et l’accompagner sur la rédaction de son poster\nPréparer ma présentation (voir le bloc ci-après) pour Rochebrune et donner un titre :\n\n“Comparing networks, a challenging task?” (NUL/20)\n“High and low: comparing networks, a burden for the mind what works and what don’t(?)”\n\nFinir implémentation dans sbm de blockmodels avec covariables sur les noeuds\nBricoler une pipeline sbm |> nnet::multinom comme performance de référence pour l’introduction de covariables\nComprendre pourquoi l’idée géniale de Sophie est remise en question\nCorriger les copies des 1As\n\n\n\n\n\n\n\nIdées présentation Rochebrune\n\n\n\n\ncolBiSBM: ce qui marche (et à la fin la galère du clustering)\nTransition sur les OTUs et motivations de pourquoi c’est galère (#OTU>>#Sample, dépendance par la phylogénie …)\nMotivation du co-clustering (LBM), trouver des groupes d’échantillons et d’OTUs qui exhibent des comportement différents (pathologies, sols particuliers, échantillon alimentaire avec une flore d’intérêt …)\nPremière idée: LBM séquentiel, faire repartir des \\tau^{l} pour initialiser les \\tau^{l+1} selon l’arbre phylogénétique\n\nIdées: faciliter l’exploration du paysage de l’ELBO en se plaçant dans une région de paramètres qui a du sens phylo et donc en sortir indiquerait un signal dans les données.\nProblèmes: ne résout pas le problème de la dimensionnalité en les OTUs\nComme implém., performances pas incroyable et signal peu clair.\n\nDeuxième idée: SBM et LBM avec covariables sur les noeuds. Reconstruire des positions dans un espace phylogénétique à partir des matrices de distances phylogénétique (et donc en accord avec l’arbre). Mais aussi modèle plus large pour prendre en compte diverses situations (trouver des exemples d’autres données?).\n\nIdées: possible de former les groupes a priori selon les tendances dans les covariables (reflet de la phylogénie) et mettre à jour selon les données\nQuasiment implémenté dans {blockmodels} et dans {sbm} (j’aimerai pouvoir dire le jour de ma présentation que c’est dispo sur la version de développement, il va falloir charbonner de mon côté).\nThéoriquement: on a l’identifiabilité (ou pas vu la pratique?)\nProblèmes: Ne résoud pas les problèmes de calculs, en pratique on ne retrouve pas les bons coefficients (label-switching?)\n\nTroisième idée: Utiliser la structure de l’arbre phylogénétique pour encoder une relation des positions latentes dans un Latent Position Model (LPM).\n\nDétail: pour chaque couche l, chaque individu de la couche i et son ancêtre j=Ancestor(i) (CITER LES PAPIERS A L’ORIGINE DE L’IDEE), on écrit \\gamma_{l,i} = \\gamma_{l-1,j=Ancestor(i)} + \\delta_{l,i} = \\gamma_{0} + \\sum_{k\\in Ancestry(i)} \\delta_{l,k} (puisque qu’on a un unique ancêtre dans chaque couche l), les noeuds qui partagent un ancêtre commun partage la position latente à ce niveau et lui ajoute un décalage \\delta.\nRemarque: Peut-être possible de gérer les cas de transferts horizontaux en élargissant le concept de lignée ancestrale?\nIdée: (casquette de biologiste) possible d’avoir dans une même lignée phylogénétique des individus qui se spécialisent voire qui développent une convergence évolutive et acquièrent des traits phénotypiques qui ressemblent à d’autres familles. Dans ce cas, le \\delta_{l,i} rapprochent le \\gamma_{l,i} d’un \\gamma_{l, i^{\\prime}} qui a le trait commun.\nProblème: les calculs seraient ils simplifiés? pas sûr. Et je n’y ai pas encore touché.\n\nUtiliser les Hierarchical SBM et LBM de Peixoto dans son package graphtools pour initialiser l’arbre liant les couches avec l’arbre phylogénétique.\n\n\n\n\n\n\n\nPetites opérations sur les OTUs (regarder la matrice dans les yeux):\n\nRanger les OTUs par variances (i.e. sd(OTU_j))\n\nHMC sur-dispersés (au-dessus bissectrice)\nEnterotype phyloseq sous-disp\n\nRegarder la proportion de 1. taxon rares, 2. zeros.\nFaire des coupures selon niveaux taxonomiques et regarder si \\mathbb{V}_{\\text{intra}} \\approx \\mathbb{V}_{\\text{inter}}\nBonus: faire ça dans qmd et voir si forge permet gitlab pages\n\nRelire Peixoto (2014)\n\nRegarder les gens qui citent les travaux de Peixoto\nUtiliser graphtools en initialisant la recherche Nested avec le partitionnement donné par l’arbre phylogénétique.\n\n\n\n\n\n\n\n\nIdées\n\n\n\n\nTrouver manière de faire un compromis : \\ell(Y,Z,W;\\theta) - \\lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?\n⌛ Mise à jour partielle des \\tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \\tau à chaque itération. Et échantillonnage stratifié selon l’arbre ?\n\n⌛ Simulations avec n_2 croissant lancée sur Migale\nRéimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\\times(\\tau^{(1)})^{\\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.\n\n\n\n\n\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\n👶 (délégué à Mona) Clustering sur Doré :\n\nAjouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.\n\n\n\n\n\n\n⌛ (En cours) Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \\pmb\\pi et \\pmb{\\rho} en utilisant les \\pmb B^{\\top}\\pmb X et en renvoyant l’ELBO adaptée.\n\n😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !\n😢 Besoin de réfléchir a une bonne implémentation.\n\n\nJ’ai codé l’optimisation et les transferts mais il faut que je vérifie que tout fonctionne\n\n✅ Appliqué multipartite sur \\forall i, OTU_i \\times Sample: \n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\n🆕 SparCC à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" + }, + { + "objectID": "suivi/2026-12/2026-12.html#a-discuter", + "href": "suivi/2026-12/2026-12.html#a-discuter", + "title": "Bilan semaine 9 2026 : 16 mars - 20 mars", + "section": "A discuter", + "text": "A discuter\n\n🆕 Voir pour des Réseaux / GDR ou aller\n🆕 Chercher des cours à suivre" + }, + { + "objectID": "suivi/2026-12/2026-12.html#biblio-à-faire", + "href": "suivi/2026-12/2026-12.html#biblio-à-faire", + "title": "Bilan semaine 9 2026 : 16 mars - 20 mars", + "section": "Biblio à faire", + "text": "Biblio à faire\n\nRegarder Transport optimal graphes bipartite." + }, + { + "objectID": "suivi/2026-12/2026-12.html#lectures-en-cours", + "href": "suivi/2026-12/2026-12.html#lectures-en-cours", + "title": "Bilan semaine 9 2026 : 16 mars - 20 mars", + "section": "Lectures en cours 📚", + "text": "Lectures en cours 📚\n\nHDR Vincent Brault\n\n⌛ Chap 2 : Creuser l’idée de maximiser l’énergie libre, très intéressant regarder le critère CARI et lire Robert et al 2021. Actuellement p32 du manuscrit\nChap 3\n\n\n\nOT\n\n⌛ Mazelet, Flamary, et Thirion (s. d.) Intéressant pour le transport optimal entre graphes de tailles différentes | Regarder si regularization entropique ne marche pas bien pour le graphe.\n⌛ Nenna (s. d.b) Pour comprendre le problème d’OT régularisé pour l’entropie.\n⌛ Nenna (s. d.a)\n\n\n\nInférence de graphes\n\n⌛ Aitchison (1982), en cours\n❗📖 Payne et al. (2023) sur MixMPLN\n\n\n\nCausalité\n\n❗📖 Bystrova (s. d.)\n\n\n\nLargest Gaps\n\n❗📖 Brault et Channarond (2023)\n❗📖 Channarond, Daudin, et Robin (2012) le papier qui introduit le Largest Gaps" }, { "objectID": "suivi/2025-28/2025-28.html", diff --git a/suivi/2025-13/2025-13.html b/suivi/2025-13/2025-13.html index cbe923e..f3d4eb3 100644 --- a/suivi/2025-13/2025-13.html +++ b/suivi/2025-13/2025-13.html @@ -192,7 +192,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-14/2025-14.html b/suivi/2025-14/2025-14.html index 65577d0..138071a 100644 --- a/suivi/2025-14/2025-14.html +++ b/suivi/2025-14/2025-14.html @@ -189,7 +189,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-15/2025-15.html b/suivi/2025-15/2025-15.html index bc3a393..1a7f3ba 100644 --- a/suivi/2025-15/2025-15.html +++ b/suivi/2025-15/2025-15.html @@ -189,7 +189,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-16/2025-16.html b/suivi/2025-16/2025-16.html index f588a7e..e492dbe 100644 --- a/suivi/2025-16/2025-16.html +++ b/suivi/2025-16/2025-16.html @@ -189,7 +189,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-17/2025-17.html b/suivi/2025-17/2025-17.html index 9094f6e..0b20ef3 100644 --- a/suivi/2025-17/2025-17.html +++ b/suivi/2025-17/2025-17.html @@ -192,7 +192,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-18/2025-18.html b/suivi/2025-18/2025-18.html index c7b5b4e..0ab0b60 100644 --- a/suivi/2025-18/2025-18.html +++ b/suivi/2025-18/2025-18.html @@ -193,7 +193,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-19/2025-19.html b/suivi/2025-19/2025-19.html index 161d056..f5e80ff 100644 --- a/suivi/2025-19/2025-19.html +++ b/suivi/2025-19/2025-19.html @@ -190,7 +190,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-20/2025-20.html b/suivi/2025-20/2025-20.html index cd0c164..c3ed208 100644 --- a/suivi/2025-20/2025-20.html +++ b/suivi/2025-20/2025-20.html @@ -191,7 +191,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-21/2025-21.html b/suivi/2025-21/2025-21.html index 8294554..e2b8425 100644 --- a/suivi/2025-21/2025-21.html +++ b/suivi/2025-21/2025-21.html @@ -191,7 +191,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-22/2025-22.html b/suivi/2025-22/2025-22.html index bdb27bd..05a767b 100644 --- a/suivi/2025-22/2025-22.html +++ b/suivi/2025-22/2025-22.html @@ -191,7 +191,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-24/2025-24.html b/suivi/2025-24/2025-24.html index d76d80a..9685d1b 100644 --- a/suivi/2025-24/2025-24.html +++ b/suivi/2025-24/2025-24.html @@ -214,7 +214,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-25/2025-25.html b/suivi/2025-25/2025-25.html index 4862d28..9c9cde9 100644 --- a/suivi/2025-25/2025-25.html +++ b/suivi/2025-25/2025-25.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-27/2025-27.html b/suivi/2025-27/2025-27.html index 3cd9a75..7a2a8cb 100644 --- a/suivi/2025-27/2025-27.html +++ b/suivi/2025-27/2025-27.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-29/2025-29.html b/suivi/2025-29/2025-29.html index 3c121bc..1ec4eb9 100644 --- a/suivi/2025-29/2025-29.html +++ b/suivi/2025-29/2025-29.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-33/2025-33.html b/suivi/2025-33/2025-33.html index f889353..3efcb22 100644 --- a/suivi/2025-33/2025-33.html +++ b/suivi/2025-33/2025-33.html @@ -214,7 +214,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-35/2025-35.html b/suivi/2025-35/2025-35.html index 0e56ddc..ae66485 100644 --- a/suivi/2025-35/2025-35.html +++ b/suivi/2025-35/2025-35.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-38/2025-38.html b/suivi/2025-38/2025-38.html index 95a4ff6..c77210a 100644 --- a/suivi/2025-38/2025-38.html +++ b/suivi/2025-38/2025-38.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-43/2025-43.html b/suivi/2025-43/2025-43.html index 4726e6d..a4a051c 100644 --- a/suivi/2025-43/2025-43.html +++ b/suivi/2025-43/2025-43.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-44/2025-44.html b/suivi/2025-44/2025-44.html index c19f7fd..a53822d 100644 --- a/suivi/2025-44/2025-44.html +++ b/suivi/2025-44/2025-44.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-45/2025-45.html b/suivi/2025-45/2025-45.html index 9ee741a..382466f 100644 --- a/suivi/2025-45/2025-45.html +++ b/suivi/2025-45/2025-45.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-50/2025-50.html b/suivi/2025-50/2025-50.html index 375e7b9..015518e 100644 --- a/suivi/2025-50/2025-50.html +++ b/suivi/2025-50/2025-50.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2025-51/2025-51.html b/suivi/2025-51/2025-51.html index 693a675..72a6f24 100644 --- a/suivi/2025-51/2025-51.html +++ b/suivi/2025-51/2025-51.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2026-12/2026-12.html b/suivi/2026-12/2026-12.html new file mode 100644 index 0000000..ffb9ea2 --- /dev/null +++ b/suivi/2026-12/2026-12.html @@ -0,0 +1,906 @@ + + + + + + + + + + +Bilan semaine 9 2026 : 16 mars - 20 mars – Suivi de la thèse + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + + +
    +
    + +
    + +
    +
    +
    +

    Bilan semaine 9 2026 : 16 mars - 20 mars

    +
    +
    colBiSBM
    +
    inférence
    +
    GNN
    +
    +
    +
    + +
    +
    Auteur·rice
    +
    Affiliation
    + +
    +

    Louis Lacoste

    +
    +
    +

    + MIA Paris-Saclay, INRAE, AgroParisTech, Université Paris-Saclay +

    +
    +
    + +
    + + +
    +
    Date de publication
    +
    +

    16 mars 2026

    +
    +
    + +
    +
    Modifié
    +
    +

    16 mars 2026

    +
    +
    + +
    + + +
    + + + + +
    + + + + + +
    +

    TODO List

    +
    +

    Mes priorités de la semaine

    +
      +
    • Faire tourner clustering colBiSBM sur les clusters dégagés par Mona et l’accompagner sur la rédaction de son poster
    • +
    • Préparer ma présentation (voir le bloc ci-après) pour Rochebrune et donner un titre : +
        +
      • “Comparing networks, a challenging task?” (NUL/20)
      • +
      • “High and low: comparing networks, a burden for the mind what works and what don’t(?)”
      • +
    • +
    • Finir implémentation dans sbm de blockmodels avec covariables sur les noeuds
    • +
    • Bricoler une pipeline sbm |> nnet::multinom comme performance de référence pour l’introduction de covariables
    • +
    • Comprendre pourquoi l’idée géniale de Sophie est remise en question
    • +
    • Corriger les copies des 1As
    • +
    +
    +
    +
    + +
    +
    +Idées présentation Rochebrune +
    +
    +
    +
      +
    • colBiSBM: ce qui marche (et à la fin la galère du clustering)
    • +
    • Transition sur les OTUs et motivations de pourquoi c’est galère (#OTU>>#Sample, dépendance par la phylogénie …)
    • +
    • Motivation du co-clustering (LBM), trouver des groupes d’échantillons et d’OTUs qui exhibent des comportement différents (pathologies, sols particuliers, échantillon alimentaire avec une flore d’intérêt …)
    • +
    • Première idée: LBM séquentiel, faire repartir des \tau^{l} pour initialiser les \tau^{l+1} selon l’arbre phylogénétique +
        +
      • Idées: faciliter l’exploration du paysage de l’ELBO en se plaçant dans une région de paramètres qui a du sens phylo et donc en sortir indiquerait un signal dans les données.
      • +
      • Problèmes: ne résout pas le problème de la dimensionnalité en les OTUs
      • +
      • Comme implém., performances pas incroyable et signal peu clair.
      • +
    • +
    • Deuxième idée: SBM et LBM avec covariables sur les noeuds. Reconstruire des positions dans un espace phylogénétique à partir des matrices de distances phylogénétique (et donc en accord avec l’arbre). Mais aussi modèle plus large pour prendre en compte diverses situations (trouver des exemples d’autres données?). +
        +
      • Idées: possible de former les groupes a priori selon les tendances dans les covariables (reflet de la phylogénie) et mettre à jour selon les données
      • +
      • Quasiment implémenté dans {blockmodels} et dans {sbm} (j’aimerai pouvoir dire le jour de ma présentation que c’est dispo sur la version de développement, il va falloir charbonner de mon côté).
      • +
      • Théoriquement: on a l’identifiabilité (ou pas vu la pratique?)
      • +
      • Problèmes: Ne résoud pas les problèmes de calculs, en pratique on ne retrouve pas les bons coefficients (label-switching?)
      • +
    • +
    • Troisième idée: Utiliser la structure de l’arbre phylogénétique pour encoder une relation des positions latentes dans un Latent Position Model (LPM). +
        +
      • Détail: pour chaque couche l, chaque individu de la couche i et son ancêtre j=Ancestor(i) (CITER LES PAPIERS A L’ORIGINE DE L’IDEE), on écrit \gamma_{l,i} = \gamma_{l-1,j=Ancestor(i)} + \delta_{l,i} = \gamma_{0} + \sum_{k\in Ancestry(i)} \delta_{l,k} (puisque qu’on a un unique ancêtre dans chaque couche l), les noeuds qui partagent un ancêtre commun partage la position latente à ce niveau et lui ajoute un décalage \delta.
      • +
      • Remarque: Peut-être possible de gérer les cas de transferts horizontaux en élargissant le concept de lignée ancestrale?
      • +
      • Idée: (casquette de biologiste) possible d’avoir dans une même lignée phylogénétique des individus qui se spécialisent voire qui développent une convergence évolutive et acquièrent des traits phénotypiques qui ressemblent à d’autres familles. Dans ce cas, le \delta_{l,i} rapprochent le \gamma_{l,i} d’un \gamma_{l, i^{\prime}} qui a le trait commun.
      • +
      • Problème: les calculs seraient ils simplifiés? pas sûr. Et je n’y ai pas encore touché.
      • +
    • +
    • Utiliser les Hierarchical SBM et LBM de Peixoto dans son package graphtools pour initialiser l’arbre liant les couches avec l’arbre phylogénétique.
    • +
    +
    +
    +
    +
    +

    Les autres tâches

    +
      +
    • Petites opérations sur les OTUs (regarder la matrice dans les yeux): +
        +
      • Ranger les OTUs par variances (i.e. sd(OTU_j)) +
          +
        • HMC sur-dispersés (au-dessus bissectrice)
        • +
        • Enterotype phyloseq sous-disp
        • +
      • +
      • Regarder la proportion de 1. taxon rares, 2. zeros.
      • +
      • Faire des coupures selon niveaux taxonomiques et regarder si \mathbb{V}_{\text{intra}} \approx \mathbb{V}_{\text{inter}}
      • +
      • Bonus: faire ça dans qmd et voir si forge permet gitlab pages
      • +
    • +
    • Relire Peixoto (2014) +
        +
      • Regarder les gens qui citent les travaux de Peixoto
      • +
      • Utiliser graphtools en initialisant la recherche Nested avec le partitionnement donné par l’arbre phylogénétique.
      • +
    • +
    +
    +
    +
    + +
    +
    +Idées +
    +
    +
    +
      +
    • Trouver manière de faire un compromis : \ell(Y,Z,W;\theta) - \lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?
    • +
    • ⌛ Mise à jour partielle des \tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \tau à chaque itération. Et échantillonnage stratifié selon l’arbre ? +
        +
      • ⌛ Simulations avec n_2 croissant lancée sur Migale
      • +
      • Réimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\times(\tau^{(1)})^{\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.
      • +
    • +
    +
    +
    +
      +
    • Clustering unipartite j’ai cassé une fonction de distance à vérifier et réparer

    • +
    • Codes pour le papier :

      +
        +
      • Nettoyer les scripts
      • +
      • Faire un joli README
      • +
      • ❓Faire des notebooks
      • +
    • +
    • Réussir à reproduire résultat de Abramov et al. (s. d.)

    • +
    • Maitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC

    • +
    • Maitriser SparCC

    • +
    • 👶 (délégué à Mona) Clustering sur Doré :

      +
        +
      • Ajouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.
      • +
    • +
    +
    +
    +

    Inférence et microbes

    +
      +
    • ⌛ (En cours) Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \pmb\pi et \pmb{\rho} en utilisant les \pmb B^{\top}\pmb X et en renvoyant l’ELBO adaptée. +
        +
      • 😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !

      • +
      • 😢 Besoin de réfléchir a une bonne implémentation.

      • +
    • +
    +

    J’ai codé l’optimisation et les transferts mais il faut que je vérifie que tout fonctionne

    +
      +
    • ✅ Appliqué multipartite sur \forall i, OTU_i \times Sample: Le plot des groupes trouvés par le multipartite (2 pour tous les OTUs et 4 pour les échantillons.)
    • +
    +
    +

    Bibliographie: à lire, à faire

    +
      +
    • Lire article multi-niveaux Saint-Clair
    • +
    • 🆕 🔎 Trouver des papiers: +
        +
      • LBM Negative Binomial
      • +
      • Network inference through sample comparison
      • +
    • +
    • Idée des groupes sur la base de distance phylogénétique: +
        +
      • En train de comprendre les distances que phyloseq permet de calculer sur notre exemple
      • +
      • En train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html
      • +
      • Parametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)
      • +
      • Lire Papier UniFrac
      • +
    • +
    +
    +
    +

    Écrire et faire tourner

    +
      +
    • 🆕 SparCC à différent niveaux
    • +
    • 🆕⌛ Tree-PLN à différents niveaux
    • +
    +
    +
    +

    Causalité

    +

    Plus sur le temps long, à regarder

    +
      +
    • GT causalité
    • +
    • Daria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)
    • +
    +
    +
    +
    +
    +

    A discuter

    +
      +
    • 🆕 Voir pour des Réseaux / GDR ou aller
    • +
    • 🆕 Chercher des cours à suivre
    • +
    +
    +
    +

    Biblio à faire

    +
      +
    • Regarder Transport optimal graphes bipartite.
    • +
    +
    +
    +

    Lectures en cours 📚

    +
    +

    HDR Vincent Brault

    +
      +
    • ⌛ Chap 2 : Creuser l’idée de maximiser l’énergie libre, très intéressant regarder le critère CARI et lire Robert et al 2021. Actuellement p32 du manuscrit
    • +
    • Chap 3
    • +
    +
    +
    +

    OT

    +
      +
    • Mazelet, Flamary, et Thirion (s. d.) Intéressant pour le transport optimal entre graphes de tailles différentes | Regarder si regularization entropique ne marche pas bien pour le graphe.
    • +
    • Nenna (s. d.b) Pour comprendre le problème d’OT régularisé pour l’entropie.
    • +
    • Nenna (s. d.a)
    • +
    +
    +
    +

    Inférence de graphes

    +
      +
    • Aitchison (1982), en cours

    • +
    • ❗📖 Payne et al. (2023) sur MixMPLN

    • +
    +
    +
    +

    Causalité

    + +
    +
    +

    Largest Gaps

    +
      +
    • ❗📖 Brault et Channarond (2023)
    • +
    • ❗📖 Channarond, Daudin, et Robin (2012) le papier qui introduit le Largest Gaps
    • +
    + + + +
    +
    + +

    Les références

    +
    +Abramov, Kesem, Barry Biton, Geut Galai, Rami Puzis, et Shai Pilosof. s. d. « Structure Knows Best: Predicting Ecological Interactions Across Space Through Pairwise Integration of Latent Network Patterns ». +
    +
    +Aitchison, J. 1982. « The Statistical Analysis of Compositional Data ». Journal of the Royal Statistical Society. Series B (Methodological) 44 (2): 139‑77. https://www.jstor.org/stable/2345821. +
    +
    +Brault, Vincent, et Antoine Channarond. 2023. « Fast and Consistent Algorithm for the Latent Block Model ». 9 mars 2023. https://doi.org/10.48550/arXiv.1610.09005. +
    +
    +Bystrova, Daria. s. d. « Causal Discovery ». +
    +
    +Channarond, Antoine, Jean-Jacques Daudin, et Stéphane Robin. 2012. « Classification and Estimation in the Stochastic Blockmodel Based on the Empirical Degrees ». Electronic Journal of Statistics 6 (janvier). https://doi.org/10.1214/12-ejs753. +
    +
    +Mazelet, Sonia, Rémi Flamary, et Bertrand Thirion. s. d. « Unsupervised Learning for Optimal Transport Plan Prediction Between Unbalanced Graphs ». +
    +
    +Nenna, Luca. s. d.a. « Lecture 1 Monge and Kantorovich Problems: From Primal to Dual ». +
    +
    +———. s. d.b. « Lecture 2: Entropic Optimal Transport ». +
    +
    +Payne, Andrea, Anjali Silva, Steven J. Rothstein, Paul D. McNicholas, et Sanjeena Subedi. 2023. « Finite Mixtures of Multivariate Poisson-Log Normal Factor Analyzers for Clustering Count Data ». 13 novembre 2023. https://doi.org/10.48550/arXiv.2311.07762. +
    +
    +Peixoto, Tiago P. 2014. « Hierarchical Block Structures and High-Resolution Model Selection in Large Networks ». Physical Review X 4 (1): 011047. https://doi.org/10.1103/PhysRevX.4.011047. +
    +
    + +
    + + + + + \ No newline at end of file diff --git a/suivi/2026-6/2026-6.html b/suivi/2026-6/2026-6.html index de49861..a99e08e 100644 --- a/suivi/2026-6/2026-6.html +++ b/suivi/2026-6/2026-6.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2026-7/2026-7.html b/suivi/2026-7/2026-7.html index 7cb46ec..646d63d 100644 --- a/suivi/2026-7/2026-7.html +++ b/suivi/2026-7/2026-7.html @@ -213,7 +213,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2026-8/2026-8.html b/suivi/2026-8/2026-8.html index d9255e1..a8278e2 100644 --- a/suivi/2026-8/2026-8.html +++ b/suivi/2026-8/2026-8.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026

    diff --git a/suivi/2026-9/2026-9.html b/suivi/2026-9/2026-9.html index 4c64cf7..105c5d0 100644 --- a/suivi/2026-9/2026-9.html +++ b/suivi/2026-9/2026-9.html @@ -211,7 +211,7 @@ window.Quarto = {
    Modifié
    -

    24 février 2026

    +

    16 mars 2026