diff --git a/index.html b/index.html index 6ebb21b..176afac 100644 --- a/index.html +++ b/index.html @@ -263,7 +263,7 @@ Agenda

Journaux

-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+
-
+

Baldock iid

diff --git a/search.json b/search.json index f25cbd5..738e963 100644 --- a/search.json +++ b/search.json @@ -340,14 +340,14 @@ "href": "suivi/2026-6/2026-6.html", "title": "Bilan semaine 6 2026 : 02 février - 06 février", "section": "", - "text": "Petites opérations sur les OTUs (regarder la matrice dans les yeux):\n\nRanger les OTUs par variances (i.e. sd(OTU_j))\n\nHMC sur-dispersés (au-dessus bissectrice)\nEnterotype phyloseq sous-disp\n\nRegarder la proportion de 1. taxon rares, 2. zeros.\nFaire des coupures selon niveaux taxonomiques et regarder si \\mathbb{V}_{\\text{intra}} \\approx \\mathbb{V}_{\\text{inter}}\nBonus: faire ça dans qmd et voir si forge permet gitlab pages\n\n✅ Faire tourner un LBM sur Human Gut et voir si ça plante sinon, ça plante, la ram est surchargée.\n\nTODO Faire LBM sur niveau taxonomique grossier, initialiser avec le résultat pour un niveau plus fin et ainsi de suite.\n\n✅ Avec blockmodels, codé un LBM-Séquentiel. Des différences contrastées…\n⌛ Prendre jeu de données exemple de phyloseq :\n\n✅ 😞 enterotype tourne mais pas bon résultats (semble deux blocs échantillons mais pas vu par le modèle).\n✅ des jeux de données de Mahendra ne tourne pas (phase forward interminable).\n\nRelire Peixoto (2014)\n\nRegarder les gens qui citent les travaux de Peixoto\n\nImplémentation blockmodels LBM avec covariables sur proportions (voir Équation 1)\n\n\n\n\n\n\n\nIdées\n\n\n\n\nTravailler sur Fungus Tree network\n🔍Demander à PB et SD : Comparaison covar prop avec GREMLINS multipartite sur (log(dist_phylo), fungus-tree)\nTrouver manière de faire un compromis : \\ell(Y,Z,W;\\theta) - \\lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?\n⌛ Mise à jour partielle des \\tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \\tau à chaque itération. Et échantillonnage stratifié selon l’arbre ?\n\n⌛ Simulations avec n_2 croissant lancée sur Migale\nRéimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\\times(\\tau^{(1)})^{\\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.\n\n\n\n\n\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\n👶 (délégué à Mona) Clustering sur Doré :\n\nAjouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.\n\n\n\n\n\n✅ En préparation d’un fichier (réu avec JBL à 10h45 le 06/02/2026). Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \\pmb\\pi et \\pmb{\\rho} en utilisant les \\pmb B^{\\top}\\pmb X et en renvoyant l’ELBO adaptée.\n\n😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !\n😢 Besoin de réfléchir a une bonne implémentation.\n\n\n\n\n\\begin{align*}\n\\pmb{\\beta}_{r}& = \\begin{pmatrix}\n \\beta_{r,0}\\\\\n \\vdots\\\\\n \\beta_{r,p}\n\\end{pmatrix}, & X_{:,j} = \\begin{pmatrix}\n 1\\\\\n x_{1}\\\\\n \\vdots\\\\\n x_p\n\\end{pmatrix}\\\\\n\\pmb{\\beta}_r^{\\top} X_{:,j}& = \\beta_{r,0} + \\beta_{r,1} x_{1} + \\dots + \\beta_{r,p} x_p & \\approx \\log(\\rho_r^j) \\\\\n\\pmb{B} & = \\begin{pmatrix}\n\\pmb{\\beta}_1 \\dots \\pmb{\\beta}_r \\dots \\pmb{\\beta}_R\n\\end{pmatrix} & \\pmb{B}^{\\top} X_{:,j} \\approx \\log(\\pmb{\\rho}^j) \\\\\n\\pmb{B}^{\\top} \\pmb{X} & \\approx \\log((\\pmb{\\rho}^j)_{j=1,\\dots,n_2}) = \\log(\\pmb{\\Rho})\\\\\n\\end{align*} Et pour les probas en lignes du LBM \\begin{align*}\n\\pmb{\\gamma}_{q}& = \\begin{pmatrix}\n \\gamma_{q,0}\\\\\n \\vdots\\\\\n \\gamma_{q,d}\n\\end{pmatrix}, & V_{:,i} = \\begin{pmatrix}\n 1\\\\\n v_{1}\\\\\n \\vdots\\\\\n v_d\n\\end{pmatrix}\\\\\n\\pmb{\\gamma}_q^{\\top} V_{:,i}& = \\gamma_{q,0} + \\gamma_{q,1} x_{1} + \\dots + \\gamma_{q,p} x_p & \\approx \\log(\\pi_q^i) \\\\\n\\pmb{\\Gamma} & = \\begin{pmatrix}\n\\pmb{\\gamma}_1 \\dots \\pmb{\\gamma}_q \\dots \\pmb{\\gamma}_Q\n\\end{pmatrix} & \\pmb{\\Gamma}^{\\top} V_{:,i} \\approx \\log(\\pmb{\\pi}^i) \\\\\n\\pmb{\\Gamma}^{\\top} \\pmb{X} & \\approx \\log((\\pmb{\\pi}^i)_{i=1,\\dots,n_1}) = \\log(\\pmb{\\Pi})\n\n\n\\end{align*}\n\n\n\nSoient X : (p+1, n_2), B : (p+1, R) avec X de plein rang, i.e., rg(X) = p+1\\implies XX^{\\top} est inversible.\nOn veut qu’il existe B^{\\prime} et B avec B_{:,R} = \\vec 0_p, par les propriétés de la fonction softmax, \\sigma(.) :\n\\begin{align*}\n& \\sigma(B^{\\top}X) = \\sigma({B^{\\prime}}^{\\top}X)\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, B^{\\top} X = {B^{\\prime}}^{\\top} X + \\pmb{1}_R C^{\\top}\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, B^{\\top} X - \\pmb{1}_R C^{\\top} = {B^{\\prime}}^{\\top} X\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, (B^{\\top} X - \\pmb{1}_R C^{\\top}) X^{\\top} = {B^{\\prime}}^{\\top} X X^{\\top}\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, (B^{\\top} X - \\pmb{1}_R C^{\\top}) X^{\\top}(X X^{\\top})^{-1} = {B^{\\prime}}^{\\top}\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, (B^{\\top} X - \\pmb{1}_R C^{\\top})X^{-1} = {B^{\\prime}}^{\\top}\\\\\n\n\\end{align*}\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\\tag{1}\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" + "text": "Petites opérations sur les OTUs (regarder la matrice dans les yeux):\n\nRanger les OTUs par variances (i.e. sd(OTU_j))\n\nHMC sur-dispersés (au-dessus bissectrice)\nEnterotype phyloseq sous-disp\n\nRegarder la proportion de 1. taxon rares, 2. zeros.\nFaire des coupures selon niveaux taxonomiques et regarder si \\mathbb{V}_{\\text{intra}} \\approx \\mathbb{V}_{\\text{inter}}\nBonus: faire ça dans qmd et voir si forge permet gitlab pages\n\n✅ Faire tourner un LBM sur Human Gut et voir si ça plante sinon, ça plante, la ram est surchargée.\n\nTODO Faire LBM sur niveau taxonomique grossier, initialiser avec le résultat pour un niveau plus fin et ainsi de suite.\n\n✅ Avec blockmodels, codé un LBM-Séquentiel. Des différences contrastées…\n⌛ Prendre jeu de données exemple de phyloseq :\n\n✅ 😞 enterotype tourne mais pas bon résultats (semble deux blocs échantillons mais pas vu par le modèle).\n✅ des jeux de données de Mahendra ne tourne pas (phase forward interminable).\n\nRelire Peixoto (2014)\n\nRegarder les gens qui citent les travaux de Peixoto\n\nImplémentation blockmodels LBM avec covariables sur proportions (voir Équation 1)\n\n\n\n\n\n\n\nIdées\n\n\n\n\nTravailler sur Fungus Tree network\n🔍Demander à PB et SD : Comparaison covar prop avec GREMLINS multipartite sur (log(dist_phylo), fungus-tree)\nTrouver manière de faire un compromis : \\ell(Y,Z,W;\\theta) - \\lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?\n⌛ Mise à jour partielle des \\tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \\tau à chaque itération. Et échantillonnage stratifié selon l’arbre ?\n\n⌛ Simulations avec n_2 croissant lancée sur Migale\nRéimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\\times(\\tau^{(1)})^{\\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.\n\n\n\n\n\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\n👶 (délégué à Mona) Clustering sur Doré :\n\nAjouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.\n\n\n\n\n\n✅ En préparation d’un fichier (réu avec JBL à 10h45 le 06/02/2026). Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \\pmb\\pi et \\pmb{\\rho} en utilisant les \\pmb B^{\\top}\\pmb X et en renvoyant l’ELBO adaptée.\n\n😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !\n😢 Besoin de réfléchir a une bonne implémentation.\n\n\n\n\n\\begin{align*}\n\\pmb{\\beta}_{r}& = \\begin{pmatrix}\n \\beta_{r,0}\\\\\n \\vdots\\\\\n \\beta_{r,p}\n\\end{pmatrix}, & X_{:,j} = \\begin{pmatrix}\n 1\\\\\n x_{1}\\\\\n \\vdots\\\\\n x_p\n\\end{pmatrix}\\\\\n\\pmb{\\beta}_r^{\\top} X_{:,j}& = \\beta_{r,0} + \\beta_{r,1} x_{1} + \\dots + \\beta_{r,p} x_p & \\approx \\log(\\rho_r^j) \\\\\n\\pmb{B} & = \\begin{pmatrix}\n\\pmb{\\beta}_1 \\dots \\pmb{\\beta}_r \\dots \\pmb{\\beta}_R\n\\end{pmatrix} & \\pmb{B}^{\\top} X_{:,j} \\approx \\log(\\pmb{\\rho}^j) \\\\\n\\pmb{B}^{\\top} \\pmb{X} & \\approx \\log((\\pmb{\\rho}^j)_{j=1,\\dots,n_2}) = \\log(\\pmb{\\Rho})\\\\\n\\end{align*} Et pour les probas en lignes du LBM \\begin{align*}\n\\pmb{\\gamma}_{q}& = \\begin{pmatrix}\n \\gamma_{q,0}\\\\\n \\vdots\\\\\n \\gamma_{q,d}\n\\end{pmatrix}, & V_{:,i} = \\begin{pmatrix}\n 1\\\\\n v_{1}\\\\\n \\vdots\\\\\n v_d\n\\end{pmatrix}\\\\\n\\pmb{\\gamma}_q^{\\top} V_{:,i}& = \\gamma_{q,0} + \\gamma_{q,1} x_{1} + \\dots + \\gamma_{q,p} x_p & \\approx \\log(\\pi_q^i) \\\\\n\\pmb{\\Gamma} & = \\begin{pmatrix}\n\\pmb{\\gamma}_1 \\dots \\pmb{\\gamma}_q \\dots \\pmb{\\gamma}_Q\n\\end{pmatrix} & \\pmb{\\Gamma}^{\\top} V_{:,i} \\approx \\log(\\pmb{\\pi}^i) \\\\\n\\pmb{\\Gamma}^{\\top} \\pmb{X} & \\approx \\log((\\pmb{\\pi}^i)_{i=1,\\dots,n_1}) = \\log(\\pmb{\\Pi})\n\n\n\\end{align*}\n\n\n\nSoient X : (p+1, n_2), B : (p+1, R) avec X de plein rang, i.e., rg(X) = p+1\\implies XX^{\\top} est inversible.\nOn veut qu’il existe B^{\\prime} et B avec B_{:,R} = \\vec 0_p, par les propriétés de la fonction softmax, \\sigma(.) :\n\\begin{align*}\n& \\sigma(B^{\\top}X) = \\sigma({B^{\\prime}}^{\\top}X)\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, B^{\\top} X = {B^{\\prime}}^{\\top} X + \\pmb{1}_R C^{\\top}\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, B^{\\top} X - \\pmb{1}_R C^{\\top} = {B^{\\prime}}^{\\top} X\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, (B^{\\top} X - \\pmb{1}_R C^{\\top}) X^{\\top} = {B^{\\prime}}^{\\top} X X^{\\top}\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, (B^{\\top} X - \\pmb{1}_R C^{\\top}) X^{\\top}(X X^{\\top})^{-1} = {B^{\\prime}}^{\\top}\\\\\n\n\n\\end{align*}\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\\tag{1}\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" }, { "objectID": "suivi/2026-6/2026-6.html#todo-list", "href": "suivi/2026-6/2026-6.html#todo-list", "title": "Bilan semaine 6 2026 : 02 février - 06 février", "section": "", - "text": "Petites opérations sur les OTUs (regarder la matrice dans les yeux):\n\nRanger les OTUs par variances (i.e. sd(OTU_j))\n\nHMC sur-dispersés (au-dessus bissectrice)\nEnterotype phyloseq sous-disp\n\nRegarder la proportion de 1. taxon rares, 2. zeros.\nFaire des coupures selon niveaux taxonomiques et regarder si \\mathbb{V}_{\\text{intra}} \\approx \\mathbb{V}_{\\text{inter}}\nBonus: faire ça dans qmd et voir si forge permet gitlab pages\n\n✅ Faire tourner un LBM sur Human Gut et voir si ça plante sinon, ça plante, la ram est surchargée.\n\nTODO Faire LBM sur niveau taxonomique grossier, initialiser avec le résultat pour un niveau plus fin et ainsi de suite.\n\n✅ Avec blockmodels, codé un LBM-Séquentiel. Des différences contrastées…\n⌛ Prendre jeu de données exemple de phyloseq :\n\n✅ 😞 enterotype tourne mais pas bon résultats (semble deux blocs échantillons mais pas vu par le modèle).\n✅ des jeux de données de Mahendra ne tourne pas (phase forward interminable).\n\nRelire Peixoto (2014)\n\nRegarder les gens qui citent les travaux de Peixoto\n\nImplémentation blockmodels LBM avec covariables sur proportions (voir Équation 1)\n\n\n\n\n\n\n\nIdées\n\n\n\n\nTravailler sur Fungus Tree network\n🔍Demander à PB et SD : Comparaison covar prop avec GREMLINS multipartite sur (log(dist_phylo), fungus-tree)\nTrouver manière de faire un compromis : \\ell(Y,Z,W;\\theta) - \\lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?\n⌛ Mise à jour partielle des \\tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \\tau à chaque itération. Et échantillonnage stratifié selon l’arbre ?\n\n⌛ Simulations avec n_2 croissant lancée sur Migale\nRéimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\\times(\\tau^{(1)})^{\\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.\n\n\n\n\n\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\n👶 (délégué à Mona) Clustering sur Doré :\n\nAjouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.\n\n\n\n\n\n✅ En préparation d’un fichier (réu avec JBL à 10h45 le 06/02/2026). Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \\pmb\\pi et \\pmb{\\rho} en utilisant les \\pmb B^{\\top}\\pmb X et en renvoyant l’ELBO adaptée.\n\n😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !\n😢 Besoin de réfléchir a une bonne implémentation.\n\n\n\n\n\\begin{align*}\n\\pmb{\\beta}_{r}& = \\begin{pmatrix}\n \\beta_{r,0}\\\\\n \\vdots\\\\\n \\beta_{r,p}\n\\end{pmatrix}, & X_{:,j} = \\begin{pmatrix}\n 1\\\\\n x_{1}\\\\\n \\vdots\\\\\n x_p\n\\end{pmatrix}\\\\\n\\pmb{\\beta}_r^{\\top} X_{:,j}& = \\beta_{r,0} + \\beta_{r,1} x_{1} + \\dots + \\beta_{r,p} x_p & \\approx \\log(\\rho_r^j) \\\\\n\\pmb{B} & = \\begin{pmatrix}\n\\pmb{\\beta}_1 \\dots \\pmb{\\beta}_r \\dots \\pmb{\\beta}_R\n\\end{pmatrix} & \\pmb{B}^{\\top} X_{:,j} \\approx \\log(\\pmb{\\rho}^j) \\\\\n\\pmb{B}^{\\top} \\pmb{X} & \\approx \\log((\\pmb{\\rho}^j)_{j=1,\\dots,n_2}) = \\log(\\pmb{\\Rho})\\\\\n\\end{align*} Et pour les probas en lignes du LBM \\begin{align*}\n\\pmb{\\gamma}_{q}& = \\begin{pmatrix}\n \\gamma_{q,0}\\\\\n \\vdots\\\\\n \\gamma_{q,d}\n\\end{pmatrix}, & V_{:,i} = \\begin{pmatrix}\n 1\\\\\n v_{1}\\\\\n \\vdots\\\\\n v_d\n\\end{pmatrix}\\\\\n\\pmb{\\gamma}_q^{\\top} V_{:,i}& = \\gamma_{q,0} + \\gamma_{q,1} x_{1} + \\dots + \\gamma_{q,p} x_p & \\approx \\log(\\pi_q^i) \\\\\n\\pmb{\\Gamma} & = \\begin{pmatrix}\n\\pmb{\\gamma}_1 \\dots \\pmb{\\gamma}_q \\dots \\pmb{\\gamma}_Q\n\\end{pmatrix} & \\pmb{\\Gamma}^{\\top} V_{:,i} \\approx \\log(\\pmb{\\pi}^i) \\\\\n\\pmb{\\Gamma}^{\\top} \\pmb{X} & \\approx \\log((\\pmb{\\pi}^i)_{i=1,\\dots,n_1}) = \\log(\\pmb{\\Pi})\n\n\n\\end{align*}\n\n\n\nSoient X : (p+1, n_2), B : (p+1, R) avec X de plein rang, i.e., rg(X) = p+1\\implies XX^{\\top} est inversible.\nOn veut qu’il existe B^{\\prime} et B avec B_{:,R} = \\vec 0_p, par les propriétés de la fonction softmax, \\sigma(.) :\n\\begin{align*}\n& \\sigma(B^{\\top}X) = \\sigma({B^{\\prime}}^{\\top}X)\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, B^{\\top} X = {B^{\\prime}}^{\\top} X + \\pmb{1}_R C^{\\top}\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, B^{\\top} X - \\pmb{1}_R C^{\\top} = {B^{\\prime}}^{\\top} X\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, (B^{\\top} X - \\pmb{1}_R C^{\\top}) X^{\\top} = {B^{\\prime}}^{\\top} X X^{\\top}\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, (B^{\\top} X - \\pmb{1}_R C^{\\top}) X^{\\top}(X X^{\\top})^{-1} = {B^{\\prime}}^{\\top}\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, (B^{\\top} X - \\pmb{1}_R C^{\\top})X^{-1} = {B^{\\prime}}^{\\top}\\\\\n\n\\end{align*}\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\\tag{1}\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" + "text": "Petites opérations sur les OTUs (regarder la matrice dans les yeux):\n\nRanger les OTUs par variances (i.e. sd(OTU_j))\n\nHMC sur-dispersés (au-dessus bissectrice)\nEnterotype phyloseq sous-disp\n\nRegarder la proportion de 1. taxon rares, 2. zeros.\nFaire des coupures selon niveaux taxonomiques et regarder si \\mathbb{V}_{\\text{intra}} \\approx \\mathbb{V}_{\\text{inter}}\nBonus: faire ça dans qmd et voir si forge permet gitlab pages\n\n✅ Faire tourner un LBM sur Human Gut et voir si ça plante sinon, ça plante, la ram est surchargée.\n\nTODO Faire LBM sur niveau taxonomique grossier, initialiser avec le résultat pour un niveau plus fin et ainsi de suite.\n\n✅ Avec blockmodels, codé un LBM-Séquentiel. Des différences contrastées…\n⌛ Prendre jeu de données exemple de phyloseq :\n\n✅ 😞 enterotype tourne mais pas bon résultats (semble deux blocs échantillons mais pas vu par le modèle).\n✅ des jeux de données de Mahendra ne tourne pas (phase forward interminable).\n\nRelire Peixoto (2014)\n\nRegarder les gens qui citent les travaux de Peixoto\n\nImplémentation blockmodels LBM avec covariables sur proportions (voir Équation 1)\n\n\n\n\n\n\n\nIdées\n\n\n\n\nTravailler sur Fungus Tree network\n🔍Demander à PB et SD : Comparaison covar prop avec GREMLINS multipartite sur (log(dist_phylo), fungus-tree)\nTrouver manière de faire un compromis : \\ell(Y,Z,W;\\theta) - \\lambda d(C(W),C_0) avec C(W) le clustering seulement sur la base de la structure LBM et C_0 le clustering de l’arbre. Problème d est une distance entre partition, comment optimiser dessus ?\n⌛ Mise à jour partielle des \\tau : ce qui pose soucis c’est les gros calculs matriciels (c’est vraiment vrai?). Donc sorte de “stochastic” VEM où on update seulement une partie des \\tau à chaque itération. Et échantillonnage stratifié selon l’arbre ?\n\n⌛ Simulations avec n_2 croissant lancée sur Migale\nRéimplementé VE Bernoulli dans colSBM pour Bipartite et début implémentation Stochastic VE. En fait le problème des calculs matriciels Y\\times(\\tau^{(1)})^{\\top} (n_2^2) donc besoin de sous-échantillonner les noeuds de l’autre dimension à mettre à jour.\n\n\n\n\n\nClustering unipartite j’ai cassé une fonction de distance à vérifier et réparer\nCodes pour le papier :\n\nNettoyer les scripts\nFaire un joli README\n❓Faire des notebooks\n\nRéussir à reproduire résultat de Abramov et al. (s. d.)\nMaitriser graphtools de Peixoto pour essayer d’utiliser l’arbre taxonomique sur graphe de cooccurence inférer par SparCC\nMaitriser SparCC\n👶 (délégué à Mona) Clustering sur Doré :\n\nAjouter Chao1 et 2, colonne par colonne (site par site), et faire indice moyen et la variance.\n\n\n\n\n\n✅ En préparation d’un fichier (réu avec JBL à 10h45 le 06/02/2026). Possible en modifiant lbm.h et sbm.h d’obtenir un modèle utilisant les covariables de groupes (de blocs ?). Car besoin de changer membership.m_step() pour mettre à jour \\pmb\\pi et \\pmb{\\rho} en utilisant les \\pmb B^{\\top}\\pmb X et en renvoyant l’ELBO adaptée.\n\n😄 Avantage s’inscrit directement dans blockmodels et permet d’avoir toutes les lois d’émissions déjà codées et compatibles !\n😢 Besoin de réfléchir a une bonne implémentation.\n\n\n\n\n\\begin{align*}\n\\pmb{\\beta}_{r}& = \\begin{pmatrix}\n \\beta_{r,0}\\\\\n \\vdots\\\\\n \\beta_{r,p}\n\\end{pmatrix}, & X_{:,j} = \\begin{pmatrix}\n 1\\\\\n x_{1}\\\\\n \\vdots\\\\\n x_p\n\\end{pmatrix}\\\\\n\\pmb{\\beta}_r^{\\top} X_{:,j}& = \\beta_{r,0} + \\beta_{r,1} x_{1} + \\dots + \\beta_{r,p} x_p & \\approx \\log(\\rho_r^j) \\\\\n\\pmb{B} & = \\begin{pmatrix}\n\\pmb{\\beta}_1 \\dots \\pmb{\\beta}_r \\dots \\pmb{\\beta}_R\n\\end{pmatrix} & \\pmb{B}^{\\top} X_{:,j} \\approx \\log(\\pmb{\\rho}^j) \\\\\n\\pmb{B}^{\\top} \\pmb{X} & \\approx \\log((\\pmb{\\rho}^j)_{j=1,\\dots,n_2}) = \\log(\\pmb{\\Rho})\\\\\n\\end{align*} Et pour les probas en lignes du LBM \\begin{align*}\n\\pmb{\\gamma}_{q}& = \\begin{pmatrix}\n \\gamma_{q,0}\\\\\n \\vdots\\\\\n \\gamma_{q,d}\n\\end{pmatrix}, & V_{:,i} = \\begin{pmatrix}\n 1\\\\\n v_{1}\\\\\n \\vdots\\\\\n v_d\n\\end{pmatrix}\\\\\n\\pmb{\\gamma}_q^{\\top} V_{:,i}& = \\gamma_{q,0} + \\gamma_{q,1} x_{1} + \\dots + \\gamma_{q,p} x_p & \\approx \\log(\\pi_q^i) \\\\\n\\pmb{\\Gamma} & = \\begin{pmatrix}\n\\pmb{\\gamma}_1 \\dots \\pmb{\\gamma}_q \\dots \\pmb{\\gamma}_Q\n\\end{pmatrix} & \\pmb{\\Gamma}^{\\top} V_{:,i} \\approx \\log(\\pmb{\\pi}^i) \\\\\n\\pmb{\\Gamma}^{\\top} \\pmb{X} & \\approx \\log((\\pmb{\\pi}^i)_{i=1,\\dots,n_1}) = \\log(\\pmb{\\Pi})\n\n\n\\end{align*}\n\n\n\nSoient X : (p+1, n_2), B : (p+1, R) avec X de plein rang, i.e., rg(X) = p+1\\implies XX^{\\top} est inversible.\nOn veut qu’il existe B^{\\prime} et B avec B_{:,R} = \\vec 0_p, par les propriétés de la fonction softmax, \\sigma(.) :\n\\begin{align*}\n& \\sigma(B^{\\top}X) = \\sigma({B^{\\prime}}^{\\top}X)\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, B^{\\top} X = {B^{\\prime}}^{\\top} X + \\pmb{1}_R C^{\\top}\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, B^{\\top} X - \\pmb{1}_R C^{\\top} = {B^{\\prime}}^{\\top} X\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, (B^{\\top} X - \\pmb{1}_R C^{\\top}) X^{\\top} = {B^{\\prime}}^{\\top} X X^{\\top}\\\\\n& \\iff \\exists C \\in \\mathbb{R}^{n_2}, (B^{\\top} X - \\pmb{1}_R C^{\\top}) X^{\\top}(X X^{\\top})^{-1} = {B^{\\prime}}^{\\top}\\\\\n\n\n\\end{align*}\n\n\n\nToujours modèle LBM mais avec probas d’appartenance pour les colonnes variables:\n\\begin{align*}\nZ_i &\\sim \\mathcal{M}(1; \\pi_1, \\dots, \\pi_Q), \\sum_{q=1}^{Q} \\pi_q = 1\\\\\nW_j &\\sim \\mathcal{M}(1; \\rho_1^j, \\dots, \\rho_R^j), \\sum_{r=1}^{R} \\rho_r^j = 1\\\\\nY_{i,j}&\\mid Z_i = q, W_j = r \\sim \\mathcal{F}(\\alpha_{qr})\n\\end{align*}\nInférence variationnelle donc \\ell(Y;\\pmb{\\theta}) \\geq \\mathcal{J}(\\mathcal{R},\\pmb{\\theta}) avec\n\n\\mathcal{J}(\\mathcal{R},\\pmb{\\theta})= \\sum_{i = 1}^{n_1}\\sum_{j=1}^{n_2}\\sum_{q \\in \\mathcal{Q}_1} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{iq}^{1} \\tau_{jr}^{2} \\log f(Y_{ij}; \\alpha_{qr})\n + \\sum_{i=1}^{n_1} \\sum_{q \\in \\mathcal{Q}_1} \\tau_{iq}^{1} \\log \\pi_{\\color{black}q} + \\sum_{j=1}^{n_2} \\sum_{r \\in \\mathcal{Q}_2} \\tau_{jr}^{2} \\log \\rho_{\\color{black}r} \\\\\n - \\sum_{i=1}^{n_1} \\tau_{iq}^{1} \\log \\tau_{iq}^{1} - \\sum_{j=1}^{n_2} \\tau_{jr}^{2} \\log \\tau_{jr}^{2}\n\n\n\nAvec \\rho_r^j = \\frac{\\exp{\\beta_r X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} = \\sigma(\\pmb{\\beta} \\pmb{X})_{r,j}, où \\sigma désigne le softmax. Mais il y a besoin de poser une contrainte sur l’un des (\\beta_r)_{r=1,\\dots,R}, ici \\beta_R = 0.\nLa partie pertinente de l’ELBO devient: \n P((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\sum_{r=1}^{R} [\\tau_{jr} (\\beta_r X_j - \\log (\\sum_{s=1}^{R} \\exp{\\beta_s X_j}))]\n\\tag{1}\nEt on obtient la dérivée partielle par rapport à \\beta_t comme: \\begin{align*}\n\\dfrac{\\partial P}{\\partial \\beta_t}&((\\beta_r)_{r=1,\\dots,R}, (X_j)_{j=1,\\dots,n_2}, (\\tau_{jr})_{\\substack{j=1,\\dots,n_2\\\\r=1,\\dots,R}} ) = \\sum_{j=1}^{n_2} \\biggl[ \\tau_{jt} X_j - \\frac{X_j \\exp{\\beta_t X_j}}{\\sum_{s=1}^{R} \\exp{\\beta_s X_j}} \\biggr]\\\\\n& = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\sigma(\\pmb{\\beta} \\pmb{X})_{t,j}\\bigr) X_j\\biggr] = \\sum_{j=1}^{n_2} \\biggl[\\bigl(\\tau_{jt} - \\rho_t^j \\bigr) X_j\\biggr]\n\\end{align*}\n\n\n\n\n\nLire article multi-niveaux Saint-Clair\n🆕 🔎 Trouver des papiers:\n\nLBM Negative Binomial\nNetwork inference through sample comparison\n\nIdée des groupes sur la base de distance phylogénétique:\n\nEn train de comprendre les distances que phyloseq permet de calculer sur notre exemple\nEn train de lire sur Principle coordinate analysis : https://openplantpathology.github.io/OPP_Workshop_Multivariate/2-MV_PCO.html\nParametric t-SNE pour avoir une unique représentation latente (inconvénient utilise du Deep Learning)\nLire Papier UniFrac\n\n\n\n\n\n\neasy16s : se renseigner sur\n\n\\alpha, \\beta diversité\nHeatmap\n\nRegarder SPARTA Rennes\nEcrire et étudier les modèles pour différents niveaux taxonomiques.\n🆕 Regarder NetComi\n🆕 Regarder OneNet car aggrégation plus robuste\n🆕 Réfléchir sens d’aggréger les données ou de les diviser\n\n\n\n\n\nLancer colBiSBM sur OTU\\times Sample → problème du chargement en mémoire des données à voir\nLancer colSBM sur OTU\\times OTU\nTabNet pratiquer les exercices\n🆕 SparCC à différent niveaux\n🆕 SBM à différent niveaux\n🆕⌛ Tree-PLN à différents niveaux\n\n\n\n\nPlus sur le temps long, à regarder\n\nGT causalité\nDaria Bystrova lire présentation Bystrova (s. d.) (Meek rules, V-structure)" }, { "objectID": "suivi/2026-6/2026-6.html#a-discuter", diff --git a/suivi/2026-6/2026-6.html b/suivi/2026-6/2026-6.html index 57ea3c8..5ce8947 100644 --- a/suivi/2026-6/2026-6.html +++ b/suivi/2026-6/2026-6.html @@ -375,7 +375,7 @@ Idées & \iff \exists C \in \mathbb{R}^{n_2}, B^{\top} X - \pmb{1}_R C^{\top} = {B^{\prime}}^{\top} X\\ & \iff \exists C \in \mathbb{R}^{n_2}, (B^{\top} X - \pmb{1}_R C^{\top}) X^{\top} = {B^{\prime}}^{\top} X X^{\top}\\ & \iff \exists C \in \mathbb{R}^{n_2}, (B^{\top} X - \pmb{1}_R C^{\top}) X^{\top}(X X^{\top})^{-1} = {B^{\prime}}^{\top}\\ -& \iff \exists C \in \mathbb{R}^{n_2}, (B^{\top} X - \pmb{1}_R C^{\top})X^{-1} = {B^{\prime}}^{\top}\\ + \end{align*}