Détails identif SBM covar groupe
All checks were successful
ci/woodpecker/push/woodpecker Pipeline was successful

This commit is contained in:
Louis 2026-02-09 09:36:07 +01:00
parent 7888eed0e0
commit 1b83ee9a41

View file

@ -62,7 +62,13 @@ bibliography: references.bib
### Inférence et microbes ### Inférence et microbes
- ⌛ En préparation d'un fichier (réu avec JBL à 10h45 le 06/02/2026). - ✅ En préparation d'un fichier (réu avec JBL à 10h45 le 06/02/2026).
Possible en modifiant lbm.h et sbm.h d'obtenir un modèle utilisant les covariables de groupes (de blocs ?).
Car besoin de changer `membership.m_step()` pour mettre à jour $\pmb\pi$ et $\pmb{\rho}$ en utilisant les $\pmb B^{\top}\pmb X$
et en renvoyant l'ELBO adaptée.
- 😄 Avantage s'inscrit directement dans blockmodels et permet d'avoir toutes les lois d'émissions déjà codées et compatibles !
- 😢 Besoin de réfléchir a une bonne implémentation.
#### Modèle avec covariables sur probas d'appartenances aux groupes #### Modèle avec covariables sur probas d'appartenances aux groupes
@ -71,20 +77,57 @@ bibliography: references.bib
\beta_{r,0}\\ \beta_{r,0}\\
\vdots\\ \vdots\\
\beta_{r,p} \beta_{r,p}
\end{pmatrix}, & X_j = \begin{pmatrix} \end{pmatrix}, & X_{:,j} = \begin{pmatrix}
1\\ 1\\
x_{1}\\ x_{1}\\
\vdots\\ \vdots\\
x_p x_p
\end{pmatrix}\\ \end{pmatrix}\\
\pmb{\beta}_r^{\top}X_j& = \beta_{r,0} + \beta_{r,1} x_{1} + \dots + \beta_{r,p} x_p & \approx \log(\rho_r^j) \\ \pmb{\beta}_r^{\top} X_{:,j}& = \beta_{r,0} + \beta_{r,1} x_{1} + \dots + \beta_{r,p} x_p & \approx \log(\rho_r^j) \\
\pmb{B} & = \begin{pmatrix} \pmb{B} & = \begin{pmatrix}
\pmb{\beta}_1 \dots \pmb{\beta}_r \dots \pmb{\beta}_Q \pmb{\beta}_1 \dots \pmb{\beta}_r \dots \pmb{\beta}_R
\end{pmatrix} & \pmb{B}^{\top} X_j \approx \log(\pmb{\rho}^j) \\ \end{pmatrix} & \pmb{B}^{\top} X_{:,j} \approx \log(\pmb{\rho}^j) \\
\pmb{B}^{\top} \pmb{X} & \approx \log((\pmb{\rho}^j)_{j=1,\dots,n_2}) = \log(\pmb{\Rho}) \pmb{B}^{\top} \pmb{X} & \approx \log((\pmb{\rho}^j)_{j=1,\dots,n_2}) = \log(\pmb{\Rho})\\
\end{align*}
Et pour les probas en lignes du LBM
\begin{align*}
\pmb{\gamma}_{q}& = \begin{pmatrix}
\gamma_{q,0}\\
\vdots\\
\gamma_{q,d}
\end{pmatrix}, & V_{:,i} = \begin{pmatrix}
1\\
v_{1}\\
\vdots\\
v_d
\end{pmatrix}\\
\pmb{\gamma}_q^{\top} V_{:,i}& = \gamma_{q,0} + \gamma_{q,1} x_{1} + \dots + \gamma_{q,p} x_p & \approx \log(\pi_q^i) \\
\pmb{\Gamma} & = \begin{pmatrix}
\pmb{\gamma}_1 \dots \pmb{\gamma}_q \dots \pmb{\gamma}_Q
\end{pmatrix} & \pmb{\Gamma}^{\top} V_{:,i} \approx \log(\pmb{\pi}^i) \\
\pmb{\Gamma}^{\top} \pmb{X} & \approx \log((\pmb{\pi}^i)_{i=1,\dots,n_1}) = \log(\pmb{\Pi})
\end{align*} \end{align*}
#### Note sur l'identifiabilité (par JBL)
Soient $X : (p+1, n_2), B : (p+1, R)$ avec $X$ de plein rang, i.e., $rg(X) = p+1\implies XX^{\top}$ est inversible.
On veut qu'il existe $B^{\prime}$ et $B$ avec $B_{:,R} = \vec 0_p$, par les propriétés de la fonction softmax, $\sigma(.)$ :
\begin{align*}
& \sigma(B^{\top}X) = \sigma({B^{\prime}}^{\top}X)\\
& \iff \exists C \in \mathbb{R}^{n_2}, B^{\top} X = {B^{\prime}}^{\top} X + \pmb{1}_R C^{\top}\\
& \iff \exists C \in \mathbb{R}^{n_2}, B^{\top} X - \pmb{1}_R C^{\top} = {B^{\prime}}^{\top} X\\
& \iff \exists C \in \mathbb{R}^{n_2}, (B^{\top} X - \pmb{1}_R C^{\top}) X^{\top} = {B^{\prime}}^{\top} X X^{\top}\\
& \iff \exists C \in \mathbb{R}^{n_2}, (B^{\top} X - \pmb{1}_R C^{\top}) X^{\top}(X X^{\top})^{-1} = {B^{\prime}}^{\top}\\
& \iff \exists C \in \mathbb{R}^{n_2}, (B^{\top} X - \pmb{1}_R C^{\top})X^{-1} = {B^{\prime}}^{\top}\\
\end{align*}
#### Description du modèle hiérarchique
Toujours modèle LBM mais avec probas d'appartenance pour les colonnes variables: Toujours modèle LBM mais avec probas d'appartenance pour les colonnes variables:
\begin{align*} \begin{align*}