397 lines
No EOL
17 KiB
TeX
397 lines
No EOL
17 KiB
TeX
\section{Contexte du modèle}
|
|
\label{sec:contexte-du-modele}
|
|
|
|
\begin{frame}
|
|
\begin{columns}
|
|
\begin{column}{0.5\textwidth}
|
|
\begin{block}{Contexte écologique}
|
|
\begin{itemize}
|
|
\small
|
|
\item Nombreux réseaux disponibles pour
|
|
interactions similaires.
|
|
\item Suivi biodiversité, robustesse et risque
|
|
d'effondrement \dots
|
|
\end{itemize}
|
|
\begin{columns}
|
|
\begin{column}{0.5\textwidth}
|
|
\begin{figure}[ht]
|
|
\centering
|
|
\begin{tikzpicture}[scale=.45,rotate=270]
|
|
\input{../tikz/plantpollinatornetwork.tex}
|
|
\end{tikzpicture}
|
|
\caption{Exemple d'un réseau plantes-pollinisateurs}
|
|
\label{fig:plantes-pollin}
|
|
\end{figure}
|
|
\end{column}
|
|
\begin{column}{0.4\textwidth}
|
|
\centering
|
|
\begin{align*}
|
|
\begin{pmatrix}
|
|
1 & 0 & 1 \\
|
|
1 & 0 & 0 \\
|
|
1 & 0 & 0 \\
|
|
1 & 1 & 0
|
|
\end{pmatrix}
|
|
\end{align*}
|
|
\footnotesize
|
|
Matrice d'adjacence associée
|
|
\end{column}
|
|
\end{columns}
|
|
\end{block}
|
|
|
|
\end{column}
|
|
\onslide<2>{
|
|
\begin{column}{0.45\textwidth}
|
|
\begin{block}{Contexte mathématique}
|
|
Pour un unique réseau~: variables latentes,
|
|
\emph{embedding}, \dots
|
|
|
|
Motivations pour proposer des méthodes adaptées aux collections
|
|
de réseaux~:
|
|
\begin{itemize}
|
|
\item Espèces différentes, rôles analogues.
|
|
\item Transfert d'informations grands vers petits réseaux.
|
|
\item Regrouper les réseaux selon leur similarité (\emph{clustering}
|
|
de réseaux).
|
|
\end{itemize}
|
|
\end{block}
|
|
\end{column}
|
|
}
|
|
\end{columns}
|
|
\end{frame}
|
|
|
|
\begin{frame}
|
|
\addtocounter{footnote}{1}
|
|
\frametitle{Latent Block Model (LBM\footnotemark[\thefootnote])}
|
|
%DONE remplacer i \in bullet par Zi = \bullet
|
|
Proposé par~\cite{govaertEMAlgorithmBlock2005}.
|
|
\begin{columns}
|
|
\begin{column}{0.40\linewidth}
|
|
\begin{figure}[H]
|
|
\center
|
|
\begin{tikzpicture}[scale=0.35]
|
|
\input{../tikz/lbm.tex}
|
|
\end{tikzpicture}
|
|
\caption{Exemple de LBM\footnotemark[\thefootnote]}
|
|
\label{fig:LBMvisu}
|
|
\end{figure}
|
|
\end{column}
|
|
\begin{column}{0.51\linewidth}
|
|
Pour \begin{itemize}
|
|
\item $Q_1 = |\{{\color{blueind}\bullet},{\color{cyanind}\bullet},{\color{electricblue}\bullet}\}|$ blocs fixés en ligne
|
|
\item $Q_2 = |\{{\color{burntorange}\bullet},{\color{goldenyellow}\bullet},{\color{peach}\bullet}\}|$ blocs fixés en colonne
|
|
\end{itemize}
|
|
\begin{block}{Paramètres}
|
|
\begin{itemize}
|
|
\item $\pi_{\bullet} = \mathbb{P}(Z_i = \bullet)$ en ligne et $\rho_{\bullet} = \mathbb{P}(W_j = \bullet)$ en colonne
|
|
\item $\alpha_{{\color{blueind}\bullet}{\color{burntorange}\bullet}} = \mathbb{P}(X_{ij} = 1 | Z_i = {\color{blueind}\bullet}, W_j = {\color{burntorange}\bullet})$
|
|
\end{itemize}
|
|
\end{block}
|
|
\end{column}
|
|
\end{columns}
|
|
|
|
\footnotetext[\thefootnote]{Que j'appellerai par la suite BiSBM}
|
|
|
|
\end{frame}
|
|
|
|
\section{Modèle de collection de réseaux bipartites}
|
|
\label{sec:extension-de-colsbm-aux-reseaux-bipartites}
|
|
\begin{frame}
|
|
\frametitle{Collections bipartites}
|
|
\begin{tikzpicture}[scale=0.33]
|
|
\input{../tikz/collbm-iid.tex}
|
|
\end{tikzpicture}
|
|
|
|
\begin{itemize}
|
|
\item $Q_1 = |\{{\color{blueind}\bullet},{\color{cyanind}\bullet},{\color{electricblue}\bullet}\}|$ blocs fixés en ligne
|
|
\item $Q_2 = |\{{\color{burntorange}\bullet},{\color{goldenyellow}\bullet},{\color{peach}\bullet}\}|$ blocs fixés en colonne
|
|
\end{itemize}
|
|
\begin{block}{Paramètres}
|
|
\begin{itemize}
|
|
\item $\pi_{\bullet} = \mathbb{P}(Z_i =\bullet)$ en ligne et $\rho_{\bullet} = \mathbb{P}(W_j = \bullet)$ en colonne
|
|
\item $\alpha_{{\color{blueind}\bullet}{\color{burntorange}\bullet}} = \mathbb{P}(X_{ij} = 1 | Z_i = {\color{blueind}\bullet}, W_j = {\color{burntorange}\bullet})$
|
|
\end{itemize}
|
|
\end{block}
|
|
\end{frame}
|
|
|
|
\begin{frame}
|
|
\frametitle{Différents modèles}
|
|
\only<1>{
|
|
\begin{tikzpicture}[scale=0.33]
|
|
\input{../tikz/collbm-iid.tex}
|
|
\end{tikzpicture}
|
|
\begin{block}{\emph{iid-colBiSBM}}
|
|
$\bm{\pi} = (\pi_1, \dots \pi_{Q_1})$ et $\bm{\rho} = (\rho_1, \dots \rho_{Q_2})$
|
|
\end{block}
|
|
}
|
|
\only<2>{
|
|
\begin{tikzpicture}[scale=0.33]
|
|
\input{../tikz/collbm-pirho.tex}
|
|
\end{tikzpicture}
|
|
\begin{block}{\emph{$\pi\rho$-colBiSBM}}
|
|
$\bm{\pi} = ((\pi_{\color{black}1}^{\color{red}m}, \dots \pi_{\color{black}Q_1}^{\color{red}m}))_{m=1,\dots M}$ et $\bm{\rho} = ((\rho_{\color{black}1}^{\color{red}m}, \dots \rho_{\color{black}Q_2}^{\color{red}m}))_{m=1,\dots M}$ %{$\forall q \in \llbracket 1, Q_1 - 1\rrbracket, \pi_q > 0$ et $\forall r \in \llbracket 1, Q_2 - 1\rrbracket, \rho_r > 0$}
|
|
\small \\
|
|
avec $\forall q,m \in \llbracket 1, Q_1 \rrbracket \times \llbracket 1, M \rrbracket, \pi_q^m \in \left[ 0,1 \right]$
|
|
et $\forall r,m \in \llbracket 1, Q_2 \rrbracket \times \llbracket 1, M \rrbracket, \rho_r^m \in \left[ 0,1 \right]$
|
|
\end{block}
|
|
}
|
|
Dans tous les modèles la structure de connectivité ($\bm{\alpha}$) est supposée identique au sein de la collection.
|
|
\end{frame}
|
|
\begin{frame}
|
|
\frametitle{Estimation des paramètres}
|
|
% DONE dire que tau i q m c' est la proba que Zim = q, approximation de la proba variationnelle. Parce qu on impose lindependance
|
|
% Par maximisation d'une borne inférieure variationnelle de la
|
|
% log-vraisemblance des données observées.
|
|
En adaptant \cite{chabert-liddellLearningCommonStructures2024a} qui se base
|
|
sur la méthode proposée par \cite{daudinMixtureModelRandom2008} utilisant
|
|
l'algorithme \emph{Variational EM}.
|
|
\begin{multline*}
|
|
\ell (\bm{X};\bm{\theta}) \geq \color{red}\sum_{m=1}^{M} \bigg(
|
|
\color{black} Q^m(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) +
|
|
\mathcal{H}(\mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}
|
|
(\mathbf{Z}^m, \mathbf{W}^m))
|
|
\color{red}\bigg) \color{black}
|
|
=: J(\bm{\tau};\bm{\theta})
|
|
\end{multline*}
|
|
où $Q^m(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) =
|
|
\operatorname{E}_{\mathbf{Z}^m,\mathbf{W}^m
|
|
\sim \mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}(.)}
|
|
\left[ \log p (\mathbf{X}^m,\mathbf{Z}^m,\mathbf{W}^m | \boldsymbol\theta) \right] \,$
|
|
|
|
\begin{block}{Approximation variationnelle}
|
|
$\mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}(\mathbf{Z}^m, \mathbf{W}^m) =
|
|
P(\mathbf{Z}^m | \mathbf{X}^m,\boldsymbol\theta^{(t)}) P(\mathbf{W}^m | \mathbf{X}^m,\boldsymbol\theta^{(t)})$, c'est à dire avoir
|
|
une indépendance lignes, colonnes.
|
|
\end{block}
|
|
\end{frame}
|
|
|
|
\begin{frame}{Formule développée de l'EM variationnel}
|
|
\begin{multline*}
|
|
\ell (\bm{X};\bm{\theta}) \geq \color{red}\sum_{m=1}^{M} \bigg( \color{black} \sum_{i = 1}^{n_1^m}\sum_{j=1}^{n_2^m}\sum_{q \in \mathcal{Q}_{1,m}} \sum_{r \in \mathcal{Q}_{2,m}} \tau^{1,m}_{i,q} \tau^{2,m}_{j,r} \log f(X^{m}_{ij}; \alpha_{qr}) \\
|
|
+ \sum_{i=1}^{n_1^m} \sum_{q \in \mathcal{Q}_{1,m}} \tau^{1,m}_{i,q} \log \pi_{\color{black}q}^{\color{gray}m} + \sum_{j=1}^{n_2^m} \sum_{r \in \mathcal{Q}_{2,m}} \tau^{2,m}_{j,r} \log \rho_{\color{black}r}^{\color{gray}m} \\
|
|
- \sum_{i=1}^{n_1} \tau^{1,m}_{i,q} \log \tau^{1,m}_{i,q} - \sum_{j=1}^{n_2} \tau^{2,m}_{j,r} \log \tau^{2,m}_{j,r} \color{red}\bigg) \color{black} =: J(\bm{\tau};\bm{\theta}),
|
|
\end{multline*}
|
|
où $\ell$ désigne la $\log$ vraisemblance.
|
|
|
|
\begin{block}{Approximation variationnelle}
|
|
$\tau_{iq}^{1,m} = P_{\mathcal{R}_m}(Z_{iq}^m = 1|X_{i\bullet}^m)$
|
|
et $\tau_{jr}^{2,m} = P_{\mathcal{R}_m}(W_{jr}^m = 1|X_{\bullet j}^m)$
|
|
\end{block}
|
|
\end{frame}
|
|
|
|
\begin{frame}{Étape \emph{Variational Expectation}}
|
|
$$\widehat{\bm{\tau}}^{(t+1)} = \arg \max_{\bm{\tau}}
|
|
\mathcal{J}(\mathcal{\bm{\tau}},\bm{\widehat{\theta}}^{(t)})$$
|
|
|
|
\begin{equation*}
|
|
\begin{cases}
|
|
\widehat{\tau}_{iq}^{1,m} \propto \widehat{\pi}_{q}^{m(t)} \prod_{j=1}^{n_2^m}\prod_{r\in\mathcal{Q}_2^m} f(X_{ij}^m;\widehat{\alpha}_{qr}^{(t)})^{\widehat{\tau}_{jr}^{2,m(t+1)}} & \forall i = 1, \dots , n_1^m, q \in \mathcal{Q}_1^m \\
|
|
\widehat{\tau}_{jr}^{2,m} \propto \widehat{\rho}_{r}^{m(t)} \prod_{i=1}^{n_1^m}\prod_{q\in\mathcal{Q}_1^m} f(X_{ij}^m;\widehat{\alpha}_{qr}^{(t)})^{\widehat{\tau}_{iq}^{1,m(t+1)}} & \forall j = 1, \dots , n_2^m, r \in \mathcal{Q}_2^m
|
|
\end{cases}
|
|
\end{equation*}
|
|
\footnotetext[2]{Initialisation des $\widehat{\bm{\tau}}$ avec un
|
|
\emph{spectral clustering} sur les réseaux.}
|
|
\end{frame}
|
|
|
|
\begin{frame}{Étape \emph{Maximization}}
|
|
\[
|
|
\widehat{\bm{\theta}}^{(t+1)} = \arg \max_{\bm{\theta}} \mathcal{J}(\mathcal{\bm{\widehat{\tau}}}^{(t+1)},\bm{\theta})
|
|
\]
|
|
|
|
\begin{block}{Paramètres de connectivité}
|
|
\begin{align*}
|
|
\widehat{\alpha}_{qr} = \frac{\sum_{m=1}^{M} \sum_{i=1}^{n_1^m} \sum_{j=1}^{n_2^m} \tau_{iq}^{1,m} \tau_{jr}^{2,m} X_{ij}^m}{\sum_{m=1}^{M} \sum_{i=1}^{n_1^m} \sum_{j=1}^{n_2^m} \tau_{iq}^{1,m} \tau_{jr}^{2,m}}
|
|
\end{align*}
|
|
\end{block}
|
|
\only<1>{
|
|
\begin{block}{Proportions pour \emph{iid}}
|
|
\begin{align*}
|
|
\widehat{\pi}_q = \frac{\sum_{m=1}^{M} \sum_{i=1}^{n_1^m} \tau_{iq}^{1,m}}{\sum_{m=1}^{M} n_1^m} & &
|
|
\widehat{\rho}_r = \frac{\sum_{m=1}^{M} \sum_{j=1}^{n_2^m} \tau_{jr}^{2,m}}{\sum_{m=1}^{M} n_2^m}
|
|
\end{align*}
|
|
\end{block}
|
|
}
|
|
\only<2>{
|
|
\begin{block}{Proportions pour $\pi\rho$}
|
|
\begin{align*}
|
|
\widehat{\pi}^{\color{red}m}_q = \frac{\sum_{i=1}^{n_1^m} \tau_{iq}^{1,m}}{n_1^m} & &
|
|
\widehat{\rho}^{\color{red}m}_r = \frac{\sum_{j=1}^{n_2^m} \tau_{jr}^{2,m}}{n_2^m}
|
|
\end{align*}
|
|
\end{block}
|
|
}
|
|
|
|
\end{frame}
|
|
|
|
\section{Sélection de modèle}
|
|
\begin{frame}
|
|
\frametitle{Problème de choix de $(Q_1, Q_2)$}
|
|
\underline{L'estimation de paramètres se fait à $Q_1, Q_2$ blocs fixés}, il faut donc déterminer les \enquote*{meilleures} coordonnées.
|
|
Nous maximisons un critère, le \emph{Bayesian Information Criterion - Like}
|
|
(BIC-L), de vraisemblance pénalisée en adaptant les formules
|
|
de~\cite{chabert-liddellLearningCommonStructures2024a}.
|
|
|
|
\begin{alertblock}{Problèmes de l'exploration}
|
|
\begin{itemize}
|
|
\item Exploration de l'espace $\mathbb{N}^2$ coûteux, besoin d'une
|
|
stratégie.
|
|
\item Sensibilité aux initialisations et à l'aléatoire.
|
|
\end{itemize}
|
|
|
|
\end{alertblock}
|
|
\end{frame}
|
|
|
|
\begin{frame}
|
|
\frametitle{Choix de $(Q_1,Q_2)$ - Approche gloutonne}
|
|
\begin{columns}
|
|
\begin{column}{0.5\linewidth}
|
|
\begin{tikzpicture}
|
|
\input{../tikz/greedy-exploration.tex}
|
|
\end{tikzpicture}
|
|
\end{column}
|
|
\begin{column}{0.35\linewidth}
|
|
\begin{itemize}
|
|
\item Modèle initialisé~:\\
|
|
\begin{tikzpicture}
|
|
\draw[fill=gray, draw=gray] circle [radius=0.225cm];
|
|
\end{tikzpicture}
|
|
\onslide<2->{
|
|
\item Modèle après \emph{split}~:
|
|
\begin{tikzpicture}
|
|
\draw[fill=blueind, draw=blueind] circle [radius=0.225cm];
|
|
\end{tikzpicture}
|
|
\item Modèle maximisant le critère~:\\
|
|
\begin{tikzpicture}
|
|
\draw[fill=white, draw=green, very thick] circle [radius=0.225cm];
|
|
\end{tikzpicture}
|
|
}
|
|
\onslide<3->{
|
|
\item Modèle après \emph{merge}~:
|
|
\begin{tikzpicture}
|
|
\draw[fill=red, draw=red] circle [radius=0.225cm];
|
|
\end{tikzpicture}
|
|
}
|
|
\end{itemize}
|
|
\end{column}
|
|
\end{columns}
|
|
\end{frame}
|
|
\begin{frame}
|
|
\frametitle{Choix de $(Q_1,Q_2)$ - Fenêtre glissante}
|
|
\begin{columns}
|
|
\begin{column}{0.6\textwidth}
|
|
\begin{figure}
|
|
\input{../tikz/moving-window.tex}
|
|
\caption{Fenêtre glissante}
|
|
\end{figure}
|
|
\end{column}
|
|
\begin{column}{0.4\textwidth}
|
|
\only<3>{\begin{block}{}
|
|
Initialisation du modèle si nécessaire
|
|
\end{block}}
|
|
\only<9>{\begin{block}{}
|
|
Localisation du nouveau mode
|
|
\end{block}}
|
|
\only<10>{\begin{block}{}
|
|
Déplacement sur le nouveau mode puis itération
|
|
\end{block}}
|
|
\end{column}
|
|
\end{columns}
|
|
\end{frame}
|
|
|
|
\section{Application}
|
|
\label{sec:application}
|
|
|
|
\begin{frame}
|
|
\frametitle{Clustering de réseaux}
|
|
\centering
|
|
\begin{tikzpicture}
|
|
\input{../tikz/clustering.tex}
|
|
\end{tikzpicture}
|
|
\end{frame}
|
|
|
|
\begin{frame}[allowframebreaks]
|
|
\frametitle{Application à~\cite{baldockDailyTemporalStructure2011,
|
|
baldockSystemsApproachReveals2019a}}
|
|
\begin{figure}[t]
|
|
\centering
|
|
\begin{subfigure}{0.5\textwidth}
|
|
\centering
|
|
\includegraphics[scale=0.2,angle=-90]{backup-app-iid.png}
|
|
\caption{Modèle $iid$,\\
|
|
séparent réseau africain et réseaux anglais}
|
|
\end{subfigure}%
|
|
~
|
|
\begin{subfigure}{0.5\textwidth}
|
|
\centering
|
|
\includegraphics[scale=0.2,angle=-90]{backup-app-pirho.png}
|
|
\caption{Modèle $\pi\rho$,\\
|
|
fusionnent réseaux africain et anglais}
|
|
\end{subfigure}%
|
|
\caption{Partitionnement des réseaux
|
|
de~\cite{baldockDailyTemporalStructure2011,
|
|
baldockSystemsApproachReveals2019a}}
|
|
\end{figure}
|
|
|
|
\begin{figure}[t]
|
|
\centering
|
|
\begin{subfigure}{0.5\textwidth}
|
|
\centering
|
|
\includegraphics[scale=0.1]{backup-app-iid-struct1.png}
|
|
\includegraphics[scale=0.2]{backup-app-iid-struct2.png}
|
|
\caption{Modèle $iid$,\\
|
|
séparent réseau africain et réseaux anglais}
|
|
\end{subfigure}%
|
|
~
|
|
\begin{subfigure}{0.5\textwidth}
|
|
\centering
|
|
\includegraphics[scale=0.2]{backup-app-pirho-struct.png}
|
|
\caption{Modèle $\pi\rho$,\\
|
|
fusionnent réseaux africain et anglais}
|
|
\end{subfigure}%
|
|
\caption{Structures détectées pour les réseaux
|
|
de~\cite{baldockDailyTemporalStructure2011,
|
|
baldockSystemsApproachReveals2019a}}
|
|
\end{figure}
|
|
\end{frame}
|
|
|
|
\section{Conclusion}
|
|
\label{sec:conclusion}
|
|
\begin{frame}
|
|
\frametitle{Conclusion et perspectives}
|
|
% DONE Ajouter une slide conclusion perspective
|
|
% Rappeler les modeles avec clustering
|
|
% Evoquer l'analyse de reseaux corrigés pour l'échantillonnage
|
|
% Lien vers le package
|
|
\begin{block}{Capacités}
|
|
\begin{itemize}
|
|
\item 4 modèles dont 3 qui ont une flexibilité sur au moins une des
|
|
dimensions (adaptabilité aux données).
|
|
\item Détecter structures classiques et moins classique de façon
|
|
agnostique.
|
|
\item Partitionner un ensemble de réseaux selon leurs structures.
|
|
\end{itemize}
|
|
\end{block}
|
|
|
|
|
|
\end{frame}
|
|
|
|
\begin{frame}{Perspectives}
|
|
\begin{itemize}
|
|
\item Investiguer stabilité face à l'aléatoire et aux \emph{optima} locaux.
|
|
\item Preuve d'identifiabilité du modèle $\pi\rho$.
|
|
\item
|
|
\end{itemize}
|
|
|
|
\begin{block}{Package et applications}
|
|
\begin{itemize}
|
|
\item Intégration au package \texttt{colSBM} et publication CRAN
|
|
\item Intégrer possibilité d'un critère supplémentaire pour le
|
|
clustering
|
|
\item Appliquer clustering données de \cite{pichonTellingMutualisticAntagonistic2024,doreRelativeEffectsAnthropogenic2021}
|
|
\item
|
|
\end{itemize}
|
|
|
|
\end{block}
|
|
\bigskip
|
|
\centering
|
|
Merci pour votre attention~!
|
|
\end{frame} |