mia-rapport-2024/soutenance/principal.tex

397 lines
No EOL
17 KiB
TeX

\section{Contexte du modèle}
\label{sec:contexte-du-modele}
\begin{frame}
\begin{columns}
\begin{column}{0.5\textwidth}
\begin{block}{Contexte écologique}
\begin{itemize}
\small
\item Nombreux réseaux disponibles pour
interactions similaires.
\item Suivi biodiversité, robustesse et risque
d'effondrement \dots
\end{itemize}
\begin{columns}
\begin{column}{0.5\textwidth}
\begin{figure}[ht]
\centering
\begin{tikzpicture}[scale=.45,rotate=270]
\input{../tikz/plantpollinatornetwork.tex}
\end{tikzpicture}
\caption{Exemple d'un réseau plantes-pollinisateurs}
\label{fig:plantes-pollin}
\end{figure}
\end{column}
\begin{column}{0.4\textwidth}
\centering
\begin{align*}
\begin{pmatrix}
1 & 0 & 1 \\
1 & 0 & 0 \\
1 & 0 & 0 \\
1 & 1 & 0
\end{pmatrix}
\end{align*}
\footnotesize
Matrice d'adjacence associée
\end{column}
\end{columns}
\end{block}
\end{column}
\onslide<2>{
\begin{column}{0.45\textwidth}
\begin{block}{Contexte mathématique}
Pour un unique réseau~: variables latentes,
\emph{embedding}, \dots
Motivations pour proposer des méthodes adaptées aux collections
de réseaux~:
\begin{itemize}
\item Espèces différentes, rôles analogues.
\item Transfert d'informations grands vers petits réseaux.
\item Regrouper les réseaux selon leur similarité (\emph{clustering}
de réseaux).
\end{itemize}
\end{block}
\end{column}
}
\end{columns}
\end{frame}
\begin{frame}
\addtocounter{footnote}{1}
\frametitle{Latent Block Model (LBM\footnotemark[\thefootnote])}
%DONE remplacer i \in bullet par Zi = \bullet
Proposé par~\cite{govaertEMAlgorithmBlock2005}.
\begin{columns}
\begin{column}{0.40\linewidth}
\begin{figure}[H]
\center
\begin{tikzpicture}[scale=0.35]
\input{../tikz/lbm.tex}
\end{tikzpicture}
\caption{Exemple de LBM\footnotemark[\thefootnote]}
\label{fig:LBMvisu}
\end{figure}
\end{column}
\begin{column}{0.51\linewidth}
Pour \begin{itemize}
\item $Q_1 = |\{{\color{blueind}\bullet},{\color{cyanind}\bullet},{\color{electricblue}\bullet}\}|$ blocs fixés en ligne
\item $Q_2 = |\{{\color{burntorange}\bullet},{\color{goldenyellow}\bullet},{\color{peach}\bullet}\}|$ blocs fixés en colonne
\end{itemize}
\begin{block}{Paramètres}
\begin{itemize}
\item $\pi_{\bullet} = \mathbb{P}(Z_i = \bullet)$ en ligne et $\rho_{\bullet} = \mathbb{P}(W_j = \bullet)$ en colonne
\item $\alpha_{{\color{blueind}\bullet}{\color{burntorange}\bullet}} = \mathbb{P}(X_{ij} = 1 | Z_i = {\color{blueind}\bullet}, W_j = {\color{burntorange}\bullet})$
\end{itemize}
\end{block}
\end{column}
\end{columns}
\footnotetext[\thefootnote]{Que j'appellerai par la suite BiSBM}
\end{frame}
\section{Modèle de collection de réseaux bipartites}
\label{sec:extension-de-colsbm-aux-reseaux-bipartites}
\begin{frame}
\frametitle{Collections bipartites}
\begin{tikzpicture}[scale=0.33]
\input{../tikz/collbm-iid.tex}
\end{tikzpicture}
\begin{itemize}
\item $Q_1 = |\{{\color{blueind}\bullet},{\color{cyanind}\bullet},{\color{electricblue}\bullet}\}|$ blocs fixés en ligne
\item $Q_2 = |\{{\color{burntorange}\bullet},{\color{goldenyellow}\bullet},{\color{peach}\bullet}\}|$ blocs fixés en colonne
\end{itemize}
\begin{block}{Paramètres}
\begin{itemize}
\item $\pi_{\bullet} = \mathbb{P}(Z_i =\bullet)$ en ligne et $\rho_{\bullet} = \mathbb{P}(W_j = \bullet)$ en colonne
\item $\alpha_{{\color{blueind}\bullet}{\color{burntorange}\bullet}} = \mathbb{P}(X_{ij} = 1 | Z_i = {\color{blueind}\bullet}, W_j = {\color{burntorange}\bullet})$
\end{itemize}
\end{block}
\end{frame}
\begin{frame}
\frametitle{Différents modèles}
\only<1>{
\begin{tikzpicture}[scale=0.33]
\input{../tikz/collbm-iid.tex}
\end{tikzpicture}
\begin{block}{\emph{iid-colBiSBM}}
$\bm{\pi} = (\pi_1, \dots \pi_{Q_1})$ et $\bm{\rho} = (\rho_1, \dots \rho_{Q_2})$
\end{block}
}
\only<2>{
\begin{tikzpicture}[scale=0.33]
\input{../tikz/collbm-pirho.tex}
\end{tikzpicture}
\begin{block}{\emph{$\pi\rho$-colBiSBM}}
$\bm{\pi} = ((\pi_{\color{black}1}^{\color{red}m}, \dots \pi_{\color{black}Q_1}^{\color{red}m}))_{m=1,\dots M}$ et $\bm{\rho} = ((\rho_{\color{black}1}^{\color{red}m}, \dots \rho_{\color{black}Q_2}^{\color{red}m}))_{m=1,\dots M}$ %{$\forall q \in \llbracket 1, Q_1 - 1\rrbracket, \pi_q > 0$ et $\forall r \in \llbracket 1, Q_2 - 1\rrbracket, \rho_r > 0$}
\small \\
avec $\forall q,m \in \llbracket 1, Q_1 \rrbracket \times \llbracket 1, M \rrbracket, \pi_q^m \in \left[ 0,1 \right]$
et $\forall r,m \in \llbracket 1, Q_2 \rrbracket \times \llbracket 1, M \rrbracket, \rho_r^m \in \left[ 0,1 \right]$
\end{block}
}
Dans tous les modèles la structure de connectivité ($\bm{\alpha}$) est supposée identique au sein de la collection.
\end{frame}
\begin{frame}
\frametitle{Estimation des paramètres}
% DONE dire que tau i q m c' est la proba que Zim = q, approximation de la proba variationnelle. Parce qu on impose lindependance
% Par maximisation d'une borne inférieure variationnelle de la
% log-vraisemblance des données observées.
En adaptant \cite{chabert-liddellLearningCommonStructures2024a} qui se base
sur la méthode proposée par \cite{daudinMixtureModelRandom2008} utilisant
l'algorithme \emph{Variational EM}.
\begin{multline*}
\ell (\bm{X};\bm{\theta}) \geq \color{red}\sum_{m=1}^{M} \bigg(
\color{black} Q^m(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) +
\mathcal{H}(\mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}
(\mathbf{Z}^m, \mathbf{W}^m))
\color{red}\bigg) \color{black}
=: J(\bm{\tau};\bm{\theta})
\end{multline*}
$Q^m(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) =
\operatorname{E}_{\mathbf{Z}^m,\mathbf{W}^m
\sim \mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}(.)}
\left[ \log p (\mathbf{X}^m,\mathbf{Z}^m,\mathbf{W}^m | \boldsymbol\theta) \right] \,$
\begin{block}{Approximation variationnelle}
$\mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}(\mathbf{Z}^m, \mathbf{W}^m) =
P(\mathbf{Z}^m | \mathbf{X}^m,\boldsymbol\theta^{(t)}) P(\mathbf{W}^m | \mathbf{X}^m,\boldsymbol\theta^{(t)})$, c'est à dire avoir
une indépendance lignes, colonnes.
\end{block}
\end{frame}
\begin{frame}{Formule développée de l'EM variationnel}
\begin{multline*}
\ell (\bm{X};\bm{\theta}) \geq \color{red}\sum_{m=1}^{M} \bigg( \color{black} \sum_{i = 1}^{n_1^m}\sum_{j=1}^{n_2^m}\sum_{q \in \mathcal{Q}_{1,m}} \sum_{r \in \mathcal{Q}_{2,m}} \tau^{1,m}_{i,q} \tau^{2,m}_{j,r} \log f(X^{m}_{ij}; \alpha_{qr}) \\
+ \sum_{i=1}^{n_1^m} \sum_{q \in \mathcal{Q}_{1,m}} \tau^{1,m}_{i,q} \log \pi_{\color{black}q}^{\color{gray}m} + \sum_{j=1}^{n_2^m} \sum_{r \in \mathcal{Q}_{2,m}} \tau^{2,m}_{j,r} \log \rho_{\color{black}r}^{\color{gray}m} \\
- \sum_{i=1}^{n_1} \tau^{1,m}_{i,q} \log \tau^{1,m}_{i,q} - \sum_{j=1}^{n_2} \tau^{2,m}_{j,r} \log \tau^{2,m}_{j,r} \color{red}\bigg) \color{black} =: J(\bm{\tau};\bm{\theta}),
\end{multline*}
$\ell$ désigne la $\log$ vraisemblance.
\begin{block}{Approximation variationnelle}
$\tau_{iq}^{1,m} = P_{\mathcal{R}_m}(Z_{iq}^m = 1|X_{i\bullet}^m)$
et $\tau_{jr}^{2,m} = P_{\mathcal{R}_m}(W_{jr}^m = 1|X_{\bullet j}^m)$
\end{block}
\end{frame}
\begin{frame}{Étape \emph{Variational Expectation}}
$$\widehat{\bm{\tau}}^{(t+1)} = \arg \max_{\bm{\tau}}
\mathcal{J}(\mathcal{\bm{\tau}},\bm{\widehat{\theta}}^{(t)})$$
\begin{equation*}
\begin{cases}
\widehat{\tau}_{iq}^{1,m} \propto \widehat{\pi}_{q}^{m(t)} \prod_{j=1}^{n_2^m}\prod_{r\in\mathcal{Q}_2^m} f(X_{ij}^m;\widehat{\alpha}_{qr}^{(t)})^{\widehat{\tau}_{jr}^{2,m(t+1)}} & \forall i = 1, \dots , n_1^m, q \in \mathcal{Q}_1^m \\
\widehat{\tau}_{jr}^{2,m} \propto \widehat{\rho}_{r}^{m(t)} \prod_{i=1}^{n_1^m}\prod_{q\in\mathcal{Q}_1^m} f(X_{ij}^m;\widehat{\alpha}_{qr}^{(t)})^{\widehat{\tau}_{iq}^{1,m(t+1)}} & \forall j = 1, \dots , n_2^m, r \in \mathcal{Q}_2^m
\end{cases}
\end{equation*}
\footnotetext[2]{Initialisation des $\widehat{\bm{\tau}}$ avec un
\emph{spectral clustering} sur les réseaux.}
\end{frame}
\begin{frame}{Étape \emph{Maximization}}
\[
\widehat{\bm{\theta}}^{(t+1)} = \arg \max_{\bm{\theta}} \mathcal{J}(\mathcal{\bm{\widehat{\tau}}}^{(t+1)},\bm{\theta})
\]
\begin{block}{Paramètres de connectivité}
\begin{align*}
\widehat{\alpha}_{qr} = \frac{\sum_{m=1}^{M} \sum_{i=1}^{n_1^m} \sum_{j=1}^{n_2^m} \tau_{iq}^{1,m} \tau_{jr}^{2,m} X_{ij}^m}{\sum_{m=1}^{M} \sum_{i=1}^{n_1^m} \sum_{j=1}^{n_2^m} \tau_{iq}^{1,m} \tau_{jr}^{2,m}}
\end{align*}
\end{block}
\only<1>{
\begin{block}{Proportions pour \emph{iid}}
\begin{align*}
\widehat{\pi}_q = \frac{\sum_{m=1}^{M} \sum_{i=1}^{n_1^m} \tau_{iq}^{1,m}}{\sum_{m=1}^{M} n_1^m} & &
\widehat{\rho}_r = \frac{\sum_{m=1}^{M} \sum_{j=1}^{n_2^m} \tau_{jr}^{2,m}}{\sum_{m=1}^{M} n_2^m}
\end{align*}
\end{block}
}
\only<2>{
\begin{block}{Proportions pour $\pi\rho$}
\begin{align*}
\widehat{\pi}^{\color{red}m}_q = \frac{\sum_{i=1}^{n_1^m} \tau_{iq}^{1,m}}{n_1^m} & &
\widehat{\rho}^{\color{red}m}_r = \frac{\sum_{j=1}^{n_2^m} \tau_{jr}^{2,m}}{n_2^m}
\end{align*}
\end{block}
}
\end{frame}
\section{Sélection de modèle}
\begin{frame}
\frametitle{Problème de choix de $(Q_1, Q_2)$}
\underline{L'estimation de paramètres se fait à $Q_1, Q_2$ blocs fixés}, il faut donc déterminer les \enquote*{meilleures} coordonnées.
Nous maximisons un critère, le \emph{Bayesian Information Criterion - Like}
(BIC-L), de vraisemblance pénalisée en adaptant les formules
de~\cite{chabert-liddellLearningCommonStructures2024a}.
\begin{alertblock}{Problèmes de l'exploration}
\begin{itemize}
\item Exploration de l'espace $\mathbb{N}^2$ coûteux, besoin d'une
stratégie.
\item Sensibilité aux initialisations et à l'aléatoire.
\end{itemize}
\end{alertblock}
\end{frame}
\begin{frame}
\frametitle{Choix de $(Q_1,Q_2)$ - Approche gloutonne}
\begin{columns}
\begin{column}{0.5\linewidth}
\begin{tikzpicture}
\input{../tikz/greedy-exploration.tex}
\end{tikzpicture}
\end{column}
\begin{column}{0.35\linewidth}
\begin{itemize}
\item Modèle initialisé~:\\
\begin{tikzpicture}
\draw[fill=gray, draw=gray] circle [radius=0.225cm];
\end{tikzpicture}
\onslide<2->{
\item Modèle après \emph{split}~:
\begin{tikzpicture}
\draw[fill=blueind, draw=blueind] circle [radius=0.225cm];
\end{tikzpicture}
\item Modèle maximisant le critère~:\\
\begin{tikzpicture}
\draw[fill=white, draw=green, very thick] circle [radius=0.225cm];
\end{tikzpicture}
}
\onslide<3->{
\item Modèle après \emph{merge}~:
\begin{tikzpicture}
\draw[fill=red, draw=red] circle [radius=0.225cm];
\end{tikzpicture}
}
\end{itemize}
\end{column}
\end{columns}
\end{frame}
\begin{frame}
\frametitle{Choix de $(Q_1,Q_2)$ - Fenêtre glissante}
\begin{columns}
\begin{column}{0.6\textwidth}
\begin{figure}
\input{../tikz/moving-window.tex}
\caption{Fenêtre glissante}
\end{figure}
\end{column}
\begin{column}{0.4\textwidth}
\only<3>{\begin{block}{}
Initialisation du modèle si nécessaire
\end{block}}
\only<9>{\begin{block}{}
Localisation du nouveau mode
\end{block}}
\only<10>{\begin{block}{}
Déplacement sur le nouveau mode puis itération
\end{block}}
\end{column}
\end{columns}
\end{frame}
\section{Application}
\label{sec:application}
\begin{frame}
\frametitle{Clustering de réseaux}
\centering
\begin{tikzpicture}
\input{../tikz/clustering.tex}
\end{tikzpicture}
\end{frame}
\begin{frame}[allowframebreaks]
\frametitle{Application à~\cite{baldockDailyTemporalStructure2011,
baldockSystemsApproachReveals2019a}}
\begin{figure}[t]
\centering
\begin{subfigure}{0.5\textwidth}
\centering
\includegraphics[scale=0.2,angle=-90]{backup-app-iid.png}
\caption{Modèle $iid$,\\
séparent réseau africain et réseaux anglais}
\end{subfigure}%
~
\begin{subfigure}{0.5\textwidth}
\centering
\includegraphics[scale=0.2,angle=-90]{backup-app-pirho.png}
\caption{Modèle $\pi\rho$,\\
fusionnent réseaux africain et anglais}
\end{subfigure}%
\caption{Partitionnement des réseaux
de~\cite{baldockDailyTemporalStructure2011,
baldockSystemsApproachReveals2019a}}
\end{figure}
\begin{figure}[t]
\centering
\begin{subfigure}{0.5\textwidth}
\centering
\includegraphics[scale=0.1]{backup-app-iid-struct1.png}
\includegraphics[scale=0.2]{backup-app-iid-struct2.png}
\caption{Modèle $iid$,\\
séparent réseau africain et réseaux anglais}
\end{subfigure}%
~
\begin{subfigure}{0.5\textwidth}
\centering
\includegraphics[scale=0.2]{backup-app-pirho-struct.png}
\caption{Modèle $\pi\rho$,\\
fusionnent réseaux africain et anglais}
\end{subfigure}%
\caption{Structures détectées pour les réseaux
de~\cite{baldockDailyTemporalStructure2011,
baldockSystemsApproachReveals2019a}}
\end{figure}
\end{frame}
\section{Conclusion}
\label{sec:conclusion}
\begin{frame}
\frametitle{Conclusion et perspectives}
% DONE Ajouter une slide conclusion perspective
% Rappeler les modeles avec clustering
% Evoquer l'analyse de reseaux corrigés pour l'échantillonnage
% Lien vers le package
\begin{block}{Capacités}
\begin{itemize}
\item 4 modèles dont 3 qui ont une flexibilité sur au moins une des
dimensions (adaptabilité aux données).
\item Détecter structures classiques et moins classique de façon
agnostique.
\item Partitionner un ensemble de réseaux selon leurs structures.
\end{itemize}
\end{block}
\end{frame}
\begin{frame}{Perspectives}
\begin{itemize}
\item Investiguer stabilité face à l'aléatoire et aux \emph{optima} locaux.
\item Preuve d'identifiabilité du modèle $\pi\rho$.
\item
\end{itemize}
\begin{block}{Package et applications}
\begin{itemize}
\item Intégration au package \texttt{colSBM} et publication CRAN
\item Intégrer possibilité d'un critère supplémentaire pour le
clustering
\item Appliquer clustering données de \cite{pichonTellingMutualisticAntagonistic2024,doreRelativeEffectsAnthropogenic2021}
\item
\end{itemize}
\end{block}
\bigskip
\centering
Merci pour votre attention~!
\end{frame}