mia-rapport-2024/presentation/principal.tex

281 lines
No EOL
12 KiB
TeX

\section{Contexte du modèle}
\label{sec:contexte-du-modele}
\begin{frame}
\begin{columns}
\begin{column}{0.5\textwidth}
\begin{block}{Contexte écologique}
\begin{itemize}
\small
\item Nombreux réseaux disponibles pour
interactions similaires.
\item Suivi biodiversité, robustesse et risque
d'effondrement \dots
\end{itemize}
\begin{columns}
\begin{column}{0.5\textwidth}
\begin{figure}[ht]
\centering
\begin{tikzpicture}[scale=.45,rotate=270]
\input{../tikz/plantpollinatornetwork.tex}
\end{tikzpicture}
\caption{Exemple d'un réseau plantes-pollinisateurs}
\label{fig:plantes-pollin}
\end{figure}
\end{column}
\begin{column}{0.4\textwidth}
\centering
\begin{align*}
\begin{pmatrix}
1 & 1 & 1 \\
0 & 0 & 0 \\
1 & 0 & 0 \\
0 & 0 & 0
\end{pmatrix}
\end{align*}
\footnotesize
Matrice d'adjacence associée
\end{column}
\end{columns}
\end{block}
\end{column}
\onslide<2>{
\begin{column}{0.45\textwidth}
\begin{block}{Contexte mathématique}
Pour un unique réseau~: variables latentes,
\emph{embedding}, \dots
Motivations pour proposer des méthodes adaptées aux collections
de réseaux~:
\begin{itemize}
\item Espèces différentes, rôles analogues.
\item Transfert d'informations grands vers petits réseaux.
\item Regrouper les réseaux selon leur similarité (\emph{clustering}
de réseaux).
\end{itemize}
\end{block}
\end{column}
}
\end{columns}
\end{frame}
\begin{frame}
\addtocounter{footnote}{1}
\frametitle{Latent Block Model (LBM\footnotemark[\thefootnote])}
%DONE remplacer i \in bullet par Zi = \bullet
Proposé par~\cite{govaertEMAlgorithmBlock2005}.
\begin{columns}
\begin{column}{0.40\linewidth}
\begin{figure}[H]
\center
\begin{tikzpicture}[scale=0.35]
\input{../tikz/lbm.tex}
\end{tikzpicture}
\caption{Exemple de LBM\footnotemark[\thefootnote]}
\label{fig:LBMvisu}
\end{figure}
\end{column}
\begin{column}{0.51\linewidth}
Pour \begin{itemize}
\item $Q_1 = |\{{\color{blueind}\bullet},{\color{cyanind}\bullet},{\color{electricblue}\bullet}\}|$ blocs fixés en ligne
\item $Q_2 = |\{{\color{burntorange}\bullet},{\color{goldenyellow}\bullet},{\color{peach}\bullet}\}|$ blocs fixés en colonne
\end{itemize}
\begin{block}{Paramètres}
\begin{itemize}
\item $\pi_{\bullet} = \mathbb{P}(Z_i = \bullet)$ en ligne et $\rho_{\bullet} = \mathbb{P}(W_j = \bullet)$ en colonne
\item $\alpha_{{\color{blueind}\bullet}{\color{burntorange}\bullet}} = \mathbb{P}(X_{ij} = 1 | Z_i = {\color{blueind}\bullet}, W_j = {\color{burntorange}\bullet})$
\end{itemize}
\end{block}
\end{column}
\end{columns}
\footnotetext[\thefootnote]{Que j'appellerai par la suite BiSBM}
\end{frame}
\section{Modèle de collection de réseaux bipartites}
\label{sec:extension-de-colsbm-aux-reseaux-bipartites}
\begin{frame}
\frametitle{Collections bipartites}
\begin{tikzpicture}[scale=0.33]
\input{../tikz/collbm-iid.tex}
\end{tikzpicture}
\begin{itemize}
\item $Q_1 = |\{{\color{blueind}\bullet},{\color{cyanind}\bullet},{\color{electricblue}\bullet}\}|$ blocs fixés en ligne
\item $Q_2 = |\{{\color{burntorange}\bullet},{\color{goldenyellow}\bullet},{\color{peach}\bullet}\}|$ blocs fixés en colonne
\end{itemize}
\begin{block}{Paramètres}
\begin{itemize}
\item $\pi_{\bullet} = \mathbb{P}(Z_i =\bullet)$ en ligne et $\rho_{\bullet} = \mathbb{P}(W_j = \bullet)$ en colonne
\item $\alpha_{{\color{blueind}\bullet}{\color{burntorange}\bullet}} = \mathbb{P}(X_{ij} = 1 | Z_i = {\color{blueind}\bullet}, W_j = {\color{burntorange}\bullet})$
\end{itemize}
\end{block}
\end{frame}
\begin{frame}
\frametitle{Différents modèles}
\only<1>{
\begin{tikzpicture}[scale=0.33]
\input{../tikz/collbm-iid.tex}
\end{tikzpicture}
\begin{block}{\emph{iid-colBiSBM}}
$\bm{\pi} = (\pi_1, \dots \pi_{Q_1})$ et $\bm{\rho} = (\rho_1, \dots \rho_{Q_2})$
\end{block}
}
\only<2>{
\begin{tikzpicture}[scale=0.33]
\input{../tikz/collbm-pirho.tex}
\end{tikzpicture}
\begin{block}{\emph{$\pi\rho$-colBiSBM}}
$\bm{\pi} = ((\pi_{\color{black}1}^{\color{red}m}, \dots \pi_{\color{black}Q_1}^{\color{red}m}))_{m=1,\dots M}$ et $\bm{\rho} = ((\rho_{\color{black}1}^{\color{red}m}, \dots \rho_{\color{black}Q_2}^{\color{red}m}))_{m=1,\dots M}$ %{$\forall q \in \llbracket 1, Q_1 - 1\rrbracket, \pi_q > 0$ et $\forall r \in \llbracket 1, Q_2 - 1\rrbracket, \rho_r > 0$}
\small \\
avec $\forall q,m \in \llbracket 1, Q_1 \rrbracket \times \llbracket 1, M \rrbracket, \pi_q^m \in \left[ 0,1 \right]$
et $\forall r,m \in \llbracket 1, Q_2 \rrbracket \times \llbracket 1, M \rrbracket, \rho_r^m \in \left[ 0,1 \right]$
\end{block}
}
Dans tous les modèles la structure de connectivité ($\bm{\alpha}$) est supposée identique au sein de la collection.
\end{frame}
\begin{frame}
\frametitle{Estimation des paramètres}
% DONE dire que tau i q m c' est la proba que Zim = q, approximation de la proba variationnelle. Parce qu on impose lindependance
% Par maximisation d'une borne inférieure variationnelle de la
% log-vraisemblance des données observées.
En adaptant \cite{chabert-liddellLearningCommonStructures2024a} qui se base
sur la méthode proposée par \cite{daudinMixtureModelRandom2008} utilisant
l'algorithme \emph{Variational EM}.
\begin{multline*}
\ell (\bm{X};\bm{\theta}) \geq \color{red}\sum_{m=1}^{M} \bigg(
\color{black} Q^m(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) +
\mathcal{H}(\mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}
(\mathbf{Z}^m, \mathbf{W}^m))
\color{red}\bigg) \color{black}
=: J(\bm{\tau};\bm{\theta})
\end{multline*}
$Q^m(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) =
\operatorname{E}_{\mathbf{Z}^m,\mathbf{W}^m
\sim \mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}(.)}
\left[ \log p (\mathbf{X}^m,\mathbf{Z}^m,\mathbf{W}^m | \boldsymbol\theta) \right] \,$
\appxnote{Formule développée EM variationnel}{
\begin{multline*}
\ell (\bm{X};\bm{\theta}) \geq \color{red}\sum_{m=1}^{M} \bigg( \color{black} \sum_{i = 1}^{n_1^m}\sum_{j=1}^{n_2^m}\sum_{q \in \mathcal{Q}_{1,m}} \sum_{r \in \mathcal{Q}_{2,m}} \tau^{1,m}_{i,q} \tau^{2,m}_{j,r} \log f(X^{m}_{ij}; \alpha_{qr}) \\
+ \sum_{i=1}^{n_1^m} \sum_{q \in \mathcal{Q}_{1,m}} \tau^{1,m}_{i,q} \log \pi_{\color{black}q}^{\color{gray}m} + \sum_{j=1}^{n_2^m} \sum_{r \in \mathcal{Q}_{2,m}} \tau^{2,m}_{j,r} \log \rho_{\color{black}r}^{\color{gray}m} \\
- \sum_{i=1}^{n_1} \tau^{1,m}_{i,q} \log \tau^{1,m}_{i,q} - \sum_{j=1}^{n_2} \tau^{2,m}_{j,r} \log \tau^{2,m}_{j,r} \color{red}\bigg) \color{black} =: J(\bm{\tau};\bm{\theta}),
\end{multline*}
$\ell$ désigne la $\log$ vraisemblance.
}
\begin{block}{Approximation variationnelle}
$\mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}(\mathbf{Z}^m, \mathbf{W}^m) =
P(\mathbf{Z}^m | \mathbf{X}^m,\boldsymbol\theta^{(t)}) P(\mathbf{W}^m | \mathbf{X}^m,\boldsymbol\theta^{(t)})$, c'est à dire avoir
une indépendance lignes, colonnes.
\end{block}
\end{frame}
\section{Sélection de modèle}
\begin{frame}
\frametitle{Problème de choix de $(Q_1, Q_2)$}
\underline{L'estimation de paramètres se fait à $Q_1, Q_2$ blocs fixés}, il faut donc déterminer les \enquote*{meilleures} coordonnées.
Nous maximisons un critère, le \emph{Bayesian Information Criterion - Like}
(BIC-L), de vraisemblance pénalisée en adaptant les formules
de~\cite{chabert-liddellLearningCommonStructures2024a}.
\begin{alertblock}{Problèmes de l'exploration}
\begin{itemize}
\item Exploration de l'espace $\mathbb{N}^2$ coûteux, besoin d'une
stratégie.
\item Sensibilité aux initialisations et à l'aléatoire.
\end{itemize}
\end{alertblock}
\end{frame}
\section{Application}
\label{sec:application}
\begin{frame}
\frametitle{Clustering de réseaux}
\centering
\begin{tikzpicture}
\input{../tikz/clustering.tex}
\end{tikzpicture}
\end{frame}
\begin{frame}[allowframebreaks]
\frametitle{Application à~\cite{baldockDailyTemporalStructure2011,
baldockSystemsApproachReveals2019a}}
\begin{figure}[t]
\centering
\begin{subfigure}{0.5\textwidth}
\centering
\includegraphics[scale=0.2,angle=-90]{backup-app-iid.png}
\caption{Modèle $iid$,\\
séparent réseau africain et réseaux anglais}
\end{subfigure}%
~
\begin{subfigure}{0.5\textwidth}
\centering
\includegraphics[scale=0.2,angle=-90]{backup-app-pirho.png}
\caption{Modèle $\pi\rho$,\\
fusionnent réseaux africain et anglais}
\end{subfigure}%
\caption{Partitionnement des réseaux
de~\cite{baldockDailyTemporalStructure2011,
baldockSystemsApproachReveals2019a}}
\end{figure}
\begin{figure}[t]
\centering
\begin{subfigure}{0.5\textwidth}
\centering
\includegraphics[scale=0.1]{backup-app-iid-struct1.png}
\includegraphics[scale=0.2]{backup-app-iid-struct2.png}
\caption{Modèle $iid$,\\
séparent réseau africain et réseaux anglais}
\end{subfigure}%
~
\begin{subfigure}{0.5\textwidth}
\centering
\includegraphics[scale=0.2]{backup-app-pirho-struct.png}
\caption{Modèle $\pi\rho$,\\
fusionnent réseaux africain et anglais}
\end{subfigure}%
\caption{Structures détectées pour les réseaux
de~\cite{baldockDailyTemporalStructure2011,
baldockSystemsApproachReveals2019a}}
\end{figure}
\end{frame}
\section{Conclusion}
\label{sec:conclusion}
\begin{frame}
\frametitle{Conclusion et perspectives}
% DONE Ajouter une slide conclusion perspective
% Rappeler les modeles avec clustering
% Evoquer l'analyse de reseaux corrigés pour l'échantillonnage
% Lien vers le package
\begin{block}{Capacités}
\begin{itemize}
\item 4 modèles dont 3 qui ont une flexibilité sur au moins une des
dimensions (adaptabilité aux données).
\item Détecter structures classiques et moins classique de façon
agnostique.
\item Partitionner un ensemble de réseaux selon leurs structures.
\end{itemize}
\end{block}
\begin{block}{Perspectives}
\begin{itemize}
\item Investiguer stabilité à la \emph{graine}.
\item Intégration au package \texttt{colSBM} et publication CRAN
\item Preuve d'identifiabilité du modèle $\pi\rho$.
\end{itemize}
\end{block}
\bigskip
\centering
Merci pour votre attention~!
\end{frame}