mia-rapport-2024/presentation/presentation.tex

365 lines
No EOL
14 KiB
TeX

\documentclass{beamer}
\usetheme{Boadilla}
% importations
\usepackage[french]{babel} % pour dire que le texte est en francais
\usepackage{csquotes}
\usepackage[T1]{fontenc} % pour les font postscript
\usepackage[cyr]{aeguill} % Police vectorielle TrueType, guillemets francais
\usepackage{epsfig} % pour gérer les images
\usepackage{amsmath,amsthm, stmaryrd} % très bon mode mathématique
\usepackage{amsfonts,amssymb,bm, bbold}% permet la definition des ensembles
\usepackage{algorithm2e} % pour les algorithmes
\usepackage{algpseudocode} % pour les algorithmes
\usepackage{graphicx}
\usepackage{float} % pour le placement des figure
\usepackage{url} % pour une gestion efficace des url
\usepackage{hyperref} % pour les hyperliens dans le document
\usepackage{tikz} % For graph plots
\usepackage[outline]{contour}
\usepackage{adjustbox} % To resize tikzpictures
\usepackage{fontawesome5}
\usepackage{makecell}
% Beamer
\setbeamertemplate{headline}{%
\begin{beamercolorbox}[ht=2.25ex,dp=3.75ex]{section in head/foot}
\insertnavigation{\paperwidth}
\end{beamercolorbox}%
}%
\beamertemplatenavigationsymbolsempty % Pas de bar de navigation
\setbeamerfont{caption}{size=\scriptsize} % Petit titre de figures
% bibliographie
\usepackage[style=apa,sorting=none]{biblatex}
\addbibresource{../references.bib}
% Images
\graphicspath{{../img/}{../figure/}}
% Tikz
%% Tikz Related
\usetikzlibrary{calc,shapes,backgrounds,arrows,automata,shadows,positioning}
\usetikzlibrary{arrows,shapes,positioning,shadows,trees,calc,backgrounds,automata,positioning}
\usetikzlibrary{decorations.pathreplacing,calligraphy,external,petri}
%% Tikz sets
\tikzset{
basic/.style = {draw, text width=3cm, font=\sffamily, rectangle},
root/.style = {basic, rounded corners=2pt, thin, align=center,
fill=green!30},
level 2/.style = {basic, rounded corners=6pt, thin,align=center, fill=green!60,
text width=8em},
level 3/.style = {basic, thin, align=left, fill=pink!60, text width=3.5cm}
}
% Couleurs
% pour tickz multilevel
\definecolor{ao(english)}{rgb}{0.0, 0.5, 0.0}
\definecolor{redorg}{RGB}{215, 48, 39}
\definecolor{orangeorg}{RGB}{253, 174, 97}
\definecolor{blueind}{RGB}{016, 101, 171}
\definecolor{cyanind}{RGB}{058, 147, 195}
\definecolor{electricblue}{RGB}{142, 196, 222}
\definecolor{greenind}{RGB}{112, 130, 56}
\definecolor{burntorange}{RGB}{179, 021, 041}
\definecolor{goldenyellow}{RGB}{215, 095, 076}
\definecolor{peach}{RGB}{246, 164, 130}
\definecolor{gray}{RGB}{128, 128, 128}
% Footnote
\makeatletter
\newcommand\blfootnote[1]{%
\begingroup
\renewcommand{\@makefntext}[1]{\noindent\makebox[1.8em][r]#1}
\renewcommand\thefootnote{}\footnote{#1}%
\addtocounter{footnote}{-1}%
\endgroup
}
\makeatother
\subtitle{Séminaire des stagiaires}
\title[Collections de réseaux bipartites]{Détection de structure dans des réseaux bipartites}
\author[L. Lacoste]{Louis \textsc{Lacoste}} % Sous la supervision de Pierre
\date{4 juillet 2024}
\begin{document}
% titre
\begin{frame}[noframenumbering,plain]
\maketitle
\end{frame}
\section{Contexte du modèle}
\label{sec:contexte-du-modele}
\begin{frame}
\begin{columns}
\begin{column}{0.5\textwidth}
\begin{block}{Contexte écologique}
\begin{itemize}
\small
\item Nombreux réseaux disponibles pour
interactions similaires.
\item Suivi biodiversité, robustesse et risque
d'effondrement \dots
\end{itemize}
\begin{columns}
\begin{column}{0.5\textwidth}
\begin{figure}[ht]
\centering
\begin{tikzpicture}[scale=.45,rotate=270]
\input{../tikz/plantpollinatornetwork.tex}
\end{tikzpicture}
\caption{Exemple d'un réseau plantes-pollinisateurs}
\label{fig:plantes-pollin}
\end{figure}
\end{column}
\begin{column}{0.4\textwidth}
\centering
\begin{align*}
\begin{pmatrix}
1 & 1 & 1 \\
0 & 0 & 0 \\
1 & 0 & 0 \\
0 & 0 & 0
\end{pmatrix}
\end{align*}
\footnotesize
Matrice d'adjacence associée
\end{column}
\end{columns}
\end{block}
\end{column}
\onslide<2>{
\begin{column}{0.45\textwidth}
\begin{block}{Contexte mathématique}
Pour un unique réseau~: variables latentes,
\emph{embedding}, \dots
Motivations pour proposer des méthodes adaptées aux collections
de réseaux~:
\begin{itemize}
\item Espèces différentes, rôles analogues.
\item Transfert d'informations grands vers petits réseaux.
\item Regrouper les réseaux selon leur similarité (\emph{clustering}
de réseaux).
\end{itemize}
\end{block}
\end{column}
}
\end{columns}
\end{frame}
\begin{frame}
\addtocounter{footnote}{1}
\frametitle{Latent Block Model (LBM\footnotemark[\thefootnote])}
%DONE remplacer i \in bullet par Zi = \bullet
Proposé par~\cite{govaertEMAlgorithmBlock2005}.
\begin{columns}
\begin{column}{0.40\linewidth}
\begin{figure}[H]
\center
\begin{tikzpicture}[scale=0.35]
\input{../tikz/lbm.tex}
\end{tikzpicture}
\caption{Exemple de LBM\footnotemark[\thefootnote]}
\label{fig:LBMvisu}
\end{figure}
\end{column}
\begin{column}{0.51\linewidth}
Pour \begin{itemize}
\item $Q_1 = |\{{\color{blueind}\bullet},{\color{cyanind}\bullet},{\color{electricblue}\bullet}\}|$ blocs fixés en ligne
\item $Q_2 = |\{{\color{burntorange}\bullet},{\color{goldenyellow}\bullet},{\color{peach}\bullet}\}|$ blocs fixés en colonne
\end{itemize}
\begin{block}{Paramètres}
\begin{itemize}
\item $\pi_{\bullet} = \mathbb{P}(Z_i = \bullet)$ en ligne et $\rho_{\bullet} = \mathbb{P}(W_j = \bullet)$ en colonne
\item $\alpha_{{\color{blueind}\bullet}{\color{burntorange}\bullet}} = \mathbb{P}(X_{ij} = 1 | Z_i = {\color{blueind}\bullet}, W_j = {\color{burntorange}\bullet})$
\end{itemize}
\end{block}
\end{column}
\end{columns}
\footnotetext[\thefootnote]{Que j'appellerai par la suite BiSBM}
\end{frame}
\section{Modèle de collection de réseaux bipartites}
\label{sec:extension-de-colsbm-aux-reseaux-bipartites}
\begin{frame}
\frametitle{Collections bipartites}
\begin{tikzpicture}[scale=0.33]
\input{../tikz/collbm-iid.tex}
\end{tikzpicture}
\begin{itemize}
\item $Q_1 = |\{{\color{blueind}\bullet},{\color{cyanind}\bullet},{\color{electricblue}\bullet}\}|$ blocs fixés en ligne
\item $Q_2 = |\{{\color{burntorange}\bullet},{\color{goldenyellow}\bullet},{\color{peach}\bullet}\}|$ blocs fixés en colonne
\end{itemize}
\begin{block}{Paramètres}
\begin{itemize}
\item $\pi_{\bullet} = \mathbb{P}(Z_i =\bullet)$ en ligne et $\rho_{\bullet} = \mathbb{P}(W_j = \bullet)$ en colonne
\item $\alpha_{{\color{blueind}\bullet}{\color{burntorange}\bullet}} = \mathbb{P}(X_{ij} = 1 | Z_i = {\color{blueind}\bullet}, W_j = {\color{burntorange}\bullet})$
\end{itemize}
\end{block}
\end{frame}
\begin{frame}
\frametitle{Différents modèles}
\only<1>{
\begin{tikzpicture}[scale=0.33]
\input{../tikz/collbm-iid.tex}
\end{tikzpicture}
\begin{block}{\emph{iid-colBiSBM}}
$\bm{\pi} = (\pi_1, \dots \pi_{Q_1})$ et $\bm{\rho} = (\rho_1, \dots \rho_{Q_2})$
\end{block}
}
\only<2>{
\begin{tikzpicture}[scale=0.33]
\input{../tikz/collbm-pirho.tex}
\end{tikzpicture}
\begin{block}{\emph{$\pi\rho$-colBiSBM}}
$\bm{\pi} = ((\pi_{\color{black}1}^{\color{red}m}, \dots \pi_{\color{black}Q_1}^{\color{red}m}))_{m=1,\dots M}$ et $\bm{\rho} = ((\rho_{\color{black}1}^{\color{red}m}, \dots \rho_{\color{black}Q_2}^{\color{red}m}))_{m=1,\dots M}$ %{$\forall q \in \llbracket 1, Q_1 - 1\rrbracket, \pi_q > 0$ et $\forall r \in \llbracket 1, Q_2 - 1\rrbracket, \rho_r > 0$}
\small \\
avec $\forall q,m \in \llbracket 1, Q_1 \rrbracket \times \llbracket 1, M \rrbracket, \pi_q^m \in \left[ 0,1 \right]$
et $\forall r,m \in \llbracket 1, Q_2 \rrbracket \times \llbracket 1, M \rrbracket, \rho_r^m \in \left[ 0,1 \right]$
\end{block}
}
Dans tous les modèles la structure de connectivité ($\bm{\alpha}$) est supposée identique au sein de la collection.
\end{frame}
\begin{frame}
\frametitle{Estimation des paramètres}
% DONE dire que tau i q m c' est la proba que Zim = q, approximation de la proba variationnelle. Parce qu on impose lindependance
Maximisation d'une borne inférieure de la log-vraisemblance des données observées.
\begin{multline*}
\ell (\bm{X};\bm{\theta}) \geq \color{red}\sum_{m=1}^{M} \bigg( \color{black} \sum_{i = 1}^{n_1^m}\sum_{j=1}^{n_2^m}\sum_{q \in \mathcal{Q}_{1,m}} \sum_{r \in \mathcal{Q}_{2,m}} \tau^{1,m}_{i,q} \tau^{2,m}_{j,r} \log f(X^{m}_{ij}; \alpha_{qr}) \\
+ \sum_{i=1}^{n_1^m} \sum_{q \in \mathcal{Q}_{1,m}} \tau^{1,m}_{i,q} \log \pi_{\color{black}q}^{\color{gray}m} + \sum_{j=1}^{n_2^m} \sum_{r \in \mathcal{Q}_{2,m}} \tau^{2,m}_{j,r} \log \rho_{\color{black}r}^{\color{gray}m} \\
- \sum_{i=1}^{n_1} \tau^{1,m}_{i,q} \log \tau^{1,m}_{i,q} - \sum_{j=1}^{n_2} \tau^{2,m}_{j,r} \log \tau^{2,m}_{j,r} \color{red}\bigg) \color{black} =: J(\bm{\tau};\bm{\theta}) $$
\end{multline*}
\begin{block}{Approximation variationnelle}
$\tau_{i,q}^{1,m} = P(Z_i = q | X^m_{ij})$ et $\tau_{j,r}^{2,m} = P(W_j = r | X^m_{ij})$ tels que $P(Z_i = q, W_j = r | X^m_{ij}) = \tau_{i,q}^{1,m}\times\tau_{j,r}^{2,m}$
\end{block}
\end{frame}
\section{Sélection de modèle}
\begin{frame}
\frametitle{Choix de $(Q_1,Q_2)$ - Approche gloutonne}
\underline{L'estimation de paramètres se fait à $Q_1, Q_2$ fixés}, il faut donc déterminer les \enquote*{meilleures} coordonnées.
Nous maximisons un critère\footnote{
\emph{Bayesian Information Criterion - Like},
vraisemblance pénalisée en adaptant les formules
de~\cite{chabert-liddellLearningCommonStructures2024a}}.
\begin{columns}
\begin{column}{0.5\linewidth}
\begin{tikzpicture}
\input{../tikz/greedy-exploration.tex}
\end{tikzpicture}
\end{column}
\begin{column}{0.35\linewidth}
\begin{itemize}
\item Modèle initialisé~:\\
\begin{tikzpicture}
\draw[fill=gray, draw=gray] circle [radius=0.225cm];
\end{tikzpicture}
\onslide<2->{
\item Modèle après \emph{split}~:
\begin{tikzpicture}
\draw[fill=blueind, draw=blueind] circle [radius=0.225cm];
\end{tikzpicture}
\item Modèle maximisant le critère~:\\
\begin{tikzpicture}
\draw[fill=white, draw=green, very thick] circle [radius=0.225cm];
\end{tikzpicture}
}
\onslide<3->{
\item Modèle après \emph{merge}~:
\begin{tikzpicture}
\draw[fill=red, draw=red] circle [radius=0.225cm];
\end{tikzpicture}
}
\end{itemize}
\end{column}
\end{columns}
\end{frame}
\begin{frame}
\frametitle{Choix de $(Q_1,Q_2)$ - Fenêtre glissante}
\begin{columns}
\begin{column}{0.6\textwidth}
\begin{figure}
\input{../tikz/moving-window.tex}
\caption{Fenêtre glissante}
\end{figure}
\end{column}
\begin{column}{0.4\textwidth}
\only<3>{\begin{block}{}
Initialisation du modèle si nécessaire
\end{block}}
\only<9>{\begin{block}{}
Localisation du nouveau mode
\end{block}}
\only<10>{\begin{block}{}
Déplacement sur le nouveau mode puis itération
\end{block}}
\end{column}
\end{columns}
\end{frame}
\section{Application}
\label{sec:application}
\begin{frame}
\frametitle{Clustering de réseaux}
\begin{tikzpicture}
\input{../tikz/clustering.tex}
\end{tikzpicture}
\end{frame}
\section{Conclusion}
\label{sec:conclusion}
\begin{frame}
\frametitle{Conclusion et perspectives}
% DONE Ajouter une slide conclusion perspective
% Rappeler les modeles avec clustering
% Evoquer l'analyse de reseaux corrigés pour l'échantillonnage
% Lien vers le package
\begin{block}{Capacités}
\begin{itemize}
\item 4 modèles dont 3 qui ont une flexibilité sur au moins une des
dimensions (adaptabilité aux données).
\item Partitionner un ensemble de réseaux selon leurs structures.
\end{itemize}
\end{block}
\begin{block}{Perspectives}
\begin{itemize}
\item Investiguer stabilité à la \emph{graine}.
\item Preuve d'identifiabilité du modèle $\pi\rho$.
\end{itemize}
\end{block}
\bigskip
\centering
Merci pour votre attention~!
\end{frame}
\renewcommand{\pgfuseimage}[1]{\scalebox{.75}{\includegraphics{#1}}}
\begin{frame}[noframenumbering,plain,allowframebreaks]
\frametitle{Bibliographie}
\printbibliography
\end{frame}
\end{document}