\section{Contexte du modèle} \label{sec:contexte-du-modele} \begin{frame} \begin{columns} \begin{column}{0.5\textwidth} \begin{block}{Contexte écologique} \begin{itemize} \small \item Nombreux réseaux disponibles pour interactions similaires. \item Suivi biodiversité, robustesse et risque d'effondrement \dots \end{itemize} \begin{columns} \begin{column}{0.5\textwidth} \begin{figure}[ht] \centering \begin{tikzpicture}[scale=.45,rotate=270] \input{../tikz/plantpollinatornetwork.tex} \end{tikzpicture} \caption{Exemple d'un réseau plantes-pollinisateurs} \label{fig:plantes-pollin} \end{figure} \end{column} \begin{column}{0.4\textwidth} \centering \begin{align*} \begin{pmatrix} 1 & 0 & 1 \\ 1 & 0 & 0 \\ 1 & 0 & 0 \\ 1 & 1 & 0 \end{pmatrix} \end{align*} \footnotesize Matrice d'adjacence associée \end{column} \end{columns} \end{block} \end{column} \onslide<2>{ \begin{column}{0.45\textwidth} \begin{block}{Contexte mathématique} Pour un unique réseau~: variables latentes, \emph{embedding}, \dots Motivations pour proposer des méthodes adaptées aux collections de réseaux~: \begin{itemize} \item Espèces différentes, rôles analogues. \item Transfert d'informations grands vers petits réseaux. \item Regrouper les réseaux selon leur similarité (\emph{clustering} de réseaux). \end{itemize} \end{block} \end{column} } \end{columns} \end{frame} \begin{frame} \addtocounter{footnote}{1} \frametitle{Latent Block Model (LBM\footnotemark[\thefootnote])} %DONE remplacer i \in bullet par Zi = \bullet Proposé par~\cite{govaertEMAlgorithmBlock2005}. \begin{columns} \begin{column}{0.40\linewidth} \begin{figure}[H] \center \begin{tikzpicture}[scale=0.35] \input{../tikz/lbm.tex} \end{tikzpicture} \caption{Exemple de LBM\footnotemark[\thefootnote]} \label{fig:LBMvisu} \end{figure} \end{column} \begin{column}{0.51\linewidth} Pour \begin{itemize} \item $Q_1 = |\{{\color{blueind}\bullet},{\color{cyanind}\bullet},{\color{electricblue}\bullet}\}|$ blocs fixés en ligne \item $Q_2 = |\{{\color{burntorange}\bullet},{\color{goldenyellow}\bullet},{\color{peach}\bullet}\}|$ blocs fixés en colonne \end{itemize} \begin{block}{Paramètres} \begin{itemize} \item $\pi_{\bullet} = \mathbb{P}(Z_i = \bullet)$ en ligne et $\rho_{\bullet} = \mathbb{P}(W_j = \bullet)$ en colonne \item $\alpha_{{\color{blueind}\bullet}{\color{burntorange}\bullet}} = \mathbb{P}(X_{ij} = 1 | Z_i = {\color{blueind}\bullet}, W_j = {\color{burntorange}\bullet})$ \end{itemize} \end{block} \end{column} \end{columns} \footnotetext[\thefootnote]{Que j'appellerai par la suite BiSBM} \end{frame} \section{Modèle de collection de réseaux bipartites} \label{sec:extension-de-colsbm-aux-reseaux-bipartites} \begin{frame} \frametitle{Collections bipartites} \begin{tikzpicture}[scale=0.33] \input{../tikz/collbm-iid.tex} \end{tikzpicture} \begin{itemize} \item $Q_1 = |\{{\color{blueind}\bullet},{\color{cyanind}\bullet},{\color{electricblue}\bullet}\}|$ blocs fixés en ligne \item $Q_2 = |\{{\color{burntorange}\bullet},{\color{goldenyellow}\bullet},{\color{peach}\bullet}\}|$ blocs fixés en colonne \end{itemize} \begin{block}{Paramètres} \begin{itemize} \item $\pi_{\bullet} = \mathbb{P}(Z_i =\bullet)$ en ligne et $\rho_{\bullet} = \mathbb{P}(W_j = \bullet)$ en colonne \item $\alpha_{{\color{blueind}\bullet}{\color{burntorange}\bullet}} = \mathbb{P}(X_{ij} = 1 | Z_i = {\color{blueind}\bullet}, W_j = {\color{burntorange}\bullet})$ \end{itemize} \end{block} \end{frame} \begin{frame} \frametitle{Différents modèles} \only<1>{ \begin{tikzpicture}[scale=0.33] \input{../tikz/collbm-iid.tex} \end{tikzpicture} \begin{block}{\emph{iid-colBiSBM}} $\bm{\pi} = (\pi_1, \dots \pi_{Q_1})$ et $\bm{\rho} = (\rho_1, \dots \rho_{Q_2})$ \end{block} } \only<2>{ \begin{tikzpicture}[scale=0.33] \input{../tikz/collbm-pirho.tex} \end{tikzpicture} \begin{block}{\emph{$\pi\rho$-colBiSBM}} $\bm{\pi} = ((\pi_{\color{black}1}^{\color{red}m}, \dots \pi_{\color{black}Q_1}^{\color{red}m}))_{m=1,\dots M}$ et $\bm{\rho} = ((\rho_{\color{black}1}^{\color{red}m}, \dots \rho_{\color{black}Q_2}^{\color{red}m}))_{m=1,\dots M}$ %{$\forall q \in \llbracket 1, Q_1 - 1\rrbracket, \pi_q > 0$ et $\forall r \in \llbracket 1, Q_2 - 1\rrbracket, \rho_r > 0$} \small \\ avec $\forall q,m \in \llbracket 1, Q_1 \rrbracket \times \llbracket 1, M \rrbracket, \pi_q^m \in \left[ 0,1 \right]$ et $\forall r,m \in \llbracket 1, Q_2 \rrbracket \times \llbracket 1, M \rrbracket, \rho_r^m \in \left[ 0,1 \right]$ \end{block} } Dans tous les modèles la structure de connectivité ($\bm{\alpha}$) est supposée identique au sein de la collection. \end{frame} \begin{frame} \frametitle{Estimation des paramètres} % DONE dire que tau i q m c' est la proba que Zim = q, approximation de la proba variationnelle. Parce qu on impose lindependance % Par maximisation d'une borne inférieure variationnelle de la % log-vraisemblance des données observées. En adaptant \cite{chabert-liddellLearningCommonStructures2024a} qui se base sur la méthode proposée par \cite{daudinMixtureModelRandom2008} utilisant l'algorithme \emph{Variational EM}. \begin{multline*} \ell (\bm{X};\bm{\theta}) \geq \color{red}\sum_{m=1}^{M} \bigg( \color{black} Q^m(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) + \mathcal{H}(\mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}} (\mathbf{Z}^m, \mathbf{W}^m)) \color{red}\bigg) \color{black} =: J(\bm{\tau};\bm{\theta}) \end{multline*} où $Q^m(\boldsymbol\theta\mid\boldsymbol\theta^{(t)}) = \operatorname{E}_{\mathbf{Z}^m,\mathbf{W}^m \sim \mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}(.)} \left[ \log p (\mathbf{X}^m,\mathbf{Z}^m,\mathbf{W}^m | \boldsymbol\theta) \right] \,$ \begin{block}{Approximation variationnelle} $\mathcal{R}_{\mathbf{X}^m,\boldsymbol\theta^{(t)}}(\mathbf{Z}^m, \mathbf{W}^m) = P(\mathbf{Z}^m | \mathbf{X}^m,\boldsymbol\theta^{(t)}) P(\mathbf{W}^m | \mathbf{X}^m,\boldsymbol\theta^{(t)})$, c'est à dire avoir une indépendance lignes, colonnes. \end{block} \end{frame} \begin{frame}{Formule développée de l'EM variationnel} \begin{multline*} \ell (\bm{X};\bm{\theta}) \geq \color{red}\sum_{m=1}^{M} \bigg( \color{black} \sum_{i = 1}^{n_1^m}\sum_{j=1}^{n_2^m}\sum_{q \in \mathcal{Q}_{1,m}} \sum_{r \in \mathcal{Q}_{2,m}} \tau^{1,m}_{i,q} \tau^{2,m}_{j,r} \log f(X^{m}_{ij}; \alpha_{qr}) \\ + \sum_{i=1}^{n_1^m} \sum_{q \in \mathcal{Q}_{1,m}} \tau^{1,m}_{i,q} \log \pi_{\color{black}q}^{\color{gray}m} + \sum_{j=1}^{n_2^m} \sum_{r \in \mathcal{Q}_{2,m}} \tau^{2,m}_{j,r} \log \rho_{\color{black}r}^{\color{gray}m} \\ - \sum_{i=1}^{n_1} \tau^{1,m}_{i,q} \log \tau^{1,m}_{i,q} - \sum_{j=1}^{n_2} \tau^{2,m}_{j,r} \log \tau^{2,m}_{j,r} \color{red}\bigg) \color{black} =: J(\bm{\tau};\bm{\theta}), \end{multline*} où $\ell$ désigne la $\log$ vraisemblance. \begin{block}{Approximation variationnelle} $\tau_{i,q}^{1,m} = P_{\mathcal{R}_m}(Z_{iq}^m = 1|X_{i\bullet}^m)$ et $\tau_{j,r}^{2,m} = P_{\mathcal{R}_m}(W_{jr}^m = 1|X_{\bullet j}^m)$ \end{block} \end{frame} \section{Sélection de modèle} \begin{frame} \frametitle{Problème de choix de $(Q_1, Q_2)$} \underline{L'estimation de paramètres se fait à $Q_1, Q_2$ blocs fixés}, il faut donc déterminer les \enquote*{meilleures} coordonnées. Nous maximisons un critère, le \emph{Bayesian Information Criterion - Like} (BIC-L), de vraisemblance pénalisée en adaptant les formules de~\cite{chabert-liddellLearningCommonStructures2024a}. \begin{alertblock}{Problèmes de l'exploration} \begin{itemize} \item Exploration de l'espace $\mathbb{N}^2$ coûteux, besoin d'une stratégie. \item Sensibilité aux initialisations et à l'aléatoire. \end{itemize} \end{alertblock} \end{frame} \section{Application} \label{sec:application} \begin{frame} \frametitle{Clustering de réseaux} \centering \begin{tikzpicture} \input{../tikz/clustering.tex} \end{tikzpicture} \end{frame} \begin{frame}[allowframebreaks] \frametitle{Application à~\cite{baldockDailyTemporalStructure2011, baldockSystemsApproachReveals2019a}} \begin{figure}[t] \centering \begin{subfigure}{0.5\textwidth} \centering \includegraphics[scale=0.2,angle=-90]{backup-app-iid.png} \caption{Modèle $iid$,\\ séparent réseau africain et réseaux anglais} \end{subfigure}% ~ \begin{subfigure}{0.5\textwidth} \centering \includegraphics[scale=0.2,angle=-90]{backup-app-pirho.png} \caption{Modèle $\pi\rho$,\\ fusionnent réseaux africain et anglais} \end{subfigure}% \caption{Partitionnement des réseaux de~\cite{baldockDailyTemporalStructure2011, baldockSystemsApproachReveals2019a}} \end{figure} \begin{figure}[t] \centering \begin{subfigure}{0.5\textwidth} \centering \includegraphics[scale=0.1]{backup-app-iid-struct1.png} \includegraphics[scale=0.2]{backup-app-iid-struct2.png} \caption{Modèle $iid$,\\ séparent réseau africain et réseaux anglais} \end{subfigure}% ~ \begin{subfigure}{0.5\textwidth} \centering \includegraphics[scale=0.2]{backup-app-pirho-struct.png} \caption{Modèle $\pi\rho$,\\ fusionnent réseaux africain et anglais} \end{subfigure}% \caption{Structures détectées pour les réseaux de~\cite{baldockDailyTemporalStructure2011, baldockSystemsApproachReveals2019a}} \end{figure} \end{frame} \section{Conclusion} \label{sec:conclusion} \begin{frame} \frametitle{Conclusion et perspectives} % DONE Ajouter une slide conclusion perspective % Rappeler les modeles avec clustering % Evoquer l'analyse de reseaux corrigés pour l'échantillonnage % Lien vers le package \begin{block}{Capacités} \begin{itemize} \item 4 modèles dont 3 qui ont une flexibilité sur au moins une des dimensions (adaptabilité aux données). \item Détecter structures classiques et moins classique de façon agnostique. \item Partitionner un ensemble de réseaux selon leurs structures. \end{itemize} \end{block} \begin{block}{Perspectives} \begin{itemize} \item Investiguer stabilité à l'aléatoire. \item Intégration au package \texttt{colSBM} et publication CRAN \item Preuve d'identifiabilité du modèle $\pi\rho$. \end{itemize} \end{block} \bigskip \centering Merci pour votre attention~! \end{frame}