mirror of
https://github.com/Polarolouis/anova-phylogenetique-projet-msv.git
synced 2026-06-17 10:15:25 +02:00
Reformulation et mise à jour référence cours Bastide et Clavel
This commit is contained in:
parent
0372715566
commit
9d03076e3c
4 changed files with 25 additions and 17 deletions
|
|
@ -214,7 +214,4 @@ TODO Ajouter les commentaires sur les simulations
|
||||||
l'erreur de première espèce que les méthodes utilisant le maximum de
|
l'erreur de première espèce que les méthodes utilisant le maximum de
|
||||||
vraisemblance.
|
vraisemblance.
|
||||||
|
|
||||||
TODO Ajouter les commentaires sur les simulations
|
\subsection{Pour des tests multiples}
|
||||||
|
|
||||||
\paragraph*{REML vs Maximum Likelihood (ML)} En comparant les méthodes selon
|
|
||||||
l'utilisation du critère REML ou du ML nous pouvons voir que la méthode
|
|
||||||
34
rapport.Rnw
34
rapport.Rnw
|
|
@ -80,16 +80,23 @@ source(here("R","utils.R"))
|
||||||
\section{Introduction}
|
\section{Introduction}
|
||||||
\label{chap:intro}
|
\label{chap:intro}
|
||||||
% Introduction au projet, contexte, objectifs.
|
% Introduction au projet, contexte, objectifs.
|
||||||
Ici contexte biologique, les données de \cite{gomez-mestrePhylogeneticAnalysesReveal2012}, les données de Paul et Mélina, etc.
|
Avec l'avènement des données massives de génomiques, transcriptomiques,
|
||||||
|
protéomiques, il y a besoin de techniques statistiques robustes et passant à
|
||||||
|
l'échelle permettant de mener à bien les analyses.
|
||||||
|
|
||||||
Avec l'avènement des données massives de génomiques, transcriptomiques, protéomiques etc, il y a besoin de techniques statistiques robustes et passant à l'échelle permettant de mener à bien l'anal
|
Ces données de génétiques proposent bien souvent deux informations, les mesures
|
||||||
Format des données : arbres phylogénétiques, données génétiques
|
et l'arbre phylogénétique. Et pour certaines, l'arbre est ramifié au bout en
|
||||||
Arbres avec des petites branche: plusieurs individus par espèces avec chacun leurs données
|
proposant des répétitions intraspécifique.
|
||||||
--> problème biologique
|
|
||||||
|
|
||||||
Deux sujets différents écologie et transcriptomique mais une même méthode.
|
% Format des données : arbres phylogénétiques, données génétiques
|
||||||
|
% Arbres avec des petites branche: plusieurs individus par espèces avec chacun leurs données
|
||||||
|
% --> problème biologique
|
||||||
|
|
||||||
Pour données \cite{chenQuantitativeFrameworkCharacterizing2019} la figure~\ref{fig:arbre-chen2019} présente l'arbre phylogénétique :
|
% Deux sujets différents écologie et transcriptomique mais une même méthode.
|
||||||
|
|
||||||
|
C'est par exemple le cas pour les données de
|
||||||
|
\cite{chenQuantitativeFrameworkCharacterizing2019} dont
|
||||||
|
la figure~\ref{fig:arbre-chen2019} présente l'arbre phylogénétique :
|
||||||
|
|
||||||
\begin{figure}[!h]
|
\begin{figure}[!h]
|
||||||
\centering
|
\centering
|
||||||
|
|
@ -105,9 +112,12 @@ Pour données \cite{chenQuantitativeFrameworkCharacterizing2019} la figure~\ref{
|
||||||
\label{fig:arbre-chen2019}
|
\label{fig:arbre-chen2019}
|
||||||
\end{figure}
|
\end{figure}
|
||||||
|
|
||||||
Au vu de la forme des données étudiées, le projet s'est tourné vers une méthode d'ANOVA phylogénétique.
|
Au vu de la forme des données étudiées, le projet s'est tourné vers une méthode
|
||||||
Celle-ci sera d'abord décrite ainsi que d'autres outils mathématiques utilisés pour affiner la fiabilité du test dans une première partie.
|
d'ANOVA phylogénétique.
|
||||||
Viendra ensuite une partie de simulation destinée à comparer et étudier la méthode d'ANOVA phylogénétique sur des données d'arbre simulés.
|
Celle-ci sera d'abord décrite ainsi que d'autres outils mathématiques utilisés
|
||||||
|
pour affiner la fiabilité du test dans une première partie.
|
||||||
|
Viendra ensuite une partie de simulation destinée à comparer et étudier la
|
||||||
|
méthode d'ANOVA phylogénétique sur des données d'arbre simulés.
|
||||||
Enfin, on teste sur des données réelles.
|
Enfin, on teste sur des données réelles.
|
||||||
\newline
|
\newline
|
||||||
\newline
|
\newline
|
||||||
|
|
@ -176,7 +186,7 @@ Le modèle de mouvement brownien va alors induire que les feuilles des arbres (n
|
||||||
|
|
||||||
Les notations correspondent toujours à celles utilisées pour \eqref{eq:ANOVA}. La seule différence se trouvant dans la distribution de $u$ et la présence d'une matrice $K$.
|
Les notations correspondent toujours à celles utilisées pour \eqref{eq:ANOVA}. La seule différence se trouvant dans la distribution de $u$ et la présence d'une matrice $K$.
|
||||||
Dans le cadre du mouvement brownien $K=(K_{i,j})_{1\leq i,j \leq n}=(t_{i,j})_{1\leq i,j \leq n}$ où $t_{i,j}$ représente le temps d’évolution commun aux espèces i et j.
|
Dans le cadre du mouvement brownien $K=(K_{i,j})_{1\leq i,j \leq n}=(t_{i,j})_{1\leq i,j \leq n}$ où $t_{i,j}$ représente le temps d’évolution commun aux espèces i et j.
|
||||||
On peut voir un exemple utilisé dans les slides de cours \cite{bastideContinuousTraitEvolution}:
|
On peut voir un exemple utilisé dans les slides de cours \cite{bastideContinuousTraitEvolution2022}:
|
||||||
\begin{center}
|
\begin{center}
|
||||||
\includegraphics[width=0.7\textwidth]{matrix_K.png}
|
\includegraphics[width=0.7\textwidth]{matrix_K.png}
|
||||||
\end{center}
|
\end{center}
|
||||||
|
|
@ -236,7 +246,7 @@ On testera alors les hypothèses suivantes :
|
||||||
\[ H_0 : \beta_2 =0 \text{, les 2 groupes ont la même moyenne}\]
|
\[ H_0 : \beta_2 =0 \text{, les 2 groupes ont la même moyenne}\]
|
||||||
\[ H_1 : \beta_2\neq 0 \text{, les 2 groupes ont des moyennes différentes}\]
|
\[ H_1 : \beta_2\neq 0 \text{, les 2 groupes ont des moyennes différentes}\]
|
||||||
|
|
||||||
\cite{bastideContinuousTraitEvolution} nous donne une F-statistique pour la méthode d'ANOVA de cette forme \eqref{eq:V_lambda} et le test de Fisher précédent.
|
\cite{bastideContinuousTraitEvolution2022} nous donne une F-statistique pour la méthode d'ANOVA de cette forme \eqref{eq:V_lambda} et le test de Fisher précédent.
|
||||||
\begin{equation}
|
\begin{equation}
|
||||||
F=\frac{||\hat{Y} - \bar{Y}||^2_{V_\lambda^{-1}}(n-2)}{||Y - \hat{Y}||^2_{V_\lambda^{-1}}} \underset{\mathcal{H}_0}{\sim}\mathcal{F}\text{isher} (1, n-2)
|
F=\frac{||\hat{Y} - \bar{Y}||^2_{V_\lambda^{-1}}(n-2)}{||Y - \hat{Y}||^2_{V_\lambda^{-1}}} \underset{\mathcal{H}_0}{\sim}\mathcal{F}\text{isher} (1, n-2)
|
||||||
\end{equation}
|
\end{equation}
|
||||||
|
|
|
||||||
BIN
rapport.pdf
BIN
rapport.pdf
Binary file not shown.
|
|
@ -14,9 +14,10 @@
|
||||||
file = {/home/polarolouis/Zotero/storage/GL9RVUJA/Bartlett et Fowler - 1997 - Properties of sufficiency and statistical tests.pdf}
|
file = {/home/polarolouis/Zotero/storage/GL9RVUJA/Bartlett et Fowler - 1997 - Properties of sufficiency and statistical tests.pdf}
|
||||||
}
|
}
|
||||||
|
|
||||||
@unpublished{bastideContinuousTraitEvolution,
|
@unpublished{bastideContinuousTraitEvolution2022,
|
||||||
title = {Continuous {{Trait Evolution}}},
|
title = {Continuous {{Trait Evolution}}},
|
||||||
author = {Bastide, Paul and Clavel, Julien},
|
author = {Bastide, Paul and Clavel, Julien},
|
||||||
|
date = {2022-12},
|
||||||
langid = {english},
|
langid = {english},
|
||||||
file = {/home/polarolouis/Zotero/storage/VSU34XGF/Bastide et Clavel - Continuous Trait Evolution.pdf}
|
file = {/home/polarolouis/Zotero/storage/VSU34XGF/Bastide et Clavel - Continuous Trait Evolution.pdf}
|
||||||
}
|
}
|
||||||
|
|
|
||||||
Loading…
Add table
Reference in a new issue