mirror of
https://github.com/Polarolouis/anova-phylogenetique-projet-msv.git
synced 2026-06-17 18:25:25 +02:00
🍱 Add MB
This commit is contained in:
parent
a4bd4bb765
commit
a6a4e1f15c
3 changed files with 19 additions and 8 deletions
BIN
img/matrix_K.png
Normal file
BIN
img/matrix_K.png
Normal file
Binary file not shown.
|
After Width: | Height: | Size: 16 KiB |
27
rapport.Rnw
27
rapport.Rnw
|
|
@ -136,6 +136,7 @@ La forme usuelle de l'ANOVA à 1 facteur est la suivante :
|
|||
|
||||
\begin{align}
|
||||
Y_{ik} = \mu_i + E_{ik}, & &i = 1,\dots I, k = 1,\dots n_i, E_{ik} \sim \Normal (0, \sigma^2)
|
||||
\label{eq:anova}
|
||||
\end{align}
|
||||
|
||||
où dans cette équation, reprise du livre \parencite{belModeleLineaireSes}, $i$ représente le niveau du facteur et $k$ indique le numéro de l'observation dans ce niveau. $I$ est le nombre total de niveaux du facteur, $n_i$ le nombre d'observation du niveau $i$.
|
||||
|
|
@ -154,21 +155,30 @@ Les paramètres de l'ANOVA sont estimables, grâce par exemple à la méthode du
|
|||
% LIMITES de l'ANOVA classique sur les données phylo
|
||||
|
||||
\subsection{L'ANOVA phylogénétique}
|
||||
Dans la méthode d'ANOVA classique l'information portée par l'arbre phylogénétique n'est pas prise en compte.
|
||||
Le but de cette nouvelle est de ne plus mettre cette information de côté et peut être obtenir de meilleurs résultats.
|
||||
En effet on peut imaginer, en considérant des traits évolutifs ou des séquences d'ADN, que des individus d'une même espèce ou bien d'espèces proche phylogénétiquement, pourraient avoir des valeurs proches.
|
||||
D'abord il s'agit de modéliser l'arbre et les informations évolutives qu'ils contient de manière à l'incorporer.
|
||||
\newline
|
||||
\newline
|
||||
Comme décrit dans \cite{bastideModelesEvolutionCaracteres2022} l'évolution d'un trait nécessite de décrire ses fluctuations le long de l'arbre et ses branches.
|
||||
C'est pour cela que souvent cela est le résultat d'un processus stochastique à temps continu.
|
||||
Le processus classique est le mouvement brownien et c'est celui que nous avons utilisé. Il a cependant quelques limites qui ne font pas l'objet de ce rapport mais qui peuvent alors justifier le choix d'autres types de processus comme celui d'Ornstein-Uhlenbecks.
|
||||
Le modèle de mouvement brownien va alors induire que les feuilles des arbres (nos observations) auront une distribution gausienne que l'on écrira sous la forme suivante:
|
||||
|
||||
L'arbre phylogénétique pour être intégré à l'ANOVA doit être représenté dans le
|
||||
modèle.
|
||||
|
||||
Pour cela, les données d'arbre sont supposées être le résultat d'un processus
|
||||
stochastique. Le processus classique est le mouvement brownien, par exemple.
|
||||
\begin{equation}
|
||||
Y = X\beta + u
|
||||
\end{equation}
|
||||
\[
|
||||
\text{où} \quad \mathbf{Y} = \begin{bmatrix} Y_1 \\ Y_2 \\ \vdots \\ Y_n \end{bmatrix}, \mathbf{X} = \begin{bmatrix} \mathbf{1} & \mathbf{1_2} \end{bmatrix}=\begin{bmatrix} 1 & 0 \\ \vdots & \vdots\\1 & 0 \\ 0 & 1\\ \vdots & \vdots\\0 & 1 \end{bmatrix}, \mathbf{\beta} = \begin{bmatrix} \beta_1 \\ \beta_2 \end{bmatrix}\text{,} \quad u \sim \mathcal{N}_n(0, \sigma^2_{phy}K)
|
||||
\]
|
||||
On remarque alors une différence par rapport à la formule d'ANOVA classique \eqref{eq:anova}, c'est la présence d'une matrice K.
|
||||
Dans le cadre du mouvement brownien $K=(K_{i,j})_{1\leq i,j \leq n}=(t_{i,j})_{1\leq i,j \leq n}$ où $t_{i,j}$ représente le temps d’évolution commun aux espèces i et j.
|
||||
On peut voir un exemple utilisé dans les slides de cours \cite{bastideContinuousTraitEvolution}:
|
||||
\begin{center}
|
||||
\includegraphics[width=0.7\textwidth]{matrix_K.png}
|
||||
\end{center}
|
||||
|
||||
Ici la matrice K porte l'information phylogénétique de l'arbre.
|
||||
TODO: parler du BM + structure de la matrice K
|
||||
<<''>>=
|
||||
|
||||
@
|
||||
|
|
@ -179,6 +189,7 @@ TODO: parler du BM + structure de la matrice K
|
|||
Etre assez concis sur l'histoire de la projection et le modèle et les différences avec l'ANOVA.
|
||||
|
||||
\subsection{ANOVA phylogénétique avec erreur de mesure}
|
||||
TODO transition
|
||||
La réalité du modèle nous donne cette nouvelle équation où l'on peut voir 2 erreurs.
|
||||
L'une en lien avec le mouvement brownien sur l'arbre et liée à l'information phylogénétique portée par celui ci (modélisée par la matrice $K$) génétique et l'autre à une erreur de mesure.
|
||||
\begin{equation}
|
||||
|
|
@ -202,7 +213,7 @@ TODO: Statistique de test
|
|||
|
||||
|
||||
Dans la statistique de test précédente, on peut voir des degrés de liberté. De manière standard on va dans notre cas avoir $n-2$ degrés de liberté.
|
||||
. Le test de Fisher, également appelé analyse de la variance (ANOVA), suppose souvent une homoscédasticité des variances entre les groupes ou les échantillons. Cela signifie que les variances des groupes sont égales.
|
||||
. L'ANOVA, suppose souvent une homoscédasticité des variances entre les groupes ou les échantillons. Cela signifie que les variances des groupes sont égales.
|
||||
|
||||
Cependant, lorsque cette condition n'est pas satisfaite, l'approximation de Satterthwaite peut être utilisée pour tenir compte des variances inégales entre les groupes. Elle est particulièrement utile dans le cas des ANOVA à un facteur, mais peut également être appliquée à des ANOVA à plusieurs facteurs.
|
||||
|
||||
|
|
|
|||
BIN
rapport.pdf
BIN
rapport.pdf
Binary file not shown.
Loading…
Add table
Reference in a new issue