Reformulation et mise à jour référence cours Bastide et Clavel

2026-06-17 10:15:25 +02:00 · 2024-03-19 13:50:10 +01:00 · 2024-03-19 13:50:10 +01:00 · 9d03076e3c
commit 9d03076e3c
parent 0372715566
4 changed files with 25 additions and 17 deletions
--- a/Rnw/simulations-methodes.Rnw
+++ b/Rnw/simulations-methodes.Rnw
@ -214,7 +214,4 @@ TODO Ajouter les commentaires sur les simulations
 l'erreur de première espèce que les méthodes utilisant le maximum de 
 vraisemblance.

-TODO Ajouter les commentaires sur les simulations
-
-\paragraph*{REML vs Maximum Likelihood (ML)} En comparant les méthodes selon 
-l'utilisation du critère REML ou du ML nous pouvons voir que la méthode 
+\subsection{Pour des tests multiples}
--- a/rapport.Rnw
+++ b/rapport.Rnw
@ -80,16 +80,23 @@ source(here("R","utils.R"))
 \section{Introduction}
 \label{chap:intro}
 % Introduction au projet, contexte, objectifs.
-Ici contexte biologique, les données de \cite{gomez-mestrePhylogeneticAnalysesReveal2012}, les données de Paul et Mélina, etc.
+Avec l'avènement des données massives de génomiques, transcriptomiques, 
+protéomiques, il y a besoin de techniques statistiques robustes et passant à 
+l'échelle permettant de mener à bien les analyses.

-Avec l'avènement des données massives de génomiques, transcriptomiques, protéomiques etc, il y a besoin de techniques statistiques robustes et passant à l'échelle permettant de mener à bien l'anal
-Format des données : arbres phylogénétiques, données génétiques 
-Arbres avec des petites branche: plusieurs individus par espèces avec chacun leurs données 
--> problème biologique 
+Ces données de génétiques proposent bien souvent deux informations, les mesures
+et l'arbre phylogénétique. Et pour certaines, l'arbre est ramifié au bout en
+proposant des répétitions intraspécifique.

-Deux sujets différents écologie et transcriptomique mais une même méthode.
+% Format des données : arbres phylogénétiques, données génétiques 
+% Arbres avec des petites branche: plusieurs individus par espèces avec chacun leurs données 
+% --> problème biologique 

-Pour données \cite{chenQuantitativeFrameworkCharacterizing2019} la figure~\ref{fig:arbre-chen2019} présente l'arbre phylogénétique :
+% Deux sujets différents écologie et transcriptomique mais une même méthode.
+
+C'est par exemple le cas pour les données de 
+\cite{chenQuantitativeFrameworkCharacterizing2019} dont 
+la figure~\ref{fig:arbre-chen2019} présente l'arbre phylogénétique :

 \begin{figure}[!h]
    \centering
@ -105,9 +112,12 @@ Pour données \cite{chenQuantitativeFrameworkCharacterizing2019} la figure~\ref{
    \label{fig:arbre-chen2019}
 \end{figure}

-Au vu de la forme des données étudiées, le projet s'est tourné vers une méthode d'ANOVA phylogénétique. 
-Celle-ci sera d'abord décrite ainsi que d'autres outils mathématiques utilisés pour affiner la fiabilité du test dans une première partie. 
-Viendra ensuite une partie de simulation destinée à comparer et étudier la méthode d'ANOVA phylogénétique sur des données d'arbre simulés. 
+Au vu de la forme des données étudiées, le projet s'est tourné vers une méthode 
+d'ANOVA phylogénétique. 
+Celle-ci sera d'abord décrite ainsi que d'autres outils mathématiques utilisés 
+pour affiner la fiabilité du test dans une première partie. 
+Viendra ensuite une partie de simulation destinée à comparer et étudier la 
+méthode d'ANOVA phylogénétique sur des données d'arbre simulés. 
 Enfin, on teste sur des données réelles. 
 \newline
 \newline
@ -176,7 +186,7 @@ Le modèle de mouvement brownien va alors induire que les feuilles des arbres (n

 Les notations correspondent toujours à celles utilisées pour \eqref{eq:ANOVA}. La seule différence se trouvant dans la distribution de $u$ et la présence d'une matrice $K$.
 Dans le cadre du mouvement brownien $K=(K_{i,j})_{1\leq i,j \leq n}=(t_{i,j})_{1\leq i,j \leq n}$ où $t_{i,j}$ représente le temps d’évolution commun aux espèces i et j. 
-On peut voir un exemple utilisé dans les slides de cours \cite{bastideContinuousTraitEvolution}:
+On peut voir un exemple utilisé dans les slides de cours \cite{bastideContinuousTraitEvolution2022}:
 \begin{center}
    \includegraphics[width=0.7\textwidth]{matrix_K.png}
 \end{center}
@ -236,7 +246,7 @@ On testera alors les hypothèses suivantes :
 \[ H_0 : \beta_2 =0 \text{, les 2 groupes ont la même moyenne}\]
 \[ H_1 : \beta_2\neq 0 \text{, les 2 groupes ont des moyennes différentes}\]

-\cite{bastideContinuousTraitEvolution} nous donne une F-statistique pour la méthode d'ANOVA de cette forme \eqref{eq:V_lambda} et le test de Fisher précédent. 
+\cite{bastideContinuousTraitEvolution2022} nous donne une F-statistique pour la méthode d'ANOVA de cette forme \eqref{eq:V_lambda} et le test de Fisher précédent. 
 \begin{equation}
    F=\frac{||\hat{Y} - \bar{Y}||^2_{V_\lambda^{-1}}(n-2)}{||Y - \hat{Y}||^2_{V_\lambda^{-1}}} \underset{\mathcal{H}_0}{\sim}\mathcal{F}\text{isher} (1, n-2)
 \end{equation}
--- a/rapport.pdf
+++ b/rapport.pdf
--- a/references.bib
+++ b/references.bib
@ -14,9 +14,10 @@
  file = {/home/polarolouis/Zotero/storage/GL9RVUJA/Bartlett et Fowler - 1997 - Properties of sufficiency and statistical tests.pdf}
 }

-@unpublished{bastideContinuousTraitEvolution,
+@unpublished{bastideContinuousTraitEvolution2022,
  title = {Continuous {{Trait Evolution}}},
  author = {Bastide, Paul and Clavel, Julien},
+  date = {2022-12},
  langid = {english},
  file = {/home/polarolouis/Zotero/storage/VSU34XGF/Bastide et Clavel - Continuous Trait Evolution.pdf}
 }