From 1e5f3d63de54eaa7cd19b9bf8ae217654aafabde Mon Sep 17 00:00:00 2001 From: Louis Lacoste Date: Wed, 20 Mar 2024 23:47:17 +0100 Subject: [PATCH] Modifications --- Rnw/donnees-reelles.Rnw | 49 ++++++++++++---------- img/OrnsteinUhlenbeck3.png | Bin 0 -> 42880 bytes img/chenFig4.png | Bin 0 -> 257297 bytes rapport.Rnw | 84 +++++++++++++++++++++++++++++++------ rapport.pdf | Bin 1969989 -> 2241357 bytes 5 files changed, 99 insertions(+), 34 deletions(-) create mode 100644 img/OrnsteinUhlenbeck3.png create mode 100644 img/chenFig4.png diff --git a/Rnw/donnees-reelles.Rnw b/Rnw/donnees-reelles.Rnw index 991ce4c..0fb7bb1 100644 --- a/Rnw/donnees-reelles.Rnw +++ b/Rnw/donnees-reelles.Rnw @@ -1,11 +1,8 @@ -Ici nous appliquons les méthodes implémentées sur l'arbre de \cite{chenQuantitativeFrameworkCharacterizing2019}. - -% TODO Décrire les données en détails - Les données compilées par \cite{chenQuantitativeFrameworkCharacterizing2019} sont des données de RNA-seq, c'est-à-dire des données quantifiant l'expression des gènes, par le biais du transcriptome, parmi les différentes espèces du bout -de l'arbre. +de l'arbre. Nous réanalysons les données, en utilisant les méthodes développées +et testées ci-dessus. Le but est alors d'identifier les gènes différentiellement exprimés, au sens de nombre d'ARN par gène différent entre les espèces. @@ -193,8 +190,8 @@ p-values \emph{non ajustées}. theme(axis.text.x=element_blank(), axis.ticks.x = element_blank()) } all_plots + patchwork::plot_layout(guides = "collect", - axis_titles = "collect", tag_level = "new") + - plot_annotation(title = "Selected genes by tested methods") + axis_titles = "collect", tag_level = "new") + # + plot_annotation(title = "Selected genes by tested methods") @ \caption{\emph{p-values} ordonnées pour les différents tests} \label{fig:pval-methods} @@ -286,9 +283,6 @@ Dans l'article \cite{rohlfsPhylogeneticANOVAExpression2015}, les auteurs introduisent une méthode de détection des gènes différentiellement exprimés. Cette méthode est à l'heure actuelle très utilisée pour cette problématique. -Elle détecte ici \Sexpr{sum(evemodel_dataframe[evemodel_dataframe$test_method == "EVEAdj",]$selected)} -gènes différentiellement exprimés. - Son principe de fonctionnement suppose que les traits évoluent selon un processus d'Ornstein-Uhlenbeck et le test réalisé est un \emph{Likelihood Ratio test}. @@ -351,23 +345,34 @@ pvalueseve_dataframe_wide <- pvalueseve_dataframe %>% \label{fig:venn-all-methods-eve} \end{figure} -\paragraph{Analyse des résultats} Nous pouvons voir que la méthode la plus +\paragraph{Analyse des résultats} La barre indiquant 3681 gènes comptabilise les +gènes qui n'ont été sélectionnés par aucune méthode. Le nombre de gènes +sélectionnés par méthode est présenté dans le tableau~\ref{tab:data-genes-selectionnes}. + +La méthode EVE détecte ici +\Sexpr{sum(evemodel_dataframe[evemodel_dataframe$test_method == "EVEAdj",]$selected)} +gènes différentiellement exprimés. Étant la méthode état de l'art nous pouvons +nous en servir comme référence. + +Nous pouvons voir que la méthode la plus parcimonieuse est celle utilisant le LRT, qui sélectionne $\Sexpr{sum(pvalues_adj_dataframe[pvalues_adj_dataframe$test_method == "LRT Ajusté",]$selected)}$ gènes qui sont eux-mêmes \textbf{sélectionnés par toutes les méthodes}. -Cette unanimité sur ces gènes nous invite à penser qu'ils sont en effet -différentiellement exprimés. +Cette unanimité sur ces gènes nous invite à penser qu'ils sont en effet bel et +bien différentiellement exprimés. La seconde méthode sélectionnant le moins de gènes est l'ANOVA Phylogénétique avec REML. Elle sélectionne $\Sexpr{sum(pvalues_adj_dataframe[pvalues_adj_dataframe$test_method == "ANOVA Phylo REML Ajustée",]$selected)}$ -gènes. Ces sélections se décompose en plusieurs sous ensembles +gènes. Ces sélections se décompose en plusieurs sous ensembles. Des méthodes +que nous avons utilisées c'est celle-ci qui semble s'en sortir le mieux, elle +donne des résultats semblables à EVE. -TODO Ici nous avons supposé un mouvement brownien comme processus sous-jacent de -l'arbre mais ce n'est peut-être pas le meilleur modèle et un OU pourrait être -intéressant. Intéressant pour l'ouverture. -% \begin{table} -% <<'table-anova-phylo-reml'>>= -% kable() -% @ -% \end{table} \ No newline at end of file +\begin{table}[H] + \centering + <<'table-anova-phylo-reml'>>= + kable(colSums(pvalueseve_dataframe_wide[,-1]), col.names = c("Nombre de gènes sélectionnés"), booktabs = TRUE) + @ + \caption{Nombre de gènes sélectionnés par méthode} + \label{tab:data-genes-selectionnes} +\end{table} diff --git a/img/OrnsteinUhlenbeck3.png b/img/OrnsteinUhlenbeck3.png new file mode 100644 index 0000000000000000000000000000000000000000..28036e77d248823765ecda70846d7da8f22bea6f GIT binary patch literal 42880 zcmc$Fg;!PG7cE>ty1TnexK*jc-}?*RbDS|8 z#V)@iaF=`peQea0E-I?1_p*8B`K;52KI^=3=E_J4FW#FK*yj0{(~@oEB6)* ztU4C%!4MJ*tdLVm^sS1A-f^b41^V3mb4SN>IgxRFy?Xg9o>kk=DXrr|y{hthG3^qu z9ynTBS`@U;p~2KJqAKVj@YwLLNvUB`MZXE<6O%)LP$1q)3P}1S1E>x`l_cLOo9h$25zdN`U zgg|t=_Tb?E_dO8FOQJJb(BT2UFQHMixX!^lZ6UCK<}Fha2X1pH)l>boChih~yvpeb z6B(=#rq%1p>i+t8D49X~{92>k#}oMH@87Yc+cdk{-{1e^hk?<^%2&rAa2B=DR`ao} z@3@ZJB~lFgCntI>ZVaBF8LEl#Ms|{U=}NWxv_~`q4(PcZh5v^4uwt z64WFP*ga>avnfXsI6FHV1cfx3#%_HuUHooUus|-o!C}3trlw|neH~pZPI0QyZe_8` zP((^fN?1J>3lnqESS*ixHk?jf&T8Otcg%eFlVRC5f?%2-^AaH_TGmRobys20;3pa- zf%?beJ`YcFFJ`@pDN*7%Xi0Xg?Z|?SdEGqlwUo6bWI>=YXQp z6>-Z3lctc=&DD|(b{P0bAs>c$+Gw*NEIH~+wqcLrijlHQX@m3~)AMIqH)3;-eI%T^ zq(KuHvlAMs22D?CZ*6PzcR8ds$N`Nd{-!cPDa#FU%!r5`|NIE5ng(v zz!ja)t!1Ar!i%44{*iNJ*Li2S8gf=a@G-cz>$Q19OD)0hkG}B}oBREqQRH0&K^{TJ z7&;r?0r~FRtp$VXFz8fh#ZQ{h^&DP^$^6RR@=e=`Iyy z6UNXSr5hU?!Rj*P{;!H4QO?l8Vdxd)!lKS8z?YS{zCz24N938J zLCN@FwH$3qBR*z+4c2xPW&Xa^GMi33cvDhR3A&>sN;mz9>1cJ(!|`{E;&vf#SSWEA`15m zhci0QTs*|A;PZpA#`&pz$Ky`?S!3i)QW|RDcOdjAdgatVbn=2mWhsq9;>UA}Ja`sk z7@zhy%@J3JaZfmLziiW&(W~#Hiwa6}WVk=H%Eu^*&)QHDVZdYlCSFA@-XSq`Mkwd6< zcuU5EQLH_(Y;HU&MO>G%(@c^EC^)-l+V8~ASDLwctfV1)M1?>@5(yOV_@z5_1AEAt znwoGpQ5Bf@q(;M-WBHd{zfVoyp|go$X2c4qEKU_F+{K9_%gUrMid9UM)vj9Rle_PR z+h_{$=BF%tBVKw&=NAnp{(&P4o0iJQn_7I$vY*fst@C!K)AMDlKKfD@Xx|GcHxLRw{1&5@Ws zwR>||*}-!vxdb&3<)9U3082Z((W7b$Htm zrYz?S8A+>^hEG%z7R#+|J^y+*lQ-p4ykLVQB+jnu-C=X&SeY{z0tT z?Zf35kb6aVYLG&WcPm0RT*VA}jBKencc~8NDkW5KEXJK*J4a_kSjz{E_U-TCb2;*u z+j`~n*nOCq6C-28c+}p@;5Bb2o)g!aU*D~)x4{CEAaLwt6z3uXSO@r}^(OMAPDb%5 z)2&*Oj6cRylTd4}lArioj&OP?X1H!qVQ7s0tjxJ7#?%O}VGr~?Pt}~5I2hUP`{9M%U${Q&A#Nh!D$#yU(lF0$JvOzFY!M2W*EC?0Q z^v#q*5p7>YuvVx16bbI6AZI0re7|$&hB?=6p?g*-lT?vHQjlz2akVkG1@366ag09dN8Pw; zuuEWGV)@8%oMR%00_V}K#2KX@8yu!ADp$R4L6kVP+(`#ZBX@s*o+`?b9X|mTeb7a% zl;vtfuIFy=?XU+$BpqkaloNVqtl$%Nond^fWbixW@7A_^cS;c>q|QOK`&49A?~~th zZ71R==_GTVYMZmOw=`q?`oLS5pC6noGFPNbJ1d`nR1&i@7+ivaa>fpn3w?#`s2kWo z6Ao`TB?AIMzYMNKO#}NBZ{nZbPQptx7z55CAa8YbECn478#jT5%;Qfi2>8?Di*=R> z#e`X;NNPs!4(papvQiaw_mY=JP42cJ)rzptj_{|g-_*lb1s5B>Cq-f1%w)5$9;4^4 zIT_RJ8H}Q4lzH#t$JW2yFw%=Az5=_+4iEb&EzT&v)7@yQuvC;d9mw~lQ#MxgspQCY zO9t}~8&xwEy675XS^W3E4lCv6+`cL6z>SvVj*=dYZh&rSxe`cs__#8SVU`fhvjqKD ze_SVa8byAh-kwIlVTF^Y(zyV^A-Ww?PlagSh2KL36zCU(!bs~GEU+4d?YC>rUz9dYls_%OUY)ZPSRN-e?Dt!rd0i1^z0RkY7prU37|Xo%V1xi|JyYGumnEI z$|A)1*GB(;zXu0RMv z>Hc~pF65m=>4x4|DW7*7SV}|i%ZMM*kFB-&FASfN#OI5lfQOv zrsdy6)PO3f_vNdi1-h&2(R_8DL@W;{!(x-Oxwf`8`pH0gR(V2+ z4`g7-DXc37#KwAeSURVDa_8XDWA5rdNByr&`sdjRXb)in8quP3mA^9{kQ9KAz*VG9 z7F^UV>HoVkZWE%Fv`V=3-7*q(`riE8UP#xi&Jk~H3f zcr{KUjO>c1$E}%cZz#Q{rFJc}zw>B6BuEcMgPJOW#X&LC(8B}!XJ%&R-QAti4zcG{ z9^2DT&+hiiHImw`zQK^nz+USA_W$I!`;ke%lZk06<<9{AAJ+&&A|k}Wv9z_NK>tJ& zDAo}q(l&FWfT?O9Pc*dREnoiMb_mU)odtJxg#%%new9S0KCU4rCx^#j)1T8>!#3-{ z|-jU5^e zTOV-N{qK((>#gU^)C?x>r*<3NlPZMd&k5CM&xa15Y4jRux6=7dOA%Eb#-|gEh-- zI=g&9P3O|wd(QZt_P`87?XjWMW;?SmsdYi?P4-;2SY-e5$KHs{@=^3Z`xJOY_5%Y+ z4P=tQ$sZ^mMDe4uw5x=HS0