diff --git a/prez.Rnw b/prez.Rnw index fedbb8c..eedc0ec 100644 --- a/prez.Rnw +++ b/prez.Rnw @@ -168,7 +168,7 @@ source(here("R","utils.R")) \note{ \begin{itemize} - \item Avec l'avènement des données omiques de masses, on a accès à des données quantitatives très nombreuses pour plusieurs espèces. + \item Avec l'avènement des données "-omiques" de masses, on a accès à des données quantitatives très nombreuses pour plusieurs espèces. \item Le but derrière est de trouver les voies métaboliques et les gènes impliqués dans leur fonctionnement. \item Problème : cela coûte cher de regarder tous les gènes. \item On veut alors trouver les gènes qui s'expriment différentiellement en utilisant des méthodes statistiques en contrôlant l'erreur de type I, c'est-à-dire les faux positifs. @@ -177,7 +177,7 @@ source(here("R","utils.R")) article de Chen: \begin{itemize} \item En compilant plusieurs jeux de données pour plusieurs espèces avec - parfois plusieurs individus cf l'arbre les auteurs regardent par exemple + parfois plusieurs individus \emph{cf} l'arbre les auteurs regardent par exemple entre les espèces les gènes qui sont différentiellement exprimés dans le foie. \item Pour voir s'il y a une différence entre 2 groupes d'espèces (\textit{RatMus vs Autres}). $\mu_1$, $\mu_2$ etc. \end{itemize} @@ -1045,7 +1045,7 @@ présentation est disponible sur notre dépôt GitHub : \\ \begin{frame}{Concernant les fautes d'orthographes} Après relecture du rapport, nous avons pu constater que celui-ci contenait de - nombreuses coquille. Nous vous présentons nos excuses. + nombreuses coquilles. Nous vous présentons nos excuses. \end{frame} \begin{frame}{Ornstein-Uhlenbeck} Une autre possibilité de processus stochastique est le processus @@ -1093,69 +1093,77 @@ $$\dd r_t = -\theta(r_t - \mu)+\sigma\dd W_t$$ \end{align*} \end{column} \end{columns} + \note{ + La F stat + \begin{align*} + F &=\frac{\text{variance entre groupes}}{\text{variance intra-groupes}}\\ + \text{variance extra} &= \frac{\sum_{i=1}^p n_i (\bar{Y_{i,.}} - \bar{Y})^2}{p-1}\\ + \text{variance intra} &= \frac{\sum_{i=1}^p \sum_{j=1}^{n_i} (Y_{i,j} - \bar{Y_{i,.}})^2}{n-p}\\ + \end{align*} + } \end{frame} -\begin{frame}[allowframebreaks]{questions posables} - % - comment obtenir la stat de test pour anova phylo (Cholesky) - % - en quoi c'est un modèle mixte pour Satterthwaite ? - % - calcul de la Hessienne optim vs formule analytique, mettre formule analytique - % - Le LRT un modèle emboité blabla ? - % - sur quoi est basé EVEmodel ? - % - Mettre la démo du calcul de la Hessienne - % - Ornstein Uhleinbeck : qu'est ce que ça change par rapport au MB ? EVE dit optimum qui saute pas le processus qui saute - % Modélise deux niches différentes. - % Effet sur la moyenne masi ok , et sur la variance $K_\alpha$, ok pour satterthwaite masi prendre $\alpha$ en compte aussi - % Modifie la structure de variance et ajoute un paramètre $\alpha$, $K(\alpha)$, un saut sur l'optima. - % - données de comptage transformées donc ok de modéliser par MB +% \begin{frame}[allowframebreaks]{questions posables} +% % - comment obtenir la stat de test pour anova phylo (Cholesky) +% % - en quoi c'est un modèle mixte pour Satterthwaite ? +% % - calcul de la Hessienne optim vs formule analytique, mettre formule analytique +% % - Le LRT un modèle emboité blabla ? +% % - sur quoi est basé EVEmodel ? +% % - Mettre la démo du calcul de la Hessienne +% % - Ornstein Uhleinbeck : qu'est ce que ça change par rapport au MB ? EVE dit optimum qui saute pas le processus qui saute +% % Modélise deux niches différentes. +% % Effet sur la moyenne masi ok , et sur la variance $K_\alpha$, ok pour satterthwaite masi prendre $\alpha$ en compte aussi +% % Modifie la structure de variance et ajoute un paramètre $\alpha$, $K(\alpha)$, un saut sur l'optima. +% % - données de comptage transformées donc ok de modéliser par MB - % En écologie ne travaille pas sur autant de traits, spécificité de la RNA-seq - % des milliers de données. +% % En écologie ne travaille pas sur autant de traits, spécificité de la RNA-seq +% % des milliers de données. - % LIMMA pour le cas non phylogénétique. - % Pour le cas phylogénétique \texttt{phylolimma}. +% % LIMMA pour le cas non phylogénétique. +% % Pour le cas phylogénétique \texttt{phylolimma}. - % Méthodes d'amélioration essayer de faire quelque chose qui prennent en compte - % plusieurs gènes à la fois - % - Est ce q'on pourrait faire une méthode comme LIMMA et faire Satterthwaite ? - % - c'est bizarre d'utiliser des mesures +% % Méthodes d'amélioration essayer de faire quelque chose qui prennent en compte +% % plusieurs gènes à la fois +% % - Est ce q'on pourrait faire une méthode comme LIMMA et faire Satterthwaite ? +% % - c'est bizarre d'utiliser des mesures - % Questions Mélina : - % - Qu’est qu’une ANOVA phylogénétique ? En quoi différent l’ ANOVA classique et l’ ANOVA phylogénétique ? - % - Comment modéliser l’évolution d’un trait continu sur un arbre (choix du processus dans l’ANOVA phylogénétique : savoir qu’il existe différentes manières de faire, soit on prend un brownien, soit on prend un OU … ) - % - Comment prendre en compte les erreurs de mesures dans l’anova phylogénétique ? (Car ici, dans le cadre de l’expression des gènes chez plusieurs espèces, on mesure plusieurs individus par espèce, on a donc une variabilité intra-espèce et une variabilité inter-espèces… il faut donc prendre en compte cela dans le modèle, et c’est d’ailleurs ce que fait EVE) - % - Quel test effectuer pour tester si on a une différence d’expression significative entre différent groupes d’espèces ? (LRT ou test basé sur la stat de Fisher). - % - Qu’est ce qu’un modèle mixte ? Comment estimer les paramètres dans un modèle mixte ? Quels tests stats ? Quel est le lien entre une anova phylo et un modèle mixte ? - % - Pourquoi faire du REML au du ML classique ? Dans quel context? - % - Pour l'analyse de données réelles, vous avez également été confrontés à un problème de tests multiples : puisque vous faites un test par gènes, et que vous avez des milliers de gènes, alors vous devez "corriger les p-values" pour extraire votre sous liste de "gènes différentiellement exprimés" (deux approches classiques : Bonferroni / BH ) - % Voici la reformulation de votre texte en utilisant l'environnement "itemize" pour qu'il soit copiable : +% % Questions Mélina : +% % - Qu’est qu’une ANOVA phylogénétique ? En quoi différent l’ ANOVA classique et l’ ANOVA phylogénétique ? +% % - Comment modéliser l’évolution d’un trait continu sur un arbre (choix du processus dans l’ANOVA phylogénétique : savoir qu’il existe différentes manières de faire, soit on prend un brownien, soit on prend un OU … ) +% % - Comment prendre en compte les erreurs de mesures dans l’anova phylogénétique ? (Car ici, dans le cadre de l’expression des gènes chez plusieurs espèces, on mesure plusieurs individus par espèce, on a donc une variabilité intra-espèce et une variabilité inter-espèces… il faut donc prendre en compte cela dans le modèle, et c’est d’ailleurs ce que fait EVE) +% % - Quel test effectuer pour tester si on a une différence d’expression significative entre différent groupes d’espèces ? (LRT ou test basé sur la stat de Fisher). +% % - Qu’est ce qu’un modèle mixte ? Comment estimer les paramètres dans un modèle mixte ? Quels tests stats ? Quel est le lien entre une anova phylo et un modèle mixte ? +% % - Pourquoi faire du REML au du ML classique ? Dans quel context? +% % - Pour l'analyse de données réelles, vous avez également été confrontés à un problème de tests multiples : puisque vous faites un test par gènes, et que vous avez des milliers de gènes, alors vous devez "corriger les p-values" pour extraire votre sous liste de "gènes différentiellement exprimés" (deux approches classiques : Bonferroni / BH ) +% % Voici la reformulation de votre texte en utilisant l'environnement "itemize" pour qu'il soit copiable : - \begin{itemize} - \item Comment obtenir la stat de test pour ANOVA phylo (Cholesky) - \item En quoi c'est un modèle mixte pour Satterthwaite ? - \item Calcul de la Hessienne optim vs formule analytique, mettre formule analytique - \item Le LRT un modèle emboîté blabla ? - \item Sur quoi est basé EVEmodel ? - \item Mettre la démo du calcul de la Hessienne - \item Ornstein Uhleinbeck : qu'est-ce que ça change par rapport au MB ? EVE dit optimum qui saute pas le processus qui saute Modélise deux niches différentes. Effet sur la moyenne mais ok, et sur la variance $K_\alpha$, ok pour Satterthwaite mais prendre $\alpha$ en compte aussi Modifie la structure de variance et ajoute un paramètre $\alpha$, $K(\alpha)$, un saut sur l'optima. - \item Données de comptage mais transformées donc ok de modéliser par MB - \item En écologie, ne travaille pas sur autant de traits, spécificité de la RNA-seq des milliers de données. - \item LIMMA pour le cas non phylogénétique. Pour le cas phylogénétique \texttt{phylolimma}. - \item Méthodes d'amélioration essayer de faire quelque chose qui prennent en compte plusieurs gènes à la fois - \begin{itemize} - \item Est-ce qu'on pourrait faire une méthode comme LIMMA et faire Satterthwaite ? - \item C'est bizarre d'utiliser des mesures - \end{itemize} - \item Questions Mélina : - \begin{itemize} - \item Qu’est-ce qu’une ANOVA phylogénétique ? En quoi diffère l’ANOVA classique et l’ANOVA phylogénétique ? - \item Comment modéliser l’évolution d’un trait continu sur un arbre (choix du processus dans l’ANOVA phylogénétique : savoir qu’il existe différentes manières de faire, soit on prend un brownien, soit on prend un OU … ) - \item Comment prendre en compte les erreurs de mesures dans l’ANOVA phylogénétique ? (Car ici, dans le cadre de l’expression des gènes chez plusieurs espèces, on mesure plusieurs individus par espèce, on a donc une variabilité intra-espèce et une variabilité inter-espèces… il faut donc prendre en compte cela dans le modèle, et c’est d’ailleurs ce que fait EVE) - \item Quel test effectuer pour tester si on a une différence d’expression significative entre différents groupes d’espèces ? (LRT ou test basé sur la stat de Fisher). - \item Qu’est-ce qu’un modèle mixte ? Comment estimer les paramètres dans un modèle mixte ? Quels tests stats ? Quel est le lien entre une ANOVA phylo et un modèle mixte ? - \item Pourquoi faire du REML au du ML classique ? Dans quel contexte? - \item Pour l'analyse de données réelles, vous avez également été confrontés à un problème de tests multiples : puisque vous faites un test par gènes, et que vous avez des milliers de gènes, alors vous devez "corriger les p-values" pour extraire votre sous-liste de "gènes différentiellement exprimés" (deux approches classiques : Bonferroni / BH ) - \end{itemize} - \end{itemize} -\end{frame} +% \begin{itemize} +% \item Comment obtenir la stat de test pour ANOVA phylo (Cholesky) +% \item En quoi c'est un modèle mixte pour Satterthwaite ? +% \item Calcul de la Hessienne optim vs formule analytique, mettre formule analytique +% \item Le LRT un modèle emboîté blabla ? +% \item Sur quoi est basé EVEmodel ? +% \item Mettre la démo du calcul de la Hessienne +% \item Ornstein Uhleinbeck : qu'est-ce que ça change par rapport au MB ? EVE dit optimum qui saute pas le processus qui saute Modélise deux niches différentes. Effet sur la moyenne mais ok, et sur la variance $K_\alpha$, ok pour Satterthwaite mais prendre $\alpha$ en compte aussi Modifie la structure de variance et ajoute un paramètre $\alpha$, $K(\alpha)$, un saut sur l'optima. +% \item Données de comptage mais transformées donc ok de modéliser par MB +% \item En écologie, ne travaille pas sur autant de traits, spécificité de la RNA-seq des milliers de données. +% \item LIMMA pour le cas non phylogénétique. Pour le cas phylogénétique \texttt{phylolimma}. +% \item Méthodes d'amélioration essayer de faire quelque chose qui prennent en compte plusieurs gènes à la fois +% \begin{itemize} +% \item Est-ce qu'on pourrait faire une méthode comme LIMMA et faire Satterthwaite ? +% \item C'est bizarre d'utiliser des mesures +% \end{itemize} +% \item Questions Mélina : +% \begin{itemize} +% \item Qu’est-ce qu’une ANOVA phylogénétique ? En quoi diffère l’ANOVA classique et l’ANOVA phylogénétique ? +% \item Comment modéliser l’évolution d’un trait continu sur un arbre (choix du processus dans l’ANOVA phylogénétique : savoir qu’il existe différentes manières de faire, soit on prend un brownien, soit on prend un OU … ) +% \item Comment prendre en compte les erreurs de mesures dans l’ANOVA phylogénétique ? (Car ici, dans le cadre de l’expression des gènes chez plusieurs espèces, on mesure plusieurs individus par espèce, on a donc une variabilité intra-espèce et une variabilité inter-espèces… il faut donc prendre en compte cela dans le modèle, et c’est d’ailleurs ce que fait EVE) +% \item Quel test effectuer pour tester si on a une différence d’expression significative entre différents groupes d’espèces ? (LRT ou test basé sur la stat de Fisher). +% \item Qu’est-ce qu’un modèle mixte ? Comment estimer les paramètres dans un modèle mixte ? Quels tests stats ? Quel est le lien entre une ANOVA phylo et un modèle mixte ? +% \item Pourquoi faire du REML au du ML classique ? Dans quel contexte? +% \item Pour l'analyse de données réelles, vous avez également été confrontés à un problème de tests multiples : puisque vous faites un test par gènes, et que vous avez des milliers de gènes, alors vous devez "corriger les p-values" pour extraire votre sous-liste de "gènes différentiellement exprimés" (deux approches classiques : Bonferroni / BH ) +% \end{itemize} +% \end{itemize} +% \end{frame} \end{document} diff --git a/prez.pdf b/prez.pdf index e3c1959..583be4b 100644 Binary files a/prez.pdf and b/prez.pdf differ