Introduction et contexte

1. Introduction et contexte#

L’objectif de ce tutoriel est de reproduire les résultats de l’article Investigating Conservation of the Cell-Cycle-Regulated Transcriptional Program in the Fungal Pathogen, Cryptococcus neoformans (Kelliher et al., PLOS Genetics, 2016) obtenus pour le cycle cellulaire de Saccharomyces cerevisiae.

Dans la rubrique Supporting Information de l’article, le fichier S1 Supporting Information Methods décrit les outils et les méthodes utilisés pour l’analyse RNA-seq.

Partant de ces informations, nous allons essayer de reproduire les différentes étapes de l’analyse RNA-seq. Nous verrons quelles sont les principales limitations et comment les contourner. Les analyses seront réalisées sur le cluster de calcul de l’IFB, mais, pour des raisons de progression pédagogique, nous n’utiliserons pas la puissance d’un tel cluster. Ce sera l’objet de la prochaine session.

1.1. Prérequis#

Posséder un compte sur le cluster de calcul de l’IFB.
Avoir réalisé le tutoriel Introduction à Unix.

1.2. Connexion à l’application JupyterLab de l’IFB#

Depuis le portail Open OnDemand de l’IFB, lancez l’application JupyterLab avec les paramètres suivants :

Reservation: No reservation
Account: 2501_duo ⚠️
Partition: fast
Number of CPUs: 6 ⚠️
Amount of memory: 6G ⚠️
GPUs: No GPU
Number of hours: 8 ⚠️

Warning

La configuration demandée pour cette session est différente de celle demandée pour l’introduction à Unix. Soyez particulièrement attentif aux paramètres Number of CPUs et Amount of memory.

1.3. Analyse des données RNA-seq#

Voici un schéma récapitulatif des différentes étapes de l’analyse RNA-seq.

Pour réaliser cette analyse, voici la procédure que nous allons suivre :