M2 - Identification de gènes soumis à empreinte parentale chez le porcelet via des approches haut-débit

Type de poste
Niveau d'étude minimal
Dates
Durée du poste
Contrat renouvelable
Contrat non renouvelable
Date de prise de fonction
Date de fin de validité de l'annonce
Localisation
Adresse

24, chemin de Borde-Rouge
31326 Castanet Tolosan
France

Contacts
Julie Demars
Email du/des contacts
julie.demars@inra.fr
Description

Contexte
L'empreinte génomique parentale est un exemple particulièrement intéressant de régulation épigénétique, puisque dans la même cellule, l'un des deux allèles parentaux est réprimé de façon stable par des modifications épigénétiques alors que l'autre allèle est maintenu à l'état actif. Cette régulation spécifique de l'allèle dépend entièrement du fait que l'allèle est hérité de la mère ou du père. Les gènes soumis à empreinte sont souvent répartis en « cluster » de gènes dont la taille varie de 20 kb à 3,7 Mb d'ADN, bien qu'il existe quelques exemples de gènes isolés (Barlow et al, 2014). Depuis la découverte des mécanismes d’empreinte, environ 130 gènes murins et 80 gènes humains ont été identifiés. Chez les animaux d’élevage, seuls 25, 21 et 14 gènes soumis à empreinte ont été validés expérimentalement chez les bovins, les porcs et les ovins, respectivement (http://www.geneimprint.com/). Des études récentes suggèrent que la conservation de ces gènes atypiques chez les mammifères est plus limitée qu'on ne le pensait initialement (Monk et al., 2006). Par exemple, le gène DLX5 présente une expression maternelle chez le porc et l’homme alors qu’une expression bi-allélique est observée chez la souris. Bien qu'il existe des données sur les mécanismes d’empreinte parentale chez les animaux d’élevage (O’Doherty et al., 2015), tous les loci identifiés jusqu'à présent ont été mis en évidence par comparaison avec les régions orthologues humaine et/ou murine. Une approche sans a priori des gènes à étudier fait donc défaut à ce jour.
Le sujet de stage s’inscrit dans le cadre du programme ANR PIPETTE (ANR-18-CE20-0018). Nous proposons d’utiliser les méthodes génomiques actuelles pour établir la liste exhaustive des gènes soumis à empreinte parentale dans l’espèce porcine. L’étude porte sur le porcelet étant donné l’importance des gènes soumis à empreinte parentale dans le développement et la croissance aux stades fœtal et post-natal. Nous avons donc choisi de considérer le stade naissance et le tissu sanguin. Pour ce faire, des croisements réciproques entre des animaux présentant une grande diversité génétique ont été réalisés. Des animaux d’origine européenne (Large White) ont été croisés avec des animaux de race chinoise (Meishan) afin de produire des descendants F1 hautement hétérozygotes et donc informatifs pour un grand nombre de variants génétiques. D’une part, des séquençages génomiques ont été obtenus pour 4 parents et 4 descendants dans chaque sens de croisement (n total = 16) afin de déterminer sans ambiguïté la phase et l’origine parentale de chacun des allèles chez les descendants. D’autre part, des séquençages transcriptomiques sanguins ont été réalisés pour les 8 descendants pour identifier l’expression mono-allélique dépendante de l’origine parentale. Dans ce cadre, l’objectif du stage consistera à établir le catalogue des gènes soumis à empreinte parentale dans le sang chez le porcelet.

Objectifs du stage
L’étudiant s’appuiera donc sur des données (i) génomiques préalablement traités avec la technologie Chromium (10X genomics) et (ii) transcriptomiques ciblant uniquement les ARN messagers. Les données de séquençage auront d’ores et déjà été pré-traitées par les outils bioinformatiques classiques. Il s’agira donc de combiner et d’intégrer les 2 types de données afin d’identifier la liste exhaustive des gènes soumis à empreinte dans le tissu sanguin chez le porcelet. Des étapes de validation de certains gènes mis en évidence seront également envisagées dans le cadre de ce stage par des méthodes de pyroséquençage ou de PCR digitale en micro-compartiments (droplet digital PCR). Les données pourront également être exploitées le cadre de l’évolution des génomes ciblant particulièrement les mécanismes d’empreinte parentale.

Compétences acquises durant le stage
- Analyse de données de séquençage haut-débit (RNAseq, Whole Genome Sequencing)
- Utilisation, et développement si nécessaire, de scripts bioinformatiques et biostatistiques pour le traitement de gros fichiers de données
- Utilisation de bases de données génomiques

Environnement et conditions du stage
Le stage sera réalisé au sein de l'équipe GenEpi (Génétique et Epigénétique Moléculaires des espèces animales utilisées en croisement) du laboratoire GenPhySE de l'INRA, qui a pour thématique majeure la caractérisation des causes moléculaires de la variabilité des caractères chez les animaux domestiques. L'équipe est constituée de 6 chercheurs et 6 ingénieurs et techniciens, et accueille des stagiaires, apprentis, CDD et doctorants (2 thèses en cours). L'étudiant(e) pourra s'appuyer sur les compétences en bioinformatique et statistique présentes au sein de l'équipe et du laboratoire. Il travaillera en outre dans un environnement propice à l'analyse de données haut-débit, en particulier grâce à la proximité des équipes bioinformatique de la plate-forme Genotoul (http://bioinfo.genotoul.fr/) et Sigenae (www.sigenae.org), auprès desquelles il/elle trouvera un soutien efficace si nécessaire.

Equipe adhérente personne morale SFBI
Equipe Non adhérente