Vous êtes iciDe nouveaux marqueurs moléculaires pour les téléostéens

De nouveaux marqueurs moléculaires pour les téléostéens


Par Agnès - Posté le 30 novembre 2012

Le travail de notre équipe se focalise sur la comparaison de séquences d'ADN de différentes espèces pour reconstituer les relations de parenté. Mais comment choisissons nous les gènes (marqueurs) dont nous allons comparer les séquences et combien de marqueurs différents seront nécessaires ?

Il y a plusieurs avantages à employer plus d'un marqueur moléculaire pour l'étude des relations de parenté des organismes :

- Un arbre de relations de parenté inclut souvent à la fois des relations récentes et des relations plus anciennes. Un marqueur à évolution lente peut ne pas être assez variable pour certaines des comparaisons (pas de différence entre les séquences). Inversement, un marqueur à évolution rapide peut avoir accumulé "trop" de mutations pour fournir des informations sur les parentés plus anciennes. Avec le temps, la probabilité que plusieurs mutations se produisent successivement au même site (chacune effacant l'information sur les relations de parenté éventuellement apportée par la précédente) augmente. Au bout d'un certain temps, il ne reste plus rien des mutations partagées anciennes (c'est la saturation mutationnelle). Ainsi, le mieux est d'employer à la fois des marqueurs plus variables qui fourniront une information sur les divergences récentes et des marqueurs moins variables (à évolution lente).

- Un marqueur (tout comme un jeu de données morphologique, d'ailleurs) ne raconte que sa propre histoire, qui peut être différente de celle des organismes (transferts latéraux, hybridations, duplications de gènes...). Comparer plusieurs marqueurs les plus indépendants possibles permet d'avoir une idée de ce qui est propre au marqueur et de ce qui provient de l'histoire des organismes (qui est elle commune entre marqueurs).

- Combiner plusieurs marqueurs permet parfois de gagner en résolution dans les arbres, ou bien de déterminer si un manque de résolution est le résultat d'une spéciation rapide.

Mais pour que les marqueurs soient réellement utiles, il faut qu'il soient également adaptés à la problématique : des marqueurs à évolution rapide pour des divergences récentes, des marqueurs à évolution plus lente pour des divergences anciennes. Il existait des marqueurs (en particulier des parties de gènes) pour les téléostéens, mais ils étaient généralement peu nombreux et/ou peu variables. Nous avons donc déterminé de nouveaux marqueurs, en employant les données des génomes complets déjà disponibles pour les téléostéens (voir sur la base de donnée de génomes ENSEMBL). 

Dans un premier temps, cette recherche s'est faite manuellement à partir des sorties d'un outil inclus dans ENSEMBL, BioMart. Elle a permis de trouver plusieurs marqueurs aujourd'hui employés à différents niveaux de la phylogénie des téléostéens : une partie du gène IRBP (interphotoreceptor retinoid binding protein, Dettai et Lecointre 2008 [1], Chen et Mayden 2009), une partie du gène Mc1r (Melanocortin receptor 1, Lautredou et al. in press), une partie du gène PkD1 (Polycystic kidney disease 1, Lautredou et al. 2010 [2]), une partie du gène RNF213 (Ring Finger protein 213, Li et al. 2009 [3]), une partie des gènes MLL2 et MLL4 (Mixed lineage leukemia like 2 et 4, Dettai et al. 2005 [4], Lautredou et al. in press), une partie du gène SSRP (structure specific recognition protein 1, Lautrédou et al. 2012 [5]), une partie du gène HECW (E3 ubiquitin-ligase protein HECW2, Lautrédou et al. 2012 [5])... Ces marqueurs ont des localisations différentes dans les génomes et des fonctions très différentes : on peut penser qu'ils fournissent des informations indépendantes sur l'histoire des organismes. Pour la phylogénie, nous n'employons qu'une partie de la séquence de ces gènes, généralement située à l'intérieur d'un exon (cf. figure 1), qui est d'une taille pratique pour l'obtention des séquences. Si nous souhaitions obtenir la séquence complète d'un gène, cela nous demanderait de très nombreuses manips pour chaque espèce étudiée et il est plus intéressant d'obtenir des fragments pour plusieurs gènes différents, que la séquence complète pour un seul si l'on s'intéresse aux relations de parenté.

Figure 1 :
Représentation de la structure du gène IRBP chez un téléostéen (Danio rerio) et un tétrapode (le xénope). Le nombre de gènes et l'assemblage des parties codantes (exons) diffère entre les téléostéens et les tétrapodes pour ce gène. Le fragment employé comme marqueur est celui qui se trouve entre les deux petites flèches, dans l'exon 1 du gène 2. Nous obtenons la séquence pour cette partie du gène et la comparons entre différentes espèces dont nous souhaitons étudier les relations de parenté. modifie d'apres [1]

Plus récemment, le processus de recherche de marqueurs à partir des génomes complets a été automatisé grâce à un logiciel conçu par Cyril Gallut et une étudiante, Mathilde Belli. Il existait déjà un logiciel (Li et collègues 2007) qui permettait d'obtenir une liste de marqueurs à tester automatiquement, cependant les marqueurs ainsi retenus étaient relativement peu variables et donnaient peu d'information pour les relations entre espèces proches. Le nouveau logiciel devrait permettre de retenir également des marqueurs plus variables, dont aujourd'hui peu sont disponibles. Plusieurs gènes sélectionnés par ce logiciel sont actuellement en cours de test au laboratoire.

Une fois qu'une liste de gènes a été obtenue, il faut vérifier qu'ils ne posent pas de problèmes au laboratoire. Pour certains fragments de gènes, il est très difficile d'obtenir des séquences, en particulier si on souhaite étudier des relations de parenté plus anciennes. Ces gènes là ne seront pas retenus. Le marqueur idéal est facile a amplifier et à séquencer et comme nous avons le choix entre des dizaines, voire des centaines de gènes, seuls ceux qui ne présentent pas trop de problèmes techniques sont conservés.

Quand à ce que nous faisons ensuite de ces marqueurs, vous trouverez un exemple dans notre étude sur les Serraniformes, celle sur les Trematominés, ou bien celle sur les Nototheniidés...


Références externes

Wei-Jen Chen, Richard L. Mayden, 2009. Molecular systematics of the Cyprinoidea (Teleostei: Cypriniformes), the world's largest clade of freshwater fishes: further evidence from six nuclear genes. Mol Phylogenet Evol. 52(2):544-9.

Chenhong Li, Guillermo Ortí, Gong Zhang, Guoqing Lu, 2007. A practical approach to phylogenomics: the phylogeny of ray-finned fish (Actinopterygii) as a case study. BMC Evol Biol. 2007; 7: 44.  doi: 10.1186/1471-2148-7-44


Références