Vous êtes iciLa systématique par le menu / ADN et systématique

ADN et systématique


Ce texte ne présente que brièvement ce qu'est l'ADN, car il existe de nombreux sites et livres sur les fondamentaux. Il se focalise plus sur la manière dont il s'hérite, pour ensuite développer la manière dont nous utilisons l'ADN pour nos recherches, et les points importants.



ADN ?

L'ADN (acide désoxyribonucléique) est le support de l'hérédité : il code pour les molécules qui permettent de construire un nouvel individu et de le faire fonctionner. La découverte de la structure de l'ADN est relativement récente.
Dans les cellules eucaryotes, il existe plusieurs génomes : le génome nucléaire, bien entendu, mais il y a également un génome réduit dans les mitochondries, et, pour les plantes, dans les chloroplastes.
L'ADN a plusieurs niveaux d'organisation. Seuls deux nous intéressent ici : les chromosomes et la séquence des bases nucléotidiques.

L'ADN d'un organisme à reproduction sexuée est hérité de ses parents. Il existe de nombreux mécanismes dans la cellule qui minimisent le taux d'erreur de copies (mutations). Cependant, malgré ces mécanismes, la copie n'est pas parfaite, ce qui fait qu'il y a quelques différences d'une génération à une autre. Sur de nombreuses générations, les erreurs s'accumulent, mais, s'il s'agit d'individus se reproduisant entre eux, il y a une certaine réhomogénéisation entre individus : les mutations « s'échangent » lors de la reproduction sexuée. Certaines seront perdues, tandis que d'autres se répandront dans toute la population (voir le texte sur l'évolution du site Vie). Si on a deux groupes de descendants ne se reproduisant pas entre eux (parce qu'ils sont isolés géographiquement, par exemple), les différences s'accumulent, mais sans que les échanges de séquences entre les deux groupes ne soient possibles : les séquences deviennent de plus en plus différentes entre les deux groupes aux fil du temps. La vitesse d'accumulation des différences dépend de nombreux facteurs : taux de mutation, nombre de générations par unité de temps...
Le taux de mutation est à la fois organisme et séquence dépendant : certains groupes ou espèces ont des mécanismes de correction moins efficaces ; de même, certaines parties du génome accumulent plus de mutations que d'autres (par exemple, le génome mitochondrial évolue en moyenne dix fois plus vite que le génome nucléaire, mais il y a aussi des différences entre les gènes du génome mitochondrial, et bien sûr entre les gènes du génome nucléaire).



À quoi sert l’ADN dans nos études ?

L'ADN remplit les conditions nécessaires pour être un bon marqueur de la descendance avec modification que nous voulons suivre dans nos études : il est héritable et subit quelques modifications qui pourront servir d'information pour les relations de parenté.

Pour les relations de parenté, il est possible de comparer la forme des chromosomes, ainsi que l'agencement et la position réciproque des séquences sur ceux ci (voir Qu'est ce que la cytogénétique ?). Une autre source de données intéressante est la comparaison de séquences soigneusement sélectionnées (appelées des marqueurs) entre différents individus ou espèces.
Dans ce cas, le marqueur sera amplifié par Amplification en Chaîne par Polymérase (ACP, ou PCR en anglais pour Polymerase Chain Reaction), puis séquencé (Le séquencage d'un ADN): la succession des bases nucléotidiques sera notée. Après séquencage, les séquences sont alignées, puis analysées. Ces étapes seront prochainement présentées de manière plus développée dans un texte qui sera disponible sur la plateforme d'enseignement du MNHN.



Quel type de séquences peut-on utiliser pour reconstruire les relations de parenté ?

La plupart des types de séquences sont utilisables, mais pas pour n'importe quoi.
Tout d'abord, il est nécessaire de s'assurer que la comparaison se fait sur des choses comparables : que nous n'allons pas comparer un pied avec une main. Or, au cours de l'évolution, toutes les lignées eucaryotes ont subi des duplications de gènes, de chromosomes entiers, voire de génomes entiers : de très nombreux gènes sont disponibles en plusieurs copies, dont il est souvent complexe de démêler l'histoire (voir Dettai et Lecointre 2008 [1]).
Pour éviter ce problème, le plus simple est d'employer des séquences qui sont en copie unique dans les génomes, ou en copies multiples mais toutes identiques, tels les ADNs ribosomiques (28S, 5S etc.) ou les gènes mitochondriaux (il existe cependant des exceptions connues où les copies ne sont pas toutes identiques).

Ensuite, selon que nous souhaitons travailler sur des relations de parenté anciennes ou plus récentes, nous allons employer des marqueurs (= types de séquences) adaptés pour les différentes problématiques.
Pour des divergences récentes, ou des études de variabilité dans des populations, il va falloir employer des marqueurs à évolution rapide, tels certains gènes mitochondriaux (d'où, par exemple, le choix du COI pour le barcoding moléculaire), certains gènes nucléaires, ou des séquences nucléaires non codantes (introns, microsatellites, et autres).
Les principaux problèmes rencontrés vont être d'une part d'acquérir assez d'informations pour déterminer quelles séquences conviendront, car un marqueur qui présente une évolution rapide dans un groupe évoluera peut être plus lentement dans un autre groupe (et vice-versa). D'autre part, il est souvent difficile d'obtenir les séquences pour ces marqueurs plus variables : la conservation de la séquence au niveau des amorces oligonucléotidiques est cruciale pour permettre les amplifications en chaîne par polymérase qui nous serviront pour obtenir les nouvelles séquences (page à venir). Un marqueur qui évolue vite présente souvent des mutations dans ces régions également, et dans ce cas il n'est pas toujours possible d'obtenir toutes les séquences pour ce marqueur.
Pour des divergences plus anciennes, si des marqueurs qui accumulent beaucoup de mutations rapidement sont employés, le signal risque d'avoir été effacé au cours du temps. Les mutations se font au hasard dans la séquence; si elles sont fréquentes et qu'une longue durée s'est écoulée, il y a de fortes chances que plusieurs se produisent successivement aux mêmes sites dans la séquence : c'est la saturation mutationnelle. Pour éviter cela, les chercheurs tendent à préférer pour les études sur des divergences « profondes » des marqueurs qui accumulent moins rapidement les mutations; il s'agit souvent de gènes codant pour des protéines avec une importance fonctionnelle, qui sont partagées par de nombreux groupes.



Comment sait-on qu'on ne s'est pas trompé dans les relations de parenté ?

Lorsque les relations de parenté sont basées sur l'étude d'un seul gène, le chercheur peut s'être trompé à plusieurs niveaux (et la plupart d'entre eux existent également dans les études morpho-anatomiques) :

  • il a sélectionné un marqueur qui ne donne pas assez d'information ou bien où les informations ont été effacées par des mutations subséquentes.
  • il a sélectionné une méthode de reconstruction qui a de forts inconvénients, ou qui ne convient pas à la quantité d'information (en particulier lorsqu'il y en a très peu ou qu'elle a été partiellement effacée).
  • Le marqueur choisi a une histoire qui n'est pas celle des organismes qui le portent (transferts latéraux, duplications de gènes et pertes...).
  • Certaines des séquences sont des erreurs de manipulation (l'ADN d'une espèce a été pris pour une autre sans que le chercheur ne s'en soit aperçu).

Cependant, si l'étude porte sur plusieurs gènes, qui sont sélectionnés pour être les plus différents possibles les uns des autres, et que tous les résultats convergent vers une réponse commune, alors la probabilité que cette convergence soit due au seul hasard est faible, et il est possible de considérer les résultats comme plus fiables. C'est le cas de la classification des acanthomorphes, qui a été retrouvée de manière répétée par différentes équipes, avec des marqueurs et des méthodes différents, et des échantillonnages légèrement différents.
Si les résultats des études morpho-anatomiques vont également dans la même direction, on dispose d'une corroboration supplémentaire. En tous cas, comme pour toute étude, plus les résultats sont différents de ce que nous pensions savoir auparavant, plus il est nécessaire de les vérifier avec des échantillons et des marqueurs supplémentaires.



Références

Pour des informations complémentaires le site "Vie" de l'Université Paris VI, avec beaucoup d'articles et de dossiers destinés aux enseignants, en particulier sur la génétique et l'ADN : http://www.snv.jussieu.fr/vie/new/new.htm  et http://www.snv.jussieu.fr/vie/bib/dos-doc/1documents.htm


Références