Vous êtes iciLa systématique par le menu / Le barcode dans tous ses états

Le barcode dans tous ses états


Le barcode est une méthode d'identification moléculaire fondée sur la comparaison de séquences précises d’ADN présentes dans un échantillon ou un spécimen, vivant ou mort.

Identifier un organisme, rattacher un spécimen ou un échantillon (chair, ADN ..) à un nom est une des activités de base de la biologie, afin de déterminer précisément ce dont on parle. Cette identification peut se réaliser sur caractéristiques morphologiques ou moléculaires de l'échantillon. Elles sont comparées à celles listées dans des clefs d'identifications ou des bases de données dédiées, ou bien par comparaison directe avec des spécimens conservés en collection. Cette technique s’applique à tout spécimen ou échantillon tant que de l’ADN en relativement bon état est présent, même en faibles quantités, y compris des échantillons séchés, cuits, broyés et mélangés... Cependant, même si elle peut s’appliquer également à des spécimens anciens, il est impossible de tirer des résultats d'échantillons à ADN trop dénaturé, par exemple par passage du spécimen dans le formol.

On peut représenter le déroulement de cette identification ainsi :

Barcode

Il s'agit de comparer, pour le spécimen à identifier, une séquence d'ADN donnée avec les séquences pour le même marqueur contenues dans une base de données de référence (voir figure). Pour la plupart des animaux, il s'agit du gène mitochondrial codant pour la cytochrome oxidase I (COI), une enzyme respiratoire. Cela suppose cependant que les séquences provenant d'individus d'une même espèce soient plus semblables entre elles que les séquences provenant d'individus appartenant à des espèces différentes. Si c'est le cas, et que des séquences proches sont présentes dans la base de données, on peut rattacher l'échantillon à une espèce donnée.

L'idée d'identification moléculaire existait et avait été mise en pratique bien avant que l'idée de ce qui a été appelé le « code-barre » moléculaire ait été proposée (Hebert et al. 2003). Cependant, le nouveau projet possède plusieurs caractéristiques intéressantes :

  • la standardisation, en employant un nombre très limité de marqueurs pour tout le vivant. Au départ, il s'agissait d’une partie du gène mitochondrial de la cytochrome oxidase I pour tous les groupes. Ceci a été revu par la suite, car ce marqueur s'est avéré ne pas convenir pour un certain nombre de groupes (champignons, plantes vertes...). Néanmoins, employer un nombre réduit de marqueurs est potentiellement très intéressant lorsque l'échantillon n'est pas attribuable facilement à un groupe.
  • La mise en place d'une base de données dédiée, où les séquences pour une espèce sont liées à des spécimens qui sont conservés pour servir de référence. C'est une amélioration notable sur les bases de données de séquence existant auparavant, où le lien avec le spécimen n'est pas conservé, et donc le retour à celui ci en cas de doute n'est pas possible.

Le projet Barcode of Life a pour but de rassembler et d'explorer les technologies nécessaires, ainsi que le jeu de données de référence pour l'identification moléculaire rapide d'autant d'espèces d'êtres vivants que possible.


Problèmes et critiques

Au départ, le nouveau projet fût présenté comme une révolution du domaine, avec des conclusions très larges. Il fut donc largement critiqué au cours des années qui suivirent, pour deux raisons : d'une part, une partie de la communauté des taxonomistes réagit négativement à ce qu'ils perçurent comme une attaque sur leur travail, et d'autre part, les études subséquentes montrèrent de nombreuses exceptions et problèmes qui n'avaient pas forcément été identifiés de premier abord. Les partisans du barcode ont pour la plupart nuancé leurs propos et leurs affirmations depuis, intégrant les critiques dans les études suivantes.

Enfin, le barcode a des limites :

  • les marqueurs mitochondriaux sont à hérédité maternelle seule dans la plupart des groupes, de sorte qu'un marqueur mitochondrial seul ne reflètera pas les possibles flux de gènes, et pourra donc donner une image fausse des limites entre espèces. Ceci est cependant valable pour toute étude n'incluant qu'un seul marqueur.
  •  Les marqueurs mitochondriaux peuvent chez certaines espèces présenter des copies nucléaires qui peuvent biaiser les résultats.
  • Il peut être difficile de faire la différence entre le niveau de divergence entre spécimens d'une même espèce et le niveau de divergence entre spécimens d'espèces différentes lorsque les espèces sont proches. Les problèmes peuvent ne pas être détectés si toutes les espèces ne sont pas représentées dans la base de données.
  •  L'efficacité de l'identification est très dépendante de la complétude de la base de données : s'il n'y a pas de séquence pour l'espèce ou des espèces proches, les identifications ne peuvent pas aboutir.
  • Les méthodes utilisées pour faire les assignations (méthodes de distance) sont sujettes à d'intenses débats quant à leur efficacité.

Quelles utilisations ?

Des résultats inattendus pour le barcode peuvent conduire à la découverte de problèmes existant dans les délimitations d'espèces actuelles, voire à la description de nouvelles espèces. Mais le barcode moléculaire seul ne suffit pas pour résoudre les cas douteux ou complexes. Pour cela, une étude morphologique et des données moléculaires additionnelles sont nécessaires.

L'identification est potentiellement un problème pour de nombreux groupes : manque de taxonomistes, difficulté d'identification... Ainsi, dans de nombreuses études en biologie, les spécimens inclus sont mal identifiés (Bely & Weisblat 2006, Bortolus 2008), ce qui pose de graves problèmes quant à l'interprétation et la comparaison des publications. Une aide à l'identification reste donc la bienvenue.

De plus, certains échantillons (larves, oeufs, fragments) ne sont pas reconnaissables via des caractéristiques morphologiques. Très souvent, les échantillons qui sont les plus intéressants à identifier d'un point de vue appliqué (saisies en douanes, répression des fraudes) sont justement dans ce cas là. L'identification moléculaire est dans ces cas la seule alternative.


Liens


Références