Chimère (biologie moléculaire)

En génétique et en biologie moléculaire, une chimère correspond à une seule séquence d'ADN provenant de plusieurs transcriptions ou séquences parentes. Un tel résultat peut se produire dans divers contextes. Les chimères sont généralement considérées comme un contaminant, car une chimère peut être interprétée comme une nouvelle séquence alors qu'il s'agit en fait d'un artefact. Cependant, la formation de chimères artificielles peut également être un outil utile en biologie moléculaire. Par exemple, en ingénierie des protéines, la « chiméragenèse (formation de chimères entre des protéines qui sont codées par des ADNc homologues) »[1] est l'une des « deux principales techniques utilisées pour manipuler les séquences d'ADNc ».

Description

Chimère de transcription

Une chimère peut se matérialiser sous la forme d'une seule séquence d'ADNc provenant de deux transcrits. Elle est généralement considérée comme un contaminant dans les bases de données de transcription et de balise de séquence exprimée (ce qui donne le surnom de chimère BSE ou EST chimera en anglais, EST étant l'acronyme de expressed sequence tag)[2]. On estime qu'environ 1% de tous les transcrits de la base de données Unigene du National Center for Biotechnology Information contiennent une « séquence chimérique »[3].

Chimère de PCR

Une chimère peut également être un artefact issu de l'amplification par PCR. Cela se produit lorsque l'extension d'un amplicon est interrompue et que le produit résultant joue le rôle d'amorce dans le prochain cycle de PCR. Le produit avorté s'hybride au mauvais brin matrice et continue de s'élonguer, synthétisant ainsi une seule séquence provenant de deux brins matrices différents[4].

Les chimères de PCR sont une question importante à prendre en compte lors du metabarcoding, où des séquences d'ADN d'échantillons environnementaux sont utilisées pour déterminer la biodiversité. Une chimère sera détectée comme une nouvelle séquence qui ne correspondra probablement à aucun organisme connu. Par conséquent, elle pourrait être interprétée comme une nouvelle espèce, surestimant ainsi la diversité.

Lecture chimérique

Une lecture est une séquence d'ADN issue d'une technologie de séquençage haut-débit. On parle de lecture chimérique ou "split read"[5] lorsque plusieurs sous-segments de cette séquence s'alignent à des endroits multiples d'un génome de référence. Cela est généralement révélateur soit d'une erreur de séquençage, soit d'un événement réel dans l'ADN de variation structurale.

De nombreux programmes de détection des variants structuraux utilisent donc aujourd'hui ces lectures[6].

Certaines méthodes plus anciennes ont été conçues pour détecter les chimères, telles que :

  • la commande "CHECK_CHIMERA" du Ribosomal Database Project[7] ;
  • la commande "ChimeraSlayer" dans QIIME[8],[4] ;
  • la commande "uchime" dans vsearch[9] ;
  • la commande "removeBimeraDenovo()" dans dada2[10] ;
  • la commande "chimera.vsearch" dans mothur[11] ;
  • le programme Bellerophon[12].

Exemples

  • Le premier transcrit d'ARNm isolé pour le gène humain C2orf3 faisait partie d'une chimère artificielle[13].
  • On pensait que CYP2C17 était un gène humain, mais il « est maintenant considéré comme un artefact basé sur une chimère de CYP2C18 et CYP2C19. »[14]
  • Des chercheurs ont créé des chimères de récepteurs au cours de leurs travaux sur l'oncostatine M[15].

Notes et références

  1. Lajtha, Abel et E. A. Reith, Maarten, Handbook of Neurochemistry and Molecular Neurobiology Neural Membranes and Transport, Boston, MA, Springer Science+Business Media, LLC., , 485 p. (ISBN 978-0-387-30347-5)
  2. Unneberg, Claverie et Hoheisel, « Tentative Mapping of Transcription-Induced Interchromosomal Interaction using Chimeric EST and mRNA Data », PLoS ONE, vol. 2, no 2,‎ , e254 (PMID 17330142, PMCID 1804257, DOI 10.1371/journal.pone.0000254, Bibcode 2007PLoSO...2..254U) Accès libre
  3. Charlie Nelson, « EST Assembly for the Creation of Oligonucleotide Probe Targets », Agilent Technologies (consulté le )
  4. a et b (en) Birren, Knight, Petrosino et Consortium, « Chimeric 16S rRNA sequence formation and detection in Sanger and 454-pyrosequenced PCR amplicons », Genome Research, vol. 21, no 3,‎ , p. 494–504 (ISSN 1549-5469, PMID 21212162, PMCID 3044863, DOI 10.1101/gr.112730.110)
  5. (en) Bernardo Rodríguez-Martín, Emilio Palumbo, Santiago Marco-Sola et Thasso Griebel, « ChimPipe: accurate detection of fusion genes and transcription-induced chimeras from RNA-seq data », BMC Genomics, vol. 18, no 1,‎ , p. 7 (ISSN 1471-2164, DOI 10.1186/s12864-016-3404-9, lire en ligne, consulté le )
  6. (en) Shunichi Kosugi, Yukihide Momozawa, Xiaoxi Liu et Chikashi Terao, « Comprehensive evaluation of structural variation detection algorithms for whole genome sequencing », Genome Biology, vol. 20, no 1,‎ , p. 117 (ISSN 1474-760X, DOI 10.1186/s13059-019-1720-5, lire en ligne, consulté le )
  7. Maidak, « The Ribosomal Database Project (RDP) », Nucleic Acids Research, vol. 24, no 1,‎ , p. 82–85 (PMID 8594608, PMCID 145599, DOI 10.1093/nar/24.1.82, lire en ligne, consulté le )
  8. « Chimera checking sequences with QIIME — Homepage », qiime.org (consulté le )
  9. « UCHIME algorithm », drive5.com (consulté le )
  10. « removeBimeraDenovo function | R Documentation », www.rdocumentation.org (consulté le )
  11. (en) James J. Kozich, Sarah L. Westcott, Nielson T. Baxter et Sarah K. Highlander, « Development of a Dual-Index Sequencing Strategy and Curation Pipeline for Analyzing Amplicon Sequence Data on the MiSeq Illumina Sequencing Platform », Applied and Environmental Microbiology, vol. 79, no 17,‎ , p. 5112–5120 (ISSN 0099-2240 et 1098-5336, PMID 23793624, DOI 10.1128/AEM.01043-13, lire en ligne, consulté le )
  12. (en) Hugenholtz, Faulkner et Huber, « Bellerophon: a program to detect chimeric sequences in multiple sequence alignments », Bioinformatics, vol. 20, no 14,‎ , p. 2317–2319 (ISSN 1367-4803, PMID 15073015, DOI 10.1093/bioinformatics/bth226)
  13. (en) Masato Takimoto, Peizhong Mao, Gang Wei et Hitoshi Yamazaki, « Molecular analysis of the GCF gene identifies revisions to the cDNA and amino acid sequences1The nucleotide sequence data reported in this paper will appear in the DDBJ/EMBL/GenBank nucleotide sequence databases with the accession number AB026911.1 », Biochimica et Biophysica Acta (BBA) - Gene Structure and Expression, vol. 1447, no 1,‎ , p. 125–131 (ISSN 0167-4781, DOI 10.1016/S0167-4781(99)00127-X, lire en ligne, consulté le )
  14. « Entrez Gene: CYP2C18 cytochrome P450, family 2, subfamily C, polypeptide 18 », National Center for Biotechnology Information (consulté le )
  15. (en) Simone Radtke, Heike M. Hermanns, Claude Haan et Hildegard Schmitz-Van de Leur, « Novel Role of Janus Kinase 1 in the Regulation of Oncostatin M Receptor Surface Expression », Journal of Biological Chemistry, vol. 277, no 13,‎ , p. 11297–11305 (ISSN 0021-9258 et 1083-351X, PMID 11786531, DOI 10.1074/jbc.M100822200, lire en ligne, consulté le )

Articles connexes