Gène essentiel

Un gène essentiel est un gène supposé crucial pour la survie de l'organisme qui le contient. Cependant, le fait d'être essentiel est largement dépendant des conditions dans lesquelles ledit organisme vit. Par exemple, un gène nécessaire à la digestion de l'amidon n'est essentiel seulement si l'amidon est la seule source d'énergie disponible. Ces derniers temps, des expériences méthodiques ont été conduites afin d'identifier ces gènes absolument nécessaires pour maintenir l'organisme en vie, pourvu que tous les nutriments soient disponibles[1]. De telles expériences ont mené les chercheurs à conclure que le nombre absolu de gènes nécessaires pour la viabilité des bactéries était de l'ordre de 250-300. Ces gènes essentiels codent des protéines permettant la maintenance du métabolisme central, la réplication de l'ADN, la traduction des gènes en protéines, la maintenance d'une structure cellulaire basique et le contrôle des processus de transport vers l'intérieur et vers l'extérieur de la cellule. La plupart des gènes dans un organisme ne sont pas essentiels mais lui confèrent des avantages sélectifs et une meilleure fitness.

Bactéries : études à l'échelle du génome

Deux stratégies ont été mises en œuvre afin d'identifier les gènes essentiels à l'échelle du génome entier : la suppression ciblée de certains gènes et la mutagénèse aléatoire en utilisant des transposons. Dans le premier cas, des gènes individuels (ou cadres de lecture ouverts ou ORFs en anglais) sont complètement effacés du génome de façon systématique. Dans le cas de la mutagénèse, des transposons sont insérés de façon aléatoire dans le plus de positions possible dans le génome afin de désactiver les gènes ciblés (voir figure ci-dessous). Les mutants d'insertion qui sont encore capables de survivre ou de croître ne se situent pas dans des gènes essentiels. Un résumé des sélections issues de ces expériences est disponible dans le tableau ci-après[1],[2].

Tableau 1. Gènes essentiels chez les bactéries.
Organisme Mutagénèse Méthode Mesure ORFs Non essentiels Essentiels % d'essentiels Notes Références
Mycoplasma genitalium/pneumoniae Aléatoire Population Séquençage 482 130 265-350 55-73 [3]
Mycoplasma genitalium Aléatoire Clones Séquençage 482 100 382 79 b, c [4]
Staphylococcus aureus WCUH29 Aléatoire Clones Séquençage 2 600 n/d 168 n/d b, c [5]
Staphylococcus aureus RNA4220 Aléatoire Clones Séquençage 2 892 n/d 658 23 [6]
Haemophilius influenzae Rd Aléatoire Population Footprint 1 657 602 670 40 [7]
Streptococcus pneumoniae Rx-1 Ciblée Clones Formation de colonies 2 043 234 113 n/d c [8]
Streptococcus pneumoniae D39 Ciblée Clones Formation de colonies 2 043 560 133 n/d c [9]
Streptococcus pyogenes 5448 Aléatoire Transposon Séquençage de transposon 1 865 n/d 227 12 [10]
Streptococcus pyogenes NZ131 Aléatoire Transposon Séquençage de transposon 1 700 n/d 241 14 [10]
Streptococcus sanguinis SK36 Ciblée Clones Formation de colonies 2 270 2 052 218 10 a [11],[12]
Mycobacterium tuberculosis H37Rv Aléatoire Population Puce à ADN 3 989 2 567 614 15 [13]
Mycobacterium tuberculosis Aléatoire Transposon n/d 3 989 n/d 401 10 [14]
Mycobacterium tuberculosis H37Rv Aléatoire Transposon Séquençage Nouvelle Génération 3 989 n/d 774 19 [15],[16]
Mycobacterium tuberculosis H37Rv Aléatoire Transposon Séquençage Nouvelle Génération 3 989 3 364 625 16 h, i [17]
Mycobacterium tuberculosis Informatique Informatique 3 989 n/d 283 7 [18]
Bacillus subtilis 168 Ciblée Clones Formation de colonies 4 105 3 830 261 7 a, d, g [19],[20]
Escherichia coli K-12 MG1655 Aléatoire Population Footprint 4 308 3 126 620 14 [21]
Escherichia coli K-12 MG1655 Ciblée Clones Formation de colonies 4 308 2 001 n/d n/d a, e [22]
Escherichia coli K-12 MG1655 Ciblée Clones Formation de colonies 4 390 3 985 303 7 a [23]
Pseudomonas aeruginosa PAO1 Aléatoire Clones Séquençage 5 570 4 783 678 12 a [24]
Porphyromonas gingivalis Aléatoire Transposon Séquençage 1 990 1 527 463 23 [25]
Pseudomonas aeruginosa PA14 Aléatoire Clones Séquençage 5 688 4 469 335 6 a, f [26]
Salmonella typhimurium Aléatoire Clones Séquençage 4 425 n/d 257 ~11 b, c [27]
Helicobacter pylori G27 Aléatoire Population Puce à ADN 1 576 1178 344 22 [28]
Campylobacter jejuni Aléatoire Population Puce à ADN 1 654 n/d 195 12 [29],[30]
Corynebacterium glutamicum Aléatoire Population n/d 3 002 2 352 650 22 [31]
Francisella novicida Aléatoire Transposon n/d 1 719 1 327 392 23 [32]
Mycoplasma pulmonis UAB CTIP Aléatoire Transposon n/d 782 472 310 40 [33]
Vibrio cholerae N16961 Aléatoire Transposon n/d 3 890 n/d 779 20 [34]
Salmonella typhi Aléatoire Transposon n/d 4 646 n/d 353 8 [35]
Staphylococcus aureus Aléatoire Transposon n/d ~ 2 600 n/d 351 14 [36]
Caulobacter crescentus Aléatoire Transposon n/d 3 767 n/d 480 13 [37]
Neisseria meningitidis Aléatoire Transposon n/d 2 158 n/d 585 27 [38]
Desulfovibrio alaskensis Aléatoire Transposon Séquençage 3 258 2 871 387 12 [39]

n/d = non disponible

  • Mutagénèse : ciblée correspond à des suppressions de gènes, aléatoire correspond à des insertions de transposons
  • Méthode : clones indique des suppressions uniques de gènes, population indique l'ensemble du type de mutagénèse, par exemple celle qui utilise des transposons. Les gènes essentiels issus des sélections de populations incluent les gènes essentiels pour la fitness.
  • ORFs : nombre de cadres de lecture ouverts dans le génome.
  • Notes : a = collection de mutants disponible ; b = méthode de dépistage directe du caractère essentiel d'un gène (par exemple via un ARN anti-sens) qui ne donne pas d'information à propos des gènes non essentiels ; c = seul une partie du jeu de données est disponible ; d = inclut l'essentialité prédite du gène et la compilation de données issues d'études publiées à propos de gènes essentiels ; e = projet en cours ; f = déduit par comparaison de deux jeux de données de gènes essentiels obtenus de façon indépendante chez les souches de P. aeruginosa PA14 et PAO1 ; g = le résultat originel de 271 gènes essentiels a été réévalué à 261, avec 31 gènes supposés comme essentiels et ne l'étant finalement pas alors que 20 nouveaux gènes essentiels ont été décrits depuis ; h = comptage de gènes avec des domaines essentiels, ainsi que ceux menant à des déficiences dans la croissance lorsque supposés comme essentiels, et ceux avantageant la croissance lorsque supposés comme non essentiels ; i = impliquant une banque de mutant complètement saturée de 14 réplicats avec 84,3 % de sites possibles d'insertion avec au moins une insertion de transposon.
Crédit image:
Jennifer E. Griffin et al.
licence CC BY 1.0 🛈
Figure 1. Gènes essentiels chez Mycobacterium tuberculosis H37Rv tels qu'identifiés en utilisant des transposons insérés dans des positions aléatoires dans le génome. Si aucun transposon n'est trouvé dans un gène, le gène est probablement essentiel car il ne peut tolérer aucune insertion. Dans cet exemple, les gènes essentiels de la biosynthèse de l'hème que sont hemA, hemB, hemC et hemD sont dépourvus d'insertions. Le nombre de lectures de séquences (reads/TA) est affiché pour la région correspondante du chromosome de H37Rv. Les sites potentiels d'insertion du dinucléotide TA sont indiqués. Figure tirée de Griffin et al., 2011 (référence [15]).

Eucaryotes

Chez la levure bourgeonnante Saccharomyces cerevisiae, 15 à 20 % des gènes sont essentiels. Chez la levure à fission Schizosaccharomyces pombe, 4 836 suppressions hétérozygotes couvrant 98,4 % des 4 914 protéines codant des ORFs ont été construites. Parmi elles, 1 260 suppressions se sont avérées correspondre à des gènes essentiels[40].

Des tests similaires sont plus difficiles à mettre en place dans d'autres organismes pluricellulaires, y compris les mammifères (comme modèles pour les humains), pour des raisons techniques et du fait que leurs résultats soient plus difficilement exploitables. Cependant, plusieurs méthodes ont été développées pour le nématode Caenorhabditis elegans[41], la drosophile[42] et le poisson-zèbre[43] (voir tableau ci-dessous). Une étude récente portant sur 900 gènes de souris a permis de conclure que 42 % d'entre eux étaient essentiels bien que les gènes sélectionnés n'étaient pas représentatifs[44].

Des expériences de knock-out ne sont pas réalisables (d'un point de vue éthique) chez les humains. Néanmoins, des mutations naturelles ont permis d'identifier des mutations conduisant à une mort embryonnaire précoce ou tardive[45]. Il est à noter que beaucoup de gènes humains ne sont pas absolument essentiels pour la survie mais peuvent causer des maladies graves lorsqu'ils sont mutés. De telles mutations sont cataloguées dans la base de données OMIM (Online Mendelian Inheritance in Man, ou Héritage mendélien chez l'Homme en français). Dans leur analyse informatique de variations génétiques et de mutations chez 2 472 orthologues humains de gènes essentiels chez la souris, Georgi et ses collaborateurs ont sélectionné une population de gènes forte et purifiée avec des niveaux de variation de séquence comparativement réduits, indiquant que ces gènes humains sont également essentiels[46].

Même s'il peut être difficile de prouver qu'un gène humain est essentiel, il est possible de démontrer qu'un gène n'est pas essentiel ou ne cause même pas de maladie. Par exemple, le séquençage du génome de 2 636 citoyens islandais et le génotypage de 101 584 autres sujets a mis en évidence 8 041 individus ayant 1 gène complètement invalidé (à noter que ces personnes étaient homozygotes pour un gène non fonctionnel)[47]. Parmi ces derniers, on a estimé que 6 885 étaient homozygotes et 1 249 étaient des hétérozygotes composés (soit ayant les deux allèles d'un gène invalidé mais les deux ayant des mutations différentes). Chez ces individus, un total de 1 171 des 19 135 gènes humains (6,1 %, base de données RefSeq) étaient complètement invalidés. On en a conclu que ces 1 171 gènes étaient non essentiels chez l'humain — en tout cas, aucune des maladies associées n'a été diagnostiquée[47]. De la même façon, les séquences exomiques de 3 222 adultes britanniques d'origine pakistanaise avec un fort taux de consanguinité parentale ont révélé 1 111 génotypes homozygotes variants rares avec une perte prédite de la fonction d'un gène (KO, soit knock-out) chez 781 gènes[48]. Cette étude a trouvé une moyenne de 140 génotypes prédits comme KO (par individu), dont 16 hétérozygotes rares (fréquence allélique

Un résumé des tests d'essentialité est disponible dans le tableau ci-dessous (basé principalement sur la Base de données des Gènes Essentiels, ou DEG en anglais)[49].

Tableau 2. Tests d'essentialité chez divers eucaryotes.
Organisme Méthode Gènes essentiels Références
Arabidopsis thaliana Insertion d'ADN-T 777 [50]
Caenorhabditis elegans Interférence d'ARN 294 [41]
Danio rerio Mutagénèse d'insertion 288 [43]
Drosophila melanogaster Mutagénèse d'insertion d'éléments mobiles 339 [42]
Homo sapiens Recherche bibliographique 118 [45]
Homo sapiens Test utilisant le complexe CRISPR/Cas 9 1 878 [51]
Homo sapiens Test de piège génétique haploïde ~ 2 000 [52]
Homo sapiens Orthologues chez la souris 2 472 [46]
Mus musculus Recherche bibliographique 2 114 [53]
Saccharomyces cerevisiae Suppression d'un seul gène 878 [54]
Saccharomyces cerevisiae Suppression d'un seul gène 1 105 [55]
Schizosaccharomyces pombe Suppression d'un seul gène 1 260 [40]

Virus

Des tests pour détecter des gènes essentiels ont été réalisés chez quelques virus. Par exemple, on a trouvé chez le Cytomégalovirus humain (CMV en anglais) 41 gènes essentiels, 88 gènes non essentiels et 27 ORFs particuliers (augmenting ORFs en anglais, sur un total de 150). La plupart des gènes essentiels et particuliers se trouvent dans la région centrale du génome viral, et les gènes non essentiels se concentrent généralement près des régions terminales[56].

En 2015, Tscharke et Dobson ont compilé un rapport général des gènes essentiels chez le virus Vaccinia (Vaccinia virus ) et ont assigné des rôles à chacun des 223 ORFs de la souche WR et des 207 ORFs de la souche de Copenhague, en testant leur rôle dans la réplication en culture cellulaire. Selon leur définition, un gène est considéré comme essentiel (soit ayant un rôle dans la culture cellulaire) si sa suppression entraîne une baisse supérieure à dix fois moins de titre dans une courbe de croissance, qu'elle soit en une ou en plusieurs étapes. Tous les gènes impliqués dans la production de virions emballés, la formation d'une queue d'actine et la libération de virions dans l'espace extracellulaire ont aussi été considérés comme essentiels. Les gènes influençant la taille de la culture dans la plaque mais pas la réplication ont été définis comme non essentiels. En appliquant ces définitions, 93 gènes se sont avérés nécessaires à la réplication du virus Vaccinia en culture cellulaire, alors que 108 et 94 ORFs, issus respectivement des souches WR et de Copenhague, se sont avérés comme non essentiels. Les virus du type Vaccinia avec des suppressions dans l'une ou l'autre des régions terminales du génome se sont comportés comme prévu, c'est-à-dire en ne présentant que des défauts légers ou nocifs à leur hôte. En revanche, des suppressions aux deux extrémités du génome du virus Vaccinia souche WR ont causé des défauts dévastateurs dans la croissance de toutes les lignées cellulaires testées. Cela démontre que les suppressions d'un seul gène ne sont pas suffisantes pour jauger de l'essentialité des gènes et que le virus Vaccinia contient plus de gènes essentiels que ce que les auteurs pensaient à l'origine[57].

Parmi les bactériophages testés pour l'essentialité des gènes se trouve le mycobactériophage Giles. Au moins 35 des 78 gènes prédits chez Giles (soit 45 %) ne sont pas essentiels pour la croissance lytique. 20 gènes se sont avérés être essentiels[58]. Un problème majeur que l'on rencontre chez les phages est qu'une majorité de leurs gènes reste fonctionnellement inconnue, c'est-à-dire que leur rôle est difficile à déterminer. Un test effectué chez le phage SPN3US infectant Salmonella enterica a révélé 13 gènes essentiels, bien que le nombre exact de gènes réellement testés reste flou[59].

Analyse quantitative de l'essentialité des gènes

La majorité des gènes rencontrés chez un organisme ne sont ni absolument essentiels, ni absolument non essentiels. Idéalement, leur contribution à la croissance cellulaire ou de l'organisme doit être mesurée de façon quantitative, par exemple en déterminant de combien le taux de croissance est réduit chez un mutant comparé à la souche sauvage (qui peut avoir été choisie de façon arbitraire au sein d'une population). Par exemple, une suppression particulière d'un gène peut réduire le taux de croissance (ou le taux de fertilité ou d'autres caractéristiques) de 90 % chez la souche sauvage.

Létalité synthétique

Deux gènes sont dits létaux synthétiques si aucun d'eux n'est essentiel mais lorsque les deux sont mutés, cette double mutation est létale. Des études ont estimé que le nombre de gènes létaux synthétiques pourrait être de l'ordre de 45 % du nombre total de gènes[60],[61].

Gènes conditionnellement essentiels

Crédit image:
licence CC BY-SA 3.0 🛈
Figure 2. Vue schématique des gènes (ou protéines) essentiel(le)s dans la biosynthèse de la lysine chez différentes bactéries. La même protéine peut être essentielle chez une espèce et pas chez une autre.

Beaucoup de gènes apparaissent comme essentiels seulement dans certaines conditions. Par exemple, si l'acide aminé lysine est disponible pour une cellule, n'importe quel gène nécessaire à la production de lysine n'est pas essentiel. Cependant, lorsqu'il n'y a pas de lysine disponible, les gènes codant les enzymes permettant la biosynthèse de la lysine deviennent alors essentiels, puisqu'aucune synthèse de protéine n'est possible sans la lysine[2].

Chez Streptococcus pneumoniae, il apparaît que 147 gènes sont requis pour la croissance et la survie dans la salive[62], soit plus que les 113-133 qui avaient été trouvés dans des études précédentes.

La suppression d'un gène peut conduire à la mort ou bien à un blocage de la division cellulaire. Alors que le dernier cas peut impliquer une survie pour un certain temps, s'il n'y a pas de division cellulaire, la cellule finira tout de même par mourir. De la même façon, au lieu d'un blocage de la division cellulaire, une cellule peut avoir une croissance ou un métabolisme réduits, allant d'un état proche de l'indétectable à la presque normalité. Ainsi, il existe un gradient entre l'état essentiel d'un gène jusqu'à la complète non-essentialité, dépendant de nouveau des conditions du milieu. Certains auteurs ont ainsi fait la distinction entre des gènes essentiels pour la survie et des gènes essentiels pour la fitness[2].

Rôle du contexte génétique

De même que les conditions environnementales, le contexte génétique peut déterminer l'essentialité d'un gène ; un gène peut être essentiel chez un individu mais pas chez un autre, selon son contexte génétique. Les duplications géniques constituent une explication possible (voir plus bas).

Dépendance métabolique

Les gènes impliqués dans certaines voies de biosynthèse, comme la synthèse des acides aminés, peuvent devenir non essentiels si un ou plusieurs acides aminés sont fournis par un autre organisme[63]. C'est la principale raison pour laquelle beaucoup bactéries parasites ou endosymbiotiques ont perdu beaucoup de gènes (par exemple chez les Chlamydia). De tels gènes peuvent être essentiels mais présents seulement dans l'organisme-hôte. Par exemple, Chlamydia trachomatis ne peut pas synthétiser les purines et les pyrimidines de novo (à partir de molécules simples comme des sucres et des acides aminés), et donc cette bactérie est dépendante des gènes codant la biosynthèse des nucléotides présents dans le génome de l'hôte[64].

Gènes essentiels et duplications géniques

Beaucoup de gènes sont dupliqués au sein d'un génome. De telles duplications (paralogues) transforment souvent des gènes essentiels en gènes non essentiels parce que le duplicata peut remplacer la copie originale. Par exemple, le gène codant l'enzyme aspartokinase est essentiel chez E. coli. Par contre, le génome de B. subtilis contient trois copies de ce gène, aucun n'étant essentiel si pris séparément des autres. Cependant, la suppression des trois gènes à la fois est létale. Dans de tels cas, l'essentialité d'un gène ou d'un groupe de paralogues peut souvent être prédite en se basant sur l'essentialité d'un seul gène essentiel chez une espèce différente. Chez la levure, peu de gènes essentiels sont dupliqués dans le génome (8,5 %), mais seulement 1 % des gènes essentiels ont un homologue dans le génome de la levure[55].

Chez le nématode C. elegans, les gènes non essentiels sont largement surreprésentés au sein des duplicatas, probablement parce que la duplication des gènes essentiels cause une surexpression de ces gènes. Woods et ses collaborateurs ont trouvé que les gènes non essentiels sont plus souvent dupliqués avec succès (de manière fixe) et perdus comparés aux gènes essentiels. A contrario, les gènes essentiels sont moins souvent dupliqués, mais à la suite d'une duplication réussie ils se maintiennent sur de plus longues périodes[65].

Conservation des gènes essentiels

Crédit image:
licence CC BY-SA 3.0 🛈
Figure 3. Conservation des gènes essentiels chez les bactéries. Figure adaptée de Fang et al., 2005 (référence [68]).

Chez les bactéries, il apparaît que les gènes essentiels sont plus conservés que les gènes non essentiels[66], bien que la corrélation ne soit pas très forte. Par exemple, seulement 34 % des gènes essentiels de B. subtilis possèdent des orthologues fiables chez tous les Firmicutes, et 61 % des gènes essentiels d'E. coli possèdent des orthologues fiables chez toutes les Gammaproteobacteria[67]. En 2005, Fang et ses collaborateurs définissent les gènes persistants comme les gènes présents dans plus de 85 % des génomes du clade[67]. Ils ont trouvé 475 et 611 de ces gènes chez B. subtilis et E. coli, respectivement. De plus, ils ont classifié les gènes en cinq classes selon leur persistance et leur essentialité : les gènes persistants, les gènes essentiels, les gènes non essentiels persistants (276 chez B. subtilis, 409 chez E. coli), les gènes essentiels non persistants (73 chez B. subtilis, 33 chez E. coli) et enfin les gènes non essentiels non persistants (3 558 chez B. subtilis, 3525 chez E. coli). Fang et ses collaborateurs ont trouvé 257 gènes persistants qui existent à la fois chez B. subtilis (pour les FIrmicutes) et chez E. coli (pour les Gammaproteobacteria). Parmi ces gènes, respectivement 144 et 139 ont été préalablement identifiés comme essentiels respectivement chez B. subtilis et E. coli, et respectivement 25 et 18 de ces 257 gènes ne sont pas présents respectivement chez les 475 et 611 gènes persistants de B. subtilis et d'E. coli. Tous les autres membres de ce groupe de gènes sont non essentiels persistants[67].

Chez les eucaryotes, 83 % des orthologues similaires un à un chez Schizosaccharomyces pombe et Saccharomyces cerevisiae ont une essentialité conservée, c'est-à-dire qu'ils sont non essentiels chez les deux espèces ou bien essentiels chez les deux espèces. Les 17 % de gènes restants sont non essentiels chez une espèce et essentiels chez l'autre[68]. Cela est assez notable, sachant que les espèces S. pombe et S. cerevisiae sont séparées par environ 400 millions d'années d'évolution[69].

En général, les gènes fortement conservés, et donc plus anciens (soient les gènes avec une origine phylogénétique plus antérieure), ont plus tendance à être essentiels que les gènes plus jeunes, et ce même s'ils ont été dupliqués[70].

Étude des gènes essentiels

L'étude expérimentale des gènes essentiels est limitée par le fait que, par définition, l'inactivation d'un gène essentiel est létale pour l'organisme. Par conséquent, ils ne peuvent pas être simplement supprimés ou mutés pour analyser les phénotypes résultants (ce que l'on fait habituellement en génétique).

Cependant, il existe des circonstances dans lesquelles les gènes essentiels peuvent être manipulés. Chez les organismes diploïdes, seulement une seule copie fonctionnelle de certains gènes essentiels peut être nécessaire (haplosuffisance), avec l'hétérozygote montrant un phénotype instructif. Certains gènes essentiels peuvent tolérer des mutations qui sont délétères, mais pas complètement létales puisqu'elles ne répriment pas totalement la fonction du gène.

Des analyses informatiques peuvent mettre en évidence beaucoup de propriétés des protéines sans les analyser expérimentalement, par exemple en s'intéressant aux protéines homologues, une fonction ou une structure homologues, etc. (voir également la section Prédire les gènes essentiels). Les produits des gènes essentiels peuvent aussi être étudiés lorsqu'ils sont exprimés chez d'autres organismes ou bien purifiés et étudiés in vitro.

Les gènes conditionnellement essentiels sont plus faciles à étudier. Des variants thermosensibles de gènes essentiels ont été identifiés, dont les produits de traduction perdent leur fonction lorsqu'ils sont soumis à de fortes températures, et ainsi ne montrent un phénotype qu'à de telles températures[71].

Reproducibilité

Comme les tests pour les gènes essentiels sont répétés dans des laboratoires indépendants, ils résultent souvent en des listes de gènes différentes. Par exemple, des tests chez E. coli ont engendré de 300 à 600 (environ) gènes essentiels (voir Tableau 1). De telles différences sont d'autant plus prononcées lorsque des souches différentes de bactéries sont utilisées (voir Figure 2). L'explication la plus fréquente est que les conditions expérimentales sont différentes, ou que la nature de la mutation pourrait être différente (par exemple, une suppression complète d'un gène versus un mutant issu d'un transposon). En particulier, les tests avec transposons sont difficiles à reproduire, étant donné qu'un transposon peut s'insérer sur plusieurs positions différentes au sein d'un même gène. Les insertions au niveau de l'extrémité 3' d'un gène essentiel pourrait résulter en un phénotype non létal (ou aucun phénotype du tout) et ainsi ne pas être reconnu comme tel. Cela peut mener à des annotations erronées (dans ce cas, des faux négatifs)[72].

Comparaison des tests CRISPR/Cas9 et ARNi

Les tests visant à identifier les gènes essentiels impliqués dans la leucémie myéloïde chronique au sein de la lignée cellulaire K562 et réalisés avec ces deux méthodes n'ont montré qu'un chevauchement limité. À un taux de 10 % de faux positifs, il y avait environ 4 500 gènes identifiés dans le test Cas9 contre environ 3 100 dans le test ARNsh, avec seulement1 200 gènes identifiés dans les deux cas[73].

Différent gènes sont essentiels chez différents organismes

Des organismes différents possèdent des gènes essentiels différents. Par exemple, B. subtilis possède 271 gènes essentiels[19]. Environ la moitié (150) des gènes orthologues chez E. coli sont également des gènes essentiels. Quelque 67 autres gènes sont également essentiels chez E. coli ne sont pas essentiels chez B. subtilis, alors que 86 gènes essentiels chez E. coli n'ont aucun orthologue chez B. subtilis[23].

Chez Mycoplasma genitalium, environ 18 gènes sont essentiels et ne le sont pas chez Mycoplasma bovis[74].

Prédire les gènes essentiels

Les gènes essentiels peuvent être prédits par l'informatique. Néanmoins, la plupart des méthodes utilisent des données expérimentales (training sets en anglais) dans une certaine mesure. Chen et ses collaborateurs[75] ont déterminé quatre critères pour sélectionner des training sets pour faire de telles prédictions :

  1. les gènes essentiels dans le training set sélectionné doivent être fiables ;
  2. les conditions de croissance dans lesquelles les gènes essentiels sont définis doivent être concordantes entre les training sets et les sets de prédiction ;
  3. les espèces utilisées dans les training sets doivent être étroitement apparentées à l'organisme d'étude ;
  4. les organismes utilisés dans les training sets et les sets de prédiction doivent montrer des phénotypes ou des modes de vie similaires.

Ils ont également trouvé que la taille du training set doit être d'au moins 10 % du nombre total de gènes afin d'obtenir des prédictions justes. Voici quelques approches pour prédire les gènes essentiels.

La génomique comparative

Peu de temps après que les premiers génomes (ceux d'Haemophilius influenzae et de Mycoplasma genitalium) ont été disponibles, Mushegian et ses collaborateurs[76] ont tenté de prédire le nombre de gènes essentiels en se basant sur les gènes les plus communs chez ces deux espèces. Ils ont présumé que seuls les gènes essentiels doivent être conservés sur la longue distance d'évolution qui sépare ces deux bactéries. Cette étude a identifié environ 250 gènes essentiels candidats. Comme plus de génomes sont devenus disponibles, le nombre de gènes essentiels prédits a continué à baisser car de plus en plus de génomes ont partagé de moins en moins de gènes. En conséquence, il a été conclu que le « cœur universel conservé » contenait moins de 40 gènes[77],[78]. Cependant, ce set de gènes conservés n'est pas identiques au set de gènes essentiels car des espèces différentes dépendent de gènes essentiels différents.

Une approche similaire a été utilisée pour prédire des gènes essentiels dans le pangénome d'espèces de Brucella. 42 génomes complets de Brucella ainsi qu'un total de 132 143 gènes codant des protéines ont été utilisés pour prédire 1 252 gènes essentiels potentiels, dérivés du noyau du génome par comparaison avec une base de données de gènes essentiels chez des procaryotes[79].

Enfin, Hua et ses collaborateurs ont utilisé un apprentissage automatique (machine learning en anglais) afin de prédire des gènes essentiels chez 25 espèces bactériennes[80].

L'index de Hurst

En 2015, Liu et ses collaborateurs[81] ont utilisé l'indice de Hurst, un paramètre caractéristique pour décrire une corrélation à long rayon d'action dans l'ADN, afin de prédire des gènes essentiels. Dans 31 des 33 génomes bactériens, les valeurs des indices de Hurst des gènes essentiels ont été significativement supérieures au set full-gène correspondant, alors que les valeurs des indices de Hurst des gènes non essentiels sont restées inchangées ou ont augmenté seulement de façon très légère.

Génomes minimaux

On pensait également que les gènes essentiels pouvait être prédits à partir des génomes minimaux, qui contiennent seulement les gènes essentiels avec lesquels les organismes sont supposément censés pouvoir survivre. Le problème posé ici est que les génomes les plus petits se retrouvent chez les espèces parasites (ou symbiotiques) capables de survivre avec un contenu réduit de gènes car ils sont approvisionnés en nutriments par leur hôte. Par exemple, le génome de Hodgkinia cicadicola, un symbionte des cigales, est l'un des plus petits qui existent, avec seulement 144 kb d'ADN codant seulement 188 gènes[82]. Comme d'autres symbiontes, Hodgkinia reçoit la plupart de ses nutriments de son hôte, ainsi ses gènes ne sont pas nécessairement essentiels.

Modélisation métabolique

Les gènes essentiels peuvent aussi être prédits au sein de génomes complètement séquencés par le biais de la reconstruction métabolique, soit en reconstruisant le métabolisme complet du contenu génique et en identifiant ensuite les gènes et voies métaboliques qui ont été trouvés comme étant essentiels chez d'autres espèces. Cependant, cette méthode peut être compromise par des protéines dont on ne connaît pas la fonction. De plus, beaucoup d'organismes possèdent des voies métaboliques de secours ou alternatives qui doivent être prises en compte (voir Figure 2). La modélisation métabolique a également été utilisée par Basler en 2015 afin de développer une méthode pour prédire les gènes métaboliques essentiels[83]. La Flux Balance Analysis, une méthode de modélisation métabolique, a récemment été utilisée pour prédire des gènes essentiels dans le métabolisme du carcinome à cellules claires des cellules rénales[84].

Les gènes à fonction inconnue

De façon surprenante, il existe un nombre significatif de gènes essentiels n'ayant pas de fonction connue. Par exemple, parmi les 385 gènes essentiels candidats chez M. genitalium, aucune fonction n'a pu être attribuée à 95 gènes[4], bien que ce nombre ait été revu à 75 en 2011[78].

  • La méthode des ZUPLS : Song et ses collaborateurs ont présenté une méthode innovante pour prédire les gènes essentiels qui n'utilise que des caractéristiques séquentielles de type Z-curve et autres[85]. De telles caractéristiques peuvent être rapidement obtenues à partir des séquences ADN/acides aminés. Cependant, la fiabilité de cette méthode reste discutable.
  • Les serveurs de prédiction des gènes essentiels : En 2015, Guo et ses collaborateurs ont développé trois services en ligne afin de prédire des gènes essentiels au sein de génomes bactériens. Ces outils gratuitement accessibles peuvent s'appliquer aux séquences de gènes uniques dépourvus de fonctions attribuées, des gènes uniques avec des noms définis, et des génomes complets de souches bactériennes[86].

Domaines protéiques essentiels

Bien que la plupart des gènes essentiels codent des protéines, beaucoup de protéines essentielles n'ont qu'un seul domaine. Cela a été utilisé pour identifier des domaines protéiques essentiels. Goodacre et ses collaborateurs ont identifié des centaines de domaines à fonction inconnue (eDUFS en anglais)[87]. Lu et ses collaborateurs[88] ont présenté une approche similaire et ont identifié 3 450 domaines qui sont essentiels dans au moins une des espèces microbiennes.

Voir aussi

Articles connexes

Liens externes

Bibliographie

  • Benjamin Lewin (2005), Essential Genes. Pearson/Prentice-Hall[90]
  • Auteurs divers (2015), Gene Essentiality - Methods and Protocols. Long Jason Lu (éditeur)[91]

Références

  1. a b et c Ren Zhang et Yan Lin, « DEG 5.0, a database of essential genes in both prokaryotes and eukaryotes », Nucleic Acids Research, vol. 37, no suppl_1,‎ , D455–D458 (ISSN 0305-1048, PMID 18974178, PMCID PMC2686491, DOI 10.1093/nar/gkn858, lire en ligne, consulté le )
  2. a b et c Svetlana Gerdes, Robert Edwards, Michael Kubal et Michael Fonstein, « Essential genes on metabolic maps », Current Opinion in Biotechnology, systems biology / Tissue and cell engineering, vol. 17, no 5,‎ , p. 448–456 (DOI 10.1016/j.copbio.2006.08.006, lire en ligne, consulté le )
  3. (en) Clyde A. Hutchison, Scott N. Peterson, Steven R. Gill et Robin T. Cline, « Global Transposon Mutagenesis and a Minimal Mycoplasma Genome », Science, vol. 286, no 5447,‎ , p. 2165–2169 (ISSN 0036-8075 et 1095-9203, PMID 10591650, DOI 10.1126/science.286.5447.2165, lire en ligne, consulté le )
  4. a et b (en) John I. Glass, Nacyra Assad-Garcia, Nina Alperovich et Shibu Yooseph, « Essential genes of a minimal bacterium », Proceedings of the National Academy of Sciences of the United States of America, vol. 103, no 2,‎ , p. 425–430 (ISSN 0027-8424 et 1091-6490, PMID 16407165, PMCID PMC1324956, DOI 10.1073/pnas.0510013103, lire en ligne, consulté le )
  5. (en) Yinduo Ji, Barbara Zhang, Stephanie F. Van et Horn, « Identification of Critical Staphylococcal Genes Using Conditional Phenotypes Generated by Antisense RNA », Science, vol. 293, no 5538,‎ , p. 2266–2269 (ISSN 0036-8075 et 1095-9203, PMID 11567142, DOI 10.1126/science.1063566, lire en ligne, consulté le )
  6. (en) R. Allyn Forsyth, Robert J. Haselbeck, Kari L. Ohlsen et Robert T. Yamamoto, « A genome-wide strategy for the identification of essential genes in Staphylococcus aureus », Molecular Microbiology, vol. 43, no 6,‎ , p. 1387–1400 (ISSN 1365-2958, DOI 10.1046/j.1365-2958.2002.02832.x, lire en ligne, consulté le )
  7. (en) Brian J. Akerley, Eric J. Rubin, Veronica L. Novick et Kensey Amaya, « A genome-scale analysis for identification of genes required for growth or survival of Haemophilus influenzae », Proceedings of the National Academy of Sciences, vol. 99, no 2,‎ , p. 966–971 (ISSN 0027-8424 et 1091-6490, PMID 11805338, PMCID PMC117414, DOI 10.1073/pnas.012602299, lire en ligne, consulté le )
  8. Jane A. Thanassi, Sandra L. Hartman‐Neumann, Thomas J. Dougherty et Brian A. Dougherty, « Identification of 113 conserved essential genes using a high‐throughput gene disruption system in Streptococcus pneumoniae », Nucleic Acids Research, vol. 30, no 14,‎ , p. 3152–3162 (ISSN 0305-1048, DOI 10.1093/nar/gkf418, lire en ligne, consulté le )
  9. Jae-Hoon Song, Kwan Soo Ko, Ji-Young Lee et Jin Yang Baek, « Identification of essential genes in Streptococcus pneumoniae by allelic replacement mutagenesis », Molecules and Cells, vol. 19, no 3,‎ , p. 365–374 (ISSN 1016-8478, PMID 15995353, lire en ligne, consulté le )
  10. a et b (en) Yoann Le Breton, Ashton T. Belew, Kayla M. Valdes et Emrul Islam, « Essential Genes in the Core Genome of the Human Pathogen Streptococcus pyogenes », Scientific Reports, vol. 5, no 1,‎ (ISSN 2045-2322, PMID 25996237, PMCID PMC4440532, DOI 10.1038/srep09838, lire en ligne, consulté le )
  11. (en) Ping Xu, Xiuchun Ge, Lei Chen et Xiaojing Wang, « Genome-wide essential gene identification in Streptococcus sanguinis », Scientific Reports, vol. 1, no 1,‎ (ISSN 2045-2322, PMID 22355642, PMCID PMC3216606, DOI 10.1038/srep00125, lire en ligne, consulté le )
  12. (en) Lei Chen, Xiuchun Ge et Ping Xu, Gene Essentiality, Humana Press, New York, NY, (PMID 25636610, DOI 10.1007/978-1-4939-2398-4_2, lire en ligne), p. 15–23
  13. (en) Christopher M. Sassetti, Dana H. Boyd et Eric J. Rubin, « Comprehensive identification of conditionally essential genes in mycobacteria », Proceedings of the National Academy of Sciences, vol. 98, no 22,‎ , p. 12712–12717 (ISSN 0027-8424 et 1091-6490, PMID 11606763, PMCID PMC60119, DOI 10.1073/pnas.231275498, lire en ligne, consulté le )
  14. (en) G. Lamichhane, J. S. Freundlich, S. Ekins et N. Wickramaratne, « Essential Metabolites of Mycobacterium tuberculosis and Their Mimics », mBio, vol. 2, no 1,‎ , e00301–10–e00301-10 (ISSN 2150-7511, DOI 10.1128/mbio.00301-10, lire en ligne, consulté le )
  15. Jennifer E. Griffin, Jeffrey D. Gawronski, Michael A. DeJesus et Thomas R. Ioerger, « High-Resolution Phenotypic Profiling Defines Genes Essential for Mycobacterial Growth and Cholesterol Catabolism », PLOS Pathogens, vol. 7, no 9,‎ , e1002251 (ISSN 1553-7374, PMID 21980284, PMCID PMC3182942, DOI 10.1371/journal.ppat.1002251, lire en ligne, consulté le )
  16. (en) Jarukit E. Long, Michael DeJesus, Doyle Ward et Richard E. Baker, Gene Essentiality, Humana Press, New York, NY, (DOI 10.1007/978-1-4939-2398-4_6, lire en ligne), p. 79–95
  17. (en) Michael A. DeJesus, Elias R. Gerrick, Weizhen Xu et Sae Woong Park, « Comprehensive Essentiality Analysis of the Mycobacterium tuberculosis Genome via Saturating Transposon Mutagenesis », mBio, vol. 8, no 1,‎ , e02133–16 (ISSN 2150-7511, PMID 28096490, PMCID PMC5241402, DOI 10.1128/mBio.02133-16, lire en ligne, consulté le )
  18. Soma Ghosh, Priyanka Baloni, Sumanta Mukherjee et Praveen Anand, « A multi-level multi-scale approach to study essential genes in Mycobacterium tuberculosis », BMC Systems Biology, vol. 7,‎ , p. 132 (ISSN 1752-0509, PMID 24308365, PMCID PMC4234997, DOI 10.1186/1752-0509-7-132, lire en ligne, consulté le )
  19. a et b (en) K. Kobayashi, S. D. Ehrlich, A. Albertini et G. Amati, « Essential Bacillus subtilis genes », Proceedings of the National Academy of Sciences, vol. 100, no 8,‎ , p. 4678–4683 (ISSN 0027-8424 et 1091-6490, PMID 12682299, PMCID PMC153615, DOI 10.1073/pnas.0730515100, lire en ligne, consulté le )
  20. (en) Fabian M. Commichau, Nico Pietack et Jörg Stülke, « Essential genes in Bacillus subtilis: a re-evaluation after ten years », Molecular BioSystems, vol. 9, no 6,‎ (ISSN 1742-2051, DOI 10.1039/C3MB25595F, lire en ligne, consulté le )
  21. (en) S. Y. Gerdes, M. D. Scholle, J. W. Campbell et G. Balázsi, « Experimental Determination and System Level Analysis of Essential Genes in Escherichia coli MG1655 », Journal of Bacteriology, vol. 185, no 19,‎ , p. 5673–5684 (ISSN 0021-9193 et 1098-5530, PMID 13129938, PMCID PMC193955, DOI 10.1128/JB.185.19.5673-5684.2003, lire en ligne, consulté le )
  22. (en) Yisheng Kang, Tim Durfee, Jeremy D. Glasner et Yu Qiu, « Systematic Mutagenesis of the Escherichia coli Genome », Journal of Bacteriology, vol. 186, no 15,‎ , p. 4921–4930 (ISSN 0021-9193 et 1098-5530, PMID 15262929, PMCID PMC451658, DOI 10.1128/JB.186.15.4921-4930.2004, lire en ligne, consulté le )
  23. a et b (en) Tomoya Baba, Takeshi Ara, Miki Hasegawa et Yuki Takai, « Construction of Escherichia coli K‐12 in‐frame, single‐gene knockout mutants: the Keio collection », Molecular Systems Biology, vol. 2, no 1,‎ , p. 2006.0008 (ISSN 1744-4292 et 1744-4292, PMID 16738554, PMCID PMC1681482, DOI 10.1038/msb4100050, lire en ligne, consulté le )
  24. (en) Michael A. Jacobs, Ashley Alwood, Iyarit Thaipisuttikul et David Spencer, « Comprehensive transposon mutant library of Pseudomonas aeruginosa », Proceedings of the National Academy of Sciences, vol. 100, no 24,‎ , p. 14339–14344 (ISSN 0027-8424 et 1091-6490, PMID 14617778, PMCID PMC283593, DOI 10.1073/pnas.2036282100, lire en ligne, consulté le )
  25. (en) J.a. Hutcherson, H. Gogeneni, D. Yoder-Himes et E.l. Hendrickson, « Comparison of inherently essential genes of Porphyromonas gingivalis identified in two transposon-sequencing libraries », Molecular Oral Microbiology, vol. 31, no 4,‎ , p. 354–364 (ISSN 2041-1014, PMID 26358096, PMCID PMC4788587, DOI 10.1111/omi.12135, lire en ligne, consulté le )
  26. (en) Nicole T. Liberati, Jonathan M. Urbach, Sachiko Miyata et Daniel G. Lee, « An ordered, nonredundant library of Pseudomonas aeruginosa strain PA14 transposon insertion mutants », Proceedings of the National Academy of Sciences of the United States of America, vol. 103, no 8,‎ , p. 2833–2838 (ISSN 0027-8424 et 1091-6490, PMID 16477005, PMCID PMC1413827, DOI 10.1073/pnas.0511100103, lire en ligne, consulté le )
  27. (en) Karin Knuth, Heide Niesalla, Christoph J. Hueck et Thilo M. Fuchs, « Large-scale identification of essential Salmonella genes by trapping lethal insertions », Molecular Microbiology, vol. 51, no 6,‎ , p. 1729–1744 (ISSN 1365-2958, DOI 10.1046/j.1365-2958.2003.03944.x, lire en ligne, consulté le )
  28. (en) Nina R. Salama, Benjamin Shepherd et Stanley Falkow, « Global Transposon Mutagenesis and Essential Gene Analysis of Helicobacter pylori », Journal of Bacteriology, vol. 186, no 23,‎ , p. 7926–7935 (ISSN 0021-9193 et 1098-5530, PMID 15547264, PMCID PMC529078, DOI 10.1128/JB.186.23.7926-7935.2004, lire en ligne, consulté le )
  29. (en) Martin Stahl et Alain Stintzi, « Identification of essential genes in C. jejuni genome highlights hyper-variable plasticity regions », Functional & Integrative Genomics, vol. 11, no 2,‎ , p. 241–257 (ISSN 1438-793X et 1438-7948, DOI 10.1007/s10142-011-0214-7, lire en ligne, consulté le )
  30. (en) Martin Stahl et Alain Stintzi, Gene Essentiality, Humana Press, New York, NY, (DOI 10.1007/978-1-4939-2398-4_1, lire en ligne), p. 1–14
  31. (en) Nobuaki Suzuki, Masayuki Inui et Hideaki Yukawa, Strain Engineering, Humana Press, (DOI 10.1007/978-1-61779-197-0_24, lire en ligne), p. 409–417
  32. (en) Larry A. Gallagher, Elizabeth Ramage, Michael A. Jacobs et Rajinder Kaul, « A comprehensive transposon mutant library of Francisella novicida, a bioweapon surrogate », Proceedings of the National Academy of Sciences, vol. 104, no 3,‎ , p. 1009–1014 (ISSN 0027-8424 et 1091-6490, PMID 17215359, PMCID PMC1783355, DOI 10.1073/pnas.0606713104, lire en ligne, consulté le )
  33. (en) Christopher T. French, Ping Lao, Ann E. Loraine et Brian T. Matthews, « Large-scale transposon mutagenesis of Mycoplasma pulmonis », Molecular Microbiology, vol. 69, no 1,‎ , p. 67–76 (ISSN 1365-2958, PMID 18452587, PMCID PMC2453687, DOI 10.1111/j.1365-2958.2008.06262.x, lire en ligne, consulté le )
  34. (en) D. Ewen Cameron, Jonathan M. Urbach et John J. Mekalanos, « A defined transposon mutant library and its use in identifying motility genes in Vibrio cholerae », Proceedings of the National Academy of Sciences, vol. 105, no 25,‎ , p. 8736–8741 (ISSN 0027-8424 et 1091-6490, PMID 18574146, PMCID PMC2438431, DOI 10.1073/pnas.0803281105, lire en ligne, consulté le )
  35. (en) Gemma C. Langridge, Minh-Duy Phan, Daniel J. Turner et Timothy T. Perkins, « Simultaneous assay of every Salmonella Typhi gene using one million transposon mutants », Genome Research, vol. 19, no 12,‎ , p. 2308–2316 (ISSN 1088-9051 et 1549-5469, PMID 19826075, PMCID PMC2792183, DOI 10.1101/gr.097097.109, lire en ligne, consulté le )
  36. Roy R. Chaudhuri, Andrew G. Allen, Paul J. Owen et Gil Shalom, « Comprehensive identification of essential Staphylococcus aureus genes using Transposon-Mediated Differential Hybridisation (TMDH) », BMC Genomics, vol. 10,‎ , p. 291 (ISSN 1471-2164, PMID 19570206, PMCID PMC2721850, DOI 10.1186/1471-2164-10-291, lire en ligne, consulté le )
  37. (en) Beat Christen, Eduardo Abeliuk, John M. Collier et Virginia S. Kalogeraki, « The essential genome of a bacterium », Molecular Systems Biology, vol. 7, no 1,‎ , p. 528 (ISSN 1744-4292 et 1744-4292, PMID 21878915, PMCID PMC3202797, DOI 10.1038/msb.2011.58, lire en ligne, consulté le )
  38. Tom A. Mendum, Jane Newcombe, Ahmad A. Mannan et Andrzej M. Kierzek, « Interrogation of global mutagenesis data with a genome scale model of Neisseria meningitidis to assess gene fitness in vitro and in sera », Genome Biology, vol. 12,‎ , R127 (ISSN 1474-760X, PMID 22208880, PMCID PMC3334622, DOI 10.1186/gb-2011-12-12-r127, lire en ligne, consulté le )
  39. (en) Jennifer V. Kuehl, Morgan N. Price, Jayashree Ray et Kelly M. Wetmore, « Functional Genomics with a Comprehensive Library of Transposon Mutants for the Sulfate-Reducing Bacterium Desulfovibrio alaskensis G20 », mBio, vol. 5, no 3,‎ , e01041–14 (ISSN 2150-7511, PMID 24865553, PMCID PMC4045070, DOI 10.1128/mBio.01041-14, lire en ligne, consulté le )
  40. a et b Dong-Uk Kim, Jacqueline Hayles, Dongsup Kim et Valerie Wood, « Analysis of a genome-wide set of gene deletions in the fission yeast Schizosaccharomyces pombe », Nature Biotechnology, vol. 28, no 6,‎ , p. 617–623 (PMID 20473289, PMCID PMC3962850, DOI 10.1038/nbt.1628, lire en ligne)
  41. a et b (en) Ravi S. Kamath, Andrew G. Fraser, Yan Dong et Gino Poulin, « Systematic functional analysis of the Caenorhabditis elegans genome using RNAi », Nature, vol. 421, no 6920,‎ , p. 231–237 (ISSN 0028-0836, DOI 10.1038/nature01278, lire en ligne, consulté le )
  42. a et b A C Spradling, D Stern, A Beaton et E J Rhem, « The Berkeley Drosophila Genome Project gene disruption project: Single P-element insertions mutating 25% of vital Drosophila genes. », Genetics, vol. 153, no 1,‎ , p. 135–177 (ISSN 0016-6731, PMID 10471706, PMCID PMC1460730, lire en ligne, consulté le )
  43. a et b (en) Adam Amsterdam, Robert M. Nissen, Zhaoxia Sun et Eric C. Swindell, « Identification of 315 genes essential for early zebrafish development », Proceedings of the National Academy of Sciences of the United States of America, vol. 101, no 35,‎ , p. 12792–12797 (ISSN 0027-8424 et 1091-6490, PMID 15256591, PMCID PMC516474, DOI 10.1073/pnas.0403929101, lire en ligne, consulté le )
  44. (en) Jacqueline K. White, Anna-Karin Gerdin, Natasha A. Karp et Ed Ryder, « Genome-wide Generation and Systematic Phenotyping of Knockout Mice Reveals New Roles for Many Genes », Cell, vol. 154, no 2,‎ , p. 452–464 (ISSN 0092-8674 et 1097-4172, PMID 23870131, PMCID PMC3717207, DOI 10.1016/j.cell.2013.06.022, lire en ligne, consulté le )
  45. a et b (en) Ben-Yang Liao et Jianzhi Zhang, « Null mutations in human and mouse orthologs frequently result in different phenotypes », Proceedings of the National Academy of Sciences, vol. 105, no 19,‎ , p. 6987–6992 (ISSN 0027-8424 et 1091-6490, PMID 18458337, PMCID PMC2383943, DOI 10.1073/pnas.0800387105, lire en ligne, consulté le )
  46. a et b Benjamin Georgi, Benjamin F. Voight et Maja Bućan, « From Mouse to Human: Evolutionary Genomics Analysis of Human Orthologs of Essential Genes », PLOS Genetics, vol. 9, no 5,‎ , e1003484 (ISSN 1553-7404, PMID 23675308, PMCID PMC3649967, DOI 10.1371/journal.pgen.1003484, lire en ligne, consulté le )
  47. a et b (en) Patrick Sulem, Hannes Helgason, Asmundur Oddson et Hreinn Stefansson, « Identification of a large set of rare complete human knockouts », Nature Genetics, vol. 47, no 5,‎ , p. 448–452 (ISSN 1061-4036, DOI 10.1038/ng.3243, lire en ligne, consulté le )
  48. (en) Vagheesh M. Narasimhan, Karen A. Hunt, Dan Mason et Christopher L. Baker, « Health and population effects of rare gene knockouts in adult humans with related parents », Science, vol. 352, no 6284,‎ , p. 474–477 (ISSN 0036-8075 et 1095-9203, PMID 26940866, PMCID PMC4985238, DOI 10.1126/science.aac8624, lire en ligne, consulté le )
  49. Hao Luo, Yan Lin, Feng Gao et Chun-Ting Zhang, « DEG 10, an update of the database of essential genes that includes both protein-coding genes and noncoding genomic elements », Nucleic Acids Research, vol. 42, no D1,‎ , D574–D580 (ISSN 0305-1048, PMID 24243843, PMCID PMC3965060, DOI 10.1093/nar/gkt1131, lire en ligne, consulté le )
  50. (en) Iris Tzafrir, Rosanna Pena-Muralla, Allan Dickerman et Michael Berg, « Identification of Genes Required for Embryo Development in Arabidopsis », Plant Physiology, vol. 135, no 3,‎ , p. 1206–1220 (ISSN 0032-0889 et 1532-2548, PMID 15266054, PMCID PMC519041, DOI 10.1104/pp.104.045179, lire en ligne, consulté le )
  51. (en) Tim Wang, Kıvanç Birsoy, Nicholas W. Hughes et Kevin M. Krupczak, « Identification and characterization of essential genes in the human genome », Science, vol. 350, no 6264,‎ , p. 1096–1101 (ISSN 0036-8075 et 1095-9203, PMID 26472758, PMCID PMC4662922, DOI 10.1126/science.aac7041, lire en ligne, consulté le )
  52. (en) Vincent A. Blomen, Peter Májek, Lucas T. Jae et Johannes W. Bigenzahn, « Gene essentiality and synthetic lethality in haploid human cells », Science, vol. 350, no 6264,‎ , p. 1092–1096 (ISSN 0036-8075 et 1095-9203, PMID 26472760, DOI 10.1126/science.aac7557, lire en ligne, consulté le )
  53. (en) Ben-Yang Liao et Jianzhi Zhang, « Mouse duplicate genes are as essential as singletons », Trends in Genetics, vol. 23, no 8,‎ , p. 378–381 (ISSN 0168-9525, DOI 10.1016/j.tig.2007.05.006, lire en ligne, consulté le )
  54. H. W. Mewes, D. Frishman, U. Güldener et G. Mannhaupt, « MIPS: a database for genomes and protein sequences », Nucleic Acids Research, vol. 30, no 1,‎ , p. 31–34 (ISSN 0305-1048, DOI 10.1093/nar/30.1.31, lire en ligne, consulté le )
  55. a et b (en) Guri Giaever, Angela M. Chu, Li Ni et Carla Connelly, « Functional profiling of the Saccharomyces cerevisiae genome », Nature, vol. 418, no 6896,‎ , p. 387–391 (ISSN 0028-0836, DOI 10.1038/nature00935, lire en ligne, consulté le )
  56. (en) Dong Yu, Maria C. Silva et Thomas Shenk, « Functional map of human cytomegalovirus AD169 defined by global mutational analysis », Proceedings of the National Academy of Sciences, vol. 100, no 21,‎ , p. 12396–12401 (ISSN 0027-8424 et 1091-6490, PMID 14519856, PMCID PMC218769, DOI 10.1073/pnas.1635160100, lire en ligne, consulté le )
  57. Bianca M. Dobson et David C. Tscharke, « Redundancy complicates the definition of essential genes for vaccinia virus », Journal of General Virology, vol. 96, no 11,‎ , p. 3326–3337 (DOI 10.1099/jgv.0.000266, lire en ligne, consulté le )
  58. (en) Rebekah M. Dedrick, Laura J. Marinelli, Gerald L. Newton et Kit Pogliano, « Functional requirements for bacteriophage growth: gene essentiality and expression in mycobacteriophage Giles », Molecular Microbiology, vol. 88, no 3,‎ , p. 577–589 (ISSN 1365-2958, PMID 23560716, PMCID PMC3641587, DOI 10.1111/mmi.12210, lire en ligne, consulté le )
  59. (en) Julie A. Thomas, Andrea Denisse Benítez Quintana, Martine A. Bosch et Adriana Coll De Peña, « Identification of Essential Genes in the Salmonella Phage SPN3US Reveals Novel Insights into Giant Phage Head Structure and Assembly », Journal of Virology, vol. 90, no 22,‎ , p. 10284–10298 (ISSN 0022-538X et 1098-5514, PMID 27605673, PMCID PMC5105663, DOI 10.1128/JVI.01492-16, lire en ligne, consulté le )
  60. (en) Csaba Pál, Balázs Papp, Martin J. Lercher et Péter Csermely, « Chance and necessity in the evolution of minimal metabolic networks », Nature, vol. 440, no 7084,‎ , p. 667–670 (ISSN 0028-0836, DOI 10.1038/nature04568, lire en ligne, consulté le )
  61. (en) Hirotada Mori, Tomoya Baba, Katsushi Yokoyama et Rikiya Takeuchi, Gene Essentiality, Humana Press, New York, NY, (DOI 10.1007/978-1-4939-2398-4_4, lire en ligne), p. 45–65
  62. Lilly M. Verhagen, Marien I. de Jonge, Peter Burghout et Kiki Schraa, « Genome-Wide Identification of Genes Essential for the Survival of Streptococcus pneumoniae in Human Saliva », PLOS ONE, vol. 9, no 2,‎ , e89541 (ISSN 1932-6203, PMID 24586856, PMCID PMC3934895, DOI 10.1371/journal.pone.0089541, lire en ligne, consulté le )
  63. Glen D’Souza et Christian Kost, « Experimental Evolution of Metabolic Dependency in Bacteria », PLOS Genetics, vol. 12, no 11,‎ , e1006364 (ISSN 1553-7404, PMID 27814362, PMCID PMC5096674, DOI 10.1371/journal.pgen.1006364, lire en ligne, consulté le )
  64. (en) Graham Tipples et Grant McClarty, « The obligate intracellular bacterium Chlamydia trachomatis is auxotrophic for three of the four ribonucleoside triphosphates », Molecular Microbiology, vol. 8, no 6,‎ , p. 1105–1114 (ISSN 1365-2958, DOI 10.1111/j.1365-2958.1993.tb01655.x, lire en ligne, consulté le )
  65. Shane Woods, Avril Coghlan, David Rivers et Tobias Warnecke, « Duplication and Retention Biases of Essential and Non-Essential Genes Revealed by Systematic Knockdown Analyses », PLOS Genetics, vol. 9, no 5,‎ , e1003330 (ISSN 1553-7404, PMID 23675306, PMCID PMC3649981, DOI 10.1371/journal.pgen.1003330, lire en ligne, consulté le )
  66. (en) I. King Jordan, Igor B. Rogozin, Yuri I. Wolf et Eugene V. Koonin, « Essential Genes Are More Evolutionarily Conserved Than Are Nonessential Genes in Bacteria », Genome Research, vol. 12, no 6,‎ , p. 962–968 (ISSN 1088-9051 et 1549-5469, PMID 12045149, PMCID PMC1383730, DOI 10.1101/gr.87702, lire en ligne, consulté le )
  67. a b et c Gang Fang, Eduardo Rocha et Antoine Danchin, « How Essential Are Nonessential Genes? », Molecular Biology and Evolution, vol. 22, no 11,‎ , p. 2147–2156 (ISSN 0737-4038, DOI 10.1093/molbev/msi211, lire en ligne, consulté le )
  68. Colm J. Ryan, Nevan J. Krogan, Pádraig Cunningham et Gerard Cagney, « All or Nothing: Protein Complexes Flip Essentiality between Distantly Related Eukaryotes », Genome Biology and Evolution, vol. 5, no 6,‎ , p. 1049–1059 (PMID 23661563, PMCID PMC3698920, DOI 10.1093/gbe/evt074, lire en ligne, consulté le )
  69. Matthias Sipiczki, « Where does fission yeast sit on the tree of life? », Genome Biology, vol. 1,‎ , reviews1011 (ISSN 1474-760X, PMID 11178233, PMCID PMC138848, DOI 10.1186/gb-2000-1-2-reviews1011, lire en ligne, consulté le )
  70. Wei-Hua Chen, Kalliopi Trachana, Martin J. Lercher et Peer Bork, « Younger Genes Are Less Likely to Be Essential than Older Genes, and Duplicates Are Less Likely to Be Essential than Singletons of the Same Age », Molecular Biology and Evolution, vol. 29, no 7,‎ , p. 1703–1706 (ISSN 0737-4038, PMID 22319151, PMCID PMC3375470, DOI 10.1093/molbev/mss014, lire en ligne, consulté le )
  71. (en) Megan Kofoed, Karissa L. Milbury, Jennifer H. Chiang et Sunita Sinha, « An Updated Collection of Sequence Barcoded Temperature-Sensitive Alleles of Yeast Essential Genes », G3: Genes, Genomes, Genetics, vol. 5, no 9,‎ , p. 1879–1887 (ISSN 2160-1836, PMID 26175450, PMCID PMC4555224, DOI 10.1534/g3.115.019174, lire en ligne, consulté le )
  72. Jingyuan Deng, Shengchang Su, Xiaodong Lin et Daniel J. Hassett, « A Statistical Framework for Improving Genomic Annotations of Prokaryotic Essential Genes », PLOS ONE, vol. 8, no 3,‎ , e58178 (ISSN 1932-6203, PMID 23520492, PMCID PMC3592911, DOI 10.1371/journal.pone.0058178, lire en ligne, consulté le )
  73. (en) David W. Morgens, Richard M. Deans, Amy Li et Michael C. Bassik, « Systematic comparison of CRISPR/Cas9 and RNAi screens for essential genes », Nature Biotechnology, vol. 34, no 6,‎ , p. 634–636 (ISSN 1087-0156, PMID 27159373, PMCID PMC4900911, DOI 10.1038/nbt.3567, lire en ligne, consulté le )
  74. Shukriti Sharma, Philip F. Markham et Glenn F. Browning, « Genes Found Essential in Other Mycoplasmas Are Dispensable in Mycoplasma bovis », PLOS ONE, vol. 9, no 6,‎ , e97100 (ISSN 1932-6203, PMID 24897538, PMCID PMC4045577, DOI 10.1371/journal.pone.0097100, lire en ligne, consulté le )
  75. Jian Cheng, Zhao Xu, Wenwu Wu et Li Zhao, « Training Set Selection for the Prediction of Essential Genes », PLOS ONE, vol. 9, no 1,‎ , e86805 (ISSN 1932-6203, PMID 24466248, PMCID PMC3899339, DOI 10.1371/journal.pone.0086805, lire en ligne, consulté le )
  76. (en) A. R. Mushegian et E. V. Koonin, « A minimal gene set for cellular life derived by comparison of complete bacterial genomes », Proceedings of the National Academy of Sciences, vol. 93, no 19,‎ , p. 10268–10273 (ISSN 0027-8424 et 1091-6490, PMID 8816789, DOI 10.1073/pnas.93.19.10268, lire en ligne, consulté le )
  77. (en) Robert L. Charlebois et W. Ford Doolittle, « Computing prokaryotic gene ubiquity: Rescuing the core from extinction », Genome Research, vol. 14, no 12,‎ , p. 2469–2477 (ISSN 1088-9051 et 1549-5469, PMID 15574825, PMCID PMC534671, DOI 10.1101/gr.3024704, lire en ligne, consulté le )
  78. a et b Mario Juhas, Leo Eberl et John I. Glass, « Essence of life: essential genes of minimal genomes », Trends in Cell Biology, vol. 21, no 10,‎ , p. 562–568 (DOI 10.1016/j.tcb.2011.07.005, lire en ligne, consulté le )
  79. (en) Xiaowen Yang, Yajie Li, Juan Zang et Yexia Li, « Analysis of pan-genome to identify the core genes and essential genes of Brucella spp. », Molecular Genetics and Genomics, vol. 291, no 2,‎ , p. 905–912 (ISSN 1617-4615 et 1617-4623, DOI 10.1007/s00438-015-1154-z, lire en ligne, consulté le )
  80. (en) Hong-Li Hua, Fa-Zhan Zhang, Abraham Alemayehu Labena et Chuan Dong, « An Approach for Predicting Essential Genes Using Multiple Homology Mapping and Machine Learning Algorithms », BioMed Research International, vol. 2016,‎ , p. 1–9 (ISSN 2314-6133, PMID 27660763, PMCID PMC5021884, DOI 10.1155/2016/7639397, lire en ligne, consulté le )
  81. Xiao Liu, Baojin Wang et Luo Xu, « Statistical Analysis of Hurst Exponents of Essential/Nonessential Genes in 33 Bacterial Genomes », PLOS ONE, vol. 10, no 6,‎ , e0129716 (ISSN 1932-6203, PMID 26067107, PMCID PMC4466317, DOI 10.1371/journal.pone.0129716, lire en ligne, consulté le )
  82. John P. McCutcheon, Bradon R. McDonald et Nancy A. Moran, « Origin of an Alternative Genetic Code in the Extremely Small and GC–Rich Genome of a Bacterial Symbiont », PLOS Genetics, vol. 5, no 7,‎ , e1000565 (ISSN 1553-7404, PMID 19609354, PMCID PMC2704378, DOI 10.1371/journal.pgen.1000565, lire en ligne, consulté le )
  83. (en) Georg Basler, Gene Essentiality, Humana Press, New York, NY, (DOI 10.1007/978-1-4939-2398-4_12, lire en ligne), p. 183–204
  84. (en) Francesco Gatto, Heike Miess, Almut Schulze et Jens Nielsen, « Flux balance analysis predicts essential genes in clear cell renal cell carcinoma metabolism », Scientific Reports, vol. 5, no 1,‎ (ISSN 2045-2322, PMID 26040780, PMCID PMC4603759, DOI 10.1038/srep10738, lire en ligne, consulté le )
  85. (en) Kai Song, Tuopong Tong et Fang Wu, « Predicting essential genes in prokaryotic genomes using a linear method: ZUPLS », Integrative Biology, vol. 6, no 4,‎ (ISSN 1757-9708, DOI 10.1039/C3IB40241J, lire en ligne, consulté le )
  86. (en) Feng-Biao Guo, Yuan-Nong Ye, Lu-Wen Ning et Wen Wei, Gene Essentiality, Humana Press, New York, NY, (DOI 10.1007/978-1-4939-2398-4_13, lire en ligne), p. 205–217
  87. (en) Norman F. Goodacre, Dietlind L. Gerloff et Peter Uetz, « Protein Domains of Unknown Function Are Essential in Bacteria », mBio, vol. 5, no 1,‎ , e00744–13 (ISSN 2150-7511, PMID 24381303, PMCID PMC3884060, DOI 10.1128/mBio.00744-13, lire en ligne, consulté le )
  88. (en) Yulan Lu, Yao Lu, Jingyuan Deng et Hui Lu, Gene Essentiality, Humana Press, New York, NY, (DOI 10.1007/978-1-4939-2398-4_15, lire en ligne), p. 235–245
  89. (en) Feng Gao, Hao Luo, Chun-Ting Zhang et Ren Zhang, Gene Essentiality, Humana Press, New York, NY, (DOI 10.1007/978-1-4939-2398-4_14, lire en ligne), p. 219–233
  90. (en) Benjamin Lewin, Essential Genes, Pearson, , 594 p. (ISBN 0-13-201636-2, lire en ligne)
  91. (en) Auteurs divers, Gene Essentiality: Methods and Protocols, New York, Long Jason Lu, , 248 p. (ISBN 978-1-4939-2397-7, 978-1-4939-4862-8 et 978-1-4939-2398-4, DOI 10.1007/978-1-4939-2398-4, lire en ligne)