Caractérisation des atténuateurs chez B. subtilis et E. coli
Une recherche documentaire approfondie des opérons chez B. subtilis régulés par l’atténuation ou l’antitermination a été menée et 46 de ces opérons ont été trouvés. Celles-ci vont de l’opéron trp bien décrit expérimentalement aux opérons où des structures de terminaison ont été trouvées et où une atténuation est attendue bien que mal caractérisée expérimentalement (pour une liste complète, voir http://www.bork.embl-heidelberg.de/Docu/attenuation). Ces 46 structures terminatoires connues ont été utilisées pour déterminer les caractéristiques communes des terminateurs d’atténuation de B. subtilis. En utilisant ces caractéristiques, nous avons criblé des régions en amont de 3650 gènes de B. subtilis (en utilisant des procédures décrites dans Matériaux et méthodes) pour détecter les plis terminateurs. Quarante-trois des 46 terminaisons connues d’origine trouvées dans la recherche documentaire ont été retenues lors de cette présélection. 1117 plis en amont supplémentaires répondant à nos critères ont également été obtenus. De plus, en tant que témoin, nous avons utilisé la même méthodologie de filtrage et de pliage sur des régions intergéniques après que les séquences ont été mélangées aléatoirement (952 plis de séquences mélangées aléatoirement ont été obtenus après filtrage).
Les plis résultants de toutes les régions intergéniques et les séquences mélangées obtenues après filtration ont été tracés en termes de stabilité et de longueur (Figure 1). Les plis de terminaison connus se trouvent dans une grappe clairement séparée et distincte de ces plis de séquences mélangées aléatoirement. Les plis de terminaison sont d’une énergie libre inférieure (ΔG) par rapport à la longueur que les plis prédits de séquences aléatoires. Un modèle similaire de deux amas facilement séparés apparaît lorsque l’on compare des structures terminatrices connues avec des régions intragéniques pliées dans lesquelles on ne s’attend pas à trouver de terminateurs (données non illustrées).
Distributions de stabilité et de longueur des structures en boucle de tige dans les segments de séquence en amont de B. subtilis. La ligne rouge montre la plus grande variance (voir Matériaux et méthodes) dérivée des structures tige-boucle dans des séquences mélangées. Les lignes bleu clair donnent les mesures de signification basées sur l’écart-type. La définition de chaque point ainsi que l’orientation des gènes voisins sont affichées dans le panneau supérieur droit.
En utilisant l’analyse en composantes principales, nous avons déterminé la plus grande variance des séquences mélangées aléatoirement. Cela peut nous donner une mesure (en utilisant l’écart-type) dont les plis sont significativement différents des plis de séquences aléatoires (voir Matériaux et méthodes). Sur les 1160 plis, un total de 203 plis de régions intergéniques obtenus dans notre écran tombent en dessous de la 2ème ligne de déviation (Z ≤ -2) dérivée de la composante principale. Ceux-ci sont ainsi considérés comme significativement différents des plis aléatoires et des sites de terminaisons possibles de régulation d’atténuation ou d’antitermination. Quarante-deux d’entre eux sont les plis de terminaison d’atténuation connus (sur les 43 plis connus d’origine maintenus après filtrage). Ainsi, nous sommes en mesure d’obtenir 91,3% (42/46) des sites d’atténuation et d’antitermination connus et caractérisés expérimentalement en utilisant notre mesure de filtre et de signification. De plus, le filtre et la mesure de signification filtrent plus de 97,7 % (930 sur 952) des plis des séquences aléatoires. Cent soixante et un plis (203 au total en excluant 42 connus) sous la ligne (Z ≤ -2) sont des plis non encore analysés expérimentalement et pourraient être prédits comme des structures terminatrices d’atténuation.
Une étude détaillée a révélé que beaucoup de ces prédictions sont fortement soutenues en tant que sites d’atténuation ou d’antitermination putatifs par le contexte génomique, tels que la présence de séquences promotrices putatives, la localisation en amont d’opérons putatifs et connus, etc. Deux structures terminatrices en amont des gènes ydbJ et yqhI servent d’exemples détaillés de la façon dont le contexte génomique peut éclairer et soutenir fortement les prédictions faites dans le tableau 1 (Figure 2). Le gène ydbJ de B. subtilis est répertorié comme hypothétique avec une homologie avec un gène transporteur ABC (protéine de liaison à l’ATP impliquée dans le transport du cuivre). Le gène immédiatement en aval, ydbK, présente une homologie avec les perméases couvrant la membrane. En utilisant STRING (un outil de recherche pour trouver des instances récurrentes de gènes voisins), les orthologues de ces deux gènes sont également trouvés dans le même ordre dans les unités transcriptionnelles de 15 autres génomes éloignés, suggérant la possibilité que ces gènes forment un opéron. Ces gènes semblent être dans une configuration typique d’opérons transporteurs ABC et plusieurs opérons transporteurs ABC sont connus pour être régulés par atténuation chez B. subtilis. La région amont de ydbJ a également une séquence promotrice putative et les plis prédits en utilisant RNAfold (Voir Matériaux et méthodes) de toute la séquence amont suggèrent qu’elle peut se plier en plis antiterminatifs complexes possibles (données non représentées). Sur la base de ce contexte, nous prédisons qu’il s’agit d’un opéron transporteur ABC régulé par atténuation. Le deuxième exemple, yqhI, est le premier gène d’une série de trois gènes ayant tous une homologie avec les gènes de biosynthèse de la glycine dans une unité transcriptionnelle putative. Cette série de trois gènes a également des orthologues trouvés comme voisins dans d’autres génomes. De nombreux opérons de biosynthèse d’acides aminés chez B. subtilis sont connus pour être régulés par atténuation, ce qui soutient cette prédiction.
Dessin schématique du voisinage et des structures prédites pour les gènes B. subtilis ydbJ et yqhI. Les gènes sont signifiés par des flèches colorées et sont en orientation de transcription par rapport à l’orientation du gène de référence (ydbJ ou yqhI). Les grands dessins animés en boucle de tige bleue signifient un pli de terminaison prédit en atténuation, « t » est un pli de terminaison standard annoté. Les régions intergéniques sont dessinées à l’échelle et les longueurs de bp de celles-ci sont données sous la figure.
Afin de voir si les patrons observés se maintiennent pour le seul autre génome dans lequel l’atténuation ou l’antitermination est bien étudiée et décrite expérimentalement, nous avons également appliqué la même méthodologie aux régions amont des gènes du génome d’E. coli pour lesquelles 16 opérons ont été décrits comme étant régulés par l’atténuation ou l’antitermination. Comme on peut le voir sur la figure 3, les structures terminatrices connues d’atténuation et d’antitermination d’E. coli ont des propriétés similaires à celles de B. subtilis. 15 des 16 atténuateurs connus ont été maintenus après filtrage. La mesure de l’importance sépare 14 de ces terminateurs d’E. coli des plis aléatoires, comme le montre la figure 3. Comme chez B. subtilis, en utilisant la ligne (Z≤ -2) comme mesure de signification, nous sommes en mesure de prédire l’atténuation pour 146 régions (Figure 3 et tableau 2).
Distributions de stabilité et de longueur des structures en boucle de tige dans les segments de séquence en amont chez E. coli. La ligne rouge montre la plus grande variance (voir Matériaux et méthodes) dérivée des structures tige-boucle dans des séquences mélangées. Les lignes bleu clair donnent les mesures de signification basées sur l’écart-type. La définition de chaque point ainsi que l’orientation des gènes voisins sont affichées dans le panneau supérieur droit.
Extension du génome d’E. coli analyse à 26 génomes
Analyse de B. subtilis et E. coli suggère qu’une étude plus large des génomes bactériens pourrait s’avérer utile à la fois pour la prédiction de la régulation de l’atténuation et de l’antitermination dans ces génomes et pour la caractérisation de l’évolution et de la distribution de ces mécanismes de régulation. Vingt-quatre génomes complétés ont été sélectionnés pour cette enquête en fonction de leur large répartition sur l’ensemble du spectre évolutif (tableau 3). Les régions intergéniques de chacun de ces génomes ont été analysées en utilisant les mêmes méthodes et filtres que pour B. subtilis et E. coli et les plis terminateurs d’atténuation et d’antitermination prédits obtenus de manière similaire.
Comme le montre le tableau 3, il existe une large distribution du nombre de sites régulateurs d’atténuation et d’antitermination putatifs dans les génomes étudiés. Celles-ci vont de 5 chez Mycobacterium tuberculosis à 275 chez Clostridium acetobutylicum (tableau 3). Des tentatives antérieures de prédire les sites de terminaison standard de la transcription à la fin des unités de transcription donnent des résultats similaires. Fait intéressant, les résultats pour les terminateurs de transcription standard sont en corrélation avec les nôtres. Comme cela a été trouvé dans Ermolaeva et. avec des terminateurs standard à la fin des unités de transcription (cet article a étudié les terminateurs à la fin des ORF et n’a pas ciblé les régions en amont, filtrant ainsi les atténuateurs possibles), certains des plus grands nombres d’occurrences de sites d’atténuation et d’antitermination de notre enquête se trouvent de la même manière dans les génomes d’E. coli, H. influenze, D. radiodurans et B. subtilis et le plus faible nombre d’occurrences dans des génomes tels que H. pylori et M. tuberculosis (génomes rapportés dans leur enquête).
À première vue, cela semble suggérer que de nombreux génomes n’utilisent pas les mêmes mécanismes de terminaison pour la terminaison standard de la transcription et n’utilisent pas d’atténuation ou d’antitermination dans la régulation. C’est probablement le cas dans certains génomes. Pourtant, si le nombre de régions intergéniques en amont est représenté par rapport au nombre de sites prévus, une forte corrélation positive est montrée (figure 4). Plus le nombre de gènes et de régions intergéniques d’un génome est petit, plus l’occurrence de terminateurs prédits est faible (terminateurs de transcription standard et terminateurs régulateurs d’atténuation / antitermination). Cela indique que le faible nombre de terminaisons standard et de terminaisons réglementaires dans de nombreux génomes est dû à une taille du génome très réduite et à la réduction du nombre d’opérons régulateurs, et pas nécessairement à la dépendance à différents mécanismes de terminaison et de régulation.
Graphique du nombre de régions intergéniques par rapport au nombre de sites d’atténuation et d’antitermination putatifs dans les 26 génomes étudiés. Plusieurs génomes dont l’atténuation ou l’antitermination est connue sont marqués à des fins de comparaison, tout comme M. tuberculosis et les Archées. La ligne pointillée est une ligne de tendance exponentielle.
Il existe une valeur aberrante claire avec un nombre de terminateurs putatifs beaucoup plus faible que prévu vu dans la figure 4, Mycobacterium tuberculosis. Ce génome a une occurrence beaucoup plus faible de sites d’atténuation et d’antitermination putatifs que ne le laisseraient supposer sa taille et le nombre de régions intergéniques. Un article récent de Unniraman et al. conclut que M. tuberculosis utilise un mécanisme de terminaison différent qui utilise des structures terminatrices sans la queue poly-U nécessaire dans d’autres génomes. Ainsi, le nombre réduit de structures terminatrices contenant du poly-U par rapport au nombre de régions intergéniques peut s’expliquer par la dépendance de M. tuberculosis à un mécanisme de terminaison différent. Cela ne prouve pas nécessairement qu’il n’y a pas de régulation de type atténuation ou antitermination chez M. tuberculosis. Cependant, cela indique que soit la perte du mécanisme standard de terminaison dans ce génome a réduit, sinon éliminé, l’atténuation ou l’antitermination chez M. tuberculosis, soit, alternativement, un mécanisme semblable à l’atténuation pourrait exister dans ce génome qui utilise le M. terminateur non standard de la tuberculose.
Tous les autres des 25 génomes étudiés ont des sites de régulation d’atténuation ou d’antitermination présumés. Même le nombre le plus faible de sites d’atténuation ou d’antitermination prévus trouvés chez M. genitalium représente une proportion significative des régions intergéniques régulatrices possibles, ce faible nombre s’explique facilement par la taille relativement petite de ce génome et le peu de régions intergéniques et d’unités transcriptionnelles. Ces résultats suggèrent que la régulation de l’atténuation et de l’antitermination est un mécanisme de régulation peut-être omniprésent chez les procaryotes, à quelques exceptions près.
Taille et atténuation du génome
Si la teneur en GC d’un génome est comparée au nombre d’atténuateurs prédits sur la base de séquences mélangées aléatoirement, la teneur en GC est quelque peu corrélée au nombre d’atténuateurs prédits, ce qui serait attendu puisqu’un cycle poly-U est requis dans les filtres. Dans la figure 5a, les plis de séquences intergéniques mélangées aléatoirement de nos 26 génomes ont été tracés par le nombre de plis filtrés par région intergénique par rapport au nombre de régions intergéniques. Si le nombre de plis filtrés était complètement aléatoire, il devrait y avoir un nombre relativement constant de sites par région par rapport au nombre de régions. Comme le montre la figure 5a, ce n’est pas complètement le cas. Le nombre de plis filtrés par région obtenus à partir de séquences mélangées aléatoirement dépend de la teneur en GC du génome. Les génomes à faible teneur en GC ont un nombre de plis légèrement plus élevé par région que les génomes d’environ 50% de teneur en GC et les génomes à haute teneur en GC ont un nombre beaucoup plus faible que les deux. Ceci est attendu à partir de séquences aléatoires filtrées pour des structures de boucles de tige contenant des séquences poly-U.
Taille et régulation du génome. (a) Des séquences intergéniques de 26 génomes ont été mélangées au hasard, pliées et filtrées à l’aide de la méthode rapportée pour obtenir des « atténuateurs » présumés. Le nombre de ces plis mélangés et filtrés par région intergénique a été tracé pour chaque génome par rapport au nombre de régions intergéniques. La corrélation, si elle est aléatoire, doit rester constante et indépendante de la taille du génome. Les sphères bleues représentent les espèces de protéobactéries et de bacilles dans notre enquête, les beiges sont des archéabactéries et les autres vertes. Les sphères ont une taille proportionnelle à la teneur en GC du génome et la teneur en GC est étiquetée dans chaque sphère. Le nombre de plis aléatoires par région intergénique est fonction de la teneur en GC, comme on pourrait s’y attendre en filtrant les plis avec des séries poly-U. Les génomes dont l’atténuation ou l’antitermination est connue sont marqués de même que le génome connu pour ne pas utiliser d’atténuateurs avec des cycles poly-U en terminaison. (b) Des séquences intergéniques de 22 génomes ont été pliées et filtrées pour détecter d’éventuels atténuateurs et indiquer une régulation de l’atténuation ou de l’antitermination. Le nombre de ces atténuateurs prédits par région intergénique est comparé au nombre de régions intergéniques dans le génome. Contrairement aux plis de séquences mélangées aléatoirement, le déterminant le plus fort pour la fréquence d’atténuation est la taille du génome (le nombre de régions intergéniques et la taille du génome sont fortement corrélés). Les couleurs et l’étiquetage sont les mêmes que dans 5a.
Même en tenant compte de la teneur en GC de M. tuberculosis, le nombre d’atténuateurs prévus est réduit par rapport aux autres génomes à haute GC (figure 5b). En fait, la figure 5b (atténuateurs prédits de séquences intergéniques réelles) montre que le déterminant le plus fort du nombre d’atténuateurs prédits par région intergénique n’est pas le contenu en GC, mais plutôt la taille du génome (plus précisément le nombre de régions intergéniques). En général, non seulement les génomes plus grands ont un plus grand nombre absolu d’atténuateurs prédits, mais ils ont également une plus grande occurrence d’atténuateurs prédits par région. Si la teneur en GC est égale dans deux génomes, le génome plus grand est plus susceptible d’avoir un nombre plus élevé d’atténuateurs prévus par région intergénique. Des rapports précédents ont suggéré des phénomènes similaires dans les protéines régulatrices, les grands génomes semblent avoir une plus grande proportion de leur nombre total de gènes codant pour des protéines contenant des motifs régulateurs. Fait intéressant, en tenant compte des archaébactéries et des génomes à haute teneur en GC, un génome d’environ 1500 régions intergéniques semble être le seuil à partir duquel la fréquence des atténuateurs régulateurs augmente dans un génome.
Distribution et conservation des Atténuateurs chez les bactéries Gram positives
Sept génomes de bactéries gram positives (B. subtilis, B. halodurans, L. innocua, S. aureus, C. acetobutylicum, L. lactis et S. pneumoniae) ont été analysés pour voir si les terminateurs d’atténuation sont conservés devant les orthologues. Le nombre de terminateurs d’atténuation prévus pour les gènes connus pour être régulés chez B. subtilis et leurs orthologues dans les six autres génomes est répertorié dans le tableau 4. Les génomes sont triés par distance phylogénétique de B. subtilis calculée par séquences d’acides aminés des orthologues partagés entre ces génomes. La plus proche de B. subtilis est B. halodurans et le nombre moyen de substitutions d’acides aminés par site est de 0,238, et la plus éloignée est S. pneumoniae et le nombre moyen de substitutions d’acides aminés par site est de 0,422. Pour les 42 gènes énumérés dans le tableau 4, le nombre d’orthologues que l’on trouve dans les autres génomes varie peu d’un génome à l’autre : les nombres d’orthologues les plus élevés et les plus faibles sont respectivement de 31 chez L. lactis et de 26 chez S. aureus et C. acetobutylicum. Ceci est principalement dû au fait que ces 42 gènes portent certaines fonctions de base telles que la synthèse d’aminoacyl-ARNt. D’autre part, les nombres de structures de terminaison d’atténuation prédites varient considérablement : En B. chez les haloduranes, 22 gènes orthologues ont prédit des structures de terminaison d’atténuation, alors que seulement 4 gènes orthologues ont les structures prédites chez S. pneumoniae. Ceci indique que l’absence ou la présence de régulation par atténuation est beaucoup plus faiblement conservée que la présence de gènes ou d’opérons.
La même tendance s’applique aux structures de terminaison d’atténuation prédites autres que celles connues (tableau 5). Il existe 105 groupes de gènes orthologues qui ont au moins un autre génome contenant une structure atténuatrice prédite en amont d’un gène orthologue. Se limiter aux orthologues qui ont prédit des atténuateurs en B. subtilis (35 groupes), les nombres les plus élevés et les plus faibles d’orthologues partagés de gènes connus pour être régulés par atténuation ou antitermination chez B. subtilis sont 28 (L. innocua) et 18 (S. pneumoniae), respectivement. Cependant, le nombre de structures de terminaison d’atténuation prédites varie davantage. Bien qu’il existe 13 gènes avec des structures prédites chez B. halodurans, qui est l’espèce la plus proche de B. subtilis parmi les six bactéries à gram positif, seuls 2 gènes ont des structures prédites chez S. pneumoniae.
Bien qu’il y ait une faible conservation des atténuateurs dans leur ensemble, les structures de terminaison d’atténuation prédites et l’ordre de leur les gènes en aval sont conservés pour certains groupes de gènes. Un de ces exemples est l’opéron infC-rpml-rplT (figure 6a). Aucune structure de terminaison d’atténuation n’est prévue dans la région amont d’infC chez S. pneumoniae (tableau 5). Un examen plus approfondi de cette région par BLAST a révélé que la borne N d’infC est surestimée dans 27 bases. En ajoutant les 27 bases à la région intergénique en amont, nous avons trouvé une structure tige-boucle stable suivie de résidus poly-U également chez S. pneumoniae (Figure 6b). Cependant, même dans cet exemple, il existe des différences considérables entre les espèces en ce qui concerne la position relative des structures tige-boucle et la conservation de la séquence. De plus, même entre la paire phylogénétiquement la plus proche, B. subtilis et B. halodurans, les distances entre l’extrémité de la tige et le codon de départ d’infC sont respectivement de 69 et 37 bases, et seuls les segments communs trouvés dans la tige sont GUGUGGGN{x} CCCACAC (x = 12 chez B. subtilis et x = 9 chez B. halodurans). Parmi les sept génomes, il n’y a qu’une faible similitude, GYGGG (GACGG chez C. acetobutylicum) dans la région de la tige.
Structure de terminaison d’atténuation prédite dans la région amont de l’opéron putatif infC-rpmI-rplT. (a) Ordre des gènes. Seules les régions intergéniques sont dessinées à l’échelle et la longueur des régions intergéniques est indiquée en dessous de la ligne. Les gènes orthologues sont indiqués dans les mêmes couleurs. Les gènes hypothétiques et les autres gènes non orthologues sont indiqués par « hyp » et leurs identifiants de gènes, respectivement. Abréviation des génomes: Bs, B. subtilis; Bh, B. halodurans; Li, Listeria innocua; Sa, Staphylococcus aureus; Ca, Clostridium acetobutylicum; Ll, Lactococcus lactis; Sp, Streptococcus pneumoniae. b) Structures de terminaison d’atténuation prévues. Les paires de bases sont indiquées par des points rouges entre les codes de base. La numérotation de base indique la distance depuis le codon de départ du gène descendant. Le poly-Us juste en aval de la structure de la tige-boucle est coloré en vert. Les segments faiblement conservés sont colorés en rouge. L’abréviation des génomes est la même qu’en (a).
La conservation des structures de terminaison d’atténuation prédites est également observée dans les régions amont de l’opéron pouvant contenir le gène nusA (Figure 7a). Quatre génomes sur sept contiennent des structures atténuatrices prévues en amont de la protéine hypothétique (ylxS chez B. subtilis). On trouve également des structures en boucle de tige dans le reste des trois génomes, bien que ces structures ne passent pas les filtres. L’emplacement des structures sur le site de début de transcription du gène en aval et les séquences elles-mêmes varient également de manière significative dans cet exemple. Dans ces séquences de tiges, le segment GUGGG (GAGCG chez L. lactis et GAGGC chez S. pneumoniae) est conservé dans l’opéron prédit contenant le gène nusA (Figure 7b). Fait intéressant, les segments à 5 bases sont identiques ou très similaires aux segments des structures en boucle de tige situées en amont d’infC (figure 6b). Les protéines codées par les gènes de ces deux opérons sont impliquées dans la transcription. La conservation des segments de séquence dans les structures de terminaison d’atténuation prévues pour l’opéron infC-rpmI-rplT et l’opéron contenant nusA implique qu’il existe un mécanisme de régulation commun qui reconnaît la structure tige-boucle et qui régule les deux opérons de la même manière.
Structure de terminaison d’atténuation prédite dans la région amont du gène ylxS. (a) Ordre des gènes. Les structures prédites en boucle de tige ayant une signification statistique sont indiquées en bleu, et les autres structures qui ne passent pas les filtres ni qui ont moins de signification sont indiquées en rouge. Pour l’autre explication, voir la légende de la figure 6a. (b) Structures de terminaison d’atténuation prédites. Voir la légende de la figure 6b pour l’explication.
Distribution et conservation des atténuateurs chez les protéobactéries
Plusieurs aspects de la conservation des atténuateurs ressortent immédiatement de notre analyse des bactéries à gram positif. Premièrement, la distribution de la régulation de l’atténuation ou de l’antitermination n’est pas bien conservée entre les baceria à gram positif et, de plus, même dans les systèmes de régulation conservés, la conservation de la séquence et de la structure est faible. Il en va de même pour les protéobactéries. Des 14 gènes de E. coli (voir tableau 5a) connu pour être régulé par atténuation ou antitermination, aucun des quatre autres génomes de protéobactéries n’a d’orthologues amont prédits par des atténuateurs. Six ont des orthologues amont prédits par des atténuateurs dans au moins un des quatre autres génomes. Trois sont des gènes qui ont des orthologues dans les quatre autres génomes, mais ceux-ci n’ont pas d’atténuateurs prédits. Les cinq gènes restants chez E. coli n’ont pas d’orthologues connus dans l’autre génome ou les orthologues ont une distribution inégale et aucun atténuateur prédit. Une inspection plus approfondie à la main confirme cette conclusion. Le tableau 5b est une liste de tous les atténuateurs prédits dans chacun des cinq génomes de la division gamma des protéobactéries dans lesquels un atténuateur similaire est prédit pour un orthologue d’un autre génome. Comme le montre ce tableau, l’atténuation et l’antitermination semblent être mal conservées comme mécanisme de régulation dans les opérons analogues des génomes protéobactériens. Sur un total de 475 gènes et leurs orthologues dans ces cinq génomes qui ont prédit des atténuateurs, seuls 36 sont des orthologues en amont partagés de deux génomes ou plus (tableaux 3, 5a et 5b).
Des recherches antérieures concernant des systèmes spécifiques ont rapporté que l’atténuation et la régulation de l’antitermination dans certains opérons d’E. coli ne sont que légèrement conservées parmi les protéobactéries de la division gamma. Il a été démontré que l’opéron de régulation rpsJ et les opérons trpE et pheA d’E. coli ont une distribution inégale et sont faiblement conservés entre les protéobactéries. Comme le montrent les tableaux 2, 5a et 5b, nous avons été en mesure d’étendre largement cette analyse de l’atténuation et de l’antitermination à la plupart de ces systèmes chez les protéobactéries, et nous avons montré que cela est vrai pour tous les mécanismes de régulation de l’atténuation et de l’antitermination connus chez E. coli et d’autres mécanismes prévus dans d’autres génomes de division gamma. Un exemple est donné sur la figure 8 de la conservation et de la régulation des atténuateurs à faible séquence. Sur la figure 8a, l’un des atténuateurs les plus conservés est représenté pour celui de l’opéron hisG. Cet opéron et ce mécanisme de régulation sont bien caractérisés chez E. coli et notre analyse prédit des mécanismes similaires de régulation de l’atténuation chez V. cholerae et H. influenzae. Les atténuateurs prévus ont conservé leur position (à environ 40-50 pb en amont du codon de départ du gène hisG) et la séquence de la tige. Bien qu’il ne soit pas possible d’aligner les régions intergéniques environnantes, V. cholerae et H. les influenzae ont des séquences leaders d’acides aminés possibles avec une série d’histidines caractéristiques du mécanisme de régulation de l’atténuation chez E. coli. Les atténuateurs prévus n’ont pas été trouvés dans les trois autres génomes de probactéries de la subdivision gamma de P. aeruginosa, N. meningitidus et X. fastidiosa. Chez P. aeruginosa, la région intergénique en amont de l’orthologue hisG ne mesure que 17 pb de longueur, chez X. fastidious, le gène orthologue chevauche l’ORF en amont, et bien que la région intergénique analogue de N. meningitidus soit de longueur suffisante, aucun atténuateur n’est prédit.