Maybaygiare.org

Blog Network

Identifizierung von Attenuierungs- und Antiterminierungsregulation in Prokaryoten

Charakterisierung von Attenuatoren in B. subtilis und E. coli

Eine umfangreiche Literaturrecherche nach Operonen in B. subtilis, die durch Attenuierung oder Antiterminierung reguliert werden, wurde durchgeführt und 46 solcher Operonen wurden gefunden. Diese reichen vom experimentell gut beschriebenen trp-Operon bis zu jenen Operonen, bei denen Terminatorstrukturen gefunden wurden und eine Dämpfung erwartet wird, die experimentell nicht gut charakterisiert ist (für eine vollständige Liste siehe http://www.bork.embl-heidelberg.de/Docu/attenuation ). Diese 46 bekannten Terminatorstrukturen wurden verwendet, um gemeinsame Eigenschaften von B. subtilis-Dämpfungsabschlüssen zu bestimmen. Unter Verwendung dieser Eigenschaften untersuchten wir stromaufwärts gelegene Regionen von 3650 B. subtilis-Genen (unter Verwendung von Verfahren, die in Materialien und Methoden beschrieben sind) auf Terminatorfalten. Dreiundvierzig der ursprünglichen 46 bekannten Terminatoren, die in der Literaturrecherche gefunden wurden, wurden in diesem Screening beibehalten. Weitere 1117 Upstream-Falten, die unseren Kriterien entsprechen, wurden ebenfalls erhalten. Zusätzlich verwendeten wir als Kontrolle die gleiche Filter- und Faltmethode für intergene Regionen, nachdem die Sequenzen zufällig gemischt worden waren (952 Falten zufällig gemischter Sequenzen wurden nach der Filterung erhalten).

Die resultierenden Falten aller nach der Filterung erhaltenen intergenen Regionen und Shuffled-Sequenzen wurden hinsichtlich ihrer Stabilität und Länge aufgetragen (Abbildung 1). Die bekannten Terminatorfalten liegen in einem Cluster deutlich getrennt und verschieden von jenen Falten zufällig gemischter Sequenzen. Terminatorfalten haben im Verhältnis zur Länge eine geringere freie Energie (ΔG) als vorhergesagte Falten von Zufallssequenzen. Ein ähnliches Muster von zwei leicht zu trennenden Clustern ergibt sich beim Vergleich bekannter Terminatorstrukturen mit gefalteten intragenen Regionen, in denen kein Terminator zu erwarten ist (Daten nicht gezeigt).

Abbildung 1
Abbildung 1

Stabilität und Längenverteilungen von Stem-Loop-Strukturen in Upstream-Sequenzsegmenten von B. subtilis. Die rote Linie zeigt die größte Varianz (siehe Materialien und Methoden), die aus Stammschleifenstrukturen in gemischten Sequenzen abgeleitet wurde. Hellblaue Linien geben die Signifikanzmessungen basierend auf der Standardabweichung an. Die Definition für jeden Punkt zusammen mit der Orientierung benachbarter Gene wird oben rechts angezeigt.

Mithilfe der Hauptkomponentenanalyse haben wir die größte Varianz der zufällig gemischten Sequenzen ermittelt. Dies kann uns ein Maß (unter Verwendung der Standardabweichung) geben, dessen Falten sich signifikant von Falten zufälliger Sequenzen unterscheiden (siehe Materialien und Methoden). Von den 1160 Falten fallen insgesamt 203 Falten von intergenen Regionen, die in unserem Bildschirm erhalten wurden, unter die 2. Abweichungslinie (Z ≤ -2), die von der Hauptkomponente abgeleitet ist. Diese werden somit als signifikant verschieden von zufälligen Falten und möglichen Abschlußstellen der Dämpfung oder Antiterminationsregelung angesehen. Zweiundvierzig davon sind die bekannten Dämpfungsabschlußfalten (von den ursprünglichen 43 bekannten Falten, die nach der Filterung beibehalten werden). Somit sind wir in der Lage, 91,3% (42/46) der bekannten und experimentell charakterisierten Dämpfungs- und Antiterminierungsstellen mit unserem Filter- und Signifikanzmaß zu erhalten. Zusätzlich siebt das Filter- und Signifikanzmaß über 97,7% (930 von 952) der Falten von Zufallssequenzen aus. Einhunderteinundsechzig (insgesamt 203 ohne 42 bekannte) Falten unter der Linie (Z ≤ -2) sind Falten, die noch nicht experimentell analysiert wurden und als Dämpfungsabschlussstrukturen vorhergesagt werden konnten.Eine detaillierte Untersuchung ergab, dass viele dieser Vorhersagen als mutmaßliche Abschwächungs- oder Antiterminierungsstellen durch den genomischen Kontext wie das Vorhandensein mutmaßlicher Promotorsequenzen, die stromaufwärts gelegene Position mutmaßlicher und bekannter Operonen usw. stark unterstützt werden. Zwei Terminatorstrukturen vor den Genen ydbJ und yqhI dienen als detaillierte Beispiele dafür, wie der genomische Kontext die in Tabelle 1 getroffenen Vorhersagen informieren und stark unterstützen kann (Abbildung 2). Das Gen ydbJ von B. subtilis ist als hypothetisch mit Homologie zu einem ABC-Transportergen (ATP-bindendes Protein, das am Kupfertransport beteiligt ist) aufgeführt. Das Gen unmittelbar stromabwärts, ydbK, hat eine Homologie zu membranspannenden Permeasen. Mit STRING (ein Suchwerkzeug für Finden Sie wiederkehrende Instanzen benachbarter Gene ), Orthologe dieser beiden Gene werden auch in der gleichen Reihenfolge in Transkriptionseinheiten von 15 anderen entfernt verwandten Genomen gefunden, was auf die Möglichkeit hindeutet, dass diese Gene ein Operon bilden. Diese Gene scheinen in einer typischen ABC-Transporter-Operon-Konfiguration zu sein, und es ist bekannt, dass mehrere ABC-Transporter-Operone durch Abschwächung in reguliert werden B. subtilis . Die YDBJ-Upstream-Region hat auch eine mutmaßliche Promotorsequenz und vorhergesagte Falten unter Verwendung von RNAfold (siehe Materialien und Methoden) der gesamten Upstream-Sequenz legen nahe, dass sie sich in komplexen möglichen Antiterminierungsfalten falten kann (Daten nicht gezeigt). Basierend auf diesem Kontext sagen wir voraus, dass dies ein ABC-Transporter-Operon ist, das durch Dämpfung reguliert wird. Das zweite Beispiel, yqhI, ist das erste Gen eines Laufs von drei Genen, die alle Homologie zu Glycin-Biosynthese-Genen in einer mutmaßlichen Transkriptionseinheit haben. Dieser Lauf von drei Genen hat auch Orthologen als Nachbarn in anderen Genomen gefunden . Es ist bekannt, dass viele Aminosäure-Biosynthese-Operonen in B. subtilis durch Dämpfung reguliert werden , was diese Vorhersage unterstützt.

Abbildung 2
Abbildung 2

Schematische Darstellung der Nachbarschaft und der vorhergesagten Strukturen für die B. subtilis-Gene ydbJ und yqhI. Gene sind durch farbige Pfeile gekennzeichnet und befinden sich in der Orientierung der Transkription in Bezug auf die Orientierung des Referenzgens (ydbJ oder yqhI). Große blaue Stem-Loop-Symbole bedeuten eine Terminatorfalte in der Dämpfung, ‚t‘ ist eine kommentierte Standard-Terminatorfalte. Intergene Regionen sind maßstabsgetreu gezeichnet und die Längen davon sind unter der Abbildung angegeben.

Tabelle 1 Prognostizierte Abschwächer im Genom von B. subtilis

Um zu sehen, ob die beobachteten Muster für das einzige andere Genom gelten, in dem Attenuation oder Antitermination gut untersucht und experimentell beschrieben ist, haben wir die gleiche Methodik auch auf vorgelagerte Regionen von Genen im E. coli-Genom angewendet, für die beschrieben wurde, dass 16 Operone durch Attenuation oder Antitermination reguliert werden. Wie in Abbildung 3 zu sehen ist, haben die bekannten E. coli-Attenuierungs- und Antiterminations-Terminatorstrukturen ähnliche Eigenschaften wie die von B. subtilis. 15 der 16 bekannten Abschwächer wurden nach der Filterung beibehalten. Das Signifikanzmaß trennt 14 dieser E. coli-Terminatoren von zufälligen Falten, wie in Abbildung 3 dargestellt. Wie in B. subtilis können wir unter Verwendung der (Z≤-2) -Linie als Signifikanzmaß die Dämpfung für 146 Regionen vorhersagen (Abbildung 3 und Tabelle 2).

Abbildung 3
Abbildung 3

Stabilität und Längenverteilung von Stem-Loop-Strukturen in Upstream-Sequenzsegmenten in E. coli. Die rote Linie zeigt die größte Varianz (siehe Materialien und Methoden), die aus Stammschleifenstrukturen in gemischten Sequenzen abgeleitet wurde. Hellblaue Linien geben die Signifikanzmessungen basierend auf der Standardabweichung an. Die Definition für jeden Punkt zusammen mit der Orientierung benachbarter Gene wird oben rechts angezeigt.

Tabelle 2 Prognostizierte Abschwächer im Genom von E. coli

Erweiterung der Analyse auf 26 Genome

Analyse von B. subtilis und E. coli legen nahe, dass sich eine breitere Untersuchung bakterieller Genome sowohl bei der Vorhersage der Abschwächung als auch der Antiterminationsregulation in diesen Genomen als nützlich erweisen könnte und die Charakterisierung der Entwicklung und Verteilung dieser Regulationsmechanismen. Vierundzwanzig abgeschlossene Genome wurden für diese Umfrage ausgewählt, basierend auf ihrer breiten Verteilung über das evolutionäre Spektrum (Tabelle 3). Die intergenen Regionen jedes dieser Genome wurden mit den gleichen Methoden und Filtern wie bei B. subtilis und E. coli und vorhergesagte Dämpfung und Antitermination Terminator werden in ähnlicher Weise erhalten.

Tabelle 3 Liste aller 26 in dieser Studie untersuchten Genome

Wie in Tabelle 3 gezeigt, gibt es eine breite Verteilung der Anzahl der mutmaßlichen Dämpfungs- und Antiterminierungsstellen in den befragten Genomen. Diese reichen von 5 bei Mycobacterium tuberculosis bis 275 bei Clostridium acetobutylicum (Tabelle 3). Frühere Versuche, Standard-Transkriptions-Terminationsstellen am Ende von Transkriptionseinheiten vorherzusagen, liefern ähnliche Ergebnisse. Interessanterweise korrelieren die Ergebnisse für Standard-Transkriptions-Terminatoren mit unseren. Wie in Ermolaeva et. al mit Standardterminatoren am Ende der Transkriptionseinheiten (dieses Papier untersuchte Terminatoren am Ende des ORFs und zielte nicht auf Upstream-Regionen ab, wodurch mögliche Abschwächer herausgefiltert wurden), Einige der höchsten Anzahl von Vorkommen von Abschwächungs- und Antiterminierungsstellen in unserer Umfrage sind ähnlich in den Genomen von E. coli, H. influenze, D. radiodurane und B. subtilis und die niedrigste Anzahl von Vorkommen in solchen Genomen wie H. pylori und M. tuberculosis (Genome in ihrer Umfrage berichtet).Auf den ersten Blick scheint dies darauf hinzudeuten, dass viele Genome nicht die gleichen Terminationsmechanismen für die Standard-Transkriptions-Termination verwenden und keine Attenuierung oder Antiterminierung in der Regulation verwenden. Dies ist wahrscheinlich in einigen Genomen der Fall. Wenn jedoch die Anzahl der vorgelagerten intergenen Regionen gegen die Anzahl der vorhergesagten Stellen aufgetragen wird, wird eine starke positive Korrelation gezeigt (Abbildung 4). Je kleiner die Anzahl der Gene und intergenen Regionen eines Genoms ist, desto geringer ist das Auftreten von vorhergesagten Terminatoren (sowohl Standard-Transkriptions-Terminatoren als auch Attenuierungs- / Antiterminations-Regulations-Terminatoren). Dies deutet darauf hin, dass die geringe Anzahl sowohl der Standardterminierung als auch der regulatorischen Terminierung in vielen Genomen auf eine stark reduzierte Genomgröße und die Verringerung der Anzahl regulatorischer Operone zurückzuführen ist und nicht unbedingt auf die Abhängigkeit von verschiedenen Mechanismen der Terminierung und Regulation.

Abbildung 4
Abbildung 4

Diagramm der Anzahl der intergenen Regionen im Vergleich zur Anzahl der mutmaßlichen Abschwächungs- und Antiterminierungsstellen in allen 26 untersuchten Genomen. Mehrere Genome mit bekannter Abschwächung oder Antiterminierung werden zum Vergleich markiert, ebenso wie M. tuberculosis und die Archaea. Die gestrichelte Linie ist eine exponentielle Trendlinie.

In Abbildung 4, Mycobacterium tuberculosis, ist ein klarer Ausreißer mit einer viel geringeren Anzahl mutmaßlicher Terminatoren als erwartet zu sehen. Dieses Genom hat ein viel geringeres Auftreten von mutmaßlichen Abschwächungs- und Antiterminierungsstellen, als dies durch seine Größe und die Anzahl der intergenen Regionen nahe gelegt würde. Ein kürzlich erschienenes Papier von Unniraman et al. kommt zu dem Schluss, dass M. tuberculosis einen anderen Terminationsmechanismus verwendet, der Terminatorstrukturen ohne den in anderen Genomen erforderlichen Poly-U-Schwanz verwendet. Somit kann die reduzierte Anzahl von Poly-U enthaltenden Terminatorstrukturen im Verhältnis zur Anzahl der intergenen Regionen durch die Abhängigkeit von M. tuberculosis von einem anderen Terminationsmechanismus erklärt werden. Dies beweist nicht unbedingt, dass es bei M. tuberculosis keine Dämpfungs- oder Antiterminationsregulierung gibt. Es deutet jedoch darauf hin, dass entweder der Verlust des Standardabbruchmechanismus in diesem Genom die Dämpfung oder Antiterminierung bei M. tuberculosis verringert, wenn nicht beseitigt hat, oder alternativ könnte in diesem Genom ein dämpfungsähnlicher Mechanismus existieren, der das M nutzt. tuberkulose Nicht-Standard-Terminator.

Alle anderen der 25 untersuchten Genome haben mutmaßliche Abschwächungs- oder Antiterminierungsregulationsstellen. Selbst die niedrigste Anzahl von vorhergesagten Abschwächungs- oder Antiterminationsstellen, die in M. genitalium gefunden werden, sind ein signifikanter Anteil möglicher regulatorischer intergener Regionen, Die geringe Anzahl lässt sich leicht durch die relativ geringe Größe dieses Genoms und die wenigen intergenen Regionen und Transkriptionseinheiten erklären. Diese Ergebnisse legen nahe, dass die Abschwächungs- und Antiterminierungsregulation mit wenigen Ausnahmen ein möglicherweise allgegenwärtiger Regulationsmechanismus in Prokaryoten ist.

Genomgröße und Dämpfung

Wenn der GC-Gehalt eines Genoms mit der Anzahl der vorhergesagten Abschwächer basierend auf einer zufällig gemischten Sequenz verglichen wird, korreliert der GC-Gehalt etwas mit der Anzahl der vorhergesagten Abschwächer, was zu erwarten wäre, da ein Poly-U-Lauf in den Filtern erforderlich ist. In Abbildung 5a wurden Falten aus zufällig gemischten intergenen Sequenzen unserer 26 Genome durch die Anzahl der gefilterten Falten pro intergener Region im Verhältnis zur Anzahl der intergenen Regionen aufgetragen. Wenn die Anzahl der gefilterten Falten völlig zufällig war, sollte es eine relativ konstante Anzahl von Stellen pro Region in Bezug auf die Anzahl der Regionen geben. Wie in Abbildung 5a zu sehen ist, ist dies nicht vollständig der Fall. Die Anzahl der gefilterten Falten pro Region, die aus zufällig gemischten Sequenzen erhalten werden, ist abhängig vom GC-Gehalt des Genoms. Genome mit niedrigem GC-Gehalt haben eine etwas höhere Anzahl von Falten pro Region als Genome mit einem GC-Gehalt von etwa 50%, und Genome mit hohem GC-Gehalt haben eine viel geringere Anzahl als beide. Dies wird von Zufallssequenzen erwartet, die nach Stammschleifenstrukturen gefiltert werden, die Poly-U-Läufe enthalten.

Abbildung 5
figure5

Genomgröße und Regulierung. (a) Intergene Sequenzen von 26 Genomen wurden nach dem Zufallsprinzip gemischt, gefaltet und unter Verwendung dieser Methode gefiltert, um mutmaßliche Attenuatoren zu erhalten. Die Anzahl dieser gemischten und gefilterten Falten pro intergener Region wurde für jedes Genom gegen die Anzahl der intergenen Regionen aufgetragen. Die Korrelation sollte, wenn sie zufällig ist, konstant und unabhängig von der Genomgröße bleiben. Blaue Kugeln repräsentieren Proteobakterien und Bacillis-Arten in unserer Umfrage, beige sind Archaeabakterien und grün der Rest. Kugeln haben eine proportionale Größe zum GC-Gehalt des Genoms, und der GC-Gehalt wird innerhalb jeder Kugel markiert. Die Anzahl der zufälligen Falten pro intergener Region ist eine Funktion des GC-Gehalts, wie es bei der Filterung nach Falten mit Poly-U-Läufen zu erwarten wäre. Genome mit bekannter Abschwächung oder Antiterminierung sind markiert, ebenso wie das Genom, von dem bekannt ist, dass es keine Abschwächer mit Poly-U-Terminierung verwendet. (b) Intergene Sequenzen von 22 Genomen wurden gefaltet und auf mögliche Abschwächer und Hinweise auf Abschwächung oder Antiterminationsregulation gefiltert. Die Anzahl dieser vorhergesagten Abschwächer pro intergener Region wird mit der Anzahl der intergenen Regionen im Genom verglichen. Im Gegensatz zu Falten von zufällig gemischten Sequenzen ist die stärkste Bestimmung für die Häufigkeit der Abschwächung die Genomgröße (Anzahl der intergenen Regionen und Genomgröße sind stark korreliert). Farben und Beschriftung sind die gleichen wie in 5a.

Selbst unter Berücksichtigung des GC-Gehalts von M. tuberculosis weist es im Vergleich zu den anderen Genomen mit hohem GC-Gehalt eine verringerte Anzahl vorhergesagter Abschwächer auf (Abbildung 5b). Tatsächlich zeigt Abbildung 5b (vorhergesagte Abschwächer tatsächlicher intergener Sequenzen), dass die stärkste Bestimmung der Anzahl der vorhergesagten Abschwächer pro intergener Region nicht der GC-Gehalt ist, sondern die Genomgröße (genauer gesagt die Anzahl der intergenen Regionen). Im Allgemeinen haben größere Genome nicht nur eine größere absolute Anzahl vorhergesagter Abschwächer, sondern auch ein größeres Auftreten vorhergesagter Abschwächer pro Region. Wenn der GC-Gehalt in zwei Genomen gleich ist, weist das größere Genom mit größerer Wahrscheinlichkeit eine höhere Anzahl vorhergesagter Abschwächer pro intergener Region auf. Frühere Berichte haben ähnliche Phänomene in regulatorischen Proteinen vorgeschlagen, große Genome scheinen einen größeren Anteil ihrer Gesamtzahl von Genen zu haben, die für Proteine kodieren, die regulatorische Motive enthalten . Interessanterweise scheint ein Genom von etwa 1500 intergenen Regionen die Schwelle zu sein, an der die Häufigkeit regulatorischer Attenuatoren in einem Genom zunimmt, wenn man die Archaebakterien und die Genome mit hohem GC-Gehalt unberücksichtigt lässt.

Verteilung und Konservierung von Attenuatoren in grampositiven Bakterien

Sieben Genome grampositiver Bakterien (B. subtilis, B. halodurans, L. innocua, S. aureus, C. acetobutylicum, L. lactis und S. pneumoniae) wurden analysiert, um festzustellen, ob die Attenuierungsabbrecher vor den Orthologen konserviert sind. Die Anzahl der vorhergesagten Abschwächungsterminatoren für die Gene, von denen bekannt ist, dass sie in B. subtilis reguliert werden, und ihre Orthologen in den anderen sechs Genomen sind in Tabelle 4 aufgeführt. Die Genome werden nach phylogenetischem Abstand von B. subtilis sortiert, berechnet durch Aminosäuresequenzen der gemeinsamen Orthologen unter diesen Genomen. Die nächstgelegene zu B. subtilis ist B. halodurans und die gemittelte Anzahl von Aminosäuresubstitutionen pro Stelle beträgt 0,238, und die am weitesten entfernte ist S. pneumoniae und die gemittelte Anzahl von Aminosäuresubstitutionen pro Stelle beträgt 0,422. Für die 42 in Tabelle 4 aufgeführten Gene variiert die Anzahl der Orthologen, die in den anderen Genomen gefunden werden, von Genom zu Genom wenig: Die höchste und die niedrigste Anzahl von Orthologen sind 31 in L. lactis und 26 in S. aureus und C. acetobutylicum, beziehungsweise. Dies liegt hauptsächlich daran, dass diese 42 Gene einige grundlegende Funktionen wie die Aminoacyl-tRNA-Synthese tragen. Auf der anderen Seite variieren die Zahlen der vorhergesagten Dämpfungsabschlussstrukturen signifikant: In B. halodurane, 22 orthologe Gene haben Attenuierungsabbruchstrukturen vorhergesagt, während nur 4 orthologe Gene die vorhergesagten Strukturen in S. pneumoniae aufweisen. Dies deutet darauf hin, dass das Fehlen oder Vorhandensein einer Regulation durch Abschwächung viel schwächer konserviert ist als das Vorhandensein des Gens oder der Operonen.

Tabelle 4 Liste der bekannten Dämpfungsglieder in B. subtilis im Vergleich zu Vorhersagen in sechs anderen Genomen grampositiver Bakterien

Der gleiche Trend gilt für die vorhergesagten Abschwächungsabbruchstrukturen, die nicht bekannt sind (Tabelle 5). Es gibt 105 orthologe Gengruppen, die mindestens ein anderes Genom aufweisen, das eine vorhergesagte Dämpfungsstruktur und ein orthologes Gen enthält. Beschränkung auf die Orthologen, die Dämpfungsglieder in B vorhergesagt haben. subtilis (35 Gruppen), die höchste und die niedrigste Anzahl von gemeinsamen Orthologen von Genen, von denen bekannt ist, dass sie durch Attenuierung oder Antiterminierung in B. subtilis reguliert werden, sind 28 (L. innocua) bzw. 18 (S. pneumoniae). Die Anzahl der vorhergesagten Dämpfungsabschlussstrukturen variiert jedoch stärker. Während es 13 Gene mit vorhergesagten Strukturen in B. halodurans gibt, der Art, die B. subtilis unter den sechs grampositiven Bakterien am nächsten kommt, haben nur 2 Gene Strukturen in S. pneumoniae vorhergesagt.

Tabelle 5 Liste aller orthologen Gene in den sechs grampositiven Bakteriengenomen, in denen zwei oder mehr Genome vorhergesagte Abschwächer teilen

Obwohl die Abschwächer insgesamt nur schwach konserviert sind, bleiben die vorhergesagten Abschwächungsabschlussstrukturen und die Reihenfolge ihrer nachgelagerten Gene erhalten für einige Gruppen von Genen. Ein solches Beispiel ist infC-rpml-rplT Operon (Abbildung 6a). In der stromaufwärts gelegenen Region von infC in S. pneumoniae wird keine Dämpfungsabbruchstruktur vorhergesagt (Tabelle 5). Ein genauerer Blick auf diese Region durch EXPLOSION ergab, dass das N-Terminal von infC in 27 Basen übertroffen wird. Durch Zugabe der 27 Basen zur intergenen Region im Upstream fanden wir eine stabile Stem-Loop-Struktur, gefolgt von Poly-U-Resten auch in S. pneumoniae (Abbildung 6b). Selbst in diesem Beispiel gibt es jedoch erhebliche Unterschiede zwischen den Arten in der relativen Position der Stammschleifenstrukturen und der Sequenzerhaltung. Darüber hinaus sogar zwischen dem phylogenetisch nächstgelegenen Paar, B. subtilis und B. halodurans, die Abstände vom Ende des Stammes zum Startcodon von infC sind 69 bzw. 37 Basen, und nur die im Stamm gefundenen gemeinsamen Segmente sind GUGUGGGN {x} CCCACAC (x = 12 in B. subtilis und x = 9 in B. halodurans). Unter allen sieben Genomen gibt es nur eine schwache Ähnlichkeit, GYGGG (GACGG in C. acetobutylicum) in der Stammregion.

Abbildung 6
Abbildung 6

Vorhergesagte Dämpfungsabschlussstruktur im stromaufwärtigen Bereich des mutmaßlichen infC-rpmI-rplT-Operons. (a) Reihenfolge der Gene. Nur intergene Regionen sind maßstabsgetreu gezeichnet und die Länge der intergenen Regionen ist unterhalb der Linie angegeben. Orthologe Gene sind in den gleichen Farben angezeigt. Hypothetische Gene und die anderen nicht orthologen Gene werden durch „hyp“ bzw. ihre Gen-IDs angezeigt. Abkürzung für Genome: Bs, B. subtilis; Bh, B. halodurans; Li, Listeria innocua; Sa, Staphylococcus aureus; Ca, Clostridium acetobutylicum; Ll, Lactococcus lactis; Sp, Streptococcus pneumoniae. (b) Vorhergesagte Dämpfungsabschlussstrukturen. Basenpaare werden durch rote Punkte zwischen den Basiscodes angezeigt. Die Basisnummerierung zeigt die Entfernung vom Startcodon des Downstream-Gens. Poly-Us nur stromabwärts der Stem-Loop-Struktur ist grün gefärbt. Schwach konservierte Segmente sind rot gefärbt. Abkürzung für Genome ist die gleiche wie in (a).

Die Erhaltung der vorhergesagten Abschwächungsabbruchstrukturen wird auch in den stromaufwärts gelegenen Regionen des möglichen Operons beobachtet, das das nusA-Gen enthält (Abbildung 7a). Vier von sieben Genomen enthalten vorhergesagte Abschwächerstrukturen vor dem hypothetischen Protein (ylxS in B. subtilis). Stammschleifenstrukturen finden sich auch im Rest von drei Genomen, obwohl diese Strukturen die Filter nicht passieren. Die Lage der Strukturen zur Transkriptionsstartstelle des Downstream-Gens und die Sequenzen selbst variieren auch in diesem Beispiel signifikant. In diesen Stammsequenzen ist das Segment GUGGG (GAGCG in L. lactis und GAGGC in S. pneumoniae) im vorhergesagten Operon enthaltenden nusA-Gen konserviert (Abbildung 7b). Interessanterweise sind die 5-Basissegmente identisch oder sehr ähnlich zu den Segmenten in den Stammschleifenstrukturen, die sich stromaufwärts von infC befinden (Abbildung 6b). Die Proteine, die die Gene in diesen beiden Operonen kodieren, sind an der Transkription beteiligt. Die Erhaltung der Sequenzsegmente in den vorhergesagten Dämpfungsabschlussstrukturen für das infC-rpmI-rplT-Operon und das Operon, das nusA enthält, impliziert, dass es einen gemeinsamen Regulationsmechanismus gibt, der die Stammschleifenstruktur erkennt, und dies würde beide Operone auf die gleiche Weise regulieren.

Abbildung 7
Abbildung 7

Vorhergesagte Dämpfungsabschlussstruktur in der stromaufwärts gelegenen Region des ylxS-Gens. (a) Reihenfolge der Gene. Vorhergesagte Stammschleifenstrukturen mit statistischer Signifikanz sind blau und die anderen Strukturen, die weder die Filter passieren noch eine geringere Signifikanz haben, rot dargestellt. Für die andere Erklärung siehe Legende zu Abbildung 6a. (b) Vorhergesagte Dämpfungsabschlussstrukturen. Siehe Legende zu Abbildung 6b für die Erklärung.

Verteilung und Konservierung von Attenuatoren in Proteobakterien

Mehrere Aspekte der Konservierung von Attenuatoren sind aus unserer Analyse von grampositiven Bakterien sofort ersichtlich . Erstens ist die Verteilung der Abschwächungs- oder Antiterminierungsregulation über grampositive Bazerien hinweg nicht gut konserviert, und selbst in konservierten Regulationssystemen ist die Sequenz- und Strukturerhaltung schwach. Gleiches gilt für Proteobakterien. Von den 14 Genen in E. coli (siehe Tabelle 5a), von denen bekannt ist, dass sie durch Attenuation oder Antitermination reguliert werden, haben keine Attenuatoren oder Upstream-Orthologen in allen vier anderen Proteobakterien-Genomen. Sechs haben Abschwächer, die Orthologen in mindestens einem der anderen vier Genome vorausgesagt haben. Drei sind Gene, die Orthologe in allen vier anderen Genomen haben, aber diese haben keine vorhergesagten Abschwächer. Die verbleibenden fünf Gene in E. coli haben entweder keine bekannten Orthologen im anderen Genom oder Orthologen haben eine fleckige Verteilung und keine vorhergesagten Abschwächer. Eine genauere Betrachtung von Hand bestätigt diese Schlussfolgerung. Tabelle 5b ist eine Liste aller vorhergesagten Abschwächer in jedem der fünf Genome der Gamma-Division von Proteobakterien, in denen ein ähnlicher Abschwächer für ein Ortholog eines anderen Genoms vorhergesagt wird. Wie in dieser Tabelle gezeigt, scheint Attenuation und Antitermination als Regulationsmechanismus in analogen Operonen in proteobakteriellen Genomen schlecht konserviert zu sein. Von den insgesamt 475 Genen und ihren Orthologen in diesen fünf Genomen, die Attenuatoren vorhergesagt haben, werden nur 36 stromaufwärts gelegene Orthologen von zwei oder mehr Genomen geteilt (Tabellen 3, 5a und 5b).

Tabelle 5a Liste bekannter Dämpfungsglieder in E. coli im Vergleich zu Vorhersagen in vier anderen Genomen von Proteobakterien (Gamma-Unterteilung)
Tabelle 5b Liste aller orthologen Gene in den fünf Proteobakterien (Gamma-Unterteilung) Genomen, in denen zwei oder mehr Genome vorhergesagte Abschwächer teilen

Frühere Forschungen zu spezifischen Systemen haben berichtet, dass die Abschwächung und Antiterminierungsregulation in einigen Operonen in E. coli über Gamma-Proteobakterien nur geringfügig konserviert sind. Es wurde gezeigt, dass das Regulations-rpsJ-Operon und die trpE- und pheA-Operone von E. coli eine fleckige Verteilung aufweisen und schwach über Proteobakterien konserviert sind. Wie in den Tabellen 2, 5a und 5b gezeigt, konnten wir diese Analyse der Abschwächung und Antiterminierung auf die meisten derartigen Systeme in Proteobakterien ausweiten und haben gezeigt, dass dies für alle bekannten Abschwächungs- und Antiterminierungsregulationsmechanismen in E. coli und andere vorhergesagte Mechanismen in zusätzlichen Gamma-Division-Genomen gilt. Ein Beispiel ist in Abbildung 8 der niedrigen Sequenzerhaltung von Dämpfungsgliedern und Regelung gegeben. In Abbildung 8a ist einer der konservierteren Abschwächer für den des hisG-Operons gezeigt. Dieser Operon- und Regulationsmechanismus ist in E. coli gut charakterisiert und unsere Analyse prognostiziert ähnliche Mechanismen der Attenuierungsregulation in V. cholerae und H. influenzae. Die vorhergesagten Abschwächer haben eine konservierte Position (bei ungefähr 40-50 bp stromaufwärts Startcodon des hisG-Gens) und Stammsequenz. Obwohl die umgebenden intergenen Regionen nicht ausgerichtet werden können, V. cholerae und H. Influenzae haben mögliche Aminosäure-Leader-Sequenzen mit einem Histidin-Lauf, der für den Attenuierungsregulationsmechanismus in E. coli charakteristisch ist. Vorhergesagte Abschwächer wurden in den anderen drei Gamma-Unterteilungsprobakteriengenomen von P. aeruginosa, N. meningitidus und X. fastidiosa nicht gefunden. Bei P. aeruginosa ist die intergene Region stromaufwärts des hisG-ortholog nur 17 bp lang, bei X. fastidious überlappt sich das orthologe Gen mit dem ORF stromaufwärts, und obwohl die analoge N. meningitidus-intergene Region ausreichend lang ist, wird kein Abschwächer vorhergesagt.

Figure 8
figure8

Predicted attenuation termination structure in upstream region of HisG gene in E. coli. (a) Order of genes. Predicted stem-loop structures with statistical significance are indicated in blue. For the other explanation, see legend to figure 6a. Abbreviations for genomes: Ec, Escherichia coli; Hi, Haemophilus influenzae; Vc, Vibrio cholerae; Pa, Pseudomonas aeruginosa; Xf, Xylella fastidiosa; Nm, Neisseria meningitidis. (b) Vorhergesagte Dämpfungsabschlussstrukturen. Siehe Legende zu Abbildung 6b für die Erklärung.

Schreibe einen Kommentar

Deine E-Mail-Adresse wird nicht veröffentlicht.