Rysunek 5
a) sekwencje Międzygeniczne 26 genomów losowo tasowano, składano i filtrowano przy użyciu zgłoszonej metody w celu uzyskania domniemanych „tłumików”. Liczbę tych tasowanych i filtrowanych fałd na region międzygeniczny wykreślono dla każdego genomu w stosunku do liczby regionów międzygenicznych. Korelacja, jeśli jest losowa, powinna pozostać stała i niezależna od wielkości genomu. Niebieskie kule reprezentują gatunki proteobakterii i Bacillis w naszych badaniach, beżowe to archeabakteria, a pozostałe zielone. Sfery mają rozmiar proporcjonalny do zawartości GC genomu, a zawartość GC jest oznaczana w każdej sferze. Liczba losowych fałdów na region międzygeniczny jest funkcją zawartości GC, jakiej można oczekiwać od filtrowania fałdów z przebiegami Poli-U. Genomy ze znanym tłumieniem lub antytermizacją są oznaczane tak, jak znany jest Genom, który nie używa tłumików z przebiegami poly-U w terminacji. B) Międzygeniczne sekwencje 22 genomów zostały złożone i przefiltrowane w celu ewentualnego tłumienia i wskazania tłumienia lub regulacji antytermizacji. Liczbę tych przewidywanych tłumików na region międzygeniczny porównuje się z liczbą regionów międzygenicznych w genomie. W przeciwieństwie do fałdów losowo tasowanych sekwencji najsilniejszym determinantem częstotliwości tłumienia jest wielkość genomu (liczba regionów międzygenicznych i wielkość genomu są silnie skorelowane). Kolory i etykiety są takie same jak w 5a.
nawet biorąc pod uwagę zawartość GC w M. tuberculosis, ma zmniejszoną liczbę przewidywanych tłumików w stosunku do innych genomów o wysokiej GC (Fig.5b). W rzeczywistości, Fig. 5b (przewidywane tłumiki rzeczywistych sekwencji międzygenicznych) pokazuje, że najsilniejszym wyznacznikiem liczby przewidywanych tłumików na region międzygeniczny nie jest zawartość GC, ale raczej rozmiar genomu (dokładniej liczba regionów międzygenicznych). Ogólnie rzecz biorąc, nie tylko większe genomy mają większą bezwzględną liczbę przewidywanych tłumików, ale mają większe występowanie przewidywanych tłumików na region. Jeśli zawartość GC jest równa w dwóch genomach, większy Genom ma większą liczbę przewidywanych tłumików na region międzygeniczny. Wcześniejsze doniesienia sugerują podobne zjawiska w białkach regulatorowych, Duże genomy wydają się mieć większą część ich całkowitej liczby genów, które kodują białka, które zawierają motywy regulatorowe . Co ciekawe, pomijając archaebakterię i genomy o wysokiej zawartości GC, Genom około 1500 regionów międzygenicznych wydaje się być progiem, w którym zwiększa się częstotliwość tłumików regulacyjnych w genomie.
Dystrybucja i konserwacja tłumików w bakteriach Gram-dodatnich
przeanalizowano siedem genomów bakterii gram-dodatnich (B. subtilis, B. halodurans, L. innocua, S. aureus, C. acetobutylicum, L. lactis i S. pneumoniae), aby sprawdzić, czy terminatory tłumienia są zachowane przed ortologami. Liczba przewidywanych Terminatorów atenuacji dla genów, o których wiadomo, że są regulowane w B. subtilis i ich ortologach w pozostałych sześciu genomach, jest wymieniona w tabeli 4. Genomy są sortowane według odległości filogenetycznej od B. subtilis obliczonej na podstawie sekwencji aminokwasowych wspólnych ortologów między tymi genomami. Najbliżej B. subtilis jest B. halodurans i uśredniona liczba podstawień aminokwasów w miejscu wynosi 0,238, a najbardziej odległa jest S. pneumoniae i uśredniona liczba podstawień aminokwasów w miejscu wynosi 0,422. W przypadku 42 genów wymienionych w tabeli 4 liczba ortologów występujących w innych genomach różni się niewiele w zależności od genomu: najwyższa i najniższa liczba ortologów wynosi odpowiednio 31 W L. lactis i 26 W S. aureus i C. acetobutylicum. Dzieje się tak głównie dlatego, że te 42 geny pełnią pewne podstawowe funkcje, takie jak synteza aminoacylo-tRNA. Z drugiej strony, liczby przewidywanych struktur zakończenia tłumienia znacznie się różnią: W B. halodurany, 22 geny ortologiczne mają przewidywane struktury zakończenia atenuacji, podczas gdy tylko 4 geny ortologiczne mają przewidywane struktury U S. pneumoniae. Oznacza to, że brak lub obecność regulacji przez tłumienie jest znacznie słabiej zachowana niż obecność genu lub operonów.
Tabela 4 Lista znanych tłumików w B. subtilis w porównaniu z przewidywaniami w sześciu innych genomach bakterii gram-dodatnich
ten sam trend utrzymuje się dla przewidywanych struktur zakończenia tłumienia innych niż znane (Tabela 5). Istnieje 105 grup genów ortologicznych, które mają co najmniej jeden inny Genom zawierający przewidywaną strukturę tłumiącą przed genem ortologicznym. Ograniczając się do ortologów, które przewidywały tłumiki w B. subtilis (35 grup), najwyższa i najniższa liczba wspólnych ortologów genów, o których wiadomo, że są regulowane przez atenuację lub antytermizację u B. subtilis to odpowiednio 28 (L. innocua) i 18 (S. pneumoniae). Liczby przewidywanych struktur zakończenia tłumienia różnią się jednak bardziej. Chociaż istnieje 13 genów o przewidywanych strukturach w B. halodurans, który jest gatunkiem najbliższym B. subtilis wśród sześciu bakterii gram-dodatnich, tylko 2 geny mają przewidywane struktury w S. pneumoniae.
Tabela 5 Lista wszystkich ortologicznych genów w sześciu genomach bakterii gram-dodatnich, w których dwa lub więcej genomów ma przewidywane tłumiki
Chociaż istnieje słaba ochrona tłumików jako całości, przewidywane struktury zakończenia tłumienia i kolejność ich występowania dalsze geny są zachowane dla niektórych grup genów. Jednym z takich przykładów jest OPERON infC-rpml-rplt (rys. 6a). Nie przewiduje się struktury zakończenia tłumienia w górnym regionie infC w S. pneumoniae (Tabela 5). Bliższe przyjrzenie się temu regionowi przez wybuch ujawniło, że N-terminal infC jest ponadprzeciętny w 27 bazach. Dodając 27 zasad do regionu międzygenicznego w górnym biegu, odkryliśmy stabilną strukturę pętli macierzystej, po której nastąpiły pozostałości Poli-U również w S. pneumoniae(Fig. 6b). Jednak nawet w tym przykładzie istnieją znaczne różnice między gatunkami we względnym położeniu struktur pnia-pętli i zachowaniu sekwencji. Ponadto nawet między filogenetycznie najbliższą parą B. subtilis I B. halodurany, odległości od końca łodygi do początkowego kodonu infC wynoszą odpowiednio 69 i 37 zasad, a jedynie wspólne segmenty występujące w łodydze to GUGUGGN{X}CCCACAC (x = 12 U B. subtilis i x = 9 U B. halodurans). Wśród wszystkich siedmiu genomów istnieje tylko słabe podobieństwo, GYGGG (gacgg w C. acetobutylicum) w regionie macierzystym.
Rysunek 6
przewidywana struktura zakończenia tłumienia w regionie wyjściowym domniemanego infC-rpmi-rplt operon. a) kolejność genów. Tylko regiony międzygeniczne są rysowane w skali, a długość regionów międzygenicznych podano poniżej linii. Geny ortologiczne są oznaczone w tych samych kolorach. Hipotetyczne geny i inne nieortologiczne geny są oznaczone odpowiednio przez ” hyp ” i ich identyfikatory genowe. Skrót dla genomów: Bs, B. subtilis; Bh, B. halodurans; Li, Listeria innocua; Sa, Staphylococcus aureus; Ca, Clostridium acetobutylicum; Ll, Lactococcus lactis; Sp, Streptococcus pneumoniae. b) przewidywane struktury zakończenia tłumienia. Pary zasad są oznaczone czerwonymi kropkami między kodami zasad. Numeracja bazowa pokazuje odległość od kodonu początkowego genu down stream. Poly – us po prostu w dół strumienia macierzystych pętli struktury jest zabarwiony na Zielono. Słabo zachowane segmenty są zabarwione na Czerwono. Skrót dla genomów jest taki sam jak w (a).
zachowanie przewidywanych struktur zakończenia tłumienia obserwuje się również w regionach poprzedzających możliwy Gen Nusa zawierający operon (Fig.7a). Cztery z siedmiu genomów zawierają przewidywane struktury tłumiące przed hipotetycznym białkiem (ylxS w B. subtilis). Struktury Stem-loop znajdują się również w pozostałych trzech genomach, chociaż struktury te nie przechodzą przez filtry. Lokalizacja struktur do miejsca rozpoczęcia transkrypcji w dolnym biegu genu i same sekwencje różnią się znacznie również w tym przykładzie. W tych sekwencjach macierzystych segment GUGGG (GAGCG u L. lactis i gaggc U S. pneumoniae) jest zachowany w przewidywanym Genie operon zawierającym Nusa (Fig. 7b). Co ciekawe, segmenty 5-bazowe są identyczne lub bardzo podobne do segmentów w strukturach pętli macierzystej znajdujących się przed infC (rysunek 6b). Białka kodujące geny w tych dwóch operonach biorą udział w transkrypcji. Zachowanie segmentów sekwencji w przewidywanych strukturach terminatora tłumienia dla Operonu infC-rpmi-rplt i Operonu zawierającego nusA oznacza, że istnieje wspólny mechanizm regulacyjny, który rozpoznaje strukturę pętli macierzystej i reguluje oba operony w ten sam sposób.
Rysunek 7
przewidywana struktura zakończenia tłumienia w górnym regionie genu ylxS. a) kolejność genów. Przewidywane struktury pętli macierzystej o znaczeniu statystycznym są oznaczone kolorem niebieskim, a inne struktury, które nie przechodzą przez filtry ani nie mają mniej znaczenia, są oznaczone kolorem czerwonym. Aby uzyskać inne wyjaśnienie, patrz legenda do fig. 6a. (b) przewidywane struktury zakończenia tłumienia. Zobacz legendę na rysunku 6b dla wyjaśnienia.
Dystrybucja i konserwacja tłumików w Proteobakteriach
z naszej analizy bakterii gram-dodatnich od razu widać kilka aspektów ochrony tłumików . Po pierwsze, rozkład regulacji tłumienia lub antytermizacji nie jest dobrze zachowany przez Gram-postive baceria, a dodatkowo, nawet w zachowanych systemach regulacyjnych, zachowanie sekwencji i struktury jest słabe. To samo dotyczy proteobakterii. Spośród 14 genów w E. coli (patrz tabela 5a), o których wiadomo, że są regulowane przez tłumienie lub antytermizację, żadna z nich nie ma atenuatorów przewidywanych w ortologach wcześniejszych we wszystkich czterech innych genomach proteobakterii. Sześć z nich ma atenuatory przewidywane w co najmniej jednym z pozostałych czterech genomów. Trzy to geny, które mają ortolog we wszystkich czterech innych genomach, ale te nie mają przewidywanych tłumików. Pozostałe pięć genów E. coli nie ma znanych ortologów w innym genomie lub ortologowie mają plamisty rozkład i brak przewidywanych tłumików. Bliższa Kontrola ręczna potwierdza ten wniosek. Tabela 5b zawiera listę wszystkich przewidywanych tłumików w każdym z pięciu genomów podziału gamma proteobakterii, w których przewidywany jest podobny Tłumik dla ortologu innego genomu. Jak pokazano w tej tabeli, tłumienie i antytermizacja wydają się być słabo zachowane jako mechanizm regulacji w analogicznych operonach w genomach proteobakteryjnych. Spośród 475 genów i ich ortologów w tych pięciu genomach, które przewidywały atenuatory, tylko 36 jest współdzielonych ortologami dwóch lub więcej genomów (tabele 3, 5A i 5b).
tabela 5a lista znanych tłumików w E. coli w porównaniu z przewidywaniami w czterech innych genomach proteobakterii (podział gamma)
tabela 5b wykaz wszystkich genów ortologicznych w pięciu genomach proteobakterii (podział gamma), w których dwa lub więcej genomów ma przewidywane tłumiki
>
poprzednie badania dotyczące specyficznych systemów donoszą, że tłumienie i regulacja przeciwgrzybicza w niektórych operonach E. coli są tylko nieznacznie zachowane w proteobakteriach podziałów gamma. Wykazano, że regulacyjny OPERON rpsJ oraz OPERON trpE i pheA E. coli mają plamistą dystrybucję i są słabo zachowane w proteobakteriach. Jak pokazano w tabelach 2, 5a i 5b, byliśmy w stanie szeroko rozszerzyć tę analizę tłumienia i antytermizacji na większość takich układów w proteobakteriach i wykazaliśmy, że dotyczy to wszystkich znanych mechanizmów regulacyjnych tłumienia i antytermizacji w E. coli i innych przewidywanych mechanizmach w dodatkowych genomach podziału gamma. Przykład podano na fig. 8 zachowania niskiej sekwencji tłumików i regulacji. Na fig. 8a pokazano jeden z bardziej zachowanych tłumików dla Operonu hisG. Ten OPERON i mechanizm regulacyjny jest dobrze scharakteryzowany u E. coli, a nasza analiza przewiduje podobne mechanizmy regulacji tłumienia u V. cholerae i H. influenzae. Przewidywane tłumiki mają zachowaną pozycję (przy około 40-50 bp kodonu początkowego genu hisG) i sekwencję macierzystą. Chociaż okoliczne regiony międzygeniczne nie są możliwe do wyrównania, V. cholerae i H. influenzae mają możliwe sekwencje przywódcze aminokwasów z przebiegiem histydyn, co jest charakterystyczne dla mechanizmu regulacji tłumienia u E. coli. Przewidywane tłumiki nie zostały znalezione w pozostałych trzech genomach probacterii podziału gamma P. aeruginosa, N. meningitidus i X. fastidiosa. U P. aeruginosa region międzygeniczny przed ortologiem hisG ma tylko 17 bp długości, U X. fastidious Gen ortologiczny pokrywa się z ORF przed ORF i chociaż analogiczny region międzygeniczny N. meningitidus ma wystarczającą długość, nie przewiduje się żadnego tłumika.
Figure 8
Predicted attenuation termination structure in upstream region of HisG gene in E. coli. (a) Order of genes. Predicted stem-loop structures with statistical significance are indicated in blue. For the other explanation, see legend to figure 6a. Abbreviations for genomes: Ec, Escherichia coli; Hi, Haemophilus influenzae; Vc, Vibrio cholerae; Pa, Pseudomonas aeruginosa; Xf, Xylella fastidiosa; Nm, Neisseria meningitidis. b) przewidywane struktury zakończenia tłumienia. Zobacz legendę na rysunku 6b dla wyjaśnienia.