Maybaygiare.org

Blog Network

Identification of attenuation and antitermination regulation in prokariotes

charakterystyka tłumików u B. subtilis i E. coli

przeprowadzono obszerne poszukiwania w literaturze operonów u B. subtilis regulowanych przez attenuację lub antiterminację i znaleziono 46 takich operonów. Zakres ten obejmuje zarówno dobrze opisany eksperymentalnie OPERON trp, jak i te, w których znaleziono struktury Terminatorów i oczekuje się tłumienia, choć nie jest to dobrze scharakteryzowane eksperymentalnie (pełna lista znajduje się w http://www.bork.embl-heidelberg.de/Docu/attenuation). Te 46 znanych struktur Terminatorów wykorzystano do określenia wspólnych cech Terminatorów tłumienia B. subtilis. Korzystając z tych cech, przebadaliśmy regiony wyjściowe 3650 genów B. subtilis (stosując procedury opisane w materiałach i metodach) pod kątem fałd terminatorowych. 43 Z 46 znanych Terminatorów znalezionych w literaturze zostało zachowanych w tej projekcji. Dodatkowe 1117 fałdy upstream, które spełniają nasze kryteria zostały również uzyskane. Dodatkowo, jako kontrolkę, zastosowaliśmy tę samą metodologię filtrowania i fałdowania na obszarach międzygenicznych po losowym tasowaniu sekwencji (po filtrowaniu uzyskano 952 fałdy losowo tasowanych sekwencji).

otrzymane fałdy wszystkich regionów międzygenicznych i sekwencji tasowanych uzyskane po filtrowaniu zostały wykreślone pod względem ich stabilności i długości (ryc. 1). Znane fałdy terminatora leżą w klastrze wyraźnie oddzielonym i odrębnym od tych fałd losowo tasowanych sekwencji. Fałdy terminatora mają mniejszą energię swobodną (ΔG) w stosunku do długości niż przewidywane fałdy sekwencji losowych. Podobny wzór dwóch łatwo oddzielonych klastrów pojawia się podczas porównywania znanych struktur terminatora ze złożonymi regionami wewnątrzgenicznymi, w których terminatora nie można znaleźć (DANE Nie pokazane).

Rysunek 1
rysunek 1

rozkład stabilności i długości struktur pętli macierzystej w segmentach sekwencji B. subtilis. Czerwona linia pokazuje największą wariancję (patrz materiały i metody) pochodzącą ze struktur pętli macierzystej w sekwencjach tasowanych. Jasnoniebieskie linie podają pomiary znaczenia na podstawie odchylenia standardowego. Definicja każdego punktu wraz z orientacją sąsiednich genów są pokazane w prawym górnym panelu.

wykorzystując analizę głównych składowych, określiliśmy największą wariancję losowych sekwencji. Może to dać nam miarę (przy użyciu odchylenia standardowego), której fałdy znacznie różnią się od fałd sekwencji losowych (patrz materiały i metody). Spośród 1160 fałd, w sumie 203 fałdy regionów międzygenicznych uzyskane na naszym ekranie spadają poniżej 2. linii odchylenia (z ≤ -2) pochodzącej z głównego składnika. Są one zatem uważane za znacząco różniące się od przypadkowych fałd i możliwych miejsc zakończenia tłumienia lub regulacji przeciwoblodzeniowej. Czterdzieści dwa z nich to znane fałdy Terminatorów tłumienia (z oryginalnych 43 znanych fałd utrzymywanych po filtrowaniu). W ten sposób jesteśmy w stanie uzyskać 91,3% (42/46) znanych i eksperymentalnie scharakteryzowanych miejsc tłumienia i antytermizacji za pomocą naszego filtra i pomiaru znaczenia. Dodatkowo filtr i miara istotności odsłania ponad 97,7% (930 z 952) fałdów losowych sekwencji. Sto sześćdziesiąt jeden (łącznie 203 z wyłączeniem 42 znanych) fałd pod linią (z ≤ -2) są fałdami, które nie zostały jeszcze zbadane doświadczalnie i można przewidzieć, że będą strukturami terminatora tłumienia.

szczegółowe badanie wykazało, że wiele z tych prognoz jest silnie wspieranych jako przypuszczalne miejsca tłumienia lub antytermizacji przez kontekst genomowy, taki jak obecność domniemanych sekwencji promotorów, lokalizacja przed nimi domniemanych i znanych operonów itp. Dwie struktury terminatorowe genów ydbj i yqhI służą jako szczegółowe przykłady tego, w jaki sposób kontekst genomowy może informować i silnie wspierać przewidywania przedstawione w tabeli 1 (Rysunek 2). Gen ydbJ B. subtilis jest wymieniony jako hipotetyczny z homologią do genu transportera ABC (białka wiążącego ATP biorącego udział w transporcie miedzi). Gen bezpośrednio w dół, ydbK, ma homologię do przepuszczania błon. Używając STRING (narzędzie do wyszukiwania powtarzających się przypadków sąsiednich genów ), ortologi tych dwóch genów znajdują się również w tej samej kolejności w jednostkach transkrypcyjnych 15 innych odlegle spokrewnionych genomów, co sugeruje możliwość, że te geny tworzą operon. Geny te wydają się być w typowej konfiguracji ABC transportera operon i kilka ABC transportera OPERON są znane być regulowane przez tłumienie w B. subtilis. Region ydbj upstream ma również przypuszczalną sekwencję promotora, a przewidywane fałdy przy użyciu RNAfold (Patrz materiały i metody) całej sekwencji upstream sugerują, że może on składać się w złożone możliwe fałdy antytermiczne (dane nie pokazane). Na podstawie tego kontekstu przewidujemy, że jest to OPERON transportowy ABC regulowany przez tłumienie. Drugi przykład, yqhI, jest pierwszym genem z serii trzech genów, wszystkie posiadające homologię do genów biosyntezy glicyny w domniemanej jednostce transkrypcyjnej. Ten bieg trzech genów ma również ortologów znalezionych jako sąsiedzi w innych genomach . Wiele aminokwasowych operonów biosyntezy u B. subtilis jest wiadomo, że są regulowane przez tłumienie, wspierając w ten sposób tę prognozę.

Rysunek 2
figure2

schematyczny rysunek Sąsiedztwa i przewidywanych struktur dla genów B. subtilis ydbJ i yqhI. Geny oznaczane są kolorowymi strzałkami i znajdują się w orientacji transkrypcji w stosunku do orientacji genu referencyjnego (ydbJ lub yqhI). Large blue stem – loop cartoons oznacza przewidywane zagięcie terminatora w tłumieniu, „t”jest standardowym zagięciem terminatora. Regiony międzygeniczne są rysowane w skali, A długości bp są podane pod rysunkiem.

Tabela 1 przewidywane tłumiki w genomie B. subtilis

aby sprawdzić, czy obserwowane wzorce dotyczą jedynego innego genomu, w którym tłumienie lub przeciwgrzybianie jest dobrze zbadane i eksperymentalnie opisane, zastosowaliśmy tę samą metodologię do regionów genów w genomie E. coli, dla których opisano 16 operonów jako regulowanych przez tłumienie lub przeciwgrzybianie. Jak widać na fig. 3, znane struktury terminatora tłumienia E. coli i antytermizacji mają podobne właściwości jak w przypadku B. subtilis. Po filtrowaniu zachowało się 15 z 16 znanych tłumików. Miara znaczenia oddziela 14 tych Terminatorów E. coli od przypadkowych fałd, jak pokazano na fig. 3. Podobnie jak w B. subtilis, używając linii (z≤-2) jako miary znaczenia, jesteśmy w stanie przewidzieć tłumienie dla 146 regionów (Rysunek 3 I Tabela 2).

ryc. 3
rys. 3

rozkład stabilności i długości struktur pętli macierzystej w segmentach sekwencji wyjściowej w E. coli. Czerwona linia pokazuje największą wariancję (patrz materiały i metody) pochodzącą ze struktur pętli macierzystej w sekwencjach tasowanych. Jasnoniebieskie linie podają pomiary znaczenia na podstawie odchylenia standardowego. Definicja każdego punktu wraz z orientacją sąsiednich genów są pokazane w prawym górnym panelu.

Tabela 2 przewidywane tłumiki w genomie E. coli

rozszerzenie z analizy do 26 genomów

analiza B. subtilis i E. coli sugerują, że szersze badanie genomów bakteryjnych może okazać się przydatne zarówno w przewidywaniu tłumienia i regulacji antytermizacji w tych genomach, jak i w charakteryzowaniu ewolucji i dystrybucji tych mechanizmów regulacji. Do tego badania wybrano dwadzieścia cztery kompletne genomy w oparciu o ich szerokie rozmieszczenie w spektrum ewolucyjnym (Tabela 3). Regiony międzygeniczne każdego z tych genomów analizowano przy użyciu tych samych metod i filtrów, co w przypadku B. subtilis i E. coli i przewidywane tłumienie i antytermizacja terminator fałdy podobnie uzyskane.

Tabela 3 Wykaz wszystkich 26 genomów badanych w tym badaniu

jak pokazano w tabeli 3, Istnieje szeroki rozkład liczby przypuszczalnych miejsc regulacyjnych w zakresie tłumienia i antytermizacji w badanych genomach. Te wahają się od 5 W Mycobacterium tuberculosis do 275 W Clostridium acetobutylicum (Tabela 3). Wcześniejsze próby przewidywania standardowych miejsc zakończenia transkrypcji na końcu jednostek transkrypcji dają podobne wyniki. Co ciekawe, wyniki dla standardowych Terminatorów transkrypcji korelują z naszymi. Jak stwierdzono w Ermolaeva et. al ze standardowymi terminatorami na końcu jednostek transkrypcyjnych (ten artykuł badał terminatory na końcu ORFs i nie celował w regiony wyjściowe, filtrując w ten sposób możliwe tłumiki), niektóre z najwyższych przypadków miejsc tłumienia i antytermizacji w naszym badaniu znajdują się podobnie w genomach E. coli, H. influenze, D. radioduranów I B. subtilis oraz najniższą liczbę wystąpień w takich genomach jak H. pylori i M. tuberculosis (genomy zgłoszone w ich badaniach).

na pierwszy rzut oka wydaje się to sugerować, że wiele genomów nie wykorzystuje tych samych mechanizmów zakończenia dla standardowego zakończenia transkrypcji i nie stosuje tłumienia ani antytermizacji w regulacji. Jest to prawdopodobne w przypadku niektórych genomów. Jednak, jeśli liczba regionów międzygenicznych w górę jest wykreślona w stosunku do liczby przewidywanych miejsc, silna dodatnia korelacja jest pokazana (Rysunek 4). Im mniejsza jest liczba genów i regionów międzygenicznych genomu, tym mniejsze jest występowanie przewidywanych Terminatorów (zarówno standardowych Terminatorów transkrypcyjnych, jak i Terminatorów regulatorowych atenuacji / antytermizacji). Oznacza to, że niska liczba zarówno standardowego zakończenia, jak i rozwiązania regulacyjnego w wielu genomach wynika ze znacznie zmniejszonego rozmiaru genomu i zmniejszenia liczby operonów regulacyjnych, a niekoniecznie z zależności od różnych mechanizmów zakończenia i regulacji.

Rysunek 4
figure4

wykres liczby regionów międzygenicznych vs.liczba przypuszczalnych miejsc tłumienia i antytermizacji we wszystkich 26 badanych genomach. Kilka genomów o znanym osłabieniu lub antytermizacji jest oznaczonych dla porównania, podobnie jak M. tuberculosis i Archaea. Linia przerywana jest wykładniczą linią trendu.

na fig. Ten Genom ma znacznie mniejsze występowanie przypuszczalnych miejsc tłumienia i antytermizacji, niż sugerowałby jego rozmiar i liczba regionów międzygenicznych. Najnowszy artykuł autorstwa Unniraman et al. wnioskuje, że M. tuberculosis wykorzystuje inny mechanizm terminacji, który wykorzystuje struktury terminatorowe bez ogona Poli-U niezbędne w innych genomach. Tak więc zmniejszoną liczbę struktur terminatorowych zawierających Poli-U w stosunku do liczby regionów międzygenicznych można wyjaśnić poleganiem M. tuberculosis na innym mechanizmie terminacji. Nie musi to świadczyć o tym, że u M. tuberculosis nie ma regulacji typu tłumienia lub przeciwgruźliczego. Jednak wskazuje to, że albo utrata standardowego mechanizmu terminacji w tym genomie zmniejszyła, jeśli nie wyeliminowała tłumienia lub antytermizacji w M. tuberculosis, albo alternatywnie, mechanizm podobny do tłumienia może istnieć w tym genomie, który wykorzystuje M. gruźlica Niestandardowy terminator.

wszystkie pozostałe z 25 badanych genomów mają przypuszczalne miejsca regulacji tłumienia lub antytermizacji. Nawet najniższa liczba przewidywanych miejsc tłumienia lub antytermizacji znalezionych w M. genitalium to znaczna część możliwych regulatorowych regionów międzygenicznych, niska liczba jest łatwo rozliczana przez stosunkowo niewielki rozmiar tego genomu i kilka regionów międzygenicznych i jednostek transkrypcyjnych. Wyniki te sugerują, że regulacja tłumienia i antytermizacji jest prawdopodobnie wszechobecnym mechanizmem regulacji u prokariotów z kilkoma wyjątkami.

Rozmiar i tłumienie genomu

Jeśli zawartość GC w genomie jest porównywana z liczbą przewidywanych tłumików w oparciu o losowo przetasowaną sekwencję, zawartość GC w pewnym stopniu koreluje z liczbą przewidywanych tłumików, czego można się spodziewać, ponieważ w filtrach wymagany jest bieg Poli-U. Na fig. 5a, fałdy z losowo tasowanych sekwencji międzygenicznych naszych 26 genomów zostały wykreślone przez liczbę przefiltrowanych fałd na region międzygeniczny w stosunku do liczby regionów międzygenicznych. Jeśli liczba przefiltrowanych fałd była całkowicie losowa, powinna istnieć względnie stała liczba miejsc na region w stosunku do liczby regionów. Jak widać na rysunku 5a, nie jest to całkowicie przypadek. Liczba przefiltrowanych fałd na region uzyskanych z losowo tasowanych sekwencji zależy od zawartości GC w genomie. Genomy o niskiej zawartości GC mają nieco wyższą liczbę fałd na region niż genomy do o około 50% zawartości GC, a genomy o wysokiej zawartości GC mają znacznie niższą liczbę niż oba. Jest to oczekiwane od losowych sekwencji filtrowanych dla struktur macierzystych-pętli zawierających przebiegi Poli-U.

Rysunek 5
rys. 5

a) sekwencje Międzygeniczne 26 genomów losowo tasowano, składano i filtrowano przy użyciu zgłoszonej metody w celu uzyskania domniemanych „tłumików”. Liczbę tych tasowanych i filtrowanych fałd na region międzygeniczny wykreślono dla każdego genomu w stosunku do liczby regionów międzygenicznych. Korelacja, jeśli jest losowa, powinna pozostać stała i niezależna od wielkości genomu. Niebieskie kule reprezentują gatunki proteobakterii i Bacillis w naszych badaniach, beżowe to archeabakteria, a pozostałe zielone. Sfery mają rozmiar proporcjonalny do zawartości GC genomu, a zawartość GC jest oznaczana w każdej sferze. Liczba losowych fałdów na region międzygeniczny jest funkcją zawartości GC, jakiej można oczekiwać od filtrowania fałdów z przebiegami Poli-U. Genomy ze znanym tłumieniem lub antytermizacją są oznaczane tak, jak znany jest Genom, który nie używa tłumików z przebiegami poly-U w terminacji. B) Międzygeniczne sekwencje 22 genomów zostały złożone i przefiltrowane w celu ewentualnego tłumienia i wskazania tłumienia lub regulacji antytermizacji. Liczbę tych przewidywanych tłumików na region międzygeniczny porównuje się z liczbą regionów międzygenicznych w genomie. W przeciwieństwie do fałdów losowo tasowanych sekwencji najsilniejszym determinantem częstotliwości tłumienia jest wielkość genomu (liczba regionów międzygenicznych i wielkość genomu są silnie skorelowane). Kolory i etykiety są takie same jak w 5a.

nawet biorąc pod uwagę zawartość GC w M. tuberculosis, ma zmniejszoną liczbę przewidywanych tłumików w stosunku do innych genomów o wysokiej GC (Fig.5b). W rzeczywistości, Fig. 5b (przewidywane tłumiki rzeczywistych sekwencji międzygenicznych) pokazuje, że najsilniejszym wyznacznikiem liczby przewidywanych tłumików na region międzygeniczny nie jest zawartość GC, ale raczej rozmiar genomu (dokładniej liczba regionów międzygenicznych). Ogólnie rzecz biorąc, nie tylko większe genomy mają większą bezwzględną liczbę przewidywanych tłumików, ale mają większe występowanie przewidywanych tłumików na region. Jeśli zawartość GC jest równa w dwóch genomach, większy Genom ma większą liczbę przewidywanych tłumików na region międzygeniczny. Wcześniejsze doniesienia sugerują podobne zjawiska w białkach regulatorowych, Duże genomy wydają się mieć większą część ich całkowitej liczby genów, które kodują białka, które zawierają motywy regulatorowe . Co ciekawe, pomijając archaebakterię i genomy o wysokiej zawartości GC, Genom około 1500 regionów międzygenicznych wydaje się być progiem, w którym zwiększa się częstotliwość tłumików regulacyjnych w genomie.

Dystrybucja i konserwacja tłumików w bakteriach Gram-dodatnich

przeanalizowano siedem genomów bakterii gram-dodatnich (B. subtilis, B. halodurans, L. innocua, S. aureus, C. acetobutylicum, L. lactis i S. pneumoniae), aby sprawdzić, czy terminatory tłumienia są zachowane przed ortologami. Liczba przewidywanych Terminatorów atenuacji dla genów, o których wiadomo, że są regulowane w B. subtilis i ich ortologach w pozostałych sześciu genomach, jest wymieniona w tabeli 4. Genomy są sortowane według odległości filogenetycznej od B. subtilis obliczonej na podstawie sekwencji aminokwasowych wspólnych ortologów między tymi genomami. Najbliżej B. subtilis jest B. halodurans i uśredniona liczba podstawień aminokwasów w miejscu wynosi 0,238, a najbardziej odległa jest S. pneumoniae i uśredniona liczba podstawień aminokwasów w miejscu wynosi 0,422. W przypadku 42 genów wymienionych w tabeli 4 liczba ortologów występujących w innych genomach różni się niewiele w zależności od genomu: najwyższa i najniższa liczba ortologów wynosi odpowiednio 31 W L. lactis i 26 W S. aureus i C. acetobutylicum. Dzieje się tak głównie dlatego, że te 42 geny pełnią pewne podstawowe funkcje, takie jak synteza aminoacylo-tRNA. Z drugiej strony, liczby przewidywanych struktur zakończenia tłumienia znacznie się różnią: W B. halodurany, 22 geny ortologiczne mają przewidywane struktury zakończenia atenuacji, podczas gdy tylko 4 geny ortologiczne mają przewidywane struktury U S. pneumoniae. Oznacza to, że brak lub obecność regulacji przez tłumienie jest znacznie słabiej zachowana niż obecność genu lub operonów.

Tabela 4 Lista znanych tłumików w B. subtilis w porównaniu z przewidywaniami w sześciu innych genomach bakterii gram-dodatnich

ten sam trend utrzymuje się dla przewidywanych struktur zakończenia tłumienia innych niż znane (Tabela 5). Istnieje 105 grup genów ortologicznych, które mają co najmniej jeden inny Genom zawierający przewidywaną strukturę tłumiącą przed genem ortologicznym. Ograniczając się do ortologów, które przewidywały tłumiki w B. subtilis (35 grup), najwyższa i najniższa liczba wspólnych ortologów genów, o których wiadomo, że są regulowane przez atenuację lub antytermizację u B. subtilis to odpowiednio 28 (L. innocua) i 18 (S. pneumoniae). Liczby przewidywanych struktur zakończenia tłumienia różnią się jednak bardziej. Chociaż istnieje 13 genów o przewidywanych strukturach w B. halodurans, który jest gatunkiem najbliższym B. subtilis wśród sześciu bakterii gram-dodatnich, tylko 2 geny mają przewidywane struktury w S. pneumoniae.

Tabela 5 Lista wszystkich ortologicznych genów w sześciu genomach bakterii gram-dodatnich, w których dwa lub więcej genomów ma przewidywane tłumiki

Chociaż istnieje słaba ochrona tłumików jako całości, przewidywane struktury zakończenia tłumienia i kolejność ich występowania dalsze geny są zachowane dla niektórych grup genów. Jednym z takich przykładów jest OPERON infC-rpml-rplt (rys. 6a). Nie przewiduje się struktury zakończenia tłumienia w górnym regionie infC w S. pneumoniae (Tabela 5). Bliższe przyjrzenie się temu regionowi przez wybuch ujawniło, że N-terminal infC jest ponadprzeciętny w 27 bazach. Dodając 27 zasad do regionu międzygenicznego w górnym biegu, odkryliśmy stabilną strukturę pętli macierzystej, po której nastąpiły pozostałości Poli-U również w S. pneumoniae(Fig. 6b). Jednak nawet w tym przykładzie istnieją znaczne różnice między gatunkami we względnym położeniu struktur pnia-pętli i zachowaniu sekwencji. Ponadto nawet między filogenetycznie najbliższą parą B. subtilis I B. halodurany, odległości od końca łodygi do początkowego kodonu infC wynoszą odpowiednio 69 i 37 zasad, a jedynie wspólne segmenty występujące w łodydze to GUGUGGN{X}CCCACAC (x = 12 U B. subtilis i x = 9 U B. halodurans). Wśród wszystkich siedmiu genomów istnieje tylko słabe podobieństwo, GYGGG (gacgg w C. acetobutylicum) w regionie macierzystym.

Rysunek 6
rys. 6

przewidywana struktura zakończenia tłumienia w regionie wyjściowym domniemanego infC-rpmi-rplt operon. a) kolejność genów. Tylko regiony międzygeniczne są rysowane w skali, a długość regionów międzygenicznych podano poniżej linii. Geny ortologiczne są oznaczone w tych samych kolorach. Hipotetyczne geny i inne nieortologiczne geny są oznaczone odpowiednio przez ” hyp ” i ich identyfikatory genowe. Skrót dla genomów: Bs, B. subtilis; Bh, B. halodurans; Li, Listeria innocua; Sa, Staphylococcus aureus; Ca, Clostridium acetobutylicum; Ll, Lactococcus lactis; Sp, Streptococcus pneumoniae. b) przewidywane struktury zakończenia tłumienia. Pary zasad są oznaczone czerwonymi kropkami między kodami zasad. Numeracja bazowa pokazuje odległość od kodonu początkowego genu down stream. Poly – us po prostu w dół strumienia macierzystych pętli struktury jest zabarwiony na Zielono. Słabo zachowane segmenty są zabarwione na Czerwono. Skrót dla genomów jest taki sam jak w (a).

zachowanie przewidywanych struktur zakończenia tłumienia obserwuje się również w regionach poprzedzających możliwy Gen Nusa zawierający operon (Fig.7a). Cztery z siedmiu genomów zawierają przewidywane struktury tłumiące przed hipotetycznym białkiem (ylxS w B. subtilis). Struktury Stem-loop znajdują się również w pozostałych trzech genomach, chociaż struktury te nie przechodzą przez filtry. Lokalizacja struktur do miejsca rozpoczęcia transkrypcji w dolnym biegu genu i same sekwencje różnią się znacznie również w tym przykładzie. W tych sekwencjach macierzystych segment GUGGG (GAGCG u L. lactis i gaggc U S. pneumoniae) jest zachowany w przewidywanym Genie operon zawierającym Nusa (Fig. 7b). Co ciekawe, segmenty 5-bazowe są identyczne lub bardzo podobne do segmentów w strukturach pętli macierzystej znajdujących się przed infC (rysunek 6b). Białka kodujące geny w tych dwóch operonach biorą udział w transkrypcji. Zachowanie segmentów sekwencji w przewidywanych strukturach terminatora tłumienia dla Operonu infC-rpmi-rplt i Operonu zawierającego nusA oznacza, że istnieje wspólny mechanizm regulacyjny, który rozpoznaje strukturę pętli macierzystej i reguluje oba operony w ten sam sposób.

Rysunek 7
figure7

przewidywana struktura zakończenia tłumienia w górnym regionie genu ylxS. a) kolejność genów. Przewidywane struktury pętli macierzystej o znaczeniu statystycznym są oznaczone kolorem niebieskim, a inne struktury, które nie przechodzą przez filtry ani nie mają mniej znaczenia, są oznaczone kolorem czerwonym. Aby uzyskać inne wyjaśnienie, patrz legenda do fig. 6a. (b) przewidywane struktury zakończenia tłumienia. Zobacz legendę na rysunku 6b dla wyjaśnienia.

Dystrybucja i konserwacja tłumików w Proteobakteriach

z naszej analizy bakterii gram-dodatnich od razu widać kilka aspektów ochrony tłumików . Po pierwsze, rozkład regulacji tłumienia lub antytermizacji nie jest dobrze zachowany przez Gram-postive baceria, a dodatkowo, nawet w zachowanych systemach regulacyjnych, zachowanie sekwencji i struktury jest słabe. To samo dotyczy proteobakterii. Spośród 14 genów w E. coli (patrz tabela 5a), o których wiadomo, że są regulowane przez tłumienie lub antytermizację, żadna z nich nie ma atenuatorów przewidywanych w ortologach wcześniejszych we wszystkich czterech innych genomach proteobakterii. Sześć z nich ma atenuatory przewidywane w co najmniej jednym z pozostałych czterech genomów. Trzy to geny, które mają ortolog we wszystkich czterech innych genomach, ale te nie mają przewidywanych tłumików. Pozostałe pięć genów E. coli nie ma znanych ortologów w innym genomie lub ortologowie mają plamisty rozkład i brak przewidywanych tłumików. Bliższa Kontrola ręczna potwierdza ten wniosek. Tabela 5b zawiera listę wszystkich przewidywanych tłumików w każdym z pięciu genomów podziału gamma proteobakterii, w których przewidywany jest podobny Tłumik dla ortologu innego genomu. Jak pokazano w tej tabeli, tłumienie i antytermizacja wydają się być słabo zachowane jako mechanizm regulacji w analogicznych operonach w genomach proteobakteryjnych. Spośród 475 genów i ich ortologów w tych pięciu genomach, które przewidywały atenuatory, tylko 36 jest współdzielonych ortologami dwóch lub więcej genomów (tabele 3, 5A i 5b).

tabela 5a lista znanych tłumików w E. coli w porównaniu z przewidywaniami w czterech innych genomach proteobakterii (podział gamma)
tabela 5b wykaz wszystkich genów ortologicznych w pięciu genomach proteobakterii (podział gamma), w których dwa lub więcej genomów ma przewidywane tłumiki
>

poprzednie badania dotyczące specyficznych systemów donoszą, że tłumienie i regulacja przeciwgrzybicza w niektórych operonach E. coli są tylko nieznacznie zachowane w proteobakteriach podziałów gamma. Wykazano, że regulacyjny OPERON rpsJ oraz OPERON trpE i pheA E. coli mają plamistą dystrybucję i są słabo zachowane w proteobakteriach. Jak pokazano w tabelach 2, 5a i 5b, byliśmy w stanie szeroko rozszerzyć tę analizę tłumienia i antytermizacji na większość takich układów w proteobakteriach i wykazaliśmy, że dotyczy to wszystkich znanych mechanizmów regulacyjnych tłumienia i antytermizacji w E. coli i innych przewidywanych mechanizmach w dodatkowych genomach podziału gamma. Przykład podano na fig. 8 zachowania niskiej sekwencji tłumików i regulacji. Na fig. 8a pokazano jeden z bardziej zachowanych tłumików dla Operonu hisG. Ten OPERON i mechanizm regulacyjny jest dobrze scharakteryzowany u E. coli, a nasza analiza przewiduje podobne mechanizmy regulacji tłumienia u V. cholerae i H. influenzae. Przewidywane tłumiki mają zachowaną pozycję (przy około 40-50 bp kodonu początkowego genu hisG) i sekwencję macierzystą. Chociaż okoliczne regiony międzygeniczne nie są możliwe do wyrównania, V. cholerae i H. influenzae mają możliwe sekwencje przywódcze aminokwasów z przebiegiem histydyn, co jest charakterystyczne dla mechanizmu regulacji tłumienia u E. coli. Przewidywane tłumiki nie zostały znalezione w pozostałych trzech genomach probacterii podziału gamma P. aeruginosa, N. meningitidus i X. fastidiosa. U P. aeruginosa region międzygeniczny przed ortologiem hisG ma tylko 17 bp długości, U X. fastidious Gen ortologiczny pokrywa się z ORF przed ORF i chociaż analogiczny region międzygeniczny N. meningitidus ma wystarczającą długość, nie przewiduje się żadnego tłumika.

Figure 8
figure8

Predicted attenuation termination structure in upstream region of HisG gene in E. coli. (a) Order of genes. Predicted stem-loop structures with statistical significance are indicated in blue. For the other explanation, see legend to figure 6a. Abbreviations for genomes: Ec, Escherichia coli; Hi, Haemophilus influenzae; Vc, Vibrio cholerae; Pa, Pseudomonas aeruginosa; Xf, Xylella fastidiosa; Nm, Neisseria meningitidis. b) przewidywane struktury zakończenia tłumienia. Zobacz legendę na rysunku 6b dla wyjaśnienia.

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany.