Karakterisering av dempere i b. subtilis og E. coli
et omfattende litteratursøk etter operoner I B. subtilis regulert ved demping eller antiterminering ble utført og 46 slike operoner ble funnet. Disse spenner fra eksperimentelt godt beskrevet trp operon til de operoner hvor terminator strukturer har blitt funnet og demping er forventet men ikke godt karakterisert eksperimentelt (for en fullstendig liste se http://www.bork.embl-heidelberg.de/Docu/attenuation). Disse 46 kjente terminator strukturer ble anvendt for å bestemme felles kjennetegn Ved B. subtilis demping terminatorer. Ved hjelp av disse egenskapene, vi vist oppstrøms regioner av 3650 b. subtilis gener (ved hjelp av prosedyrer beskrevet I Materialer og Metoder) for terminator folder. Førti-tre av de opprinnelige 46 kjente terminatorer funnet i litteratursøk ble beholdt i denne screening. Ytterligere 1117 oppstrøms folder som passer våre kriterier ble også oppnådd. I tillegg, som en kontroll, vi brukte samme filtrering og folding metodikk på intergenic regioner etter sekvensene ble stokket tilfeldig (952 folder av tilfeldig stokket sekvenser ble oppnådd etter filtrering).
de resulterende foldene av alle intergeniske regioner og blandede sekvenser oppnådd etter filtrering ble plottet i form av stabilitet og lengde (Figur 1). De kjente terminator folder ligge i en klynge klart atskilt og forskjellig fra de folder av tilfeldig stokket sekvenser. Terminatorfoldene har en mindre fri energi (Δ) i forhold til lengde enn forventede folder av tilfeldige sekvenser. Et lignende mønster av to lett separerte klynger oppstår når man sammenligner kjente terminatorstrukturer med brettede intrageniske regioner der terminator ikke forventes å bli funnet (data ikke vist).
Ved hjelp av hovedkomponentanalyse bestemte vi den største variansen av tilfeldig stokket sekvenser. Dette kan gi oss et mål (ved hjelp av standardavvik) som folder er vesentlig forskjellig fra folder av tilfeldige sekvenser(se Materialer og Metoder). Av de 1160 foldene faller totalt 203 foldene av intergeniske regioner oppnådd i skjermen under 2. avvikslinje (Z ≤ -2) avledet fra hovedkomponenten. Disse anses derfor å være signifikant forskjellig fra tilfeldige folder og mulige avslutningssteder for demping eller antiterminasjonsregulering. Førtito av disse er de kjente demping terminatorer folder (av de opprinnelige 43 kjente folder opprettholdes etter filtrering). Dermed er vi i stand til å oppnå 91,3% (42/46)av de kjente og eksperimentelt karakteriserte dempings-og antitermineringsstedene ved hjelp av vårt filter og signifikansmål. I tillegg skjermer filteret og signifikansmålet ut over 97,7% (930 av 952) av foldene av tilfeldige sekvenser. Ett hundre og sekstien (203 totalt unntatt 42 kjente) bretter under linjen (Z ≤ -2) er bretter som ennå ikke er analysert eksperimentelt og kan forutsies å være dempningsterminatorstrukturer.en detaljert undersøkelse fant at mange av disse spådommene er sterkt støttet som en formodentlig demping eller antiterminasjonssteder av genomisk kontekst som tilstedeværelsen av formodede promotorsekvenser, oppstrøms plassering av formodede og kjente operoner, etc. To terminatorstrukturer oppstrømsgener ydbJ og yqhI tjener som detaljerte eksempler på hvordan genomisk kontekst kan informere og sterkt støtte spådommene i Tabell 1 (Figur 2). Genet ydbJ av b. subtilis er oppført som hypotetisk med homologi til ET ABC-transportørgen (ATP-bindende protein involvert i kobbertransport). Genet umiddelbart nedstrøms, ydbK, har homologi til membran som spenner over permeases. Ved HJELP AV STRENG (et søkeverktøy for å finne gjentatte forekomster av nabogener ), er ortologene av disse to genene også funnet i samme rekkefølge i transkripsjonelle enheter av 15 andre fjernt relaterte genomer, noe som tyder på muligheten for at disse genene danner en operon. Disse genene ser ut til å være i en TYPISK ABC transporter operon konfigurasjon og flere ABC transporter operoner er kjent for å være regulert av demping I b. subtilis . YdbJ oppstrøms regionen har også en antatte promoter sekvens og spådde folder ved Hjelp Av RNAfold (Se Materialer og Metoder) av hele oppstrøms sekvens foreslår det kan kaste i komplekse mulige antitermination folder (data ikke vist). Basert på denne konteksten forutsier vi at DETTE er EN ABC transporter operon regulert av demping. Det andre eksemplet, yqhI, er det første genet av et løp av tre gener som alle har homologi til glysinbiosyntesegener i en antatt transkripsjonell enhet. Denne løp av tre gener har også orthologer funnet som naboer i andre genomer . Mange aminosyrebiosynteseoperoner I b. subtilis er kjent for å være regulert ved demping, og dermed støtte denne prediksjonen.
For å se om de observerte mønstrene holder for det eneste andre genomet der demping eller antiterminering er godt studert og eksperimentelt beskrevet, brukte vi også den samme metoden til oppstrøms regioner av gener I E. coli-genomet som 16 operoner har blitt beskrevet som regulert av demping eller antiterminering. Som det fremgår av Figur 3, har de kjente e. coli-demping og antiterminerings terminatorstrukturer lignende egenskaper Som B. subtilis. 15 av de 16 kjente demperne ble opprettholdt etter filtrering. Signifikansmålet skiller 14 Av Disse E. coli-terminatorene fra tilfeldige folder som vist i Figur 3. Som I b. subtilis, ved å bruke linjen (Z≤-2) som et mål på signifikans, er vi i stand til å forutsi demping for 146 regioner (Figur 3 Og Tabell 2).
Forlengelse av analyse til 26 genomer
analyse av b. subtilis og e. coli antyder at en bredere undersøkelse av bakterielle genomer kan vise seg nyttig i både prediksjon av demping og antiterminasjonsregulering i disse genomene og karakteriseringen av utviklingen og distribusjonen av disse reguleringsmekanismer. Tjuefire fullførte genomer ble valgt for denne undersøkelsen basert på deres brede fordeling over det evolusjonære spekteret (Tabell 3). De intergeniske regioner av hver av disse genomene ble analysert ved hjelp av de samme metoder og filtre Som Med b. subtilis Og E. coli og spådd demping og antitermination terminator folder på samme måte oppnådd.
som vist i Tabell 3, er det en bred fordeling av antall antatte dempings-og antiterminasjonsreguleringssteder i de undersøkte genomene. Disse varierer fra 5 I Mycobacterium tuberculosis til 275 I Clostridium acetobutylicum (Tabell 3). Tidligere forsøk på å forutsi standard transkripsjon termineringssteder på slutten av transkripsjonsenheter gi lignende resultater. Interessant, resultatene for standard transkripsjon terminatorer korrelerer med vår. Som ble funnet I Ermolaeva et. al med standard terminatorer på slutten av transkripsjonsenheter (dette papiret studerte terminatorer på slutten Av ORFs og målte ikke oppstrøms regioner, og filtrerte dermed ut mulige dempere), er noen av de høyeste antall forekomster av demping og antitermineringssteder i vår undersøkelse også funnet i genomene Av E. coli, H. influenze, D. radioduraner og b. subtilis og det laveste antallet forekomster i slike genomer Som h. pylori og m. tuberculosis(genomer rapportert i undersøkelsen).Ved første øyekast ser dette ut til å antyde at mange genomer ikke bruker de samme termineringsmekanismer for standard transkripsjonsterminering og ikke bruker demping eller antiterminering i regulering. Dette er sannsynligvis tilfelle i noen genomer. Likevel, hvis antall oppstrøms intergeniske regioner er plottet mot antall forventede steder, vises en sterk positiv korrelasjon(Figur 4). Jo mindre antall gener og intergeniske regioner et genom har, desto lavere er forekomsten av forventede terminatorer (både standard transkripsjonsterminatorer og demping/antiterminering regulatoriske terminatorer). Dette indikerer at det lave antallet av både standard terminering og regulatorisk terminering i mange genomer skyldes en mye redusert genomstørrelse og reduksjon av antall regulatoriske operoner, og ikke nødvendigvis til avhengighet av ulike mekanismer for terminering og regulering.
Det er en klar outlier med et mye lavere enn forventet antall antatte terminatorer sett I Figur 4, Mycobacterium tuberculosis. Dette genomet har en mye lavere forekomst av antatte dempnings-og antitermineringssteder enn det som ville bli foreslått av størrelsen og antall intergeniske regioner. En fersk papir Av Unniraman et al. konkluderer Med At m. tuberculosis bruker en annen termineringsmekanisme som utnytter terminatorstrukturer uten at poly-u-halen er nødvendig i andre genomer. Således kan det reduserte antall poly-u som inneholder terminatorstrukturer i forhold til antall intergeniske regioner forklares Av m. tuberculosis ‘ avhengighet av en annen termineringsmekanisme. Dette viser ikke nødvendigvis at det ikke er noen demping eller antiterminasjonstype regulering i m. tuberculosis. Imidlertid indikerer det at enten tapet av standardmekanismen for avslutning i dette genomet har redusert hvis ikke eliminert demping eller antiterminering I m. tuberculosis eller alternativt kan en dempningslignende mekanisme eksistere i dette genomet som utnytter M. tuberkulose ikke-standard terminator.
Alle andre av de 25 undersøkte genomene har antatte dempnings-eller antitermineringsreguleringssteder. Selv det laveste antall forventede dempnings-eller antitermineringssteder funnet I m. genitalium er en betydelig andel av mulige regulatoriske intergeniske regioner, det lave antallet er lett regnskapsført av dette genomets relativt små størrelse og få intergeniske regioner og transkripsjonelle enheter. Disse resultatene tyder på at demping og antiterminasjonsregulering er en muligens allestedsnærværende reguleringsmekanisme i prokaryoter med få unntak.
Genomstørrelse og Demping
Hvis gc-innholdet i et genom sammenlignes med antall forventede dempere basert på tilfeldig blandet sekvens, korrelerer GC-innholdet noe med antall forventede dempere, noe som forventes siden en poly-U-løp er nødvendig i filtrene. I Figur 5a, folder fra tilfeldig stokket intergenic sekvenser av våre 26 genomer ble plottet av antall filtrerte folder per intergenic region i forhold til antall intergenic regioner. Hvis antall filtrerte folder var helt tilfeldig, bør det være et relativt konstant antall steder per region i forhold til antall regioner. Som det fremgår av figur 5a, er dette ikke helt tilfelle. Antall filtrerte folder per region oppnådd fra tilfeldig stokket sekvenser er avhengig AV gc-innholdet i genomet. Lav-GC innhold genomer har en litt høyere per region antall folder enn gjør genomer på rundt 50% GC innhold og høy-GC innhold genomer har mye lavere tall enn begge. Dette forventes fra tilfeldige sekvenser filtrert for stem-loop strukturer som inneholder poly – u-løp.
Selv når MAN tar HENSYN TIL gc-innholdet I m. tuberculosis, har det et redusert antall forventede dempere i forhold til de andre høy-GC-genomene (Figur 5b). Faktisk, Figur 5b (spådd attenuators av faktiske intergenic sekvenser) viser at den sterkeste determinate av antall spådd attenuators per intergenic region er IKKE GC innhold, men heller genom størrelse (mer spesifikt antall intergenic regioner). Generelt, ikke bare gjøre større genomer har et større absolutt antall spådd dempere, men har en større forekomst av spådd dempere per region. HVIS GC-innholdet er lik i to genomer, er det større genomet mer sannsynlig å ha et høyere antall forventede dempere per intergenisk region. Tidligere rapporter har antydet lignende fenomener i regulatoriske proteiner, store genomer ser ut til å ha en større andel av deres totale antall gener som koder for proteiner som inneholder regulatoriske motiver . Interessant, diskontere archaebacteria og høy GC innhold genomer, et genom av ca 1500 intergenic regioner synes å være terskelen på hvor frekvensen av regulatoriske dempere øker i et genom.
Distribusjon og Bevaring Av Attenuatorer I Gram positive Bakterier
Syv genomer av gram-positive bakterier (b. subtilis, b. halodurans, L. innocua, s. aureus, c. acetobutylicum, L. lactis og S. pneumoniae) ble analysert for å se om dempningsterminatorene er konservert foran ortologene. Antallet anslåtte dempningsterminatorer for genene som er kjent for å være regulert I b. subtilis og deres ortologier i de andre seks genomene er oppført i Tabell 4. Genomene er sortert etter fylogenetisk avstand Fra B. subtilis beregnet av aminosyresekvenser av de delte ortologene blant disse genomene. Den nærmeste til b. subtilis er b. haloduraner og gjennomsnittlig antall aminosyresubstitusjoner per sted er 0,238, Og den fjerneste Er S. pneumoniae og gjennomsnittlig antall aminosyresubstitusjoner per sted er 0,422. For de 42 genene som er oppført i Tabell 4, varierer antall ortologer som finnes i de andre genomene lite fra genom til genom: det høyeste og laveste antallet ortologer er henholdsvis 31 I L. lactis og 26 i s. aureus og c. acetobutylicum. Dette er hovedsakelig fordi disse 42 gener bære noen grunnleggende funksjoner som aminoacyl-tRNA syntese. På den annen side varierer antall forventede dempingstermineringsstrukturer betydelig: I B. halodurans, 22 ortologe gener har spådd demping terminering strukturer, mens bare 4 ortologe gener har spådd strukturer I S. pneumoniae. Dette indikerer at fraværet eller tilstedeværelsen av regulering ved demping er mye svakere bevart enn genet eller operons nærvær.
den samme trenden gjelder for de forventede dempingsterminasjonsstrukturene andre enn kjente (Tabell 5). Det er 105 ortologe gengrupper som har minst ett annet genom som inneholder en spådd demperstruktur oppstrøms et ortologe gen. Begrensning til ortologene som har spådd dempere I B. subtilis (35 grupper), det høyeste og laveste antallet delte ortologier av gener som er kjent for å være regulert ved demping eller antiterminering i B. subtilis er henholdsvis 28 (L. innocua) og 18 (s. pneumoniae). Antallet av forventede dempingsterminasjonsstrukturer varierer imidlertid mer. Mens det er 13 gener med forventede strukturer I b. haloduraner, som er nærmeste art Til b. subtilis blant de seks gram-positive bakteriene, har bare 2 gener spådd strukturer I s. pneumoniae.
selv om det er svak bevaring av dempere som helhet, forutsier dempingsterminasjonsstrukturer og rekkefølgen av deres nedstrøms gener er bevart for noen grupper av gener. Et slikt eksempel er infC-rpml-rplt operon (figur 6a). Ingen dempingsterminasjonsstruktur er spådd i oppstrømsregionen av infC i S. pneumoniae (Tabell 5). Nærmere titt på denne regionen VED BLAST viste at n-terminalen til infC er over spådd i 27 baser. Ved å legge 27 baser til intergenic regionen i oppstrøms, vi fant en stabil stem-loop struktur som etterfulgt av poly-U rester også I S. pneumoniae (Figur 6b). Selv i dette eksemplet er det imidlertid betydelige forskjeller mellom arter i den relative posisjonen til stem-loop strukturer og sekvens bevaring. Videre, selv mellom fylogenetisk nærmeste par, b. subtilis Og B. haloduraner, avstandene fra enden av stammen til startkodonet til infC er henholdsvis 69 og 37 baser, og bare de vanlige segmentene som finnes i stammen ER GUGUGGGN{x}CCCACAC(x = 12 I b. subtilis og x = 9 I b. haloduraner). Blant alle de syv genomene er det bare en svak likhet, GYGGG (GACGG I c. acetobutylicum) i stammeområdet.
Bevaring av forutsagte dempningsstrukturer observeres også i oppstrømsregionene av det mulige operonet som inneholder nusA-genet (Figur 7a). Fire av syv genomer inneholder forventede demperstrukturer i oppstrøms av det hypotetiske proteinet (ylxS i b. subtilis). Stem-loop strukturer finnes også i resten av tre genomer, selv om disse strukturene ikke passerer filtrene. Plasseringen av strukturene til transkripsjonsstartstedet for nedstromsgenet og sekvensene selv varierer betydelig i dette eksemplet ogsa. I disse stamsekvensene blir segmentet GUGGG (GAGCG I L. lactis og GAGGC I S. pneumoniae) konservert i det forutsagte operonet som inneholder nusA-genet (Figur 7b). Interessant er 5-basesegmentene identiske eller svært lik segmentene i stem-loop-strukturer som ligger i oppstrøms infC (figur 6b). Proteinene kodet gener i disse to operonene er involvert i transkripsjon. Bevaringen av sekvenssegmentene i de forventede dempningsterminatorstrukturene for infC-rpmI – rplt operon og operonen som inneholder nusA innebærer at det eksisterer en felles reguleringsmekanisme som gjenkjenner stem-loop-strukturen, og dette vil regulere begge operonene på samme måte.
Distribusjon og Bevaring Av Attenuatorer I Proteobakterier
Flere aspekter ved bevaring av attenuatorer er umiddelbart tydelige fra vår analyse av gram-positive bakterier . For det første er fordelingen av demping eller antiterminasjonsregulering ikke godt bevart over gram-postiv baceria, og i tillegg, selv i konserverte reguleringssystemer, er sekvens-og strukturbevarelse svak. Det samme gjelder for proteobakterier. Av de 14 gener I E. coli (Se Tabell 5a) kjent for å være regulert av demping eller antiterminering, ingen har dempere spådd oppstrøms orthologs i alle de fire andre proteobacteria genomer. Seks har dempere spådd oppstrøms orthologer i minst ett av de andre fire genomene. Tre er gener som har orthologs i alle fire andre genomer, men disse har ingen spådde dempere. De resterende fem gener i E. coli har enten ingen kjente ortologier i det andre genomet eller ortologene har en spotty fordeling og ingen forventede dempere. Nærmere inspeksjon for hånd bekrefter denne konklusjonen. Tabell 5b er en liste over alle spådde dempere i hver av de fem genomene av gamma-delingen av proteobakterier der en lignende demperen er spådd for en ortolog av et annet genom. Som vist i denne tabellen, synes demping og antiterminering å være dårlig bevart som en reguleringsmekanisme i analoge operoner i proteobakterielle genomer. Av totalt 475 gener og deres ortologer i disse fem genomene som har spådd dempere, er bare 36 delt oppstrøms ortologier av to eller flere genomer(Tabell 3, 5a og 5b).
tidligere forskning om spesifikke systemer har rapportert at demping og antiterminasjon regulering i enkelte operoner i e. coli er bare mildt konservert over gamma divisjon proteobakterier. Reguleringen rpsJ operon og trpE og pheA operoner Av E. coli har vist seg å ha en flekkete fordeling og svakt konservert over proteobakterier. Som vist I Tabell 2, 5a og 5b, har vi vært i stand til å utvide denne analysen av demping og antiterminering til de fleste slike systemer i proteobakterier, og har vist at dette gjelder for alle kjente dempnings-og antiterminasjonsreguleringsmekanismer I E. coli og andre forutsagte mekanismer i ytterligere gamma divisjonsgenomer. Et eksempel er gitt i figur 8 av lav sekvens bevaring av dempere og regulering. I figur 8a, en av de mer konserverte dempere er vist for at av hisG operon. Denne operon-og reguleringsmekanismen er godt karakterisert I E. coli, og vår analyse forutsier lignende mekanismer for dempningsregulering I V. cholerae og H. influenzae. De spådde dempere har bevart posisjon (på ca 40-50 bp oppstrøms startkodon av hisG genet), og stammen sekvens. Selv om de omkringliggende intergeniske områdene ikke er mulige å justere, V. cholerae Og H. influenzae har mulige aminosyreledersekvenser med et løp av histidiner som er karakteristisk for dempningsreguleringsmekanismen i E. coli. Spådd attenuators ble ikke funnet i de andre tre gamma underavdeling probacteria genomer Av p. aeruginosa, n. meningitidus Og X. fastidiosa. I p. aeruginosa er den intergeniske regionen oppstrøms for hisg-ortologgen bare 17 bp i lengde, I X. fastidious overlapper det ortologe genet MED ORF oppstrøms, og selv om den analoge n. meningitidus intergeniske regionen er tilstrekkelig lengde, er ingen demperen spådd.