karakterisering van de Verzwakkers in B. subtilis en E. coli
een uitgebreid literatuuronderzoek naar operonen in B. subtilis gereguleerd door verzwakking of antiterminatie werd uitgevoerd en 46 van dergelijke operonen werden gevonden. Deze variëren van het experimenteel goed beschreven TRP-operon tot die operons waar terminatorstructuren zijn gevonden en verzwakking wordt verwacht hoewel experimenteel niet goed gekarakteriseerd (voor een volledige lijst zie http://www.bork.embl-heidelberg.de/Docu/attenuation). Deze 46 bekende terminatorstructuren werden gebruikt om gemeenschappelijke kenmerken van B subtilis dempende terminators te bepalen. Met behulp van deze eigenschappen hebben we upstream regio ‘ s van 3650 B. subtilis genen gescreend (met behulp van procedures beschreven in materialen en methoden) voor terminatorplooien. Drieënveertig van de oorspronkelijke 46 bekende terminators die in de literatuurstudie werden gevonden, werden in deze screening bewaard. Daarnaast werden 1117 upstream vouwen verkregen die aan onze criteria voldoen. Bovendien, als een controle, gebruikten we dezelfde filtering en vouwen methodologie op intergene gebieden nadat de sequenties willekeurig werden geschud (952 plooien van willekeurig geschud sequenties werden verkregen na het filteren).
de resulterende plooien van alle intergene gebieden en geschudde sequenties verkregen na filtering werden uitgezet in termen van hun stabiliteit en lengte (figuur 1). De bekende terminatorvouwen liggen in een cluster duidelijk gescheiden en onderscheiden van die vouwen van willekeurig geschud opeenvolgingen. De terminatorvouwen zijn van een lagere vrije energie (ΔG) in verhouding tot lengte dan voorspelde vouwen van willekeurige opeenvolgingen. Een vergelijkbaar patroon van twee gemakkelijk gescheiden clusters komt naar voren wanneer bekende terminatorstructuren worden vergeleken met gevouwen intragenic gebieden waarin terminator naar verwachting niet zal worden gevonden (gegevens worden niet getoond).
met behulp van hoofdcomponentanalyse hebben we de grootste variantie van de willekeurig geschud sequenties bepaald. Dit kan ons een maat geven (met behulp van standaardafwijking) waarvan de vouwen significant verschillen van de vouwen van willekeurige sequenties (zie materialen en methoden). Van de 1160 vouwen, vallen in totaal 203 vouwen van intergene gebieden verkregen in ons scherm onder de 2e afwijking lijn (Z ≤ -2) afgeleid van de hoofdcomponent. Deze worden dus beschouwd als significant verschillend van willekeurige plooien en mogelijke terminaties plaatsen van verzwakking of antiterminatie regelgeving. Tweeënveertig hiervan zijn de bekende demping terminators plooien (van de oorspronkelijke 43 bekende plooien behouden na filtering). Zo kunnen we 91,3% (42/46) van de bekende en experimenteel gekarakteriseerde verzwakings-en antiterminatieplaatsen verkrijgen met behulp van onze filter-en significantiemeting. Bovendien, de filter en significantie meten schermen uit meer dan 97,7% (930 van 952) van de plooien van willekeurige sequenties. Honderd eenenzestig (203 totaal exclusief 42 bekende) plooien onder de lijn (Z ≤ -2) zijn plooien die nog niet experimenteel geanalyseerd zijn en kunnen worden voorspeld als verzwakkende terminator structuren.
uit een gedetailleerd onderzoek bleek dat veel van deze voorspellingen sterk worden ondersteund als een vermeende verzwakking of antiterminatieplaatsen door genomische context zoals de aanwezigheid van veronderstelde promotorsequenties, upstream locatie van veronderstelde en bekende operonen, enz. Twee terminatorstructuren upstream genen ydbJ en yqhI dienen als gedetailleerde voorbeelden van hoe genomische context de voorspellingen in Tabel 1 kan informeren en sterk ondersteunen (Figuur 2). Gen ydbJ van B. subtilis is hypothetisch met homologie aan een ABC transporter gen (ATP-bindend eiwit betrokken bij koper transport). Het gen onmiddellijk stroomafwaarts, ydbK, heeft homologie aan membraan die permeasen overspannen. Met behulp van STRING (een zoekhulpmiddel voor het vinden van terugkerende instanties van naburige genen), worden orthologs van deze twee genen ook gevonden in dezelfde volgorde in transcriptionele eenheden van 15 andere ver verwante genomen, die de mogelijkheid voorstellen dat deze genen een operon vormen. Deze genen lijken in een typische ABC transporter operon configuratie te zijn en verschillende ABC transporter operons zijn bekend te worden gereguleerd door verzwakking in B. subtilis . Het ydbj upstream gebied heeft ook een veronderstelde promotorvolgorde en voorspelde vouwen gebruikend RNAfold (zie materialen en methodes) van de volledige upstreamvolgorde suggereren het in complexe mogelijke antiterminatievouwen kan vouwen (gegevens niet getoond). Gebaseerd op deze context, voorspellen we dat dit een ABC transporter operon is gereguleerd door demping. Het tweede voorbeeld, yqhI, is het eerste gen van een reeks van drie genen die allemaal homologie hebben aan glycine biosynthesegenen in een vermeende transcriptionele eenheid. Deze run van drie genen heeft ook orthologs gevonden Als buren in andere genomen . Vele aminozuurbiosynthese-operons in B. subtilis zijn gekend om door verzwakking worden geregeld, waarbij deze voorspelling wordt gesteund.
om te zien of de waargenomen patronen gelden voor het enige andere genoom waarin verzwakking of antiterminatie goed bestudeerd en experimenteel beschreven is, hebben we dezelfde methodologie ook toegepast op upstream gebieden van genen in het E. coli genoom waarvoor 16 operonen beschreven zijn als gereguleerd door verzwakking of antiterminatie. Zoals te zien is in Figuur 3, hebben de bekende E. coli verzwakking en antiterminatie terminator structuren vergelijkbare eigenschappen als die van B. subtilis. 15 van de 16 bekende Verzwakkers werden na filtering gehandhaafd. De significantiemaat scheidt 14 van deze E. coli terminators van willekeurige plooien zoals te zien is in Figuur 3. Net als in B. subtilis kunnen we met behulp van de (Z≤-2) lijn als maat voor significantie de verzwakking voorspellen voor 146 regio ‘ s (Figuur 3 en Tabel 2).
uitbreiding van de analyse tot 26 genomen
analyse van B. subtilis en E. coli stelt voor dat een breder onderzoek van bacteriële genomen nuttig zou kunnen blijken in zowel de voorspelling van de verzwakking en de antiterminatieregulatie in deze genomen als de karakterisering van de evolutie en distributie van deze mechanismen van regulering. Vierentwintig voltooide genomen werden geselecteerd voor dit onderzoek op basis van hun brede verspreiding over het evolutionaire spectrum (Tabel 3). De intergenic gebieden van elk van deze genomen werden geanalyseerd gebruikend de zelfde methodes en filters zoals met B. subtilis en E. coli en voorspelde verzwakking en antiterminatie terminator plooien op soortgelijke wijze verkregen.
zoals getoond in Tabel 3 is er een brede verdeling van het aantal veronderstelde regulerende verzwakking-en antiterminatieplaatsen in de onderzochte genomen. Deze variëren van 5 in Mycobacterium tuberculosis tot 275 in Clostridium acetobutylicum (Tabel 3). Eerdere pogingen om standaardinterminatieplaatsen aan het einde van transcriptie-eenheden te voorspellen, geven vergelijkbare resultaten. Interessant, de resultaten voor standaard transcriptie terminators correleren met de onze. Zoals gevonden in Ermolaeva et. al met standaard terminators aan het einde van transcriptie-eenheden (Dit artikel bestudeerde terminators aan het einde van ORFs en richtte zich niet op upstream regio ‘ s, waardoor mogelijke Verzwakkers werden gefilterd), zijn enkele van de hoogste aantal voorvallen van verzwakking en antiterminatieplaatsen in ons onderzoek op dezelfde manier te vinden in de genomen van E. coli, H. influenze, D. radioduranen en B. subtilis en het laagste aantal gevallen in genomen als H. pylori en M. tuberculosis (genomen gerapporteerd in hun onderzoek).
op het eerste gezicht lijkt dit erop te wijzen dat veel genomen niet dezelfde terminatiemechanismen gebruiken voor de standaard transcriptie terminatie en geen verzwakking of antiterminatie gebruiken in Regulatie. Dit is waarschijnlijk het geval in sommige genomen. Maar als het aantal upstream intergenic regio ‘ s wordt uitgezet tegen het aantal voorspelde plaatsen, wordt een sterke positieve correlatie getoond (Figuur 4). Hoe kleiner het aantal genen en intergenic gebieden een genoom heeft, hoe lager het voorkomen van voorspelde terminators (zowel standaard transcriptie terminators als verzwakking/antitermination regulatory terminators). Dit wijst erop dat het lage aantal zowel standaard terminatie als regulerende terminatie in veel genomen te wijten is aan een sterk verminderde genoomgrootte en de vermindering van het aantal regulerende operons, en niet noodzakelijkerwijs aan de afhankelijkheid van verschillende mechanismen van terminatie en regulering.
Er is een duidelijke uitschieter met een veel lager dan verwacht aantal vermeende terminatoren in Figuur 4, Mycobacterium tuberculosis. Dit genoom heeft een veel lager voorkomen van vermeende verzwakking en antiterminatieplaatsen dan door zijn grootte en het aantal intergenic gebieden zou worden voorgesteld. Een recent artikel van Unniraman et al. concludeert dat M. tuberculosis een ander terminatiemechanisme gebruikt dat terminatorstructuren gebruikt zonder de poly-u-staart die nodig is in andere genomen. Het verminderde aantal terminatorstructuren met poly-U in verhouding tot het aantal intergene regio’ s kan dus worden verklaard door de afhankelijkheid van M. tuberculosis van een ander terminatiemechanisme. Dit bewijst niet noodzakelijk dat er geen verzwakking of antiterminatie type Regulatie is bij M. tuberculosis. Nochtans, wijst het erop dat of het verlies van het standaardmechanisme van beëindiging in dit genoom heeft verminderd als niet geëlimineerd verzwakking of antitermination in M. tuberculose of alternatief, zou een verzwakking-als mechanisme in dit genoom kunnen bestaan dat M. gebruikt. tuberculose niet-standaard terminator.
alle andere van de 25 onderzochte genomen hebben vermoedelijk een verzwakking-of antiterminatieregulatieplaats. Zelfs het laagste aantal voorspelde demping of antiterminatieplaatsen die in M. genitalium worden gevonden zijn een significant deel van mogelijke regelgevende intergenic gebieden, wordt het lage aantal gemakkelijk verklaard door de vrij kleine grootte van dit genoom en weinig intergenic gebieden en transcriptional eenheden. Deze resultaten suggereren dat de verzwakking en de antiterminatieregeling een mogelijk alomtegenwoordig reguleringsmechanisme in prokaryoten is, met enkele uitzonderingen.
Genoomgrootte en verzwakking
als het GC-gehalte van een genoom wordt vergeleken met het aantal voorspelde Verzwakkers op basis van willekeurig geschud sequentie, correleert het GC-gehalte enigszins met het aantal voorspelde Verzwakkers, wat te verwachten is omdat een poly-U-run in de filters vereist is. In Figuur 5a, werden de vouwen van willekeurig geschud intergenic opeenvolgingen van onze 26 genomen uitgezet door het aantal gefilterde vouwen per intergenic gebied in verhouding tot Aantal intergenic gebieden. Als het aantal gefilterde plooien volledig willekeurig was, zou er een relatief constant aantal locaties per regio moeten zijn in verhouding tot het aantal regio ‘ s. Zoals blijkt uit figuur 5a is dit niet helemaal het geval. Het aantal gefilterde vouwen per gebied dat uit willekeurig geschud opeenvolgingen wordt verkregen is afhankelijk van de GC-inhoud van het genoom. De genomen van het laag-GC-gehalte hebben een lichtjes hoger per gebiedaantal vouwen dan de genomen van rond 50% GC-gehalte en de genomen van het hoog-GC-gehalte hebben veel lager aantal dan beide. Dit wordt verwacht van willekeurige sequenties gefilterd voor stam-lus structuren die poly-u runs bevatten.
zelfs wanneer rekening wordt gehouden met het GC-gehalte van M. tuberculosis, heeft het een verminderd aantal voorspelde Verzwakkers ten opzichte van de andere genomen met een hoog GC-gehalte (figuur 5b). In feite toont figuur 5b (voorspelde Verzwakkers van actuele intergene sequenties) aan dat de sterkste bepaling van het aantal voorspelde Verzwakkers per intergene Regio niet het GC-gehalte is, maar eerder de genoomgrootte (meer bepaald het aantal intergene regio ‘ s). In het algemeen, hebben grotere genomen niet alleen een groter absoluut aantal voorspelde Verzwakkers, maar hebben een groter voorkomen van voorspelde Verzwakkers per gebied. Als de inhoud van GC in twee genomen gelijk is, zal het grotere genoom eerder een hoger aantal voorspelde Verzwakkers per intergenic gebied hebben. De vorige rapporten hebben gelijkaardige fenomenen in regelgevende proteã nen voorgesteld, schijnen de grote genomen om een groter deel van hun totaal aantal genen te hebben dat Voor proteã nen coderen die regelgevende motieven bevatten . Interessant, het verdisconteren van de genomen van de archaebacteriën en de hoge GC-inhoud, schijnt een genoom van ongeveer 1500 intergenic gebieden om de drempel te zijn bij waar de frequentie van regelgevende Verzwakkers in een genoom toeneemt.
distributie en conservering van Verzwakkers in Grampositieve bacteriën
zeven genomen van grampositieve bacteriën (B. subtilis, B. halodurans, L. innocua, S. aureus, C. acetobutylicum, L. lactis en S. pneumoniae) werden geanalyseerd om te zien of de verzwakkingsterminatoren voor de orthologen behouden blijven. Het aantal voorspelde verzwakkingsterminatoren voor de genen waarvan bekend is dat ze worden gereguleerd in B. subtilis en hun orthologen in de andere zes genomen zijn vermeld in Tabel 4. De genomen worden gesorteerd door phylogenetic afstand van B. subtilis berekend door aminozuuropeenvolgingen van de gedeelde orthologs onder deze genomen. Het dichtst bij de B. subtilis is B. halodurans en het gemiddelde aantal aminozuursubstituties per plaats is 0,238, en de verste is S. pneumoniae en het gemiddelde aantal aminozuursubstituties per plaats is 0,422. Voor de 42 genen die in Tabel 4 worden vermeld, variëren de aantallen orthologen die in de andere genomen worden gevonden weinig van genoom tot genoom: de hoogste en de laagste aantallen orthologen zijn respectievelijk 31 in L. lactis en 26 in S. aureus en C. acetobutylicum. Dit is hoofdzakelijk omdat deze 42 genen sommige basisfuncties zoals aminoacyl-tRNA synthese dragen. Aan de andere kant, het aantal voorspelde verzwakking beëindiging structuren variëren aanzienlijk: in B. halodurans, 22 orthologe genen hebben verzwakking terminatie structuren voorspeld, terwijl slechts 4 orthologe genen hebben de voorspelde structuren in S. pneumoniae. Dit wijst erop dat de afwezigheid of aanwezigheid van regulatie door verzwakking veel zwakker wordt behouden dan de aanwezigheid van gen of operons.
dezelfde trend geldt voor de voorspelde verzwakkende terminatiestructuren anders dan bekende (Tabel 5). Er zijn 105 orthologe gengroepen die minstens één ander genoom hebben dat een voorspelde verzwakkerstructuur stroomopwaarts een orthologe gen bevat. Beperkt tot de orthologen die Verzwakkers hebben voorspeld in B. subtilis (35 groepen), het hoogste en het laagste aantal gedeelde orthologen van genen waarvan bekend is dat ze worden gereguleerd door verzwakking of antiterminatie in B. subtilis zijn respectievelijk 28 (L. innocua) en 18 (S. pneumoniae). Het aantal voorspelde dempingsafsluitingsstructuren varieert echter meer. Terwijl er 13 genen met voorspelde structuren in B. halodurans, die het dichtst bij B. subtilis onder de zes gram-positieve bacteriën, slechts 2 genen hebben voorspeld structuren in S. pneumoniae.
hoewel er een zwakke instandhouding van de Verzwakkers als geheel is, zijn de voorspelde verzwakkings terminatiestructuren en de volgorde van hun downstream genen geconserveerd voor sommige groepen genen. Een voorbeeld hiervan is infC-rpml-rplt operon (figuur 6a). In het upstreamgebied van infC bij S. pneumoniae wordt geen verzwakkende terminatiestructuur voorspeld (Tabel 5). Een nadere blik op dit gebied door explosie toonde aan dat de N-terminal van infC over voorspeld is in 27 bases. Door de 27 basen toe te voegen aan het intergene gebied in de stroomopwaarts, vonden we een stabiele stam-lus structuur die gevolgd werd door poly-u residuen ook in S. pneumoniae (figuur 6b). Zelfs in dit voorbeeld zijn er echter aanzienlijke verschillen tussen soorten in de relatieve positie van de stengel-lusstructuren en sequentiebehoud. Bovendien, zelfs tussen de fylogenetisch dichtstbijzijnde paar, B. subtilis en B. halodurans, de afstanden van het eind van de stengel tot het begincodon van infC zijn respectievelijk 69 en 37 basissen, en alleen de gemeenschappelijke segmenten die in de stengel worden gevonden zijn GUGUGGGN{x}cccacac (x = 12 in B. subtilis en x = 9 In B. halodurans). Van alle zeven genomen, is er slechts een zwakke gelijkenis, GYGGG (gacgg in C. acetobutylicum) in het stamgebied.
behoud van voorspelde demping terminatiestructuren wordt ook waargenomen in de upstream regio ‘ s van het mogelijke operon dat Nusa-gen bevat (figuur 7a). Vier van de zeven genomen bevatten voorspelde verzwakkingsstructuren in stroomopwaarts van het hypothetische eiwit (ylxS in B. subtilis). De structuren van de stam-lijn worden ook gevonden in de rest van drie genomen, hoewel deze structuren niet de filters overgaan. De plaats van de structuren aan de plaats van het transcriptiebegin van het stroomafwaartse gen en de opeenvolgingen zelf variëren ook beduidend in dit voorbeeld. In deze stamsequenties wordt het segment GUGGG (gagcg in L. lactis en Gaggc in S. pneumoniae) behouden in het voorspelde operon dat Nusa-gen bevat (figuur 7b). Interessant is dat de 5-basesegmenten identiek of zeer vergelijkbaar zijn met de segmenten in de stem-lusstructuren die zich in de stroomopwaarts van infC bevinden (figuur 6b). De proteã NEN gecodeerd de genen in deze twee operon zijn betrokken bij transcriptie. Het behoud van de sequentiesegmenten in de voorspelde dempende terminatorstructuren voor infC-rpmI-rplT-operon en het operon dat nusA bevat, impliceert dat er een gemeenschappelijk reguleringsmechanisme bestaat dat de stam-loopstructuur herkent en dat beide operons op dezelfde manier zou reguleren.
distributie en conservering van Verzwakkers in Proteobacteriën
verschillende aspecten van de conservering van Verzwakkers worden onmiddellijk duidelijk uit onze Analyse van gram-positieve bacteriën . Ten eerste is de verdeling van de verzwakking-of antiterminatieregelgeving niet goed behouden over grampositieve baceria en bovendien, zelfs in geconserveerde regulerende systemen, is de opeenvolging en structuurbehoud zwak. Hetzelfde geldt voor proteobacteriën. Van de 14 genen in E. coli (zie tabel 5a) waarvan bekend is dat ze worden gereguleerd door verzwakking of antiterminatie, geen van de Verzwakkers voorspelde upstream orthologen in alle vier andere proteobacteriën genomen. Zes hebben Verzwakkers voorspeld stroomopwaartse orthologen in ten minste een van de andere vier genomen. Drie zijn genen die orthologen hebben in alle vier andere genomen, maar deze hebben geen voorspelde Verzwakkers. De overige vijf genen in E. coli hebben ofwel geen bekende orthologs in het andere genoom of orthologs hebben een vlekkerige verdeling en geen voorspelde Verzwakkers. Nadere controle met de hand bevestigt deze conclusie. Tabel 5b is een lijst van alle voorspelde Verzwakkers in elk van de vijf genomen van de gamma-divisie van proteobacteriën waarin een soortgelijke verzwakker wordt voorspeld voor een ortholog van een ander genoom. Zoals getoond in deze tabel, lijken de verzwakking en de antiterminatie slecht bewaard te zijn als regulatiemechanisme in analoge operonen in proteobacteriële genomen. Van het totaal van 475 genen en hun orthologen in deze vijf genomen die Verzwakkers hebben voorspeld, worden er slechts 36 upstream orthologen van twee of meer genomen gedeeld (tabellen 3, 5a en 5b).
Vorige onderzoek op het gebied van specifieke systemen hebben gemeld dat de demping en antitermination de verordening in sommige operons in E. coli zijn slechts matig geconserveerd over gamma-verdeling proteobacteria. Het regulatierrpsj-operon en de trpE-en pheA-operons van E. coli hebben een vlekkeloze distributie en zijn zwak behouden over proteobacteriën. Zoals in de tabellen 2, 5a en 5b is aangetoond, zijn wij in staat geweest deze analyse van de verzwakking en antiterminatie uitgebreid uit te breiden tot de meeste van deze systemen in proteobacteriën, en hebben wij aangetoond dat dit geldt voor alle bekende verzwakking en antiterminatie regulerende mechanismen in E. coli en andere voorspelde mechanismen in extra gammadeling genomen. Een voorbeeld wordt gegeven in figuur 8 van de lage sequentie behoud van Verzwakkers en Regulatie. In figuur 8a wordt een van de meer geconserveerde Verzwakkers getoond voor die van het hisg-operon. Dit operon en regulerend mechanisme wordt goed gekarakteriseerd in E. coli en onze Analyse voorspelt gelijkaardige mechanismen van demping Regulatie in V. cholerae en H. influenzae. De voorspelde Verzwakkers hebben positie behouden (bij ongeveer 40-50 bp stroomopwaarts startcodon van hisg gen), en stamvolgorde. Hoewel de omringende intergenic gebieden niet mogelijk zijn om zich te richten, V. cholerae en H. influenzae heeft wel mogelijke aminozuurleaderopeenvolgingen met een run van histidines die kenmerkend is voor het dempingsregelingsmechanisme in E. coli. Voorspelde Verzwakkers werden niet gevonden in de andere drie gamma-onderverdeling probacteriën genomen van P. aeruginosa, N. meningitidus en X. fastidiosa. In P. aeruginosa is het intergene gebied stroomopwaarts van de hisg ortholog slechts 17 bp lang, in X. fastidious overlapt het orthologe gen met de ORF stroomopwaarts, en hoewel het analoge N. meningitidus intergene gebied voldoende lang is, wordt geen verzwakker voorspeld.