karakterisering af dæmpere i B. subtilis og E coli
en omfattende litteratursøgning efter operoner i B. subtilis reguleret ved dæmpning eller antitermination blev udført, og 46 sådanne operoner blev fundet. Disse spænder fra den eksperimentelt godt beskrevne trp-operon til de operoner, hvor terminatorstrukturer er fundet, og dæmpning forventes, men ikke godt karakteriseret eksperimentelt (for en komplet liste se http://www.bork.embl-heidelberg.de/Docu/attenuation). Disse 46 kendte terminatorstrukturer blev anvendt til at bestemme fælles egenskaber ved B. subtilis dæmpningsterminatorer. Ved hjælp af disse egenskaber screenede vi opstrømsregioner på 3650 B. subtilis-gener (ved hjælp af procedurer beskrevet i materialer og metoder) til terminatorfoldninger. Treogfyrre af de oprindelige 46 kendte terminatorer fundet i litteratursøgningen blev bevaret i denne screening. Yderligere 1117 opstrøms folder, der passer til vores kriterier, blev også opnået. Derudover brugte vi som kontrol den samme filtrerings-og foldemetode på intergeniske regioner, efter at sekvenserne blev blandet tilfældigt (952 folder af tilfældigt blandede sekvenser blev opnået efter filtrering).
de resulterende folder af alle intergeniske regioner og blandede sekvenser opnået efter filtrering blev afbildet med hensyn til deres stabilitet og længde (Figur 1). De kendte terminatorfoldninger ligger i en klynge, der er klart adskilt og adskilt fra disse folder af tilfældigt blandede sekvenser. Terminatorfoldene har en mindre fri energi (PRISTG) i forhold til længden end forudsagte folder af tilfældige sekvenser. Et lignende mønster af to let adskilte klynger fremkommer, når man sammenligner kendte terminatorstrukturer med foldede intragene regioner, hvor terminator ikke forventes at blive fundet (data ikke vist).
Ved hjælp af hovedkomponentanalyse bestemte vi den største varians af de tilfældigt blandede sekvenser. Dette kan give os et mål (ved hjælp af standardafvigelse), hvoraf folder er signifikant forskellige fra folder af tilfældige sekvenser (se materialer og metoder). Af de 1160 folder falder i alt 203 folder af intergeniske regioner opnået i vores skærm under 2.afvigelseslinie (å-2) afledt af hovedkomponenten. Disse betragtes således som væsentligt forskellige fra tilfældige folder og mulige afslutningssteder for dæmpning eller antitermineringsregulering. Toogfyrre af disse er de kendte dæmpningsterminatorfoldninger (af de originale 43 kendte folder, der opretholdes efter filtrering). Således er vi i stand til at opnå 91,3% (42/46) af de kendte og eksperimentelt karakteriserede dæmpnings-og antitermineringssteder ved hjælp af vores filter og signifikansmål. Derudover screener filter-og signifikansmålet over 97,7% (930 af 952) af folderne af tilfældige sekvenser. Et hundrede og enogtres (203 i alt eksklusive 42 kendte) folder under linjen (kr.-2) er folder, der endnu ikke er analyseret eksperimentelt og kunne forudsiges at være dæmpningsterminatorstrukturer.
en detaljeret undersøgelse fandt, at mange af disse forudsigelser understøttes stærkt som en formodet dæmpning eller antitermineringssteder ved genomisk kontekst, såsom tilstedeværelsen af formodede promotorsekvenser, opstrøms placering af formodede og kendte operoner osv. To terminatorstrukturer opstrøms gener ydbJ og ykhi tjener som detaljerede eksempler på, hvordan genomisk kontekst kan informere og stærkt understøtte forudsigelserne i tabel 1 (Figur 2). Gen ydbJ af B. subtilis er opført som hypotetisk med homologi til en ABC transportør gen (ATP-bindende protein involveret i kobber transport). Genet umiddelbart nedstrøms, ydbK, har homologi til membran, der spænder over permeaser. Ved hjælp af streng (et søgeværktøj til at finde tilbagevendende forekomster af nabogener) findes ortologer af disse to gener også i samme rækkefølge i transkriptionsenheder af 15 andre fjernt beslægtede genomer, hvilket antyder muligheden for, at disse gener danner en operon. Disse gener ser ud til at være i en typisk ABC-transportoperonkonfiguration, og flere ABC-transportoperoner vides at være reguleret ved dæmpning i B. subtilis . YdbJ opstrømsregionen har også en formodet promotorsekvens og forudsagte folder ved hjælp af RNAfold (se materialer og metoder) af hele opstrømssekvensen antyder, at den kan foldes i komplekse mulige antitermineringsfoldninger (data ikke vist). Baseret på denne sammenhæng forudsiger vi, at dette er en ABC-transportoperon reguleret af dæmpning. Det andet eksempel, ykhi, er det første gen i et løb af tre gener, der alle har homologi til glycin biosyntesegener i en formodet transkriptionsenhed. Denne kørsel af tre gener har også ortologer fundet som naboer i andre genomer . Mange aminosyrebiosynteseoperoner i B. subtilis vides at være reguleret ved dæmpning og understøtter således denne forudsigelse.
for at se, om de observerede mønstre holder for det eneste andet genom, hvor dæmpning eller antitermination er godt undersøgt og eksperimentelt beskrevet, anvendte vi også den samme metode til opstrømsregioner af gener i E. coli-genomet, for hvilke 16 operoner er blevet beskrevet som reguleret ved dæmpning eller antitermination. Som det kan ses i figur 3, har de kendte E. coli-dæmpnings-og antitermineringsterminatorstrukturer lignende egenskaber som B. subtilis. 15 af de 16 kendte dæmpere blev opretholdt efter filtrering. Signifikansmålet adskiller 14 af disse E. coli terminatorer fra tilfældige folder som vist i figur 3. Som i B. subtilis, ved hjælp af linjen (å-2) som et mål for betydning, er vi i stand til at forudsige dæmpning for 146 regioner (figur 3 og tabel 2).
udvidelse af analyse til 26 genomer
analyse af B. subtilis og E. coli antyder, at en bredere undersøgelse af bakterielle genomer kan vise sig nyttig i både forudsigelsen af dæmpning og antitermineringsregulering i disse genomer og karakteriseringen af udviklingen og fordelingen af disse reguleringsmekanismer. Fireogtyve afsluttede genomer blev udvalgt til denne undersøgelse baseret på deres brede fordeling på tværs af det evolutionære spektrum (tabel 3). De intergeniske regioner i hvert af disse genomer blev analyseret ved hjælp af de samme metoder og filtre som med B. subtilis og E. coli og forudsagt dæmpning og antitermination terminator folder tilsvarende opnået.
som vist i tabel 3 er der en bred fordeling af antallet af formodede dæmpnings-og antitermineringsregulerende steder i de undersøgte genomer. Disse spænder fra 5 i Mycobacterium tuberculosis til 275 i Clostridium acetobutylicum (tabel 3). Tidligere forsøg på at forudsige standard transkriptionstermineringssteder i slutningen af transkriptionsenheder giver lignende resultater. Interessant nok korrelerer resultaterne for standardtranskriptionsterminatorer med vores. Som det blev fundet i Ermolaeva et. al med standardterminatorer i slutningen af transkriptionsenheder (dette papir studerede terminatorer i slutningen af ORF ‘ er og målrettede ikke opstrømsregioner og filtrerede således mulige dæmpere ud), nogle af det højeste antal forekomster af dæmpnings-og antitermineringssteder i vores undersøgelse findes ligeledes i genomerne af E. coli, H. influense, D. radioduraner og B. subtilis og det laveste antal forekomster i sådanne genomer som H. pylori og M. tuberculosis (genomer rapporteret i deres undersøgelse).
Ved første øjekast synes dette at antyde, at mange genomer ikke bruger de samme termineringsmekanismer til standard transkriptionsterminering og ikke bruger dæmpning eller antitermination i regulering. Dette er sandsynligvis tilfældet i nogle genomer. Men hvis antallet af opstrøms intergeniske regioner er afbildet mod antallet af forudsagte steder, vises en stærk positiv korrelation (figur 4). Jo mindre antallet af gener og intergeniske regioner et genom har, jo lavere er forekomsten af forudsagte terminatorer (både standard transkriptionsterminatorer og dæmpning/antiterminering regulatoriske terminatorer). Dette indikerer, at det lave antal af både standardterminering og regulatorisk opsigelse i mange genomer skyldes en meget reduceret genomstørrelse og reduktionen af antallet af regulatoriske operoner og ikke nødvendigvis afhængigheden af forskellige mekanismer for opsigelse og regulering.
der er en klar outlier med et meget lavere end forventet antal formodede terminatorer set i figur 4, Mycobacterium tuberculosis. Dette genom har en meget lavere forekomst af formodede dæmpnings-og antitermineringssteder, end det ville blive antydet af dets størrelse og antallet af intergeniske regioner. Et nyligt papir af Unniraman et al. konkluderer, at M. tuberculosis bruger en anden termineringsmekanisme, der bruger terminatorstrukturer uden den poly-u-hale, der er nødvendig i andre genomer. Således kan det reducerede antal Poly-U-holdige terminatorstrukturer i forhold til antallet af intergeniske regioner forklares ved M. tuberculosis’ afhængighed af en anden termineringsmekanisme. Dette beviser ikke nødvendigvis, at der ikke er nogen dæmpning eller regulering af antitermineringstype i M. tuberculosis. Imidlertid, det indikerer, at enten tabet af standardmekanismen for opsigelse i dette genom er reduceret, hvis ikke elimineret dæmpning eller antiterminering i M. tuberkulose eller alternativt, en dæmpningslignende mekanisme kunne eksistere i dette genom, der bruger M. tuberkulose ikke-standard terminator.
alle andre af de 25 undersøgte genomer har formodede dæmpnings-eller antitermineringsreguleringssteder. Selv det laveste antal forudsagte dæmpnings-eller antitermineringssteder, der findes i M. genitalium er en betydelig andel af mulige regulatoriske intergeniske regioner, det lave antal redegøres let for dette genoms relativt lille størrelse og få intergeniske regioner og transkriptionsenheder. Disse resultater antyder, at dæmpning og antitermineringsregulering er en muligvis allestedsnærværende reguleringsmekanisme i prokaryoter med få undtagelser.
Genomstørrelse og dæmpning
Hvis GC-indholdet i et genom sammenlignes med antallet af forudsagte dæmpere baseret på tilfældigt blandet sekvens, korrelerer GC-indhold noget med antallet af forudsagte dæmpere, hvilket ville forventes, da der kræves en poly-u-kørsel i filtrene. I figur 5a, folder fra tilfældigt blandede intergeniske sekvenser af vores 26 genomer blev afbildet med antallet af filtrerede folder pr.intergen region i forhold til antallet af intergeniske regioner. Hvis antallet af filtrerede folder var helt tilfældigt, skulle der være et relativt konstant antal steder pr. Som det fremgår af figur 5a, er dette ikke helt tilfældet. Region opnået fra tilfældigt blandede sekvenser afhænger af genomets GC-indhold. Genomer med lavt GC-indhold har et lidt højere antal folder pr. region end genomer på omkring 50% GC-indhold og genomer med højt GC-indhold har meget lavere antal end begge. Dette forventes fra tilfældige sekvenser filtreret for stem-loop strukturer indeholdende poly-u kørsler.
tidligere undersøgelser vedrørende specifikke systemer har rapporteret, at dæmpning og antitermineringsregulering i nogle operoner i E. coli kun er mildt bevaret på tværs af gamma division Proteobacteria. Forordningen rpsj operon og trpE og pheA operoner af E. coli har vist sig at have en plettet fordeling og svagt konserveret på tværs proteobakterier. Som vist i tabel 2, 5A og 5b, vi har været i stand til i vid udstrækning at udvide denne analyse af dæmpning og antiterminering til de fleste sådanne systemer i proteobakterier, og har vist, at dette gælder for alle kendte dæmpnings-og antitermineringsreguleringsmekanismer i E. coli og andre forudsagte mekanismer i yderligere gamma division genomer. Et eksempel er givet i figur 8 af den lave sekvens bevarelse af dæmpere og regulering. I figur 8a vises en af de mere konserverede dæmpere for HISG-operonens. Denne operon og reguleringsmekanisme er godt karakteriseret i E. coli, og vores Analyse forudsiger lignende mekanismer for dæmpningsregulering i V. cholerae og H. influensae. 40-50 bp opstrøms startkodon af hisG gen) og stamsekvens. Selvom de omgivende intergeniske regioner ikke er mulige at justere, V. cholerae og H. de har mulige aminosyreledersekvenser med et løb af histidiner, der er karakteristisk for dæmpningsreguleringsmekanismen i E. coli. Der blev ikke fundet forudsagte dæmpere i de andre tre probacteria-genomer med gamma-underinddeling af P. aeruginosa, N. meningitidus og fastidiosa. I P. aeruginosa er det intergeniske område opstrøms for HISG-ortologen kun 17 bp i længden, i fastidious overlapper det ortologe gen med ORF opstrøms, og selvom det analoge N. meningitidus intergeniske område er af tilstrækkelig længde, forudsiges ingen dæmpning.
Predicted attenuation termination structure in upstream region of HisG gene in E. coli. (a) Order of genes. Predicted stem-loop structures with statistical significance are indicated in blue. For the other explanation, see legend to figure 6a. Abbreviations for genomes: Ec, Escherichia coli; Hi, Haemophilus influenzae; Vc, Vibrio cholerae; Pa, Pseudomonas aeruginosa; Xf, Xylella fastidiosa; Nm, Neisseria meningitidis. (B) forudsagte dæmpningsafslutningsstrukturer. Se forklaring til figur 6b for forklaringen.