caracterizarea atenuatorilor la B. subtilis și E. coli
s-a efectuat o amplă căutare în literatura de specialitate a operonilor la B. subtilis reglementați prin atenuare sau antiterminare și s-au găsit 46 de astfel de operoni. Acestea variază de la operonul TRP bine descris experimental la acei operoni în care s-au găsit structuri terminatoare și se așteaptă atenuarea, deși nu este bine caracterizată experimental (pentru o listă completă a se vedea http://www.bork.embl-heidelberg.de/Docu/attenuation). Aceste 46 de structuri terminatoare cunoscute au fost utilizate pentru a determina caracteristicile comune ale terminatorilor de atenuare B. subtilis. Folosind aceste caracteristici, am analizat regiunile din amonte ale genelor 3650 B. subtilis (folosind procedurile descrise în materiale și metode) pentru faldurile Terminatorului. Patruzeci și trei dintre cei 46 de Terminatori cunoscuți originali găsiți în căutarea literaturii au fost reținuți în acest screening. De asemenea, au fost obținute 1117 pliuri suplimentare în amonte care se potrivesc criteriilor noastre. În plus, ca control, am folosit aceeași metodologie de filtrare și pliere pe regiunile intergenice după ce secvențele au fost amestecate aleatoriu (952 de pliuri de secvențe amestecate aleatoriu au fost obținute după filtrare).
pliurile rezultate ale tuturor regiunilor intergenice și secvențele amestecate obținute după filtrare au fost reprezentate grafic în ceea ce privește stabilitatea și lungimea lor (figura 1). Faldurile Terminatorului cunoscute se află într-un cluster clar separat și distinct de acele falduri ale secvențelor amestecate aleatoriu. Faldurile Terminatorului au o energie liberă mai mică (CENTIGG) în raport cu lungimea decât pliurile prezise ale secvențelor aleatorii. Un model similar de două clustere ușor separate apare atunci când se compară structurile Terminatorului cunoscute cu regiunile intragenice pliate în care terminatorul nu este de așteptat să fie găsit (datele nu sunt prezentate).
folosind analiza componentelor principale, am determinat cea mai mare varianță a secvențelor amestecate aleatoriu. Acest lucru ne poate oferi o măsură (folosind deviația standard) a cărei pliuri sunt semnificativ diferite de pliurile secvențelor aleatorii (vezi materiale și metode). Din cele 1160 de falduri, un total de 203 de pliuri ale regiunilor intergenice obținute în ecranul nostru se încadrează sub linia de abatere 2 (z -2) derivată din componenta principală. Astfel, acestea sunt considerate semnificativ diferite de pliurile aleatorii și posibilele locuri de terminare a atenuării sau a reglării antiterminării. Patruzeci și două dintre acestea sunt cunoscute terminatori de atenuare falduri (din original 43 cunoscut falduri menținute după filtrare). Astfel, suntem capabili să obținem 91,3% (42/46) din siturile de atenuare și antiterminare cunoscute și caracterizate experimental folosind filtrul și măsura noastră de semnificație. În plus, filtrul și măsurarea semnificației afișează peste 97,7% (930 din 952) din pliurile secvențelor aleatorii. O sută șaizeci și unu (203 în total, excluzând 42 cunoscute) pliuri sub linie (z -2) sunt pliuri care nu sunt încă analizate experimental și ar putea fi prezise a fi structuri terminatoare de atenuare.
o investigație detaliată a constatat că multe dintre aceste predicții sunt puternic susținute ca site-uri de atenuare sau antiterminare presupuse de contextul genomic, cum ar fi prezența secvențelor de promotori presupuși, localizarea în amonte a operonilor presupuși și cunoscuți etc. Două structuri terminatoare în amonte genele ydbJ și yqhI servesc ca exemple detaliate ale modului în care contextul genomic poate informa și susține puternic predicțiile făcute în tabelul 1 (Figura 2). Gena ydbJ a lui B. subtilis este listată ca ipotetică cu omologie la o genă transportoare ABC (proteină care leagă ATP implicată în transportul cuprului). Gena imediat în aval, ydbK, are omologie cu membrana care acoperă permeazele. Folosind STRING (un instrument de căutare pentru Găsiți instanțe recurente ale genelor vecine ), ortologii acestor două gene se găsesc, de asemenea, în aceeași ordine în unitățile transcripționale ale altor 15 genomi înrudiți la distanță, sugerând posibilitatea ca aceste gene să formeze un operon. Aceste gene par a fi într-o configurație tipică de operon transportor ABC și se știe că mai mulți operoni transportori ABC sunt reglementați prin atenuare în B. subtilis . Regiunea upstream ydbJ are, de asemenea, o presupusă secvență promotor și pliurile prezise folosind RNAfold (vezi materiale și metode) din întreaga secvență upstream sugerează că se poate plia în pliuri complexe posibile de antiterminare (datele nu sunt afișate). Pe baza acestui context, prezicem că acesta este un operon transportor ABC reglementat de atenuare. Al doilea exemplu, yqhI, este prima genă dintr-o serie de trei gene, toate având omologie cu genele de biosinteză a glicinei într-o unitate transcripțională presupusă. Această serie de trei gene are, de asemenea, ortologi găsiți ca vecini în alte genomi . Mulți operoni de biosinteză a aminoacizilor din B. subtilis sunt cunoscuți a fi reglementați prin atenuare , susținând astfel această predicție.
pentru a vedea dacă modelele observate sunt valabile pentru singurul genom în care atenuarea sau antiterminarea este bine studiată și descrisă experimental, am aplicat aceeași metodologie și regiunilor din amonte ale genelor din genomul E. coli pentru care 16 operoni au fost descriși ca fiind reglementați prin atenuare sau antiterminare. După cum se poate observa în Figura 3, structurile Terminatorului de atenuare și antiterminare cunoscute ale E. coli au proprietăți similare cu cele ale lui B. subtilis. 15 din cele 16 atenuatoare cunoscute au fost menținute după filtrare. Măsura de semnificație separă 14 dintre acești Terminatori E. coli de pliuri aleatorii așa cum se vede în Figura 3. Ca și în B. subtilis, folosind linia (Z -2) ca măsură de semnificație, suntem capabili să prezicem atenuarea pentru 146 de regiuni (Figura 3 și Tabelul 2).
extinderea analizei la 26 de genomi
analiza B. subtilis și E. coli sugerează că un studiu mai larg al genomilor bacterieni s-ar putea dovedi util atât în predicția atenuării și a reglării antiterminării în aceste genomi, cât și în caracterizarea evoluției și distribuției acestor mecanisme de reglare. Douăzeci și patru de genomi finalizați au fost selectați pentru acest studiu pe baza distribuției lor largi în spectrul evolutiv (Tabelul 3). Regiunile intergenice ale fiecăruia dintre aceste genomi au fost analizate folosind aceleași metode și filtre ca și în Cazul B. subtilis și E. coli și atenuarea prezis și terminator antiterminare falduri obținute în mod similar.
așa cum se arată în tabelul 3, există o distribuție largă a numărului de site-uri de reglare a atenuării și antiterminării presupuse în genomii chestionați. Acestea variază de la 5 în Mycobacterium tuberculosis la 275 în Clostridium acetobutylicum (Tabelul 3). Încercările anterioare de a prezice site-urile standard de terminare a transcrierii la sfârșitul unităților de transcriere dau rezultate similare. Interesant, rezultatele pentru terminatorii de transcriere standard se corelează cu ale noastre. Așa cum a fost găsit în Ermolaeva et. al Cu Terminatori standard la sfârșitul unităților de transcripție (această lucrare a studiat terminatorii la sfârșitul ORFs și nu a vizat regiunile din amonte, filtrând astfel posibilii atenuatori), unele dintre cele mai mari apariții ale siturilor de atenuare și antiterminare din sondajul nostru se găsesc în mod similar în genomul E. coli, H. influenze, D. radiodurans și B. subtilis și cel mai mic număr de apariții în astfel de genomi ca H. pylori și M. tuberculosis (genomi raportate în sondajul lor).
la prima vedere, acest lucru pare să sugereze că mulți genomi nu folosesc aceleași mecanisme de terminare pentru terminarea transcripției standard și nu folosesc atenuarea sau antiterminarea în reglementare. Acest lucru este probabil cazul în unele genomi. Cu toate acestea, dacă numărul regiunilor intergenice din amonte este reprezentat grafic în raport cu numărul siturilor prezise, este prezentată o corelație pozitivă puternică (Figura 4). Cu cât este mai mic numărul de gene și regiuni intergenice pe care le are un genom, cu atât este mai mică apariția terminatorilor preziși (atât terminatori de transcripție standard, cât și terminatori de reglare a atenuării/antiterminării). Acest lucru indică faptul că numărul scăzut atât al încetării standard, cât și al încetării de reglementare în multe genomi se datorează unei dimensiuni mult reduse a genomului și reducerii numărului de operoni de reglementare și nu neapărat dependenței de diferite mecanisme de reziliere și reglementare.
există un outlier clar, cu un număr mult mai mic decât cel așteptat de Terminatori presupuși, observat în Figura 4, Mycobacterium tuberculosis. Acest genom are o apariție mult mai mică a siturilor de atenuare și antiterminare presupusă decât ar fi sugerată de dimensiunea sa și de numărul de regiuni intergenice. O lucrare recentă de Unniraman și colab. concluzionează că M. tuberculosis folosește un mecanism diferit de terminare care utilizează structuri terminatoare fără coada poli-U necesară în alte genomi. Astfel, numărul redus de structuri terminatoare care conțin poli-U în raport cu numărul de regiuni intergenice poate fi explicat prin dependența M. tuberculosis de un mecanism diferit de terminare. Acest lucru nu dovedește neapărat că nu există o reglare a tipului de atenuare sau antiterminare în M. tuberculosis. Cu toate acestea, indică faptul că fie pierderea mecanismului standard de terminare în acest genom a redus dacă nu a eliminat atenuarea sau antiterminarea în M. tuberculosis sau, alternativ, un mecanism asemănător atenuării ar putea exista în acest genom care utilizează M. Terminator non-standard pentru tuberculoză.
toate celelalte dintre cele 25 de genomi chestionați au site-uri de atenuare sau reglare antiterminare. Chiar și cel mai mic număr de site-uri de atenuare sau antiterminare prezise găsite în M. genitalium sunt o proporție semnificativă a posibilelor regiuni intergenice de reglementare, numărul redus este ușor reprezentat de dimensiunea relativ mică a acestui genom și de puține regiuni intergenice și unități transcripționale. Aceste rezultate sugerează că reglarea atenuării și antiterminării este un mecanism posibil omniprezent de reglare la procariote, cu puține excepții.
dimensiunea și atenuarea genomului
dacă conținutul GC al unui genom este comparat cu numărul de atenuatori preziși pe baza secvenței amestecate aleatoriu, conținutul GC se corelează oarecum cu numărul de atenuatori preziși, ceea ce ar fi de așteptat, deoarece este necesară o rulare poli-U în filtre. În figura 5a, pliurile din secvențele intergenice amestecate aleatoriu ale celor 26 de genomi ai noștri au fost reprezentate de numărul de pliuri filtrate pe regiune intergenică în raport cu numărul de regiuni intergenice. Dacă numărul de pliuri filtrate a fost complet aleatoriu, ar trebui să existe un număr relativ constant de site-uri pe regiune în raport cu numărul de regiuni. După cum se vede în figura 5a, acest lucru nu este complet cazul. Numărul de pliuri filtrate pe regiune obținut din secvențe amestecate aleatoriu depinde de conținutul GC al genomului. Genomii cu conținut scăzut de GC au un număr ușor mai mare de pliuri pe regiune decât genomii cu conținut de GC de aproximativ 50%, iar genomii cu conținut ridicat de GC au un număr mult mai mic decât ambele. Acest lucru este de așteptat din secvențe aleatorii filtrate pentru structuri stem-buclă care conțin rulări poli-U.
chiar și atunci când se ia în considerare conținutul de GC al M. tuberculosis, acesta are un număr redus de atenuatori preziși în raport cu ceilalți genomi cu GC ridicat (figura 5b). De fapt, figura 5b (atenuatorii preziși ai secvențelor intergenice reale) arată că cel mai puternic determinat al numărului de atenuatori preziși pe regiune intergenică nu este conținutul GC, ci mai degrabă dimensiunea genomului (mai precis numărul regiunilor intergenice). În general, nu numai că genomii mai mari au un număr absolut mai mare de atenuatori preziși, dar au o apariție mai mare a atenuatorilor preziși pe regiune. Dacă conținutul de GC este egal în două genomi, genomul mai mare este mai probabil să aibă un număr mai mare de atenuatori preziși pe regiune intergenică. Rapoartele anterioare au sugerat fenomene similare în proteinele reglatoare, genomii mari par să aibă o proporție mai mare din numărul lor total de gene care codifică proteinele care conțin motive reglatoare . Interesant este că, scăzând arhebacteriile și genomii cu conținut ridicat de GC, un genom de aproximativ 1500 de regiuni intergenice pare a fi pragul la care frecvența atenuatorilor reglatori crește într-un genom.
distribuția și conservarea Atenuatorilor în bacteriile Gram pozitive
au fost analizate șapte genomi de bacterii gram-pozitive (B. subtilis, B. halodurans, L. innocua, S. aureus, C. acetobutylicum, L. lactis și S. pneumoniae) pentru a vedea dacă terminatorii de atenuare sunt conservați în fața ortologilor. Numărul de terminatori de atenuare preziși pentru genele despre care se știe că sunt reglate în B. subtilis și ortologii lor în celelalte șase genomi sunt enumerați în tabelul 4. Genomii sunt Sortați după distanța filogenetică de la B. subtilis calculată prin secvențe de aminoacizi ale ortologilor împărțiți între acești genomi. Cel mai apropiat de B. subtilis este B. halodurans și numărul mediu de substituții de aminoacizi pe situs este de 0,238, iar cel mai îndepărtat este S. pneumoniae și numărul mediu de substituții de aminoacizi pe situs este de 0,422. Pentru cele 42 de gene enumerate în tabelul 4, Numărul de ortologi care se găsesc în celelalte genomi variază puțin de la genom la genom: cel mai mare și cel mai mic număr de ortologi sunt 31 în L. lactis și 26 în S. aureus și, respectiv, C. acetobutylicum. Acest lucru se datorează în principal faptului că aceste 42 de gene poartă unele funcții de bază, cum ar fi sinteza aminoacil-Arnt. Pe de altă parte, numărul structurilor de terminare a atenuării prezise variază semnificativ: în B. halodurani, 22 de gene ortologice au prezis structuri de terminare a atenuării, în timp ce doar 4 gene ortologice au structurile prezise în S. pneumoniae. Acest lucru indică faptul că absența sau prezența reglării prin atenuare este mult mai slab conservată decât prezența genei sau operonilor.
aceeași tendință este valabilă și pentru structurile de terminare a atenuării prezise, altele decât cele cunoscute (Tabelul 5). Există 105 grupuri de gene ortologe care au cel puțin un alt genom care conține o structură atenuatoare prezisă în amonte de o genă ortologă. Restricționarea la ortologii care au prezis atenuatori în B. subtilis (35 de grupuri), cel mai mare și cel mai mic număr de ortologi împărțiți de gene cunoscute a fi reglate prin atenuare sau antiterminare în B. subtilis sunt 28 (L. innocua) și, respectiv, 18 (S. pneumoniae). Cu toate acestea, numărul structurilor de terminare a atenuării prezise variază mai mult. Deși există 13 gene cu structuri prezise în B. halodurans, care este cea mai apropiată specie de B. subtilis dintre cele șase bacterii gram-pozitive, doar 2 gene au prezis structuri în S. pneumoniae.
deși există o conservare slabă a atenuatorilor în ansamblu, structurile de terminare a atenuării prezise și ordinea de genele lor din aval sunt conservate pentru unele grupuri de gene. Un astfel de exemplu este infc-rpml-rplt operon (figura 6a). Nu este prevăzută nicio structură de terminare a atenuării în regiunea amonte a infC în S. pneumoniae (Tabelul 5). O privire mai atentă asupra acestei regiuni de către BLAST a arătat că n-terminalul infC este peste prezis în 27 de baze. Prin adăugarea celor 27 de baze în regiunea intergenică din amonte, s-a constatat o structură stabilă de buclă stem care a urmat reziduurilor poli-U și în S. pneumoniae (figura 6b). Chiar și în acest exemplu cu toate acestea, există diferențe considerabile între specii în poziția relativă a structurilor stem-buclă și conservarea secvenței. Mai mult, chiar și între perechea filogenetică cea mai apropiată, B. subtilis și B. halodurani, distanțele de la capătul tulpinii până la codonul de pornire al infC sunt 69 și respectiv 37 de baze și numai segmentele comune găsite în tulpină sunt GUGUGGGN{x}CCCACAC (x = 12 în B. subtilis și x = 9 în B. halodurans). Dintre toate cele șapte genomi, există doar o asemănare slabă, GYGGG (GACGG în C. acetobutylicum) în regiunea tulpinii.
conservarea structurilor de terminare a atenuării prezise este observată și în regiunile din amonte ale posibilului operon care conține gena nusA (figura 7a). Patru din șapte genomi conțin structuri atenuatoare prezise în amonte de proteina ipotetică (ylxS în B. subtilis). Structurile cu buclă Stem se găsesc și în restul a trei genomi, deși aceste structuri nu trec filtrele. Localizarea structurilor la locul de pornire a transcrierii genei din aval și secvențele în sine variază semnificativ și în acest exemplu. În aceste secvențe stem, segmentul GUGGG (GAGCG în L. lactis și GAGGC în S. pneumoniae) este conservat în operonul prezis care conține gena nusA (figura 7b). Interesant este că segmentele cu 5 baze sunt identice sau foarte asemănătoare cu segmentele din structurile stem-buclă situate în amonte de infC (figura 6b). Proteinele codificate genele din aceste două operon sunt implicate în transcriere. Conservarea segmentelor de secvență în structurile Terminatorului de atenuare prevăzut pentru operonul infC-rpmI-rplT și operonul care conține Nusa implică faptul că există un mecanism comun de reglementare care recunoaște structura stem-buclă și acest lucru ar regla ambii operoni în același mod.
distribuția și conservarea Atenuatorilor în proteobacterii
Mai multe aspecte ale conservării atenuatorilor sunt imediat evidente din analiza noastră a bacteriilor gram-pozitive . În primul rând, distribuția atenuării sau a reglării antiterminării nu este bine conservată în baceria gram-postivă și, în plus, chiar și în sistemele de reglare conservate, conservarea secvenței și a structurii este slabă. Același lucru este valabil și pentru proteobacterii. Din cele 14 gene din E. coli (vezi Tabelul 5a) cunoscut a fi reglat prin atenuare sau antiterminare, niciunul dintre atenuatori nu a prezis ortologi în amonte în toate celelalte patru genomi de proteobacterii. Șase atenuatori au prezis ortologi în amonte în cel puțin unul dintre celelalte patru genomi. Trei sunt gene care au ortologi în toate celelalte patru genomi, dar acestea nu au atenuatori preziși. Restul de cinci gene din E. coli fie nu au ortologi cunoscuți în celălalt genom, fie ortologii au o distribuție spotty și nu au atenuatori preziși. O inspecție mai atentă cu mâna confirmă această concluzie. Tabelul 5b este o listă a tuturor atenuatorilor preziși în fiecare dintre cele cinci genomi ai Diviziei gamma a proteobacteriilor în care este prezis un atenuator similar pentru un ortolog al unui alt genom. După cum se arată în acest tabel, atenuarea și antiterminarea par a fi slab conservate ca mecanism de reglare în operoni analogi în genomii proteobacterieni. Din totalul de 475 de gene și ortologii lor din aceste cinci genomi care au prezis atenuatori, doar 36 sunt ortologi în amonte împărțiți a două sau mai multe genomi (Tabelele 3, 5A și 5B).
cercetările anterioare privind sistemele specifice au raportat că atenuarea și reglarea antiterminării la unii operoni din E. coli sunt doar ușor conservate în proteobacteriile diviziei Gamma. Operonul rpsJ de reglare și operonii trpE și pheA ai E. coli s-au dovedit a avea o distribuție spotty și slab conservată între proteobacterii. Așa cum se arată în tabelele 2, 5A și 5B, am reușit să extindem extensiv această analiză a atenuării și antiterminării la majoritatea acestor sisteme din proteobacterii și am arătat că acest lucru este valabil pentru toate mecanismele cunoscute de reglare a atenuării și antiterminării în E. coli și alte mecanisme prezise în genomii suplimentari de diviziune gamma. Un exemplu este dat în figura 8 a conservării secvenței scăzute a atenuatoarelor și reglării. În figura 8a, unul dintre atenuatorii mai conservați este prezentat pentru cel al operonului hisG. Acest operon și mecanism de reglementare este bine caracterizat în E. coli și analiza noastră prezice mecanisme similare de reglare a atenuării în V. cholerae și H. influenzae. Atenuatorii preziși au păstrat poziția (la aproximativ 40-50 bp codonul de pornire în amonte al genei hisG) și secvența tulpinii. Deși regiunile intergenice înconjurătoare nu sunt posibile să se alinieze, V. cholerae și H. influenzae au posibile secvențe de lider de aminoacizi cu o serie de histidine care este caracteristică mecanismului de reglare a atenuării în E. coli. Atenuatorii preziși nu au fost găsiți în celelalte trei genomi de probacterii de subdiviziune gamma ale P. aeruginosa, N. meningitidus și X. fastidiosa. În P. aeruginosa Regiunea intergenică în amonte de ortologul hisG are doar 17 bp în lungime, în X. fastidios gena ortologă se suprapune cu Orf în amonte și, deși regiunea intergenică analogă N. meningitidus are o lungime suficientă, nu este prevăzut niciun atenuator.