genom mérete és szabályozása. a) 26 genomból álló Intergenikus szekvenciákat véletlenszerűen összekeverünk, összehajtogatunk és szűrünk a jelentett módszerrel, hogy feltételezett csillapítókat kapjunk. Ezeknek a kevert és szűrt redőknek a számát intergenikus régiónként ábrázoltuk minden genomra az intergenikus régiók számával szemben. A korrelációnak, ha véletlenszerű, állandónak kell maradnia, és függetlennek kell lennie a genom méretétől. A kék gömbök a proteobaktériumokat és a Bacillis fajokat képviselik felmérésünkben, a bézs archaeabaktériumok, a többi zöld. A gömbök mérete a genom GC-tartalmának arányában van, és a GC-tartalmat minden gömbön belül címkézik. Az intergenikus régiónkénti véletlenszerű redők száma a GC-tartalom függvénye, amint az várható lenne a poli-U futásokkal rendelkező redők szűrésétől. Az ismert csillapítással vagy anti-terminációval rendelkező genomokat úgy jelöljük, mint azt a genomot, amelyről ismert, hogy nem használ csillapítókat poli-U futásokkal a terminációban. b) 22 genomból álló Intergenikus szekvenciákat hajtogattunk és szűrtünk a lehetséges csillapítók és a csillapítás vagy a terminációellenes szabályozás jelzése érdekében. Ezen előrejelzett csillapítók számát intergenikus régiónként összehasonlítjuk a genomban található intergenikus régiók számával. A véletlenszerűen kevert szekvenciák redőivel ellentétben a csillapítás gyakoriságának legerősebb meghatározója a genom mérete (az intergenikus régiók száma és a genom mérete erősen korrelál). A színek és a címkézés ugyanaz, mint az 5a.
még akkor is, ha figyelembe vesszük az M. tuberculosis GC-tartalmát, a többi magas GC-genomhoz képest csökkent az előre jelzett csillapítók száma (5b ábra). Valójában az 5b ábra (a tényleges intergenikus szekvenciák előrejelzett csillapítói) azt mutatja, hogy az intergenikus régiónkénti előrejelzett csillapítók számának legerősebb meghatározása nem a GC-tartalom, hanem a genom mérete (pontosabban az intergenikus régiók száma). Általánosságban elmondható, hogy a nagyobb genomokban nemcsak az előre jelzett csillapítók abszolút száma nagyobb, hanem az előrejelzett csillapítók előfordulása is nagyobb régiónként. Ha a GC-tartalom két genomban egyenlő, akkor a nagyobb genomban nagyobb valószínűséggel nagyobb az előre jelzett csillapítók száma intergenikus régiónként. Korábbi jelentések hasonló jelenségeket javasoltak a szabályozó fehérjékben, úgy tűnik, hogy a nagy genomokban nagyobb arányban vannak azok a gének, amelyek szabályozó motívumokat tartalmazó fehérjéket kódolnak . Érdekes, hogy az archaebaktériumokat és a magas GC-tartalmú genomokat leszámítva egy körülbelül 1500 intergenikus régióból álló Genom tűnik a küszöbértéknek, ahol a szabályozó csillapítók gyakorisága növekszik egy genomban.
az Attenuátorok eloszlása és konzerválása Gram – pozitív baktériumokban
hét gram-pozitív baktérium genomját (B. subtilis, B. halodurans, L. innocua, S. aureus, C. acetobutylicum, L. lactis és S. pneumoniae) elemezték annak megállapítására, hogy a csillapító terminátorok konzerváltak-e az ortológusok előtt. A B. subtilis-ben és a másik hat genomban ismert ortológusaik esetében az előre jelzett csillapítási terminátorok számát A 4. táblázat tartalmazza. A genomokat filogenetikai távolság szerint rendezzük B. subtilis az ezen genomok között megosztott ortológusok aminosav-szekvenciái alapján számítják ki. A B. subtilishez legközelebb a B. halodurans áll, az aminosav-szubsztitúciók átlagos száma helyenként 0,238, a legtávolabbi pedig az S. pneumoniae, az aminosav-szubsztitúciók átlagos száma helyenként 0,422. A 42. táblázatban felsorolt 4 gén esetében a többi genomban található ortológusok száma genomonként alig változik: a legmagasabb és a legalacsonyabb ortológusok száma 31 Az L. lactis-ban és 26 Az S. aureus-ban és a C. acetobutylicum-ban. Ez elsősorban azért van, mert ez a 42 gén hordoz néhány alapvető funkciót, például az aminoacil-tRNS szintézist. Másrészt az előre jelzett csillapítási végződtetési struktúrák száma jelentősen eltér: B-ben. haloduránok, 22 ortológ gén jósolta meg a csillapítási terminációs struktúrákat, míg csak 4 ortológ gén rendelkezik az előre jelzett struktúrákkal S. pneumoniae. Ez azt jelzi, hogy a csillapítással történő szabályozás hiánya vagy jelenléte sokkal gyengébben konzervált, mint a gén vagy az operonok jelenléte.
4. táblázat a B-ben ismert csillapítók listája. subtilis a Gram-pozitív baktériumok hat másik genomjának előrejelzéseivel összehasonlítva
ugyanez a tendencia érvényes az ismertektől eltérő várható csillapítási terminációs struktúrákra is (5.táblázat). 105 ortológ géncsoport van, amelyeknek legalább egy másik genomja van, amely előrejelzett csillapító szerkezetet tartalmaz egy ortológ gén előtt. Azokra az ortológusokra korlátozva, amelyek előre jelezték a csillapítókat B-ben. subtilis (35 csoport), a B. subtilisben a csillapítással vagy antiterminációval szabályozható közös ortológusok közül a legmagasabb és a legalacsonyabb a 28 (L. innocua) és a 18 (S. pneumoniae). Az előre jelzett csillapítási végződtetési struktúrák száma azonban jobban változik. Míg a B. haloduransban 13 gén van előre jelzett struktúrával, amely a hat gram-pozitív baktérium közül a B. subtilishez legközelebb eső faj, a S. pneumoniae-ban csak 2 gén jósolta meg a struktúrákat.
5.táblázat a hat Gram-pozitív baktérium Genom összes ortológ génjének felsorolása, amelyekben két vagy több Genom osztozik az előre jelzett csillapítókon
bár a csillapítók egésze gyenge, az előre jelzett csillapítási terminációs struktúrák és a downstream génjeik egyes géncsoportok számára konzerválódnak. Az egyik ilyen példa az infC-rpml-rplt operon (6A ábra). Az infC upstream régiójában az S. pneumoniae-ban nem várható csillapítás-végződtetési szerkezet (5.táblázat). Közelebbről szemügyre ezt a régiót BLAST kiderült, hogy az n-terminál infC felett előre 27 bázisok. Azáltal, hogy a 27 bázist hozzáadtuk az upstream intergenikus régióhoz, stabil szár-hurok szerkezetet találtunk, amelyet poli-U maradványok követtek az S. pneumoniae-ban is (6B ábra). Még ebben a példában is jelentős különbségek vannak a fajok között a szár-hurok struktúrák relatív helyzetében és a szekvencia megőrzésében. Sőt, még a filogenetikailag legközelebbi pár között is, B. subtilis és B. haloduránok, az infC szár végétől a kezdő kodonig terjedő távolság 69, illetve 37 bázis, és csak a szárban található közös szegmensek GUGUGGGN{x}CCCACAC (x = 12 A B. subtilisben és x = 9 A B. haloduransban). A hét Genom közül csak gyenge hasonlóság van, GYGGG (GACGG a C. acetobutylicumban) a szár régióban.
6.ábra
a feltételezett infC-rpmI-rplt operon upstream régiójában várható csillapítási végződési struktúra. a) A gének sorrendje. Csak az intergenikus régiók méretarányosak, az intergenikus régiók hossza pedig a vonal alatt van megadva. Az ortológ gének azonos színekben vannak feltüntetve. A hipotetikus géneket és a többi nem ortológ gént a “hyp”, illetve azok génazonosítói jelzik. A genomok rövidítése: Bs, B. subtilis; Bh, B. halodurans; Li, Listeria innocua; Sa, Staphylococcus aureus; Ca, Clostridium acetobutylicum; Ll, Lactococcus lactis; Sp, Streptococcus pneumoniae. (b) előre jelzett csillapítás megszüntetése struktúrák. Az alappárokat piros pontok jelzik az alapkódok között. Az alapszámozás a down stream gén kezdő kodonjától való távolságot mutatja. Poly-Us csak le patak a szár-hurok szerkezet zöld színű. A gyengén konzervált szegmensek piros színűek. A genomok rövidítése ugyanaz, mint az a) pontban.
Az előre jelzett csillapítási terminációs struktúrák megőrzése a lehetséges Nusa gént tartalmazó operon upstream régióiban is megfigyelhető (7a ábra). A hét Genom közül négy előre jelzett csillapító struktúrákat tartalmaz a hipotetikus fehérje előtt (ylxS a B. subtilis-ben). A szár-hurok struktúrák a három Genom többi részében is megtalálhatók, bár ezek a struktúrák nem haladnak át a szűrőkön. A struktúrák elhelyezkedése a downstream gén transzkripciós kiindulási helyéhez és maguk a szekvenciák is jelentősen eltérnek ebben a példában is. Ezekben a szárszekvenciákban a GUGGG szegmens (GAGCG az L. lactis-ban és GAGGC az S. pneumoniae-ban) konzerválódik az előre jelzett Nusa gént tartalmazó operonban (7b ábra). Érdekes módon az 5 bázisú szegmensek azonosak vagy nagyon hasonlóak az infC-től felfelé elhelyezkedő szárhurok-struktúrák szegmenseihez (6B ábra). A két operonban a géneket kódoló fehérjék részt vesznek a transzkripcióban. A szekvencia szegmensek megőrzése az infC-rpmI-rplT operon és a Nusa-t tartalmazó operon előrejelzett csillapítási Terminátor struktúráiban azt jelenti, hogy létezik egy közös szabályozó mechanizmus, amely felismeri a szár-hurok struktúrát, és ez mindkét operont azonos módon szabályozná.
7.ábra
előrejelzett csillapítási terminációs szerkezet az ylxS gén upstream régiójában. a) A gének sorrendje. A statisztikai szignifikanciájú előre jelzett szárhurok-struktúrákat kék színnel, a többi struktúrát, amelyek sem a szűrőkön nem haladnak át, sem kevésbé jelentősek, piros színnel jelölik. A másik magyarázat, lásd jelmagyarázat ábra 6A. (b) előre csillapítás megszüntetése struktúrák. Lásd legenda ábra 6B a magyarázat.
a csillapítók eloszlása és megőrzése Proteobaktériumokban
a csillapítók megőrzésének számos aspektusa azonnal nyilvánvaló a gram-pozitív baktériumok elemzéséből . Először is, a csillapítás vagy az anti-terminációs szabályozás eloszlása nem jól konzervált a gram-posztív baceria-ban, és emellett még a konzervált szabályozási rendszerekben is gyenge a szekvencia és a szerkezet megőrzése. Ugyanez igaz a proteobaktériumokra is. Az E-ben található 14 gén közül. coli (lásd az 5a táblázatot), amelyről ismert, hogy csillapítással vagy antiterminációval szabályozható, egyik sem rendelkezik attenuátorokkal előre jelzett upstream ortológusok mind a négy másik proteobaktérium genomban. Hat csillapító előrejelezte az upstream ortológusokat a másik négy Genom legalább egyikében. Három olyan gén, amelynek ortológusa van mind a négy másik genomban, de ezeknek nincsenek előre jelzett csillapítóik. Az E. coli fennmaradó öt génjének vagy nincs ismert ortológusa a másik genomban, vagy az ortológusok foltos eloszlással rendelkeznek, és nincsenek előre jelzett csillapítók. A kézi közelebbi vizsgálat megerősíti ezt a következtetést. Az 5b táblázat felsorolja az összes előre jelzett csillapítót a proteobaktériumok gamma-osztódásának öt genomjában, amelyekben hasonló csillapítót jósolnak egy másik Genom ortológusának. Amint az ebben a táblázatban látható, úgy tűnik, hogy a proteobaktérium genomokban az analóg operonok szabályozásának mechanizmusaként a csillapítás és az anti-termináció gyengén konzervált. Az öt genomban lévő összesen 475 génből és azok ortológusaiból, amelyek előre jelezték az attenuátorokat, csak 36 van két vagy több Genom upstream ortológusa (3., 5a. és 5b. táblázat).
5a. táblázat az e-ben ismert csillapítók listája.
5b.táblázat az öt proteobaktérium (gamma alosztály) Genom összes ortológ génjének felsorolása, amelyekben két vagy több Genom osztozik az előrejelzett csillapítókon
a specifikus rendszerekkel kapcsolatos korábbi kutatások arról számoltak be, hogy az E. coli egyes operonjaiban a csillapítás és az anti-termináció szabályozása csak enyhén konzervált a gamma-osztódás proteobaktériumaiban. Kimutatták, hogy a regulációs rpsJ operon, valamint az E. coli trpE és pheA operonjai foltos eloszlásúak és gyengén konzerváltak a proteobaktériumok között. Amint azt a 2., 5A. és 5b. táblázat mutatja, a proteobaktériumok legtöbb ilyen rendszerére kiterjedően ki tudtuk terjeszteni a csillapítás és az anti-termináció elemzését, és megmutattuk, hogy ez igaz az E. coli összes ismert csillapítási és anti-terminációs szabályozó mechanizmusára, valamint a további gamma-osztódási genomok egyéb előre jelzett mechanizmusaira. A 8. ábra egy példát mutat be a csillapítók alacsony szekvenciájú megőrzésére és szabályozására. A 8a. ábrán a hisg operon egyik konzerváltabb csillapítója látható. Ezt az operont és szabályozó mechanizmust jól jellemzi az E. coli, és elemzésünk a V. cholerae és a H. influenzae csillapítási szabályozásának hasonló mechanizmusait jósolja. Az előrejelzett csillapítók megtartották pozíciójukat (körülbelül 40-50 bp-nél a hisg gén kezdeti kodonja), valamint a szárszekvenciát. Bár a környező intergenikus régiókat nem lehet összehangolni, V. cholerae és H. az influenzae-knak vannak lehetséges aminosav-vezető szekvenciái a hisztidinek futtatásával, amely jellemző az E. coli csillapítási szabályozási mechanizmusára. A P. aeruginosa, az N. meningitidus és az X. fastidiosa másik három Gamma alosztályú probacteria genomjában nem találtak előre jelzett csillapítókat. A P. aeruginosa – ban az intergenikus régió a hisG ortolog előtt csak 17 bp hosszú, az X. fastious-ban az ortológ gén átfedésben van az ORF-fel felfelé, és bár az analóg N. meningitidus intergenikus régió elegendő hosszúságú, nem várható csillapító.
Figure 8
Predicted attenuation termination structure in upstream region of HisG gene in E. coli. (a) Order of genes. Predicted stem-loop structures with statistical significance are indicated in blue. For the other explanation, see legend to figure 6a. Abbreviations for genomes: Ec, Escherichia coli; Hi, Haemophilus influenzae; Vc, Vibrio cholerae; Pa, Pseudomonas aeruginosa; Xf, Xylella fastidiosa; Nm, Neisseria meningitidis. (b) előre jelzett csillapítás megszüntetése struktúrák. Lásd legenda ábra 6B a magyarázat.