안정성 및 길이의 분포 stem-loop 구조에서 업스트림 세그먼트 시퀀스에서 대장균. 빨간색 선은 단행 된 시퀀스의 줄기 루프 구조에서 파생 된 가장 큰 분산(재료 및 방법 참조)을 보여줍니다. 밝은 파란색 선은 표준 편차를 기반으로 의미 측정을 제공합니다. 이웃 유전자의 방향과 함께 각 점에 대한 정의는 오른쪽 상단 패널에 표시됩니다.2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 그 결과,그 결과는 다음과 같습니다. 대장균 세균 게놈의 광범위 한 조사 감쇠 및 이러한 게놈에서 항 제 규제의 예측 및 진화와 규제의 이러한 메커니즘의 분포의 특성에 유용 증명할 수 있습니다 것이 좋습니다. 24 완성 된 게놈 진화 스펙트럼(표 3)에 걸쳐 그들의 광범위 한 분포에 따라이 설문 조사에 대 한 선택 되었다. 이러한 각 게놈의 유전자 간 영역은 다음과 같은 방법 및 필터를 사용하여 분석되었습니다. 대장균 및 예측 감쇠 및 항 제거 터미네이터 폴드 유사하게 얻어진다.표 3 에서 볼 수 있듯이,조사된 게놈에서 추정 감쇠 및 항소 규제 사이트의 수가 광범위하게 분포되어 있다. 이들은 결핵균의 5 에서 클로스 트리 디움 아세토 부틸 리쿰의 275 까지 다양합니다(표 3). 전사 단위의 끝에 표준 전사 종료 사이트를 예측 하는 이전 시도 비슷한 결과 제공 합니다. 흥미롭게도,표준 전사 종결 자에 대 한 결과 우리와 상관 관계. 에르 몰라 에바 등에서 발견 된 바와 같이. 알 전사 단위의 끝에 표준 터미네이터(이 종이 연구 종결자 끝 및 따라서 가능한 감쇠기를 필터링 업스트림 영역을 대상으로 하지 않았다),감쇠 및 항 제 사이트의 발생의 가장 높은 수의 일부 우리의 조사에서 마찬가지로 대장균의 게놈에서 발견 된다,에이치. 이 유전체 중 가장 낮은 발생 횟수는 다음과 같습니다.언뜻 보면,이것은 많은 게놈이 표준 전사 종료를 위해 동일한 종단 메커니즘을 사용하지 않고 규제에서 감쇠 또는 항 제제를 사용하지 않는다는 것을 암시하는 것 같습니다. 이 가능성이 일부 게놈의 경우입니다. 그러나 상류 간 지역 수가 예측 된 사이트의 수에 대해 플롯되면 강한 양의 상관 관계가 표시됩니다(그림 4). 게놈이 가지고있는 유전자 및 유전자 간 영역의 수가 작을수록 예측 된 종결 자(표준 전사 종결 자 및 감쇠/항 제거 규제 종결 자 모두)의 발생이 낮아집니다. 이것은 많은 게놈에서 표준 종료 및 규제 종료의 낮은 숫자가 훨씬 감소 된 게놈 크기와 규제 오페론의 수의 감소로 인한 것임을 나타냅니다.,그리고 반드시 종료 및 규제의 다른 메커니즘에 의존하는 것은 아닙니다.조사 대상 26 개 게놈에서 추정 감쇠 및 항결핍 사이트의 수 대 유전자 간 영역의 수의 그래프. 알려진 감쇠 또는 항 제를 가진 여러 게놈은 비교를 위해 다음과 같이 표시됩니다. 점선은 지수 추세선입니다.그림 4 에서 볼 수있는 추정 종결자의 예상보다 훨씬 낮은 수의 명확한 이상치가있다,결핵균. 이 게놈은 그 크기와 홀몬 간 영역의 수에 의해 제안되는 것보다 추정 감쇠 및 항 제거 부위의 발생이 훨씬 낮습니다. 우니 라만 등의 최근 논문. 결핵은 다른 게놈에서 필요한 폴리-유 꼬리없이 터미네이터 구조를 활용 종료의 다른 메커니즘을 사용. 따라서 수 감소는 많 U 포함하는 터미네이터 구조와 관련하여 수출지역으로 설명할 수 있는 M.tuberculosis’에 대한 의존도 다른 메커니즘의 종료됩니다. 이것은 반드시 결핵에 감쇠 또는 항결핵 유형 규제가 없다는 것을 증명하지는 않습니다. 그러나,이 게놈에서 종료의 표준 메커니즘의 손실 감소 하지 제거 감쇠 또는 항 결핵 또는 양자 택일로,감쇠와 같은 메커니즘을 활용 하 여이 게놈에 존재할 수 있는 경우를 나타냅니다. 결핵 비표준 터미네이터.조사 된 25 개의 게놈 중 다른 모든 게놈은 추정 감쇠 또는 항 제거 조절 부위를 가지고 있습니다. 심지어 가장 낮은 수의 예측된 감쇠 또는 항제거 사이트에서 발견 엠.성기는 가능한 규제 간 지역,낮은 수의 상당한 비율 쉽게이 게놈의 상대적으로 작은 크기와 몇 간 지역 및 전사 단위에 의해 설명. 이러한 결과 감쇠 및 항 제 규제는 몇 가지 예외를 제외 하 고 원핵 생물에 규제의 가능성이 유비쿼터스 메커니즘 것이 좋습니다.만약 게놈의 게놈 함량이 무작위로 뒤섞인 서열을 기반으로 한 예측 감쇠기의 수와 비교된다면,필터에서 폴리 유 런이 필요하기 때문에 예상되는 예측 감쇠기의 수와 어느 정도 상관 관계가 있습니다. 그림 5 에서,우리의 26 게놈의 무작위로 단행 된 인터 홀겐 서열에서 폴드 인터 홀겐 영역의 수와 관련하여 인터 홀겐 영역 당 필터링 된 폴드의 수에 의해 플롯되었다. 필터링된 폴드의 수가 완전히 무작위인 경우 영역 수와 관련하여 영역당 사이트 수가 상대적으로 일정해야 합니다. 그림 5 에서 볼 수 있듯이,이 완전히 사실이 아니다. 무작위로 뒤섞인 시퀀스에서 얻은 영역 당 필터링 된 폴드의 수는 게놈의 유전자 검사 내용에 따라 다릅니다. 저 유전체 함량 게놈은 약 50%의 유전체 함량 및 고 유전체 함량 게놈보다 영역 당 주름 수가 약간 더 높습니다. 이는 폴리 유 런을 포함하는 스템 루프 구조에 대해 필터링 된 무작위 시퀀스에서 예상됩니다.2015 년 12 월 15 일(토)~2015 년 12 월 15 일(토)~2015 년 12 월 15 일(일) (에이)26 게놈의 유전자 간 서열을 무작위로 섞었다,접혀 및 추정’감쇠기’를 얻기 위해보고 된 방법을 사용하여 필터링. 각 게놈에 대해 각 게놈에 대해 각 게놈 간 영역 당 이러한 셔플 및 필터링 된 주름의 수를 플롯했습니다. 상관 관계,임의의 경우,일정하고 게놈 크기의 독립적 남아 있어야합니다. 파란색 구체는 프로 테오 박테리아와 바실리스 종을 나타냅니다. 구체는 게놈의 구체 내용에 비례하여 크기에서 이고 구체 내용은 각 구체 안에 레테르를 붙인다. 이 기능은 다음과 같은 기능을 제공합니다. 알려진 감쇠 또는 항거제를 가진 게놈은 폴리 유가 종단 상태에서 감쇠기를 사용하지 않는 것으로 알려진 게놈으로 표시됩니다. (비)22 개의 게놈의 유전자 간 서열을 접어서 가능한 감쇠기 및 감쇠 또는 항 제거 조절의 표시를 위해 여과 하였다. 유전자 간 영역 당 이러한 예측 감쇠기의 수는 게놈의 유전자 간 영역의 수와 비교됩니다. 무작위로 뒤섞인 시퀀스의 폴드와는 달리,감쇠 빈도에 대한 가장 강력한 확정은 게놈 크기(유전자 간 영역의 수와 게놈 크기는 강하게 상관된다)입니다. 색상 및 라벨은 5 와 동일합니다.결핵은 다른 높은 유전체 게놈과 관련하여 예측 감쇠기의 수를 감소시켰다(그림 5 비). 실제로,그림 5 비(실제 인터 홀몬 서열의 예측 감쇠기)는 인터 홀몬 영역 당 예측 감쇠기 수의 가장 강력한 결정체가 게놈 내용이 아니라 게놈 크기(보다 구체적으로 인터 홀몬 영역의 수)를 보여줍니다. 일반적으로,뿐만 아니라 더 큰 게놈 예측된 감쇠기의 더 큰 절대 번호를가지고 있지만 지역 당 예측된 감쇠기의 더 큰 발생. 만약 게놈 함량이 두 게놈에서 같으면,더 큰 게놈은 인터 홀몬 영역 당 더 많은 수의 예측 감쇠기를 가질 가능성이 더 높습니다. 이전 보고서 규제 단백질에 비슷한 현상을 제안 했다,큰 게놈 규제 모티브를 포함 하는 단백질에 대 한 코드 유전자의 그들의 총 수의 큰 비율이 나타납니다. 흥미롭게도,고세균과 높은 유전체 함량 게놈을 할인,약 1500 개 간 영역의 게놈은 규제 감쇠기의 주파수가 게놈에서 증가하는 임계 값으로 나타납니다.
배포하고 보존의 감쇠기에는 그램 양성 박테리아
일곱 개의 유전자는 그램 양성 박테리아(B.subtilis,B.halodurans,L.innocua,S. 균,C.acetobutylicum,L.lactis,그리고 미 균)으로 분석하였는지 여부를 확인 감쇠 터미네이터 보존에 앞 orthologs. 다른 6 개의 게놈에서 서브 틸리 스 및 그들의 직교체는 표 4 에 나열되어 있습니다. 서브 틸리 스 이러한 게놈 중 공유 직교체의 아미노산 서열에 의해 계산. 가장 가까운 것은 비.서브 틸리 스 비.할로 두란스 및 사이트 당 평균 아미노산 치환 수는 0.238 이고,가장 먼 것은 에스.폐렴 및 사이트 당 평균 아미노산 치환 수는 0.422 입니다. 표 4 에 나열된 42 개의 유전자에 대해,다른 게놈에서 발견되는 오르톨로지의 수는 게놈에서 게놈에 따라 거의 다릅니다:오르톨로지의 최고 및 최저 수는 엘 락티스에서 31 개,에스 아우 레우스 및 씨 아세토 부틸 리쿰에서 각각 26 개입니다. 이것은 주로 이들 42 개의 유전자가 아미노 아실-트르 나 합성과 같은 몇 가지 기본 기능을 가지고 있기 때문입니다. 다른 한편으로는,예측 감쇠 종단 구조의 수는 크게 변화:에 비. 할로 두란,22 개의 직교 유전자는 감쇠 종단 구조를 예측 한 반면,4 개의 직교 유전자 만이 뉴 모니 아에서 예측 된 구조를 가지고 있습니다. 이것은 감쇠에 의한 조절의 부재 또는 존재가 유전자 또는 오페론의 존재보다 훨씬 약하게 보존된다는 것을 나타냅니다.표 4 에서 알려진 감쇠기 목록. 그람 양성균의 다른 6 개 게놈의 예측과 비교하여 서브 틸리 스는 알려진 것 이외의 예측 된 감쇠 종단 구조에 대해서도 동일한 경향이 있습니다(표 5). 예측 감쇠기 구조를 포함하는 적어도 하나의 다른 게놈을 갖는 105 개의 직교 유전자 그룹이 직교 유전자 상류에있다. 에 감쇠기를 예측 한 직교로 제한 비. 감쇠 또는 항염에 의해 조절되는 것으로 알려진 유전자의 가장 높은 수와 가장 낮은 수의 서브 틸리 스(35 개 그룹)는 각각 28 개(엘.이노 쿠아)및 18 개(에스. 그러나 예측 된 감쇠 종단 구조의 수는 더 다양합니다. 6 개의 그람 양성균 중에서 2 개의 유전자 만이 뉴 모니 아에서 구조를 예측했습니다.표 5 두 개 이상의 게놈이 예측 감쇠기를 공유하는 6 그람 양성균 게놈의 모든 직교 유전자 목록 전체 감쇠기의 보존이 약하지만,예측 감쇠 종단 구조와 그 하류 유전자의 순서가 보존된다.일부 유전자 그룹의 경우. 이러한 예는 다음과 같습니다. 감쇠 종단 구조는 뉴 모니 아(표 5)의 상류 영역에서 예측되지 않습니다. 폭발로 이 지역을 자세히 살펴보면,27 개 기지에서 인포메이션의 엔터미널이 이미 예측된 것으로 나타났다. 27 기지 상류에 있는 간 지역에 추가 하 여,우리는 폴리-유 잔기에 의해 다음 안정적인 줄기 루프 구조를 발견. 그러나이 예에도 줄기 루프 구조 및 시퀀스 보존의 상대적인 위치에 종 사이 상당한 차이가 있다. 또한 계통 발생 학적으로 가장 가까운 쌍 사이에서도 비.서브 틸리 스 과 비. 할로 두란,줄기의 끝에서 시작 코돈까지의 거리는 각각 69 및 37 염기이며,줄기에서 발견되는 일반적인 세그먼트 만 구그그겐{엑스}씨 카카 크(엑스=12 비.서브 틸리 스 과 엑스=9 비.할로 두란). 모든 7 개의 게놈 중에서 줄기 영역에는 약한 유사성 인 기그그(아세토 부틸 리쿰의 가그그)가 있습니다.2015 년 12 월 15 일(토)~2015 년 12 월 15 일(토)~2015 년 12 월 15 일(토)~2015 년 12 월 15 일(일)~2015 년 12 월 15 일(일)~2015 년 12 월 15 일(일)~2015 년 12 월 15 일(일)~2015 년 12 월 15 일(일)~2015 년 12 월 15 일(일)~2015 년 12 월 15 일(일)~2015 년 12 월 15 일(일)~2015 년 12 월 15 일(일)~2015 년 12 월 15 일(일)~2015 년 12 월 15 일(일) 1)유전자 순서. 만 간 지역 규모로 그려집니다 및 간 지역의 길이는 선 아래에 주어진다. 직교 유전자는 같은 색으로 표시됩니다. 가설 유전자 및 기타 비 직교 유전자는 각각”힙”과 그 유전자 신분증으로 표시됩니다. 유전자좌의 약어:병,비.서브 틸리 스;비,비.할로 두란;리,리스테리아 이노 쿠아;사,황색 포도상 구균;캘리포니아,클로스 트리 디움 아세토 부틸 리쿰;엘,락토 코커스 락 티스;스피,연쇄상 구균 폐렴. (비)예측 감쇠 종단 구조. 기본 쌍은 기본 코드 사이에 빨간색 점으로 표시됩니다. 기본 번호 매기기는 다운 스트림 유전자의 시작 코돈으로부터의 거리를 보여줍니다. 폴리-우리 그냥 줄기 루프 구조의 스트림 아래로 녹색으로 착색된다. 약하게 보존 된 세그먼트는 빨간색으로 표시됩니다. 게놈의 약어는(에이)와 동일합니다.예측 감쇠 종단 구조의 보존은 또한 누사 유전자를 포함하는 가능한 오페론의 상류 영역에서 관찰된다(그림 7 에이). 7 개의 게놈 중 4 개는 가상의 단백질 상류에서 예측 된 감쇠기 구조를 포함합니다. 이러한 구조는 필터를 통과하지 않지만 줄기 루프 구조는 세 게놈의 나머지 부분에서 발견된다. 다운스트림 유전자 및 시퀀스 자체의 전사 시작 사이트에 구조의 위치는이 예에서 또한 크게 다릅니다. 이러한 줄기 서열에서,세그먼트 구그그(락티스의 개그그 및 뉴모니아의 개그그)는 누사 유전자를 포함하는 예측된 오페론에서 보존된다(그림 7 비). 흥미롭게도,5-기본 세그먼트는 동일 하거나 매우 유사 한의 상류에 위치한 줄기 루프 구조에서 세그먼트. 이 두 오페론의 유전자를 암호화 한 단백질은 전사에 관여합니다. 2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일,2013 년 12 월 1 일2014 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1 일,2015 년 12 월 1)유전자 순서. 통계적 유의성을 가진 예측된 줄기 루프 구조는 파란색으로 표시되며,필터를 통과하거나 유의성이 적은 다른 구조는 빨간색으로 표시됩니다. (비)예측 감쇠 종단 구조. 자세한 설명은 그림 6 에 대한 범례를 참조하십시오.감쇠기의 보존의 몇몇 양상은 그램 양성 박테리아의 우리의 분석에서 즉각 명백합니다. 첫째,감쇠 또는 항제 규제의 분포는 그람 포지티브 바 세리아에 걸쳐 잘 보존되지 않으며 또한 보존 된 규제 시스템에서도 서열 및 구조 보존이 약합니다. 같은 프로 테오 박테리아에 대 한 사실 보유 하고있다. 의 14 전자 유전자. 대장균(표 5 참조)감쇠 또는 항 제제에 의해 조절되는 것으로 알려진 감쇠기는 다른 4 개의 프로 테오 박테리아 게놈 모두에서 상류 직교체를 예측 한 적이 없습니다. 6 개는 다른 4 개의 게놈 중 적어도 하나에서 상류 직교체를 예측 한 감쇠기를 가지고 있습니다. 세 개는 다른 네 개의 게놈 모두에서 직교체를 가진 유전자이지만,이들은 예측 된 감쇠기가 없습니다. 대장균의 나머지 5 개의 유전자는 다른 게놈에 알려진 직교체가 없거나 직교체는 드문 드문 분포와 예측 된 감쇠기가 없습니다. 손으로 면밀한 검사는이 결론을 확인합니다. 표 5 는 다른 게놈의 직교에 대해 유사한 감쇠기가 예측되는 프로 테오 박테리아의 감마 분열의 5 개 게놈 각각에서 예측 된 모든 감쇠기의 목록입니다. 이 표에 표시된 바와 같이,감쇠 및 항 제거는 단백질 박테리아 게놈에서 유사한 오페론의 조절 메커니즘으로 잘 보존되지 않는 것으로 보인다. 예측 된 감쇠기를 가진이 5 개의 게놈에서 총 475 개의 유전자와 그 직교체 중 36 개만이 두 개 이상의 게놈의 상류 직교체(표 3,5 에이 및 5 비)를 공유합니다.표 5 에 알려진 감쇠기 목록 이자형. 두 개 이상의 게놈이 예측 감쇠기를 공유하는 5 개의 프로테오박테리아(감마 세분)게놈의 모든 직교 유전자 목록 특정 시스템에 관한 이전의 연구에 따르면 대장균의 일부 오페론에서 감쇠 및 항제거 조절은 감마 분열 프로테오박테리아 전체에서 약간 보존되어 있다고합니다. 대장균의 규제는 드문 드문 분포와 프로 테오 박테리아에 걸쳐 약하게 보존 된 것으로 나타났습니다. 표 2 에 도시 된 바와 같이,우리는 광범위 하 게 프로 테오 박테리아에서 대부분의 이러한 시스템에 감쇠 및 항의의이 분석을 확장할 수 있다 고이 모든 알려진 감쇠 및 대장균 및 추가 감마 분할 게놈에서 다른 예측 메커니즘에 대 한 사실 유지 하는 것으로 나타났습니다. 예를 들어 감쇠기 및 조절의 낮은 시퀀스 보존 그림 8 에 나와 있습니다. 도 8 에 도시된 바와 같이,보다 보존된 감쇠기 중 하나가 하이스그 오페론의 감쇠기에 대해 도시된다. 이 오페론 및 규제 메커니즘은 대장균에서 잘 특징 지어지며 우리의 분석은 감쇠 조절의 유사한 메커니즘을 예측합니다. 예측 된 감쇠기는 보존 된 위치(약 40-50 혈압 상류 시작 코돈 의 히스 유전자)및 줄기 서열. 주변 홀몬 간 영역을 정렬 할 수는 없지만,대.콜레라 과 에이치. 인플루엔자에는 대장균에 있는 묽게함 규칙 기계장치의 특성인 히스티딘의 뛰기를 가진 가능한 아미노산 지도자 서열이 있습니다. 예측 감쇠기는 다른 세 가지 감마 세분 프로 박테리아 게놈에서 발견되지 않았습니다. 에 피.아에 루기 노사 상류의 인터 겐 영역 히스 그 오르 톨로 그 길이는 혈압이 17 에 불과하다 엑스 까다로운 직교 유전자는 오르 에프 업스트림,그리고 유사하지만 엔.수막 이티 두스 인터 겐 영역 길이가 충분하지만 감쇠기는 예측되지 않습니다.
Figure 8
Predicted attenuation termination structure in upstream region of HisG gene in E. coli. (a) Order of genes. Predicted stem-loop structures with statistical significance are indicated in blue. For the other explanation, see legend to figure 6a. Abbreviations for genomes: Ec, Escherichia coli; Hi, Haemophilus influenzae; Vc, Vibrio cholerae; Pa, Pseudomonas aeruginosa; Xf, Xylella fastidiosa; Nm, Neisseria meningitidis. (비)예측 감쇠 종단 구조. 자세한 설명은 그림 6 에 대한 범례를 참조하십시오.2018 년 10 월 15 일(토)~2018 년 12 월 15 일(일)