《生物化學和分子生物學:第十三章 真核基因與基因組》由會員分享,可在線閱讀,更多相關《生物化學和分子生物學:第十三章 真核基因與基因組(35頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、遺傳信息的傳遞遺傳信息的傳遞第三篇第三篇DNADNARNARNAPROTEINPROTEINTranscriptionReverse-transcriptionRNA-replicationDNA-replicationTranslation復制復制轉錄轉錄逆轉錄逆轉錄RNARNA復制復制翻譯翻譯中心法則中心法則原核和真核細胞中遺傳信息的傳遞原核和真核細胞中遺傳信息的傳遞真核基因與基因組真核基因與基因組DNA的生物合成的生物合成DNA的損傷和修復的損傷和修復RNA的生物合成的生物合成蛋白質的生物合成蛋白質的生物合成基因表達調控基因表達調控細胞信號轉導細胞信號轉導 本篇學習內容:本篇學習內容:真
2、核基因與基因組真核基因與基因組 第十三章第十三章Eukaryote Gene and Genome核心內容:核心內容:1.1.什么是基因(什么是基因(GeneGene)?)?2.2.基因的結構組成?功能?基因的結構組成?功能?3.3.什么是基因組(什么是基因組(GenomeGenome)?)?4.4.真核基因組的結構特點?真核基因組的結構特點?基因(基因(genegene):編碼蛋白質或編碼蛋白質或RNA等具有特定功能等具有特定功能產物的、負載遺傳信息的基本單位。染色體或基因產物的、負載遺傳信息的基本單位。染色體或基因組的一段組的一段DNADNA序列。序列。Gene vs Genome基因組(
3、基因組(genomegenome):泛指一個細胞或一個生物體泛指一個細胞或一個生物體的全部遺傳信息。包括核染色體及線粒體的全部遺傳信息。包括核染色體及線粒體DNADNA。真核基因的結構與功能真核基因的結構與功能 第一節(jié)第一節(jié)The Structure and Function of Eukaryotic Genes1.利用堿基的不同排列荷載遺傳信息利用堿基的不同排列荷載遺傳信息 2.指導指導RNA和蛋白質的合成,表達遺傳信息和蛋白質的合成,表達遺傳信息 基因的功能基因的功能轉錄起始位點(轉錄起始位點(mRNAmRNA合成起始位點)合成起始位點)翻譯起始位點(起始密碼子翻譯起始位點(起始密碼子A
4、TGATG)上游調控區(qū)上游調控區(qū)翻譯終止密碼子翻譯終止密碼子3-端非翻譯區(qū)端非翻譯區(qū) (3 UTR)5-端非翻譯區(qū)端非翻譯區(qū) (5 UTR)編碼序列編碼序列初級轉錄物初級轉錄物成熟轉錄物成熟轉錄物 內含子內含子一、真核基因的基本結構一、真核基因的基本結構真核基因的編碼序列被內含子隔開,是斷裂基因真核基因的編碼序列被內含子隔開,是斷裂基因1.1.編碼序列編碼序列 (coding sequence)coding sequence)2.2.非編碼序列非編碼序列(non-coding sequence)(non-coding sequence),包括編碼區(qū)兩側,包括編碼區(qū)兩側的的調控序列調控序列和編碼
5、序列間的和編碼序列間的間隔序列間隔序列(內含子,內含子,intronintron)在細胞內表達為蛋白質或功能在細胞內表達為蛋白質或功能RNA的的DNA序列序列真核基因的結構包括兩部分:真核基因的結構包括兩部分:轉錄起始點轉錄起始點TATA盒盒CAAT盒盒GC盒盒增強子增強子AATAAA剪切位點剪切位點轉錄終止點轉錄終止點加尾信號序列加尾信號序列外顯子外顯子翻譯起始點翻譯起始點內內含含子子 OCT-1 OCT-1:ATTTGCAT八聚體八聚體+1核心啟動子核心啟動子上游啟動子元件上游啟動子元件基因表達需要調控區(qū)(基因表達需要調控區(qū)(regulatory region)序列,包括)序列,包括啟動子
6、(啟動子(promoter)、增強子()、增強子(enhancer)等。)等。5AATGCTACTAGTCGAAGCC3+1+2+3+4+5+6+7+8-8-7-6-5-4-3-2-1-9DNA5 AGUCGAAGCC3+9+10mRNA基因序列的正負編號基因序列的正負編號編碼序列決定編碼產物的序列和功能;編碼序列決定編碼產物的序列和功能;編碼序列堿基突變可導致基因功能變化;編碼序列堿基突變可導致基因功能變化;相同序列起始位點的變化或不同的剪接方相同序列起始位點的變化或不同的剪接方式可導致產物不同。式可導致產物不同。編碼序列編碼多肽鏈和特定的編碼序列編碼多肽鏈和特定的RNARNA分子分子 1.
7、1.啟動子提供轉錄起始信號啟動子提供轉錄起始信號 啟動子啟動子是結合是結合RNA聚合酶并形成轉錄聚合酶并形成轉錄起始復合體的起始復合體的DNA序列。序列。調控序列參與真核基因表達調控調控序列參與真核基因表達調控 可在啟動子的上游或下游發(fā)揮作用;可在啟動子的上游或下游發(fā)揮作用;距離所調控基因幾百至幾千個堿基對;距離所調控基因幾百至幾千個堿基對;通常數(shù)個增強子序列形成一簇;通常數(shù)個增強子序列形成一簇;有時位于內含子之中;有時位于內含子之中;不同的增強子結合不同調節(jié)蛋白。不同的增強子結合不同調節(jié)蛋白。2.2.增強子增強鄰近基因的轉錄增強子增強鄰近基因的轉錄增強子(增強子(Enhancer)是是增強真
8、核基因啟動子工作效增強真核基因啟動子工作效率的最重要的順式作用元件。率的最重要的順式作用元件。沉默子沉默子(silencer)是抑制基因轉錄的特定)是抑制基因轉錄的特定DNA序列,當其結合一些反式作用因子時對基序列,當其結合一些反式作用因子時對基因的轉錄起阻遏作用,使基因沉默。因的轉錄起阻遏作用,使基因沉默。3.3.沉默子是負調節(jié)元件沉默子是負調節(jié)元件真核基因組的結構與功能真核基因組的結構與功能 第二節(jié)第二節(jié)The Structure and Function of Eukaryote Genome人基因組構成人基因組構成1.1.編碼序列比例遠小于非編碼序列編碼序列比例遠小于非編碼序列;2.2
9、.含有大量的含有大量的重復序列重復序列;3.3.存在存在多基因家族多基因家族和和假基因假基因;4.4.多數(shù)基因進行可變剪接,導致蛋白多樣性多數(shù)基因進行可變剪接,導致蛋白多樣性;5.5.基因組基因組DNA與蛋白質結合形成染色體。與蛋白質結合形成染色體。一、真核基因組獨特的結構特點一、真核基因組獨特的結構特點二、根據(jù)重復頻率將重復序列分為三類二、根據(jù)重復頻率將重復序列分為三類 (一)高度重復序列(一)高度重復序列重復頻率重復頻率10106 6,不編碼蛋白質或,不編碼蛋白質或RNARNA。2.2.反向重復序列反向重復序列(inverted repeat sequence)重復單位長度約重復單位長度約
10、300 bp,多數(shù)散在分布,約占,多數(shù)散在分布,約占5 依據(jù)結構特點分為:依據(jù)結構特點分為:著絲粒區(qū)域,重復單位長度著絲粒區(qū)域,重復單位長度210 bp,成串排列,成串排列,約占約占5%6%。1.衛(wèi)星衛(wèi)星DNA(satellite DNA)55335533AGGATTTCCTTTAGGATCCTAAAGGAAATCCT53AGGATTTCGAAATCCTInverted repeats:同一個序列的兩個:同一個序列的兩個拷貝在一個分子中以相反的方向重復??截愒谝粋€分子中以相反的方向重復。l參與復制水平的調節(jié)參與復制水平的調節(jié) 存在于存在于DNA復制起點附近復制起點附近l參與基因表達的調控參與基
11、因表達的調控 轉錄轉錄hnhnRNA分子中,形成發(fā)夾結構,穩(wěn)定分子中,形成發(fā)夾結構,穩(wěn)定RNAl參與染色體配對參與染色體配對 如如 衛(wèi)星衛(wèi)星DNA成簇樣分布在染色體著絲粒附近,可能成簇樣分布在染色體著絲粒附近,可能與染色體減數(shù)分裂時染色體配對有關。與染色體減數(shù)分裂時染色體配對有關。高度重復序列的功能:高度重復序列的功能:(二)中度重復序列(二)中度重復序列重復數(shù)十至數(shù)千次重復數(shù)十至數(shù)千次,與單拷貝基因間隔排列。與單拷貝基因間隔排列。1.短分散重復片段短分散重復片段300 bp500 bp,與,與1000 bp的單拷貝序列間隔排列的單拷貝序列間隔排列Alu家族家族:300 bp,重復,重復305
12、0萬次,萬次,Alu酶切位點酶切位點 (AGCT),分成),分成130bp和和170bp兩段。兩段。KpnI家族家族:僅次于:僅次于Alu家族,家族,Kpn位點,散在分布,位點,散在分布,30004800個拷貝個拷貝Hinf家族家族:串聯(lián)重復,:串聯(lián)重復,319 bp,Hinf I酶切位點。酶切位點。3.rRNArRNA基因重復序列屬于中度重復序列基因重復序列屬于中度重復序列l(wèi)各重復單位中的各重復單位中的rRNA基因都是相同的?;蚨际窍嗤?。lrRNA基因集中成簇存在,這樣的區(qū)域稱為基因集中成簇存在,這樣的區(qū)域稱為rDNA區(qū)。區(qū)。lrRNA基因位于核仁組織區(qū),每個核仁組織區(qū)平均基因位于核仁組
13、織區(qū),每個核仁組織區(qū)平均含有含有50個個rRNA基因的重復單位?;虻闹貜蛦挝?。l5SrRNA基因似乎全部位于基因似乎全部位于1號染色體,每個單倍體號染色體,每個單倍體基因組約有基因組約有1000個個5SrRNA基因?;?。2.長分散重復片段長分散重復片段3500 bp5000bpbp,與,與13000bp的單拷貝序列間隔排列。的單拷貝序列間隔排列。在單倍體基因組中只出現(xiàn)一次,大多在單倍體基因組中只出現(xiàn)一次,大多數(shù)為蛋白質編碼的基因。數(shù)為蛋白質編碼的基因。(三)單拷貝序列(三)單拷貝序列多基因家族(多基因家族(multigene family)multigene family)是指一類結構是指
14、一類結構相似(核苷酸序列具有同源性)、功能相關的相似(核苷酸序列具有同源性)、功能相關的基因??煞譃閮深悾夯?。可分為兩類:1.1.基因家族成簇地分布在某一條染色體上,同時發(fā)揮作基因家族成簇地分布在某一條染色體上,同時發(fā)揮作用,合成某些蛋白質。如組蛋白基因家族。用,合成某些蛋白質。如組蛋白基因家族。2.2.基因家族的不同成員成簇地分布于不同染色體上,編基因家族的不同成員成簇地分布于不同染色體上,編碼一組功能上緊密相關的蛋白質。如球蛋白基因家族。碼一組功能上緊密相關的蛋白質。如球蛋白基因家族。三、真核基因組存在多基因家族與假基因三、真核基因組存在多基因家族與假基因與正?;蚍浅O嗨频荒鼙磉_的與
15、正常基因非常相似但不能表達的DNA序列。序列。假基因(假基因(pseudogene),),DNA序列相似,功能不一定相關的若干個基序列相似,功能不一定相關的若干個基因或若干組基因家族的總稱。如因或若干組基因家族的總稱。如IgGIgG超家族。超家族。超家族基因超家族基因(superfamily gene)四、線粒體四、線粒體DNA(mitochondrial DNA,mtDNA)3737個基因:個基因:1313個編碼呼吸鏈個編碼呼吸鏈多酶體系,多酶體系,2222個編碼個編碼mt-mt-tRNAtRNA,2 2個編碼個編碼mt-rRNAmt-rRNA(16S16S和和12S12S)。)。物種物種基
16、因組大小基因組大小(Mb)基因數(shù)基因數(shù)染色體數(shù)染色體數(shù)*支原體支原體 M.genitalium0.58470無無流感嗜血桿菌流感嗜血桿菌 H.influrnzae1.831743無無枯草芽孢桿菌枯草芽孢桿菌 B.subtilis4.204100無無大腸桿菌大腸桿菌 E.coli 4.604288無無釀酒酵母釀酒酵母 S.cerevisiae 13.50603416裂殖酵母裂殖酵母 S.pombe12.50492916燕麥燕麥 O.sativa4663000021果蠅果蠅 D.melanogaster165136014秀麗隱桿線蟲秀麗隱桿線蟲 C.elegans97184246小鼠小鼠 mous
17、e27003000020人人 H.sapiens30002500023不同生物體基因組的比較不同生物體基因組的比較五、基因組大小或基因數(shù)量與生物體復雜度五、基因組大小或基因數(shù)量與生物體復雜度六、人的基因在染色體上的分布特征六、人的基因在染色體上的分布特征 非均勻分布非均勻分布,19,19號基因密度最大,號基因密度最大,1313號和號和Y Y基因密度最小?;蛎芏茸钚?。存在存在“沙漠區(qū)沙漠區(qū)”,即在,即在500kb500kb區(qū)域內,沒有區(qū)域內,沒有任何基因的編碼序列。任何基因的編碼序列。全部人類基因組約有全部人類基因組約有2.91Gbp 基因基因數(shù)量約數(shù)量約3-4萬,萬,目前已定位了目前已定位了
18、2.6萬多個基萬多個基因,但其中尚有因,但其中尚有42%的功能不明。的功能不明。人類基因組中存在人類基因組中存在“熱點熱點”和大片和大片“荒漠荒漠”。編。編碼序列約占碼序列約占3%,非編碼序列約占非編碼序列約占97%。35.3%的基因組包含的基因組包含重復重復的序列。的序列。人與人之間人與人之間99.99%的基因密碼的基因密碼是是相同相同的。的。大約有大約有223個基因可能是人類的脊椎動物祖先生個基因可能是人類的脊椎動物祖先生存時由細菌插入的順序。存時由細菌插入的順序。人類基因組草圖初步結論人類基因組草圖初步結論1.如何理解斷裂基因及其意義?2.何謂啟動子、增強子、沉默子?3.真核基因組的結構特點是什么?4.是否可以依據(jù)基因組大小或基因數(shù)量判斷 生物體的復雜度?討討 論論