查找啟動(dòng)子區(qū)[優(yōu)質(zhì)分析]
《查找啟動(dòng)子區(qū)[優(yōu)質(zhì)分析]》由會(huì)員分享,可在線閱讀,更多相關(guān)《查找啟動(dòng)子區(qū)[優(yōu)質(zhì)分析](47頁珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、如何判斷序列的正反向 NCBI里的序列,mRNA,CDS序列等等,都標(biāo)注的很清楚,只是有的基因序列給的是反向互補(bǔ)的序列,需要大家在primer5等軟件里轉(zhuǎn)換一下。 具體看是不是反向互補(bǔ)的序列,辦法就是看在第一個(gè)CDS區(qū)的前三個(gè)堿基是不是是不是ATGATG,如果是ATG,那么這個(gè)序列就是你要的了,如果不是,那八成就是你要得序列的反向互補(bǔ)序列了。1嚴(yán)選文書目的: 尋找promoter區(qū)域預(yù)測(cè)核心啟動(dòng)子區(qū)2嚴(yán)選文書尋找promoter區(qū)域1.用NCBI:http:/www.ncbi.nlm.nih.gov/ 2.用UCSC:http:/www.genome.ucsc.edu/3.用Ensembl:h
2、ttp:/www.ensembl.org/index.html4.用公司信息(只包含公司擁有promoter clones的信息): http:/ (*種類比較少)5.用SIB-EPD: http:/www.epd.isb-sib.ch/ (可直接提供TSS,但是庫容較小,很多基因查不到)6.預(yù)測(cè)核心啟動(dòng)子區(qū)3嚴(yán)選文書NCBI數(shù)據(jù)庫4嚴(yán)選文書尋找promoter區(qū)域NCBI http:/www.ncbi.nlm.nih.gov/pubmed/選擇Gene, 輸入ankh,點(diǎn)擊search選擇第一項(xiàng),以人類Homo sapiens的ANKH為例;Chromosome 5 location 147
3、04909-14871887, complement(反義鏈)即-14871887 到 -14704909為基因范圍此例中選取-14873887 到-14871887 約2000bp核苷酸序列作為啟動(dòng)子區(qū)域5嚴(yán)選文書選擇Ensembl或者HGNC_,進(jìn)入ensembl分析尋找promoter區(qū)域6嚴(yán)選文書尋找promoter區(qū)域圖形顯示FASTA格式顯示的核苷酸序列輸入序列可以查詢?nèi)旧w位置ANKH gene在反義鏈上,所以用負(fù)數(shù)表示可以查詢具體核苷酸序列Genomic context 點(diǎn)擊Graphics-Tools-Sequece Text View7嚴(yán)選文書尋找promoter區(qū)域點(diǎn)擊G
4、o To Position, 輸入-14873887,點(diǎn)擊Prev Page找到具體位置復(fù)制白底黑色區(qū)域即為promoter區(qū)域。白底黑字為啟動(dòng)子區(qū)域紫底黑字為基因區(qū)域粉底黑字為編碼區(qū),ATG為啟示密碼子8嚴(yán)選文書尋找promoter區(qū)域在前兩張幻燈片中選擇FASTA在右邊Change region shown輸入14871887到14873887Display options選擇Show reverse complement可以直接得到FASTA格式的promoter核苷酸序列(似乎有一個(gè)bp的差距,可以輸入14871887到14873886 )可以選擇展示反向互補(bǔ)序列9嚴(yán)選文書1. 選擇基
5、因示意圖:1).向下查看“Genomic regions, transcripts and products”2). 將鼠標(biāo)放在Genes的”NR_”示意圖上,3). 在彈出的窗口中點(diǎn)擊2. 點(diǎn)擊”FASTA View,序列范圍表示NR_的位置。出現(xiàn)該基因的實(shí)際序列,第一個(gè)序列的位置表示“起始位置”3. 調(diào)整顯示位置:將起始位點(diǎn)先前排1000bp,向后排1000bp。更改后的位置認(rèn)為是啟動(dòng)子區(qū)。10嚴(yán)選文書UCSC數(shù)據(jù)庫11嚴(yán)選文書尋找promoter區(qū)域UCSC http:/www.genome.ucsc.edu/ 選擇左側(cè)邊欄的“Table Browser”在clade選擇Mammal,g
6、enome選擇Human,assmebly選擇最新的數(shù)據(jù)庫,在position后面的搜索框內(nèi)寫入待查的基因名稱,如actin。點(diǎn)擊get output。方法一12嚴(yán)選文書尋找promoter區(qū)域出現(xiàn)一系列候選序列。當(dāng)搜索用詞不特異的時(shí)候會(huì)出來太多的結(jié)果,只顯示500條。13嚴(yán)選文書尋找promoter區(qū)域點(diǎn)擊自己目的基因的結(jié)果鏈接,會(huì)出現(xiàn)該基因在染色體上的位置 (有時(shí)候會(huì)直接跳到選擇genome,protein,mRNA那一頁面,可能是在搜索詞比較特異的情況寫),繼續(xù) getout put選擇 genome14嚴(yán)選文書尋找promoter區(qū)域選擇Promoter/Upstream by 200
7、0 basesExons in upper case, everything else in lower case:外顯子大寫,其他小寫15嚴(yán)選文書尋找promoter區(qū)域小寫字母為promoter區(qū)域大寫字母為基因區(qū)域,與NCBI結(jié)果相同ATG為CDS區(qū)起始密碼子16嚴(yán)選文書尋找promoter區(qū)域promoter/upstream前面的框中打勾,一般的啟動(dòng)子長度大約為2kb左右,這個(gè)數(shù)字可以修改。為便于觀察,可繼續(xù)修改下面的幾個(gè)選項(xiàng)。這里選擇CDS大寫。點(diǎn)擊get sequence即可得到結(jié)果。17嚴(yán)選文書尋找promoter區(qū)域UTR和upstream是分開的,CDS是大寫的,可以看到起
8、始碼。Copy ATG以前的序列進(jìn)行啟動(dòng)子分析。PCR以genome為模板。18嚴(yán)選文書尋找promoter區(qū)域UCSC http:/www.genome.ucsc.edu/,點(diǎn)擊左側(cè)邊欄的“Genome Browser”方法二19嚴(yán)選文書尋找promoter區(qū)域以大鼠(rattus orvegicus)的結(jié)締組織生長因子(CTGF)為例,在OrganismOrganism的下拉菜單中選擇Rat,在assemblyassembly的下拉菜單中選擇最新日期最新日期Nov.2004,在positionposition框中鍵入CTGF,image widthimage width選擇默認(rèn)即可,如下圖
9、所示:點(diǎn)擊 Submit20嚴(yán)選文書尋找promoter區(qū)域結(jié)果顯示該基因的已知序列和相關(guān)mRNA序列,點(diǎn)擊“Known Gene”中的第一個(gè)序列,21嚴(yán)選文書尋找promoter區(qū)域出現(xiàn)包含這序列的圖解概要為了獲得這個(gè)區(qū)域更清晰的圖像,可以點(diǎn)擊緊靠zoom out的1.5X按鈕,如下圖:對(duì)于Known Genes(已知基因)和預(yù)測(cè)的基因路徑來說,一般的慣例是以一個(gè)高的垂直線或塊狀表示每個(gè)編碼外顯子,以短的垂直線或塊狀表示5端和3端非翻譯區(qū)。起連接作用的內(nèi)含子以非常細(xì)的線條表示。翻譯的方向由沿著細(xì)線的箭頭指示。22嚴(yán)選文書尋找promoter區(qū)域本例的搜尋目的來說,默認(rèn)設(shè)置不是理想的設(shè)置。按照
10、視圖利用頁面底部的Track Controls按鈕,將一些路徑設(shè)置為hide模式(即不顯示),其他設(shè)置為dense模式(所有資料密集在一條直線上);另一些路徑設(shè)置為full模式(每個(gè)特征有一個(gè)分開的線條,最多達(dá)300)。23嚴(yán)選文書尋找promoter區(qū)域Ensembl基因通過許多方法來預(yù)測(cè),包括與已知mRNA和蛋白質(zhì)進(jìn)行同源性比較。若查詢啟動(dòng)子區(qū)域,我們需要將將Ensembl Genes選擇為選擇為dense 或或full模式模式,點(diǎn)擊Refresh,即刷新,出現(xiàn)下圖:圖中多出了Ensembl Genes的預(yù)測(cè)路徑,我們?cè)诩t框中圈出。點(diǎn)擊用于表達(dá)該序列的任何方塊出現(xiàn)以下頁面:24嚴(yán)選文書尋找
11、promoter區(qū)域點(diǎn)擊紅框中的條形深色方塊(不是(不是Ensembl Genes文字)文字),25嚴(yán)選文書尋找promoter區(qū)域選擇并點(diǎn)擊Link to sequence中的Genomic Sequence,即顯示基因組序列26嚴(yán)選文書尋找promoter區(qū)域?qū)romoter改為2000bp,具體多少bp合適,可根據(jù)文獻(xiàn)資料和實(shí)驗(yàn)?zāi)康墨@取,有的基因可能在其上游戲幾百bp就可以了,其他的幾個(gè)選項(xiàng)分別為5端非編碼區(qū),編碼區(qū)外顯子,3端非編碼區(qū),內(nèi)含子(內(nèi)含子用綠框圈了起來)等。Sequence Formatting Options序列顯示方式,選擇上圖紅框里的內(nèi)容,即外顯子大寫,即外顯子大寫
12、,其余的小寫,也就是說,其余的小寫,也就是說mRNA的外顯子大寫,其余上下游非編碼區(qū)以及內(nèi)含子均為的外顯子大寫,其余上下游非編碼區(qū)以及內(nèi)含子均為小寫。小寫。27嚴(yán)選文書尋找promoter區(qū)域第一個(gè)大寫字母以后就是第一個(gè)大寫字母以后就是mRNA序列,之序列,之前的小寫字母序列即為啟動(dòng)子區(qū)域了。前的小寫字母序列即為啟動(dòng)子區(qū)域了。28嚴(yán)選文書第一個(gè)大寫字母以后就是mRNA序列,但該序列包含外顯子和內(nèi)含子,是未經(jīng)剪切修飾的mRNA, 圖中兩段大寫字母中間的小寫字母便為內(nèi)含了序列。尋找promoter區(qū)域29嚴(yán)選文書Ensemble數(shù)據(jù)庫30嚴(yán)選文書尋找promoter區(qū)域Ensembl:http:/
13、www.ensembl.org/index.html 選擇human 輸入 ankh選擇Gene,點(diǎn)擊 GeneID ENSG00000154122點(diǎn)擊左邊的Export data 方法一31嚴(yán)選文書尋找promoter區(qū)域5 Flanking sequence 輸入2000Options for FASTA sequence中Genomic選5 Flanking sequence,deselect all點(diǎn)擊Next(不管正反此法都適用)32嚴(yán)選文書尋找promoter區(qū)域得到2000 bases 的核苷酸序列33嚴(yán)選文書尋找promoter區(qū)域Ensembl:http:/www.ensem
14、bl.org/index.html在“Search Ensembl“標(biāo)題下search后的下拉框中選中物種名homo sapiens(人),for框中輸入基因名ankh,點(diǎn)擊Go方法二34嚴(yán)選文書尋找promoter區(qū)域找到所需要的gene,點(diǎn)擊出來2個(gè)結(jié)果。本例中貌似是同一個(gè)。點(diǎn)擊相應(yīng)鏈接進(jìn)入新頁面。35嚴(yán)選文書尋找promoter區(qū)域貌似有2個(gè)不同的轉(zhuǎn)錄本。點(diǎn)擊Exon Info。36嚴(yán)選文書尋找promoter區(qū)域新頁面中即可看到5 upstream sequence??梢栽贔lanking sequence at either end of transcript后面的框中修改期望顯示的
15、序列長度。一般啟動(dòng)子最好選2kb。然后copy所顯示的上游序列進(jìn)行分析。 37嚴(yán)選文書Genecopoeia公司38嚴(yán)選文書尋找promoter區(qū)域http:/ product, 選擇promoter clones,因?yàn)闆]有ANKH的信息,此處輸入FIBRONECTIN 選擇目的基因39嚴(yán)選文書尋找promoter區(qū)域點(diǎn)擊click here to view the promoter sequence得到promoter信息40嚴(yán)選文書EPD數(shù)據(jù)庫41嚴(yán)選文書尋找promoter區(qū)域SIB-EPD 網(wǎng)址:http:/www.epd.isb-sib.ch/ 具體使用方法大同小異,就是輸入物種名、
16、基因名,限定啟動(dòng)子序列區(qū)域 42嚴(yán)選文書預(yù)測(cè) 核心啟動(dòng)子區(qū)43嚴(yán)選文書Transcript start site (TSS) 附近-60bp到+40bp是核心啟動(dòng)子區(qū)核心啟動(dòng)子區(qū),是精確轉(zhuǎn)錄必須的最小單元。CpG島島是一段200 bp 或更長的DNA 序列,核苷酸G+C 的含量較高,并且CpG雙核苷酸的出現(xiàn)頻率占G+ C 含量的50%以上。許多脊椎動(dòng)物的啟動(dòng)子區(qū)都與CpG島的位置重合。44嚴(yán)選文書常見的在線預(yù)測(cè)工具有:真核啟動(dòng)子真核啟動(dòng)子數(shù)據(jù)庫第數(shù)據(jù)庫第85版版(The Eukaryotic Promoter Database Current Release 85 ,EPD,http:/www
17、.epd.isb-sib.ch/ )http:/epd.vital-it.ch/ 轉(zhuǎn)錄起始位點(diǎn)數(shù)據(jù)庫轉(zhuǎn)錄起始位點(diǎn)數(shù)據(jù)庫:http:/dbtss.hgc.jp/ 該數(shù)據(jù)庫主要包括人,小鼠等常見生物的基因轉(zhuǎn)錄起始位點(diǎn)及該基因啟動(dòng)子的可能情況。Promoter scan (http:/bimas.dcrt.nih.gov/molbio/proscan/ ), Promoter2.0 Prediction Server (http:/www.cbs.dtu.dk/services/promoter/ ) 神經(jīng)網(wǎng)絡(luò)啟動(dòng)子預(yù)測(cè)器 NNPP(http:/www.fruitfly.org/seq_tools/
18、promoter.html )Soft Berry (http:/ )Dragon Promoter Finder (http:/research.i2r.a-star.edu.sg/promoter )(好像不能用了?)45嚴(yán)選文書FirstEF (http:/rulai.cshl.edu/tools/FirstEF/ ) UROGENE (http:/www.urogene.org/methprimer/ ),可用于位點(diǎn)甲基化的預(yù)測(cè)CpGPlot/CpGReport/Isochore (http:/www.ebi.ac.uk/emboss/cpgplot/)CpGProD (http:/p
19、bil.univ-lyon1.fr/software/cpgprod_query.html)CpG Island Searcher (http:/ Prediction (http:/www.ualberta.ca/stothard/jaascript/cpg_islands.html)/ CpGCpG島預(yù)測(cè)軟件島預(yù)測(cè)軟件46嚴(yán)選文書1、獲取目的基因的mRNA序列,并且在NCBI的數(shù)據(jù)庫中查獲轉(zhuǎn)錄起始點(diǎn);2、截取轉(zhuǎn)錄起始點(diǎn)為中心,上下約各1000bp,若在此范圍內(nèi)出現(xiàn)CDS,可到翻譯起始點(diǎn)終止;3、利用在線軟件進(jìn)行分析;PromoterInspectorhttp:/www.genomatix.
20、de/software_services/online_access/free_accounts.htmlPromoterScanhttp:/bimas.dcrt.nih.gov/molbio/proscanPromoter 2.0http:/www.cbs.dtu.dk/services/PromoterNNPPhttp:/www.fruitfly.org/seq_tools/promoter.htmlEMBOSS Cpgplothttp:/www.ebi.ac.uk/servicestmp/95441066796504.htmlCpGCpG Islands Islands PredictionPredictionhttp:/www.ualberta.ca/%7Estothard/javascript/cpg_island.html本人是采取多種軟件結(jié)合的方法,由于proscan和promoter 2.0的假陽性率較高,僅作為參考,而promoter inspector的特異性較高,結(jié)果比較可信。同時(shí),利用CpG島預(yù)測(cè),作為輔助參考4、最后,可以找到小鼠的同源區(qū),進(jìn)行同源性比較,啟動(dòng)子區(qū)域一定是高保守區(qū)!5、到此,可以初步預(yù)測(cè)啟動(dòng)子區(qū)域的范圍了。47嚴(yán)選文書
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 建筑施工重大危險(xiǎn)源安全管理制度
- 安全培訓(xùn)資料:典型建筑火災(zāi)的防治基本原則與救援技術(shù)
- 企業(yè)雙重預(yù)防體系應(yīng)知應(yīng)會(huì)知識(shí)問答
- 8 各種煤礦安全考試試題
- 9 危險(xiǎn)化學(xué)品經(jīng)營單位安全生產(chǎn)管理人員模擬考試題庫試卷附答案
- 加壓過濾機(jī)司機(jī)技術(shù)操作規(guī)程
- 樹脂砂混砂工藝知識(shí)總結(jié)
- XXXXX現(xiàn)場(chǎng)安全應(yīng)急處置預(yù)案
- 某公司消防安全檢查制度總結(jié)
- 1 煤礦安全檢查工(中級(jí))職業(yè)技能理論知識(shí)考核試題含答案
- 4.燃?xì)獍踩a(chǎn)企業(yè)主要負(fù)責(zé)人模擬考試題庫試卷含答案
- 工段(班組)級(jí)安全檢查表
- D 氯化工藝作業(yè)模擬考試題庫試卷含答案-4
- 建筑起重司索信號(hào)工安全操作要點(diǎn)
- 實(shí)驗(yàn)室計(jì)量常見的30個(gè)問問答題含解析