GenBank數(shù)據(jù)庫(kù)檢索.ppt
《GenBank數(shù)據(jù)庫(kù)檢索.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《GenBank數(shù)據(jù)庫(kù)檢索.ppt(67頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
GenBank數(shù)據(jù)庫(kù)檢索及其應(yīng)用Entrez檢索功能,NCBI網(wǎng)站網(wǎng)址:http:/www.ncbi.nlm.nih.gov,簡(jiǎn)介,檢索入口,基本檢索功能,特征欄輔助檢索,檢索結(jié)果的顯示,GenBank數(shù)據(jù)庫(kù)是由美國(guó)國(guó)立生物技術(shù)信息中心(NCBI)維護(hù)的一級(jí)核酸序列數(shù)據(jù)庫(kù)。,GenBank數(shù)據(jù)庫(kù)的數(shù)據(jù)來(lái)源有三種:1、直接來(lái)源于測(cè)序工作者提交的序列;2、與其它數(shù)據(jù)機(jī)構(gòu)協(xié)作交換的數(shù)據(jù);3、美國(guó)專(zhuān)利局提供的專(zhuān)利數(shù)據(jù)。,簡(jiǎn)介,檢索界面,簡(jiǎn)介,1、基本檢索界面,Nucleotide數(shù)據(jù)庫(kù)分為三個(gè)子數(shù)據(jù)庫(kù):,EST:表達(dá)序列標(biāo)記數(shù)據(jù)庫(kù)GSS:基因組測(cè)序序列數(shù)據(jù)庫(kù)CoreNucleotide:包含所有未被以上兩個(gè)子數(shù)據(jù)庫(kù)收錄的核苷酸序列,檢索界面,簡(jiǎn)介,1、基本檢索界面,2、跨庫(kù)檢索界面,簡(jiǎn)介,檢索界面,基本檢索功能,(一)字段限制檢索、強(qiáng)制短語(yǔ)檢索,(二)特殊標(biāo)志符檢索,(四)范圍檢索,(三)序列長(zhǎng)度檢索,簡(jiǎn)介,檢索界面,基本檢索功能,(一)字段限制檢索、強(qiáng)制短語(yǔ)檢索,rasGENE,檢索限定詞:,1、基因名稱(chēng)的檢索限定詞:GENEorGENENAME2、生物體名稱(chēng)的檢索限定詞:ORGNorORGANISM3、作者姓名的檢索限定詞:AUTHorAUTHOR,獲取所需要的基因序列,顯示方式,序列號(hào),物種信息,作者信息,選擇顯示模式為FASTA,序列信息,保存序列信息,點(diǎn)擊send選擇file,格式為FASTA,選擇顯示方式為Graphics,編碼蛋白質(zhì)的序列信息,點(diǎn)擊顯示蛋白質(zhì)編碼序列,蛋白質(zhì)氨基酸序列,簡(jiǎn)介,檢索界面,基本檢索功能,(二)特殊標(biāo)志符檢索,(一)字段限制檢索、強(qiáng)制短語(yǔ)檢索,特殊標(biāo)志符的格式(核酸序列):,2、GenBank/EMBL/DDBJ序列接受號(hào):(1)1個(gè)字母+5個(gè)阿拉伯?dāng)?shù)字e.g.:U12345(2)2個(gè)字母+6個(gè)阿拉伯?dāng)?shù)字e.g.:AY123456,Af123456,1、序列辨認(rèn)號(hào)(GI):一串阿拉伯?dāng)?shù)字e.g.:19440733,(1)mRNA記錄(NM_*):e.g.:NM_000492(2)基因組的DNA重疊群(NT_*):e.g.:NT_000347(3)完整的基因組或染色體(NC_*):e.g.:NC_000907(4)基因組的局部區(qū)域(NG_*):e.g.:NG_000019(5)從人類(lèi)基因組注釋、加工得到的序列模型(XM,XP,orXR_*):e.g.:XM_000483,特殊標(biāo)志符的格式(核酸序列):,3、RefSeq(ReferenceSequence)序列接受號(hào):,特殊標(biāo)志符的格式(核酸序列):,4、PDB序列接受號(hào):個(gè)阿拉伯?dāng)?shù)字個(gè)字母e.g.:TUP,序列接受號(hào)的檢索限定詞為ACCNorACCESSION,簡(jiǎn)介,檢索界面,基本檢索功能,(一)字段限制檢索、強(qiáng)制短語(yǔ)檢索,(二)特殊標(biāo)志符檢索,(三)序列長(zhǎng)度檢索,序列長(zhǎng)度的檢索限定詞:SLEN,簡(jiǎn)介,檢索界面,基本檢索功能,(一)字段限制檢索、強(qiáng)制短語(yǔ)檢索,(二)特殊標(biāo)志符檢索,(四)范圍檢索,(三)序列長(zhǎng)度檢索,范圍檢索:中間用冒號(hào)連接,1、序列接受號(hào)范圍檢索:AF114696:AF114714ACCN2、序列長(zhǎng)度范圍檢索:3000:4000SLEN3、日期范圍檢索:2005/01:2006/09/26MDATorPDAT,簡(jiǎn)介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits),高級(jí)檢索(AdvancedSearch),檢索史管理(History),剪貼板管理(Clipboard),詳細(xì)匹配過(guò)程(Details),限制檢索,高級(jí)檢索,簡(jiǎn)介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits),限制基因位點(diǎn),限制序列片段的顯示,限制數(shù)據(jù)來(lái)源,限制數(shù)據(jù)發(fā)布日期,限制數(shù)據(jù)修訂日期,簡(jiǎn)介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits),高級(jí)檢索(AdvancedSearch),預(yù)檢索輸入框,添加檢索詞,索引檢索,預(yù)檢索結(jié)果,簡(jiǎn)介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits),高級(jí)檢索(AdvancedSearch),檢索史管理(History),簡(jiǎn)介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits),高級(jí)檢索(AdvancedSearch),檢索史管理(History),剪貼板管理(Clipboard),簡(jiǎn)介,檢索界面,基本檢索功能,特征欄輔助檢索,限制檢索(Limits),高級(jí)檢索(AdvancedSearch),檢索史管理(History),詳細(xì)匹配過(guò)程(Details),剪貼板管理(Clipboard),簡(jiǎn)介,檢索入口,基本檢索功能,特征欄輔助檢索,檢索結(jié)果的顯示,序列相似性搜索,啟動(dòng)相似性搜索,輸入序列號(hào),選擇搜索的數(shù)據(jù)集,點(diǎn)擊開(kāi)始搜索,相似性序列信息,GenBank記錄中特性表中的主要關(guān)鍵詞:,GenBank記錄中特性表中的限定詞:,GenBank和PubMed(序列數(shù)據(jù))檢索的比較:,1、GenBank的檢索結(jié)果是序列及其注釋信息;PubMed的檢索結(jié)果是與序列數(shù)據(jù)相關(guān)的文獻(xiàn)信息。2、GenBank數(shù)據(jù)更新早于PubMed,GenBank數(shù)據(jù)庫(kù)的檢全率高于PubMed。3、GenBank可對(duì)序列數(shù)據(jù)進(jìn)行限制檢索,而PubMed只能對(duì)文獻(xiàn)、雜志、作者等進(jìn)行限制檢索,因而GenBank數(shù)據(jù)庫(kù)的檢準(zhǔn)率也高于PubMed。,課后練習(xí),用GenBank數(shù)據(jù)庫(kù)搜索”SARScoronavirusBJ01”的全基因組序列信息并下載保存,查詢(xún)?cè)摶蛩a(chǎn)生的蛋白質(zhì)序列信息。用BLAST模塊對(duì)該基因序列進(jìn)行相似性搜索。,謝謝!,- 1.請(qǐng)仔細(xì)閱讀文檔,確保文檔完整性,對(duì)于不預(yù)覽、不比對(duì)內(nèi)容而直接下載帶來(lái)的問(wèn)題本站不予受理。
- 2.下載的文檔,不會(huì)出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請(qǐng)點(diǎn)此認(rèn)領(lǐng)!既往收益都?xì)w您。
下載文檔到電腦,查找使用更方便
14.9 積分
下載 |
- 配套講稿:
如PPT文件的首頁(yè)顯示word圖標(biāo),表示該P(yáng)PT已包含配套word講稿。雙擊word圖標(biāo)可打開(kāi)word文檔。
- 特殊限制:
部分文檔作品中含有的國(guó)旗、國(guó)徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計(jì)者僅對(duì)作品中獨(dú)創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- GenBank 數(shù)據(jù)庫(kù) 檢索
鏈接地址:http://italysoccerbets.com/p-11549158.html