《如何利用BankIt向NCBI在線提交序列》由會員分享,可在線閱讀,更多相關《如何利用BankIt向NCBI在線提交序列(9頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、如何利用BankIt向NCBI在線提交序列日期:2013-03-07 來源:網(wǎng)絡 作者:青嵐 點擊:1352次摘要:向NCBI提交序列常用的方法有兩種,其一是在線提交的BankIt,其二是用軟件Sequin。在此結(jié)合網(wǎng)絡牛人實際操作經(jīng)驗來總結(jié)下如何通過BankIt在線提交DNA或RNA序列,供參考。向ncbi提交序列常用的方法有兩種,其一是在線提交的BankIt,其二是用軟件Sequin。在此結(jié)合網(wǎng)絡牛人實際操作經(jīng)驗來總結(jié)下如何通過BankIt在線提交DNA或RNA序列,供參考。1.整理序列信息:包括病原采集地、病原的寄主、寄主癥狀、采集人等基本信息;還有序列分析結(jié)果,包括序列全長大小,開放閱
2、讀框(ORF)的長度、位置及特定ORF序列翻譯的氨基酸序列等基因水平的信息,這對于接下來的快速準確提交序列及提交成功后為全世界其他作者準確全面分享此類信息很重要;2.登陸B(tài)ackIt站點,注意到頁面右邊的“Sign in to use BankIt”標簽,點擊登錄進入。如果沒有賬號就注冊一個(注意,此賬號與NCBI賬號不通用)。附 注冊賬號步驟,需要填寫的項目為:Title:你的職位或頭銜First name:名last name:姓login:登陸名Affiliation:所屬機構(gòu)地址,一般填寫自己學校地址E-mail Address:通信電郵,填完后會發(fā)隨機密碼到此電郵地址,使用隨機密碼進
3、行登陸,當然登陸后可對密碼進行重置;3.登陸B(tài)ankIt,看到如下圖所示界面,此時NCBI會自動分配一個SubmissionID,但不是最終的提交序列ID:接下來共有九個步驟(好事多磨):3.1 Contact InFORMAtion填寫個人姓名、機構(gòu)、電郵等資料集聯(lián)系方式,如果錯誤該頁會有ERROR提示直到正確填寫,填寫完畢點擊CONTINUE;3.2 Reference填寫參考作者信息(Reference author)及序列相關信息,比如該序列是否對應有文章,如單純提交序列則只需選擇Unpublished即可(Reference title項可以填入“Direct Submission”
4、),有的話就填寫已發(fā)表文章的信息(卷、期等),接下來會問你該序列的提交者是否是序列的發(fā)現(xiàn)者等信息,填寫完畢點擊CONTINUE;提示:新版的BankIt中,接下來會有“Sequencing Technology”一項,呈現(xiàn)有454、Illumina、SOLiD及Other等測序方法選擇,目前為“Sanger dideoxy sequencing”即一代測序方法測序,并且所提交的序列均為“assembled sequences”,目前的“assembly program”為“Lasergene,version 7.0”。3.3 Nucleotide包括三個小項:Submission Releas
5、e Date(期望NCBI什么時候公布你的序列)、16S rRNA submissions(該序列是否為16S rRNA)、Sequence(s) and Definition Line(s)(會提示問你該序列是否為全長genomic DNA、線狀或環(huán)狀等、序列長度,需要復制序列或提交FASTA格式文件),如若序列長度與復制序列或FASTA文件長度不同則會有提示,需要重新提交序列,依次選擇即可。一般選擇“Immediately after Processing”,“非16S rRNA”,“genomic DNA”,“circular”,“complete”等信息,然后將全序列粘貼到下方的空格中
6、,別忘了在上方寫上總核苷酸數(shù)。完后審查看有沒有錯誤,繼續(xù)CONTINUE;3.4 Organism填寫Organism(病原物)的名字,即序列公開顯示時候的標題(如MYVYNV分離物序列“Malvastrum yellow vein Yunnanvirusisolate SC226-5, complete genome),點擊CONTINUE后會出現(xiàn)自動檢索項目,核對后(有可能會進行選擇)繼續(xù)CONTINUE;3.5 Submission Category提交范疇,是否直接提交或通過第三方Annotation提交(不是太清楚什么意思,可能指的是從EMBL和DDBJ中導入的數(shù)據(jù)吧),一般為直接提
7、交,如下圖示選擇Original,繼續(xù)CONTINUE;3.6 Source modifier選擇該病原物的種類,比如質(zhì)粒、線粒體等;Source modifier下拉菜單及后面的Value設置:進一步選擇該病原物獲取信息,比如Country、Host、Clone、Collection date、Strain/Isolate等,至少三項(Organelle/Location為細胞器/位置,該項可以不填寫),否則該項不通過,盡量信息全面真實,需要繼續(xù)添加則點擊Add,填寫完畢查看下方已填寫表格進行信息核對,然后CONTINUE;3.7 PrimersPCR引物項目,可選項目,不想填寫可CONTI
8、NUE;3.8 Features()該步驟重要!將用到之前準備的內(nèi)容,比如序列內(nèi)ORFs等信息的填寫,并根據(jù)之前的選項來填寫該步驟,比如需要將DNA翻譯為氨基酸序列并進行復制粘貼等,該步操作只需將之前準備信息錄入即可,比較耗時;點擊下方“ADD”鍵,頁面將切換為在這里我們需要錄入更多與該序列有關的信息,最主要的就是錄入之前已經(jīng)整理好的序列里面的開放閱讀框(ORF)信息:Genetic Code設置為”Standard“,5和3都勾選上,Protein Name/Protein Description項都填寫,將特定區(qū)域(ORF)的核苷酸序列翻譯為氨基酸序列后(除去末端的終止子)復制到下方的”Amino Acid Sequence“框中,依次錄入即可。在這里越詳細越好,具體參照實際操作;3.9 Review and Correct對已填寫信息進行復核及提交,并被告知在2個工作日之內(nèi)會收到NCBI電郵,需要進一步對序列進行審查核對;4.至此,基本序列提交已經(jīng)完工,剩下的事情就是等待審核,大概兩個工作日后會收到來自NCBI工作人員的電郵,如有問題會通知你進一步修改信息直到完全無誤,包括以后的接受序列號,即你的序列會出現(xiàn)在NCBI里面世界上唯一的一個界面里。