ncbi中查詢基因序列的方法和三個號碼?

Tags: 號碼, 基因, 序列,

一.例子:查詢釀酒酵母(Saccharomyces cerevisiae)裡的海藻糖合成酶基因(tps1)

即可出現很多條目,找到Saccharomyces cerevisiae的就是NC_001134了,點選後就進入該基因所在染色體的介面了,再在“編輯”中“查詢”tps1就可以看該基因所在的位置,再點選CDS或者GeneID:852423都可以出現相關連結!

當然,如果你在文獻查到目的蛋白的序列號如NP_009684.1或者GeneID:852423,那分別在Search後選擇Protein或者Gene也可以出現相關連結!

二.基因CDS區介面的3個號碼

;from=488899&to=490386&view=gbwithparts

找到後,我發現該介面有3個標記,一個是NC_001134,其次是gi:50593115,最後是FEATURES中的gene中的/db_xref=“GeneID:852423”,他們分別是什麼號碼,用在什麼地方呢?嘗試中,終於發現,

在Search“Nucleotide”或者“Core Nucleotide”時,for後面是NC_001134,最終go到該基因所在染色體全長序列的資訊,所以NC_001134應該是該染色體的登入號吧?

在Search“Nucleotide”或者“Core Nucleotide”時,for後面是50593115,最終go到該基因所在染色體全長序列的資訊,所以50593115應該是該染色體的號吧?

在Search“Gene”時,for後面是852423,最終go到該基因的資訊,所以852423應該是該基因的登入號吧?所以我們如果要記住目的基因在ncbi中的位置就記住這個GeneID!

其他像NP_009684當然是基因編碼的蛋白質的登入號啦,不說了。

我們在文獻中查到的基因往往給的是Gene ID

三.引物設計第一步--找編碼序列的方法

在Search“Gene”時,for後面是852423,最終go到目的基因的資訊

點選中的FASTA,獲得的就是mRNA的非模板鏈(其實就是mRNA裡的U換成了T),也可以說是CDNA的互補片段,因為與編碼的蛋白質一一對應,所以也就是引物設計真正的模板!引物設計後面的PCR要克隆的就是這段序列!所以千萬不要搞錯了!點選GENBANK,獲得的是CDS區的序列和相關資訊,這個CDS區包括CDNA,也包括其他不編碼的序列,所以PCR沒必要把CDS區全部克隆出來!其實在CDS介面(或者說點選GENBANK後出現的介面裡),把Display裡的GENBANK(full)改成FASTA也可以!

其實在該介面中我們還可以瞭解到其他資訊

1.點選reference sequence details,可以看到NP_009684.1,點選他,可以看到目的蛋白質的資訊

2.點選獲得的是目的基因的圖譜,然後點選

TPS1後面的sv,也可以看到編碼序列了,當然這裡的DNA序列和蛋白質一一對應,更說明是設計引物的模板(這個圖譜介面也可以在2的點選GENBANK後獲得的CDS區中點選852423連結獲得,或者說條條連結通羅馬!)

四.關於CDS和CDNA的關係

ncbi中的CDS就是編碼序列,包括CDNA全部,也含有其他序列,畢竟CDNA是人為根據mRNA反轉錄得到的,而CDS區生物本身的,有些不編碼的序列,好像CDNA是純淨物,CDS有點渣子,呵呵。CDNA的互補序列既然是與編碼的蛋白質一一對應的,當然是ATG起始的,TAA TAG TGA終止的。

相關問題答案