除了核苷酸序列數據庫,另外一個主要的初級數據源來自各種基因組測序計劃?;蚪M數據庫的主要內容為收集基因組序列、注釋結果并且展示這些序列。目前許多基因組已經測序完成,這些基因組的大部分信息在ENA、GenBank 等數據庫...[繼續(xù)閱讀]
海量資源,盡在掌握
除了核苷酸序列數據庫,另外一個主要的初級數據源來自各種基因組測序計劃?;蚪M數據庫的主要內容為收集基因組序列、注釋結果并且展示這些序列。目前許多基因組已經測序完成,這些基因組的大部分信息在ENA、GenBank 等數據庫...[繼續(xù)閱讀]
非編碼RNA(non-coding RNA)包括rRNA、tRNA、snRNA、snoRNA 和microRNA 等,它們的共同特點是都能轉錄但是不翻譯成蛋白,在RNA 水平上就能行使各自的生物學功能。非編碼RNA 從長度上來劃分可以分為3類:小于50nt,包括miRNA、siRNA、piRNA;50nt 到500nt,包括...[繼續(xù)閱讀]
1.蛋白質序列數據庫Swiss-Prot 和PIR 是國際上兩個主要的蛋白質序列數據庫,目前這兩個數據庫在EMBL和GenBank 數據庫上均建立了鏡像(mirror)站點。Swiss-Prot 數據庫包括了從EMBL 翻譯而來的蛋白質序列,這些序列經過了人工檢驗和注釋。該數...[繼續(xù)閱讀]
表1-2.13 部分代謝途徑數據庫網址生物體內基因經由轉錄并翻譯成蛋白質后,參與的各種復雜的生化反應,使物質A 到物質X 的酶反應按常規(guī)程序(A→B→C→……X)進行,稱為A 至X 的代謝途徑(metabolic pathway )。代謝途徑數據庫中較為常用和...[繼續(xù)閱讀]
1.代謝組學數據庫代謝組學數據庫是收錄在代謝組學通路中的酶、化合物以及基因等成分信息的數據庫。其中MetaboLights (http://www.ebi.ac.uk/metabolights/)為EMBL 下屬的代謝組學數據庫(圖1-2.15),主要內容包含代謝組學實驗數據以及相關聯(lián)的衍...[繼續(xù)閱讀]
1.什么是一級數據庫和二級數據庫,它們有什么異同?2.簡述Fasta 和Fastq 格式,并比較它們的異同。3.如何向NCBI 遞交序列? 列舉三種方法。如果遞交序列數據很大或序列條數很多應該如何解決?4.如何下載水稻基因組的特定區(qū)段序列或注釋...[繼續(xù)閱讀]
序列聯(lián)配(sequence alignment)也叫序列對比,是生物信息學中的重要內容之一,許多生物信息學分析均涉及序列聯(lián)配方法。如下兩條DNA 序列:我們簡單地把它們聯(lián)配如下,僅有兩個堿基匹配:如果我們在一條序列中引入一個空位或空格(gap),即一...[繼續(xù)閱讀]
構建計分矩陣,我們需要找到一個可以估計任何聯(lián)配的某一統(tǒng)計數,使生物學關系最顯著的聯(lián)配統(tǒng)計數最大。先看以下2條氨基酸序列的聯(lián)配情況。如果我們將各殘基按相同率處理,則2種聯(lián)配方式(a 和b)的得分是相等的(9個殘基中5個匹配...[繼續(xù)閱讀]
1.PAM 替換矩陣已故Dayhoff 是蛋白質序列比較的先驅,她和她的同事們通過對蛋白質進化模式的研究,建立了一組被廣泛應用的氨基酸替換矩陣,這些矩陣常被稱為Dayhoff 矩陣、MDM(mutation data matrix)或PAM(percent accepted mutation)矩陣。由于蛋白質...[繼續(xù)閱讀]
PSSM(position-specific scoring matrix)是由一個簡單對數變換而來的矩陣,它給出不同來源的一小段保守序列(基序)各個特定位置氨基酸的頻率。PSSM 可以用于一條序列的保守序列的搜索。一條序列中,與PSSM 最相似的位置即為PSSM 代表的基序位...[繼續(xù)閱讀]