Needleman-Wunsch 算法是一種全局聯(lián)配算法,它從整體上分析兩個(gè)序列的關(guān)系,即考慮序列總長(zhǎng)的整體比較,用類(lèi)似于使整體相似(global similarity)最大化的方式,對(duì)序列進(jìn)行聯(lián)配。兩個(gè)不等長(zhǎng)序列的聯(lián)配分析必須考慮在一個(gè)序列中一些堿基的刪...[繼續(xù)閱讀]
海量資源,盡在掌握
Needleman-Wunsch 算法是一種全局聯(lián)配算法,它從整體上分析兩個(gè)序列的關(guān)系,即考慮序列總長(zhǎng)的整體比較,用類(lèi)似于使整體相似(global similarity)最大化的方式,對(duì)序列進(jìn)行聯(lián)配。兩個(gè)不等長(zhǎng)序列的聯(lián)配分析必須考慮在一個(gè)序列中一些堿基的刪...[繼續(xù)閱讀]
Smith-Waterman 算法是在Needleman-Wunsch 算法基礎(chǔ)上發(fā)展而來(lái)的,它是一種局部聯(lián)配算法。由于親緣關(guān)系較遠(yuǎn)的蛋白質(zhì)序列可能只有一些相互獨(dú)立的保守片段,所以進(jìn)行局部相似性分析有時(shí)可能比整體相似性分析更合理。Smith 和Waterman(1981)提...[繼續(xù)閱讀]
BLAST 算法同樣是利用動(dòng)態(tài)規(guī)劃算法,與Smith-Waterman 算法類(lèi)似,其不同之處是引入了所謂“字”或“字符串”(word 或K-tuple,K-mer 等)的檢索技術(shù)。所有序列其實(shí)都是由若干字符串組成,例如我們以3個(gè)堿基長(zhǎng)度的字符串為例,下列DNA 序列包括...[繼續(xù)閱讀]
采用BLAST 的基本算法目前形成了若干不同的工具,分別用于特定序列數(shù)據(jù)庫(kù)和特定目的的序列搜索。以NCBI 提供的在線序列數(shù)據(jù)庫(kù)搜索工具BLAST(2014年12月)為例(圖1-3.4),BLASTN 是對(duì)核苷酸遞交序列庫(kù)搜索核苷酸序列數(shù)據(jù)庫(kù),BLASTP 是在蛋白...[繼續(xù)閱讀]
BLAST 搜索返回的結(jié)果中,提供了遞交序列與數(shù)據(jù)庫(kù)中序列比對(duì)結(jié)果的得分(score)和一個(gè)統(tǒng)計(jì)測(cè)驗(yàn)結(jié)果(E-value)。到目前為止,對(duì)局部聯(lián)配的統(tǒng)計(jì)學(xué)問(wèn)題已基本搞清楚,特別是那些不含空位的局部聯(lián)配更是如此。我們不妨首先考慮不含空位的...[繼續(xù)閱讀]
1.目前計(jì)分矩陣主要有哪些? 比較它們的異同。2.請(qǐng)利用動(dòng)態(tài)規(guī)劃Needleman-Wunsch 算法對(duì)下列兩條蛋白質(zhì)序列進(jìn)行全局聯(lián)配,獲得最優(yōu)聯(lián)配結(jié)果: P1=AGWGAHEA P2=PAWHEAEAG計(jì)分系統(tǒng):計(jì)分矩陣BLOSUM50,空位罰8分。表1-3.7 BLOSUM50(部分)3.數(shù)據(jù)庫(kù)...[繼續(xù)閱讀]
許多生物學(xué)研究都涉及多條序列甚至幾十上百條序列的比較,因此多序列聯(lián)配是生物信息學(xué)的一個(gè)重要課題。通過(guò)多序列聯(lián)配結(jié)果,我們可以確定這些序列的親緣關(guān)系,通過(guò)序列保守性判斷功能域或功能位點(diǎn)等。多序列聯(lián)配同樣包括全...[繼續(xù)閱讀]
多序列全局聯(lián)配算法目前主要是以Clustal 算法為代表的漸進(jìn)式全局聯(lián)配方法。漸進(jìn)式全局聯(lián)配算法是20世紀(jì)80年代發(fā)展起來(lái)的(Waterman 和Perlwitz,1984; Feng 和Doolittle,1987),其中以軟件工具Clustal 算法最為成功。下面就重點(diǎn)介紹Clustal 算法。...[繼續(xù)閱讀]
具有相同功能的基因往往在序列上存在局部相似性或保守性,這些保守性與相應(yīng)功能和選擇壓等有關(guān)(詳見(jiàn)下節(jié))。圖1-4.3列舉了一個(gè)多序列局部保守性。生物信息學(xué)的一個(gè)重要任務(wù)是找到這些保守序列。圖1-4.3 多序列局部保守性舉例...[繼續(xù)閱讀]
蛋白質(zhì)功能域(domain)的概念最早由Wetlaufer(1973)在研究蛋白質(zhì)結(jié)構(gòu)時(shí)提出。蛋白質(zhì)功能域一般是指一條蛋白質(zhì)序列中一段保守的區(qū)域,該區(qū)域能夠獨(dú)立行使功能、進(jìn)化等。在蛋白質(zhì)結(jié)構(gòu)中,功能域是指一個(gè)蛋白質(zhì)結(jié)構(gòu)的一部分,它能形成一...[繼續(xù)閱讀]