進(jìn)入21世紀(jì),隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)的高速發(fā)展,信息的存儲(chǔ)和處理能力得到迅速提高,信息量持續(xù)增長(zhǎng),紙質(zhì)文檔被不斷轉(zhuǎn)變?yōu)殡娮游臋n,可以說(shuō),我們正在被呈幾何量級(jí)產(chǎn)生的信息所淹沒(méi)。但大量的信息卻因?yàn)闆](méi)有經(jīng)過(guò)挑...[繼續(xù)閱讀]
海量資源,盡在掌握
進(jìn)入21世紀(jì),隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)的高速發(fā)展,信息的存儲(chǔ)和處理能力得到迅速提高,信息量持續(xù)增長(zhǎng),紙質(zhì)文檔被不斷轉(zhuǎn)變?yōu)殡娮游臋n,可以說(shuō),我們正在被呈幾何量級(jí)產(chǎn)生的信息所淹沒(méi)。但大量的信息卻因?yàn)闆](méi)有經(jīng)過(guò)挑...[繼續(xù)閱讀]
標(biāo)引(indexing),簡(jiǎn)單說(shuō)是一種標(biāo)識(shí)和引導(dǎo),是對(duì)文獻(xiàn)是什么信息的描述;具體是指在分析文獻(xiàn)內(nèi)容或情報(bào)問(wèn)題的基礎(chǔ)上,用某種索引語(yǔ)言或標(biāo)識(shí)符號(hào)把文獻(xiàn)的主題概念及其他有檢索意義的特征標(biāo)識(shí)出來(lái),作為情報(bào)存儲(chǔ)和檢索的依據(jù)的處理過(guò)...[繼續(xù)閱讀]
標(biāo)引按照使用的標(biāo)引語(yǔ)言或標(biāo)識(shí)符號(hào)的類型,可分為分類標(biāo)引和主題標(biāo)引;按照使用的標(biāo)引設(shè)備,可分為手工標(biāo)引和自動(dòng)標(biāo)引。1.2.2.1 分類標(biāo)引分類標(biāo)引,又稱文獻(xiàn)分類或信息分類,是依據(jù)特定的分類規(guī)則,對(duì)文獻(xiàn)進(jìn)行分類標(biāo)識(shí)的過(guò)程。分類...[繼續(xù)閱讀]
自動(dòng)標(biāo)引的研究至今大致經(jīng)歷了三個(gè)階段:第一階段是20世紀(jì)50年代至90年代初。這個(gè)階段主要是關(guān)于關(guān)鍵字提取方法的研究。第二階段是20世紀(jì)90年代至90年代末。這個(gè)階段傳統(tǒng)的自動(dòng)標(biāo)引方法的效率已達(dá)到極限,因此自動(dòng)標(biāo)引方法的研...[繼續(xù)閱讀]
自動(dòng)標(biāo)引方法主要包括統(tǒng)計(jì)標(biāo)引法、語(yǔ)言分析標(biāo)引法、人工智能標(biāo)引法、網(wǎng)頁(yè)標(biāo)引法、概率標(biāo)引法、詞典標(biāo)引法等。下面對(duì)這些方法做一詳細(xì)介紹。1.3.2.1 統(tǒng)計(jì)標(biāo)引法在各類自動(dòng)標(biāo)引的方法中,出現(xiàn)最早且被廣泛持續(xù)使用的是統(tǒng)計(jì)標(biāo)...[繼續(xù)閱讀]
1.3.3.1 自動(dòng)標(biāo)引方法研究的不足自動(dòng)標(biāo)引通過(guò)近幾十年的發(fā)展,已取得了長(zhǎng)足的進(jìn)步,但國(guó)內(nèi)自動(dòng)標(biāo)引的研究仍存在不足,主要表現(xiàn)在以下幾個(gè)方面。1.中文分詞算法存在缺陷找出各知識(shí)單元,是進(jìn)行標(biāo)引的第一步,但由于中文的特殊性,使...[繼續(xù)閱讀]
標(biāo)引分為分類標(biāo)引和主題標(biāo)引,相對(duì)應(yīng)的,標(biāo)引的標(biāo)準(zhǔn)也分為分類法和主題詞法。1.4.1.1 分類法基于分類法的標(biāo)引標(biāo)準(zhǔn)發(fā)展較早。早在1876年,杜威就創(chuàng)立了《杜威十進(jìn)分類法》(Dewey Decimal Classfication,DDC),可以說(shuō)是開辟了圖書分類法的新紀(jì)...[繼續(xù)閱讀]
元數(shù)據(jù),即數(shù)據(jù)的數(shù)據(jù),是用來(lái)描述數(shù)字化信息資源并確保這些數(shù)字化信息資源能夠被計(jì)算機(jī)自動(dòng)辨析、分解、提取和分析歸納的一種框架或一套編碼體系。④基于元數(shù)據(jù)的信息資源描述標(biāo)準(zhǔn)目前使用最廣泛的有兩種:一種是使用較早...[繼續(xù)閱讀]
隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)以及通信技術(shù)的發(fā)展,網(wǎng)絡(luò)信息資源的數(shù)量呈幾何級(jí)增長(zhǎng),已經(jīng)成為信息資源的主體,因而網(wǎng)絡(luò)信息資源標(biāo)引也成為現(xiàn)代信息資源標(biāo)引中首先要解決的問(wèn)題,其標(biāo)準(zhǔn)也在傳統(tǒng)標(biāo)準(zhǔn)的基礎(chǔ)上產(chǎn)生了新的變化。1.4.3.1 MARC在...[繼續(xù)閱讀]
國(guó)際標(biāo)準(zhǔn)化組織(ISO)的標(biāo)準(zhǔn)化原理委員會(huì)(STACO)將標(biāo)準(zhǔn)定義為由一個(gè)公認(rèn)的機(jī)構(gòu)制定和批準(zhǔn)的文件。它對(duì)活動(dòng)或活動(dòng)的結(jié)果規(guī)定了規(guī)則、導(dǎo)則或特殊值,供其共同和反復(fù)使用,以實(shí)現(xiàn)在預(yù)定領(lǐng)域內(nèi)最佳秩序的效果。而國(guó)家標(biāo)準(zhǔn)GB/T 3935.1—...[繼續(xù)閱讀]