融合ALBERT與規(guī)則的小麥病蟲(chóng)害命名實(shí)體識(shí)別
計(jì)算機(jī)科學(xué)與探索
頁(yè)數(shù): 10 2022-07-05
摘要: 小麥病蟲(chóng)害中文命名實(shí)體識(shí)別是構(gòu)建該領(lǐng)域知識(shí)圖譜的關(guān)鍵步驟,針對(duì)小麥病蟲(chóng)害領(lǐng)域訓(xùn)練數(shù)據(jù)匱乏、實(shí)體結(jié)構(gòu)復(fù)雜、實(shí)體類(lèi)型多樣及實(shí)體分布不均勻等問(wèn)題,在充分挖掘隱含知識(shí)的前提下,采用了兩種數(shù)據(jù)增廣方法擴(kuò)充句子語(yǔ)義信息,構(gòu)建了小麥病蟲(chóng)害實(shí)體識(shí)別語(yǔ)料庫(kù)WpdCNER及其領(lǐng)域詞典WpdDict,并在領(lǐng)域?qū)<业闹笇?dǎo)下定義了16類(lèi)實(shí)體;同時(shí)提出了一種基于規(guī)則修正的中文命名實(shí)體識(shí)別模型WPD-RA,...