當前位置:首頁 > IT技術(shù) > 系統(tǒng)服務(wù) > 正文

Brat標注工具安裝及使用(虛擬機系統(tǒng)Ubuntu16)
2022-03-06 18:10:28

原文地址https://blog.csdn.net/p_jinsan/article/details/96152078

稍作了一些補充

1.環(huán)境
windows10->虛擬機->Ubuntu 16.04 64位

2.前置條件

  2.1更新apt

sudo apt upgrade
sudo apt update

  2.2安裝git

sudo apt install git

  2.3安裝apache2

sudo apt install apache2

檢測:瀏覽器中輸入http://127.0.0.1/或者http://localhost/
進入下圖界面,則說明安裝成功

?

  2.4安裝google chrome#個人習慣

wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
sudo dpkg -i google-chrome-stable_current_amd64.deb

3.安裝

  3.1下載brat

進入主頁下載 http://brat.nlplab.org/index.html

?

補充:點擊Download,像我就出現(xiàn)了無法連接的情況,可以將下載地址復(fù)制到迅雷進行下載

http://weaver.nlplab.org/~brat/releases/brat-v1.3_Crunchy_Frog.tar.gz

?

?

?

  3.2解壓

tar xzf 路徑/文件名
eg: tar xzf Downloads/brat-v1.3_Crunchy_Frog.tar.gz

  3.3進入文件夾

重命名為brat

cd brat

  3.4安裝,配置一些用戶信息

./install.sh

  3.5打開#每次使用都需要

python2 standalone.py

  3.6打開瀏覽器進入即可開始標注

http://127.0.0.1:8001/index.xhtml

4.使用

  4.1登錄后,選中文本后會彈出窗口,選擇實體類型
  4.2拖動標注好的實體可以連接關(guān)系
  4.3雙擊標簽可對標簽進行修改或刪除
  4.4點擊data可導(dǎo)出標注好的數(shù)據(jù)
  ps:未登錄不能進行標注

?

?

?

?

5.配置

annotation.conf

1.entities用來定義標注的實體名稱,其格式為每行一個實體類型,
    比如:人名、地名、英雄名、技能名等,可以采用tab來增加二級標注,
    hero
        hero1
2.relations用來定義實體間的關(guān)系,格式為每行定義一種關(guān)系,第一列為關(guān)系類型,
    隨后是用逗號分隔的ArgNrelations用來定義實體間的關(guān)系,格式為每行定義一種關(guān)系,第一列為關(guān)系類型,
    隨后是用逗號分隔的ArgN:實體名,用來表示關(guān)系的各個相關(guān)者。
    relation1 Arg1:hero1, Arg2:hero1
3.events用來定義事件,每行定義一類事件,第一列為事件名,隨后是用逗號分隔的Participant:實體名,
    用來表示事件的各個參與者。
4.attributes用來定義屬性,每行一個屬性,第一列為屬性名,隨后是用逗號分隔的Arg:<模塊類型>, Value:屬性值,
    注意屬性值可以有多個

?

?visual.conf#視覺配置文件

1.采用中文標簽時需要
2.將annotation.conf中名稱替換
3.labels
    [labels]
    hero1 | 魏

?

?6.其他

  6.1中文支持

添加

n = re.sub(u'[^a-zA-Zu4e00-u9fa5<>,0-9_-]', '_', n)

到./server/src/projectconfig.py第163行

?

  6.2給.txt文件添加.ann的標引文件

find 文件夾名稱 -name '*.txt'|sed -e 's|.txt|.ann|g'|xargs touch
eg:find data/exa -name '*.txt'|sed -e 's|.txt|.ann|g'|xargs touch

給文件夾內(nèi)所有.txt文件添加對應(yīng)的.ann標引文件

6.3添加用戶(本地不需要)

直接在config.py文件中添加

USER_PASSWORD = { 
    'admn': 'admin', 
    'test': 'test', 
    #'user':'password',
    # (add USERNAME:PASSWORD pairs below this line.) 
}

7.參考

中文文本標注工具調(diào)研以及BRAT安裝使用

標注工具Brat安裝(本地)

本文摘自 :https://www.cnblogs.com/

開通會員,享受整站包年服務(wù)立即開通 >