ubuntu下文本标注工具BRAT全程离线安装
1 Apache离线安装
1.1 软件下载
1.1.1 httpd文件
从http://httpd.apache.org/download.cgi下载httpd文件
1.1.2 apr文件
可到官网http://apr.apache.org/下载apr。
1.1.3 apr-util文件
从官网http://apr.apache.org/下载apr-util。
1.1.4 pcre文件
从官网http://www.pcre.org/下载PCRE。
1.1.5 expat文件
由于系统缺失expat库,需要另外下载expat源码包并安装,否则安装apr-util环境会出错。
下载地址:
https://sourceforge.net/projects/expat/files/expat/2.2.9/
1.2 安装
下载完成后,分别解压这些安装包。
tar -zxvf apr-1.7.0.tar.gz
tar -zxvf apr-util-1.6.1.tar.gz
tar -zxvf pcre-8.43.tar.gz
tar -zxvf httpd-2.4.39.tar.gz
tar -zxvf expat-2.2.9.tar.gz
解压完成后,会出现解压的目录。
然后分别进入四个目录,执行以下命令
cd expat-2.2.9
./configure
make
make installcd ../apr-1.7.0
./configure --prefix=/usr/local/apr (指定安装目录)
make
make installcd ../apr-util-1.6.1
./configure --prefix=/usr/local/apr-util --with-apr=/usr/local/apr
make
make installcd ../pcre
./configure --prefix=/usr/local/pcre
make
make installcd …/httpd-2.4.39
./configure --prefix=/usr/local/httpd --with-apr=/usr/local/apr --with-apr-util=/usr/local/apr-util --with-pcre=/usr/local/pcre
make
make install
默认安装httpd后在/usr/local/httpd/modules下没有cgi模块,可以通过apxs命令进行离线编译安装cgi,mod_cgi.c在httpd源码中查找。
cd /usr/local/httpd/bin
./apxs -i -a -c /home/jcsa/httpd/modules/generators/mod_cgi.c
将Apache加入系统服务中(待验证):
cp /usr/local/httpd/bin/apachectl /etc/rc.d/init.d/httpd
2、设置开机自己启动
sudo update-rc.d -f httpd defaults
利用服务启动httpd
service httpd start
查看状态
service httpd status
参考:Ubuntu下apache开机自启
1.3 文件配置
一切都按照流程安装完成后,进入目录 /usr/local/httpd/conf/
打开httpd.conf文件:
`vim httpd.conf`
找到文件中的 #ServerName www.example.com:80
修改为:ServerName 192.168.190.156:80(自己的IP)
在本地浏览器访问apache服务,显示以下内容,表示Apache服务正常。
确保httpd.conf文件中mod_cgi模块加载进来。
2 brat安装
brat是一个文本标注工具,可以标注实体,事件、关系、属性等,只支持在linux下安装,其使用需要webserver,官方给出的教程使用的是Apache2。
2.1 下载brat软件
建议下载brat的release版本地址:
https://github.com/nlplab/brat/releases/tag/v1.3p1
httpd安装成功后,将下载的brat软件解压到/usr/local/httpd/htdocs/brat
使用如下命令对brat目录授权:
sudo chmod 777 -R /usr/local/httpd/htdocs/brat
进入brat目录
cd /usr/local/httpd/htdocs/brat
执行以下命令,根据提示输入用户名、密码、管理员邮箱
sudo ./install.sh
2.2 配置
打开httpd.conf文件:vim httpd.conf或者gedit httpd.conf
增加
<Directory /usr/local/httpd/htdocs/brat>
AllowOverride Options Indexes FileInfo Limit
Require all granted
AddType application/xhtml+xml .xhtml
AddType font/ttf .ttf
Options +ExecCGI
AddHandler cgi-script .cgi
重启httpd后
cd /usr/local/httpd/bin
sudo ./apachectl restart
访问以下网址http://127.0.0.1/brat/
3 brat使用
3.1 设置中文标注
brat默认不支持中文标注,需要手动修改brat主目录/server/src路径下的projectconfig.py文件的第162行代码,注释源代码,然后另起一行加入新代码(修改之后记得重启apache2服务):
# n = re.sub(r'[^a-zA-Z0-9_-]', '_', n)
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)
请确保python2环境存在,并且python软连接指向的是python2,否则brat可能运行报错(最新的release版本只支持python2),如果需要安装python3可以建立新的软连接,名字叫python3即可;当然这只是参考处理方案,也可以采用虚拟环境的方式在python2下运行brat。
3.2 添加多个用户
找到config.py 对应的行,增加:
USER_PASSWORD = {'admn': 'admin',
'test': 'test',
# (add USERNAME:PASSWORD pairs below this line.)
}
3.3 准备数据
把数据放进文件夹中,比如我把数据(即filename.txt文件,filename为文件名)放在data/project/中。每一个句子独立成一个.txt文件。然后按下列操作就可以给data文件夹中每一个.txt文件都产生一个.ann文件。
find data -name '*.txt' | sed -e 's|\.txt|.ann|g' | xargs touch
另外再对新添加的文件夹添加读写权限:
chmod –R 777 ./
3.4 实体标注
brat需要登陆用户,才能进行标注,否则会点击文本不出现实体类型弹窗。
对文本进行实体标注时,如果Options下Annotation options设置为Careful,点击实体类型后,需要再增加一个点击确定的操作。如果Annotation options设置为Normal,则双击实体类型即可完成操作。
错误解决
如果使用brat加载本地文件的时候报错“unable to read text file xxx/xxx/xxx/xxx.txt ”,请确保你的txt文件已经授权给当前linux系统的登录用户,授权方式可以参考如下方式:
sudo chmod 777 xxx.txt
4 参考
中标麒麟操作系统6.7版本下安装Apache-2.4.39
Ubuntu 12.94 离线安装(部署)Apache(Apache-2.4.7)
用深度学习做命名实体识别(二):文本标注工具brat
文本标注工具brat部署笔记
所有的离线安装包地址:https://download.csdn.net/download/maoersong/12191533
ubuntu下文本标注工具BRAT全程离线安装相关推荐
- 文本标注工具BRAT的安装与配置
文本标注工具BRAT的安装与配置 因此博客是安装完成之后回顾下写的,所以没有配图说明,仅记录下安装步骤及出现的一些问题,具体安装路线如下: 1.win10下VirtualBox与Ubuntu的安装 B ...
- 【文本标注】文本标注工具brat的使用
brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息: (1)实体:命名实体,可用于NER: (2)关系:实体间关系,可用于关系抽取: (3)事件:实体参与的事 ...
- 用深度学习做命名实体识别(二):文本标注工具brat
本篇文章,将带你一步步的安装文本标注工具brat. brat是一个文本标注工具,可以标注实体,事件.关系.属性等,只支持在linux下安装,其使用需要webserver,官方给出的教程使用的是Apac ...
- 文本标注工具-brat安装
参考:Ubuntu16.04安装文本标注工具brat brat使用参考:BRAT的安装.配置.标注操作
- 文本标注工具--BRAT 安装
brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息: 实体:命名实体,可用于NER: 关系:实体间关系,可用于关系抽取: 事件:实体参与的事件: 属性:事件或 ...
- 文本标注工具BRAT安装使用
1.介绍 BRAT是一个基于web的文本标注工具,主要用于对文本的结构化标注,用BRAT生成的标注结果能够把无结构化的原始文本结构化,供计算机处理.利用该工具可以方便的获得各项NLP任务需要的标注语料 ...
- Ubuntu16.04安装文本标注工具brat
brat 的下载地址http://brat.nlplab.org/ Ubuntu16.04安装CGI环境 安装Apache2 sudo apt install apache2 配置CGI 1)打开文件 ...
- NLP标注工具Brat
https://www.cnblogs.com/xiaoqi/p/brat-config.html [文本标注]文本标注工具brat的使用 2019常用NLP标注工具简单介绍 NLP标注工具: YED ...
- NLP文本标注工具与平台(数据标注公司)
最近在做NLP相关项目,包括句法分析.情感分析等,有大量数据需要标注.我评估了几个文本标注工具,也接触了几家数据标注公司和平台,总结如下,供各位参考. 文本标注平台(标注外包公司) 数据标注公司的工作 ...
最新文章
- WEB 测试点总结
- 【semantic】本体和语义网的研究方向
- 《C++面向对象高效编程(第2版)》——2.16 识别成员函数的目标对象
- Day12 前端html
- close wait 过多原因_从Linux源码看TIME_WAIT状态的持续时间
- 打造安全可靠的研发中心桌面
- 五子棋聊天java_java带聊天的五子棋 适合新手
- 第十四篇 项目整体管理__项目选择方法 之 投资收益率分析、投资回收期分析
- intel ax200ngw刷killer 1650x教程
- 简单的卷积神经网络编程,python卷积神经网络训练
- mysql的ace什么概念_ACE(03):努力了,总会有收获
- 阿昆的Java学习日记Day2
- 主题颜色提取 ——— Palette
- 全球著名化妆品品牌--SEPHORA丝芙兰验厂
- GNU链接脚本(06) - SECTIONS指令
- RTU厂家,RTU品牌.遥测终端机厂家,遥测终端机品牌,DTU厂家DTU品牌
- 微信支付提示url未注册
- vue中实现文字超过2行... 展开-收起(兼容ie)
- 《凯恩斯革命的前世今生》导语集(前三章)
- 硬盘界面发展史:ATA, AHCI, NVMe. PATA, SATA, SAS, Mini PCIE/MSATA, M.2(PCEx2/SATA or PCIEx4)