中文标注工具brat的使用
安装
下载地址:https://github.com/nlplab/brat/releases/tag/v1.3p1
解压
unzip brat-1.3p1.zip
Anaconda创建新环境
conda create -n brat python=2.7
conda activate brat
将解压后的文件放入该环境目录下,然后进入再安装
cd brat-1.3p1/
./install.sh
输入登陆名、登陆密码、联系邮箱,账号和密码记下,登录brat时候会用到
使用
在该环境下开启服务
python2 standalone.py
用浏览器访问127.0.0.1:8001进入brat系统界面
http://127.0.0.1:8001/index.xhtml
brat要先登录账号才能使用标注功能,右上角登录
需要标注的文本存放在brat下的data文件夹中
可以在data文件夹中新建project文件夹,用于存放需要标注的txt文档和ann标注文件
两个文件都是需要自己生成的,其中demo.txt是需要标注的文档文件,ann标注文件为空
touch demo.txt
touch demo.ann
如果要进行批量标注,可以先把所有txt文本放在project文件夹下,然后在project文件夹所在目录下执行以下命令自动生成ann标注文件
find project -name '*.txt'|sed -e 's|.txt|.ann|g'|xargs touch
页面左上角有三个按钮
Collection
用于设置待标注文本
Document也就是data文件夹
project是我们新建的文件夹,进入该文件夹下选中待标注文档demo.txt,双击
选中词语自动跳出标签页面
对于标注好的标签,双击该标签可以跳出页面删除该标签
中文标注
brat默认不支持中文标注
修改brat下的server/src/projectconfig.py文件
注释掉162行代码,在正则匹配中加入中文
n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)
修改brat下的annotation.conf文件
annotation.conf文件中有四个模块:
entities
:实体,比如:人名、地名,可以采用tab来增加二级标注
relations
:关系,每行定义一种关系,第一列为关系类型,随后是用逗号分隔的ArgN:实体名,用来表示关系的各个相关者
events
:事件,每行定义一类事件,第一列为事件名,随后是用逗号分隔的Participant:实体名,用来表示事件的各个参与者
attributes
:属性,每行一个属性,第一列为属性名,随后是用逗号分隔的Arg:<模块类型>, Value:属性值,属性值可以有多个
修改brat下的visual.conf文件
实体直接使用中文会报错,所以需要进行修改
参考
https://blog.csdn.net/weixin_42927998/article/details/106623370
https://www.jianshu.com/p/3a70ee9ad632
https://blog.csdn.net/u014028063/article/details/89329306
中文标注工具brat的使用相关推荐
- 【文本标注】文本标注工具brat的使用
brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息: (1)实体:命名实体,可用于NER: (2)关系:实体间关系,可用于关系抽取: (3)事件:实体参与的事 ...
- 文本标注工具BRAT的安装与配置
文本标注工具BRAT的安装与配置 因此博客是安装完成之后回顾下写的,所以没有配图说明,仅记录下安装步骤及出现的一些问题,具体安装路线如下: 1.win10下VirtualBox与Ubuntu的安装 B ...
- NLP标注工具Brat
https://www.cnblogs.com/xiaoqi/p/brat-config.html [文本标注]文本标注工具brat的使用 2019常用NLP标注工具简单介绍 NLP标注工具: YED ...
- ubuntu下文本标注工具BRAT全程离线安装
1 Apache离线安装 1.1 软件下载 1.1.1 httpd文件 从http://httpd.apache.org/download.cgi下载httpd文件 1.1.2 apr文件 可到官网h ...
- NLP标注工具Brat的简单使用
目录 写在前面 1. 背景 2. Brat的安装与启动 3. Brat的运行 4. 标注配置与标注 (1) 原始数据文件准备 (2) 配置文件配置 (3) 标注 (4) 中文标签配置 (5) 标注 ( ...
- 【NLP】NLP标注工具Brat的简单使用
写在前面 今天跟大家分享的是 NLP标注工具 Brat 的简单使用. 1. 背景 Brat 所支持的标注任务有:实体识别.实体关系.事件抽取等:当然也可适配到 Aspect-Based Sentime ...
- 实体标注工具 BRAT(brat rapid annotation tool)
最近在看命名实体识别这一块,因为要涉及到数据标注,所以我了解了一款实体标注工具BRAT. BRAT(brat rapid annotation tool) 它是一款功能较全面的文本标注工具,可以标注实 ...
- 文本标注工具-brat安装
参考:Ubuntu16.04安装文本标注工具brat brat使用参考:BRAT的安装.配置.标注操作
- 用深度学习做命名实体识别(二):文本标注工具brat
本篇文章,将带你一步步的安装文本标注工具brat. brat是一个文本标注工具,可以标注实体,事件.关系.属性等,只支持在linux下安装,其使用需要webserver,官方给出的教程使用的是Apac ...
最新文章
- 业界丨2018深度学习十大趋势:元学习成新SGD,多数硬件创企将失败
- 在centos7上编译安装nginx
- 编译报错一列----aclocal找不到
- SAP系统中发送消息的几种办法
- Delphi 从PaintBox拷贝一部分内容到TBitmap
- SAP Data Intelligence Graph json源代码的结构分析
- 阅读书源最新2020在线导入_书源篇三及6.5.0版本介绍
- jQuery学习总结06-插件开发
- 56 - II. 数组中数字出现的次数 II
- 电切镜行业调研报告 - 市场现状分析与发展前景预测(2021-2027年)
- C++11 用户自定义字面量
- (三) 弦截法(试位法)求根
- 剑指offer——面试题54:表示数值的字符串
- English trip V1 - 20.Look at me 看着我 Teacher:Solo Key: 声调(英语默认就声调[rising]和降调[falling]两种)...
- PHPObject v1.51(Flash Remoting for PHP developers)
- Atitit.部分错误 设计模式,异常处理框架atiPartErr 的总结
- ai一个线段多个箭头_「平面设计」Illustrator(AI)基础教学-第2章 绘制简单的图形...
- 热传导方程以及Matlab求解
- IPIP.Net地址库格式分析
- 蚂蚁金服上市,程序员流下了激动的眼泪