本人需要做实体抽取、关系抽取和关系抽取,使用brat来对数据进行标注。具体操作如下:
1、下载brat-v1.3。下载链接为http://brat.nlplab.org/index.html,
2、安装。解压文件,进入文件夹brat-v1.3_Crunchy_Frog中,操作chmod -R 777更改权限,操作./install.sh -u,输入用户名、密码以及邮箱就完成了对brat的安装。更复杂更详细的安装过程参考http://brat.nlplab.org/installation.html。
3、准备数据。把数据放进文件夹中,比如我把数据(即filename.txt文件,filename为文件名)放在data/project/中。每一个句子独立成一个.txt文件。然后按下列操作就可以给data文件夹中每一个.txt文件都产生一个.ann文件。

find data -name '*.txt' | sed -e 's|\.txt|.ann|g' | xargs touch

4、启动brat。如果不需要更改默认的配置文件,操作python standalone.py即可,如需更改默认的配置文件,操作完第六步后再python standalone.py即可。由于brat的开发语言是python2,所以就不能使用python3来对其进行操作了,我的python2版本的编译器是pytho2.7,所以我的操作就是python2.7 standalone.py。
5、标注。进入网页localhost:8001(localhost为你本机的地址,如果你是在服务器上运行那就是你服务器的地址)。点击右上角的login输入你在第二步的用户名和密码即可完成登录。完成登录后就会出现下面的界面。

选择我数据所存放的文件夹,在我这里是project/bee,这一步的设置是在第三步中。然后皆可以进行标注了。即:

6、更改配置。
6.1、更改实体类型以及关系类型。复制annotation.conf文件到第三步.txt文件的同一目录下,按照你自己的需求更改配置即可。冒号(:)和逗号(,)是全角,即英文模式,不能是半角,即中文模式。
6.2、支持中文。brat本身是不支持中文的,如果在配置文件里定义中文会报错,解决办法是修改./server/src/projectconfig.py文件的第163行,加上中文支持即可:

n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)

6.3、添加快捷键。同样复制kb_shortcuts.conf文件到第三步.txt文件的同一目录下,为每个标记提供一个键盘快捷键,只有两列内容,第一列是键,第二列是对应的标记。

7、一些有用的功能。
7.1、按TAB键就会显示当前标注文件所在的文件夹,如下:

7.2、左键:到上一个文件;右键:到下一个文件。
7.3、在右上角打开Option,把Annotation Option改为Normal,而不是Careful。否则你完成选择之后,还需要额外点一次Ok才可以。如:

知识图谱brat标注工具的用法相关推荐

  1. brat标注工具知识总结

    目录 医疗实体识别.关系抽取标注工具 标注思路 BRAT 参考文档 Brat docker image 其他 error 医疗实体识别.关系抽取标注工具 哈工大开源标注工具 这个项目中不仅提供了用于命 ...

  2. Brat标注工具(本地)安装及使用

    Brat标注工具(本地)安装及使用 环境 windows10->虚拟机->Ubuntu 16.04 64位 前置条件 1:更新apt sudo apt upgrade sudo apt u ...

  3. [Python知识图谱] 三.Jieba工具中文分词、添加自定义词典及词性标注详解

    本系列文章主要结合Python语言实现知识图谱构建相关工程,具有一定创新性和实用性,非常希望各位博友交流讨论,相互促进成长.前面两篇文章详细讲解了哈工大Pyltp工具,包括中文分词.词性标注.实体识别 ...

  4. 知识图谱本体建模工具Protege使用教程

    1.下载 先去官网下载:protégé 直接下最新版,点击会有注册页面,只填必填项的name和project description即可. 下载后解压即可使用. 2.安装可视化工具Graphviz 去 ...

  5. Brat 标注工具 配置文件 详细说明

    标注项目由 4 个配置文件控制 1.标注类型配置 annotation.conf: annotation type configuration 2.标注显示配置 visual.conf: 3.注解工具 ...

  6. 【文本标注】文本标注工具brat的使用

    brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息: (1)实体:命名实体,可用于NER: (2)关系:实体间关系,可用于关系抽取: (3)事件:实体参与的事 ...

  7. NLP标注工具:brat【可用于标注:实体、关系、事件、属性】【只能用于Linux下】【开源、免费】

    brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息: 实体:命名实体,可用于NER: 关系:实体间关系,可用于关系抽取: 事件:实体参与的事件: 属性:事件或 ...

  8. Brat序列标注工具小结

    20210616 https://blog.csdn.net/u012436149/article/details/79321112 spacy 构建语法解析树 Brat标注工具(本地)安装及使用 环 ...

  9. 【金猿产品展】亚信科技AISWare Onta KG知识图谱工具——一站式全流程知识计算管理平台...

    亚信科技产品 本项目由亚信科技投递并参与"数据猿年度金猿策划活动--2021大数据产业创新服务产品榜单及奖项"评选. 数据智能产业创新服务媒体 --聚焦数智 · 改变商业 亚信科技 ...

最新文章

  1. 你的神经网络不起作用的37个理由
  2. 专业ajax解决方案汇集
  3. invalid table name什么意思_新手入门前端要学习什么?总结一些知识点(建议收藏)...
  4. linux malloc 线程,Linux上的侧线程的malloc/calloc崩溃
  5. WordPress解析之数据库
  6. 20135310陈巧然家庭作业汇总[3.56 3.67 6.23 6.39.6.40 6.41]
  7. python绘制复杂表格_Python3绘制整齐的表格
  8. centos6 java安装_CentOS6下安装Java JDK8
  9. SpringBoot + MyBatis + Thymeleaf 之 HelloWorld
  10. 手机软件Toast无法显示提示信息
  11. Hark的数据结构与算法练习之地精(侏儒)排序
  12. POJ1144 Network 连通性
  13. 技术思辨:GCN和CNN到底有什么差别?
  14. axure 抖音部件库_原型技巧:如何用Axure画出抖音APP页面色彩风格(干货技能)...
  15. [转载]布谷鸟算法的程序(个人注释)
  16. STM32CAN总线协议讲解
  17. 高项 人力资源管理论文
  18. swift锁屏播放,音乐进度更新,专辑,歌手名显示
  19. 那些崩溃率低于万分之一的独角兽APP都作对了什么?
  20. 剖析visa信用卡支付的交易处理流程

热门文章

  1. 计算机电源中线分布,电子工程师必看!五大开关电源EMI抑制策略
  2. 无线充电循迹小车方案
  3. 在没有wifi,没有路由器,没有网线的情况下,如何让笔记本、电脑等设备联网 解决手机热点网络慢的问题
  4. 953-验证外星语词典
  5. GDUT - 专题学习1 D - 一维前缀和
  6. 怪兽充电上市规模缩水:盘中跌破发行价,搜电、街电宣布联手对抗
  7. kvm通过qcw2文件创建虚拟机
  8. JAVA | 线程(四)线程通信
  9. 计算机辅助设计自考实践,广东工业大学自考09233计算机辅助设计实践环节考核要求...
  10. 全球与中国第一人称视角无人机风镜市场现状及未来发展趋势