20210616

https://blog.csdn.net/u012436149/article/details/79321112
spacy
构建语法解析树

Brat标注工具(本地)安装及使用

  1. 环境
    windows10->虚拟机->Ubuntu 16.04 64位

  2. 前置条件

    1:更新apt

    sudo apt upgrade
    sudo apt update
    
    • 1
    • 2

    2:安装git

    sudo apt install git
    
    • 1

    3.安装apache2

    sudo apt install apache2
    
    • 1

    检测:浏览器中输入http://127.0.0.1/或者http://localhost/
    进入下图界面,则说明安装成功

    4.安装google chrome#个人习惯

    wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb
    sudo dpkg -i google-chrome-stable_current_amd64.deb
    
    • 1
    • 2
  3. 安装

    1.下载brat

    进入主页下载 http://brat.nlplab.org/index.html

    2.解压

    tar xzf 路径/文件名
    eg: tar xzf Downloads/brat-v1.3_Crunchy_Frog.tar.gz
    
    • 1
    • 2

    3.进入文件夹

    重命名为brat

    cd brat
    
    • 1

    4.安装

    ./install.sh
    
    • 1


    5.打开#每次使用都需要

    python2 standalone.py
    
    • 1

    6.打开浏览器进入即可开始标注

    http://127.0.0.1:8001/index.xhtml

  4. 使用

    1.登录后,选中文本后会弹出窗口,选择实体类型
    2.拖动标注好的实体可以连接关系
    3.双击标签可对标签进行修改或删除
    4.点击data可导出标注好的数据
    ps:未登录不能进行标注

  5. 配置

    annotation.conf

    1.entities用来定义标注的实体名称,其格式为每行一个实体类型,比如:人名、地名、英雄名、技能名等,可以采用tab来增加二级标注,herohero1
    2.relations用来定义实体间的关系,格式为每行定义一种关系,第一列为关系类型,随后是用逗号分隔的ArgNrelations用来定义实体间的关系,格式为每行定义一种关系,第一列为关系类型,随后是用逗号分隔的ArgN:实体名,用来表示关系的各个相关者。relation1 Arg1:hero1, Arg2:hero1
    3.events用来定义事件,每行定义一类事件,第一列为事件名,随后是用逗号分隔的Participant:实体名,用来表示事件的各个参与者。
    4.attributes用来定义属性,每行一个属性,第一列为属性名,随后是用逗号分隔的Arg:<模块类型>, Value:属性值,注意属性值可以有多个
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
    • 8
    • 9
    • 10
    • 11
    • 12


    visual.conf#视觉配置文件

    1.采用中文标签时需要
    2.将annotation.conf中名称替换
    3.labels[labels]hero1 | 魏
    
    • 1
    • 2
    • 3
    • 4
    • 5

  6. 其他

    1.中文支持

    添加

    n = re.sub(u'[^a-zA-Z\u4e00-\u9fa5<>,0-9_-]', '_', n)
    
    • 1

    到./server/src/projectconfig.py第163行

    2.给.txt文件添加.ann的标引文件

    find 文件夹名称 -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch
    eg:find data/exa -name '*.txt'|sed -e 's|\.txt|.ann|g'|xargs touch
    
    • 1
    • 2

    给文件夹内所有.txt文件添加对应的.ann标引文件

    3.添加用户(本地不需要)

    直接在config.py文件中添加
    USER_PASSWORD = {
    'admn': 'admin',
    'test': 'test',
    #'user':'password',
    # (add USERNAME:PASSWORD pairs below this line.)
    }
    
    • 1
    • 2
    • 3
    • 4
    • 5
    • 6
    • 7
  7. 参考
    中文文本标注工具调研以及BRAT安装使用

    标注工具Brat安装(本地)

                                </div><div data-report-view="{&quot;mod&quot;:&quot;1585297308_001&quot;,&quot;dest&quot;:&quot;https://blog.csdn.net/p_jinsan/article/details/96152078&quot;,&quot;extend1&quot;:&quot;pc&quot;,&quot;ab&quot;:&quot;new&quot;}"><div></div></div><link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-60ecaf1f42.css" rel="stylesheet"></div>
</article>


http://www.taodudu.cc/news/show-63998.html

相关文章:

  • 深度学习概率输出
  • albert速度
  • Huggingface及BERT代码介绍
  • 各bert 模型下载
  • 输入输出导入导出问题
  • bert [unused*] 特殊符号
  • logits的理解
  • 知识蒸馏(Knowledge Distillation)详细深入透彻理解重点
  • openpyxl.utils.exceptions.IllegalCharacterError错误
  • RuntimeError: Expected object of device type cuda but got device type cpu for argument pytorch数据位置
  • 熵,交叉熵,散度理解较为清晰
  • 交叉熵理解深度学习互信息
  • 各种正交以及正交和
  • 动态规划 搜索
  • 支持度置信度关联
  • Apriori算法通俗详解_fpgrowth_关联
  • 正向最大匹配 和逆向最大匹配对比比较
  • 数学符号1
  • RuntimeError: Expected object of backend CUDA but got backend CPU for argument
  • 通俗解释指数加权平均
  • CUDA error: device-side assert triggered Assertion t 」= 0 t n classes failed
  • Python多线程调试
  • 多线程调试
  • 模型不收敛
  • python读取word
  • TensorRT简介
  • 对列表去重并保持原来的顺序
  • torch.backends.cudnn.deterministic 使用cuda保证每次结果一样
  • torch.nn.functional.cross_entropy.ignore_index
  • GPT-3 Finetune

Brat序列标注工具小结相关推荐

  1. Brat中文标注工具的使用

    安装比较简单,参考网上(本人装的ubuntu虚拟机,没有安装apache) root@ubuntu:/home/brat-v1.3_Crunchy_Frog# python standalone.py ...

  2. 腾讯云Ubuntu18.04.4上安装brat文本标注工具(2020年9月)

    参考博文: https://zhuanlan.zhihu.com/p/65101293 https://zhuanlan.zhihu.com/p/92334491 https://www.cnblog ...

  3. ubuntu下文本标注工具BRAT全程离线安装

    1 Apache离线安装 1.1 软件下载 1.1.1 httpd文件 从http://httpd.apache.org/download.cgi下载httpd文件 1.1.2 apr文件 可到官网h ...

  4. brat标注工具知识总结

    目录 医疗实体识别.关系抽取标注工具 标注思路 BRAT 参考文档 Brat docker image 其他 error 医疗实体识别.关系抽取标注工具 哈工大开源标注工具 这个项目中不仅提供了用于命 ...

  5. NLP标注工具Brat

    https://www.cnblogs.com/xiaoqi/p/brat-config.html [文本标注]文本标注工具brat的使用 2019常用NLP标注工具简单介绍 NLP标注工具: YED ...

  6. 实体标注工具 BRAT(brat rapid annotation tool)

    最近在看命名实体识别这一块,因为要涉及到数据标注,所以我了解了一款实体标注工具BRAT. BRAT(brat rapid annotation tool) 它是一款功能较全面的文本标注工具,可以标注实 ...

  7. 【文本标注】文本标注工具brat的使用

    brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息: (1)实体:命名实体,可用于NER: (2)关系:实体间关系,可用于关系抽取: (3)事件:实体参与的事 ...

  8. Ubuntu16.04安装文本标注工具brat

    brat 的下载地址http://brat.nlplab.org/ Ubuntu16.04安装CGI环境 安装Apache2 sudo apt install apache2 配置CGI 1)打开文件 ...

  9. 标注工具Brat安装(本地)

    由于研究方向需要对文本进行标注,对象为大量期刊文献,手动标注肯定不太现实,于是找到了Brat标注工具,虽然这玩意儿好像挺久没更新了,只支持Python2,但是只用来标注还是没问题吧. 事先声明:Bra ...

最新文章

  1. Jquery 之Ajax方法$.get() 的运用,扩展链接模型的天地
  2. Mysql之count(*),count(1),count(field)区别、性能差异
  3. 关于Nowpaper
  4. 转 fiddler教程
  5. pythonasyncio在哪个版本好_什么情况下需要使用 Python 的 asyncio 模块?
  6. CSDN写博客提交后的网络交互
  7. Hitv8 文件批量重命名工具
  8. Redis精进:List的使用和应用场景
  9. C#.Net工作笔记016---C#中使用反射对两个对象copy复制内容
  10. php用什么打开_php文件怎么打开,用什么软件打开php文件
  11. 库卡profinet通讯中文说明书
  12. 25款操作系统全面接触 [8]
  13. 通过机器学习预测电网平均总负荷
  14. 【USB笔记】USB 2.0 帧开始包Start-of-Frame Packets
  15. 云计算 - 虚拟化技术Overview
  16. 如何在VS2019编辑器的第一行默认添加:#define _CRT_SECURE_NO_WARNINGS 1
  17. python 点击屏幕
  18. 盘点:2019年好用的设备管理系统软件,你都用过吗?
  19. jquery给一个li标签添加和去掉class属性
  20. arm linux使用 usbmon 抓取usb总线数据包

热门文章

  1. Django学习之路(一)--初识django
  2. leetcode:2680 Remove Duplicates from Sorted Array 删除数组中的重复元素
  3. LeetCode简单题之验证外星语词典
  4. deeplearning算法优化原理
  5. 参数服务器训练基本理论
  6. MindSpore基准性能
  7. Linux服务器上监控网络带宽的18个常用命令
  8. 微信 request 合法域名校验出错
  9. [JavaScript] Math里的api
  10. Python:数据导入、爬虫:csv,excel,sql,html,txt