文本标注开源系统Doccano、Label Studio、BRAT比较
竞品分析:
Label Studio 多模态数据标注首选,当然也可以做文本标注,但是角色权限管理没有doccano完善。
BRAT 老牌文本标注工具,擅长关系标注,构建知识图谱数据集比较有优势。界面比较粗超。
Doccano:提供了文本分类,序列标注和序列到序列的标注功能,可以为情绪分析,命名实体识别,文本摘要等创建标记数据。
Doccano标注平台UI风格不错。
主要特点:
- 数据导入导出
- 标签添加
- 角色权限管理
- 能否实现单账户同时标注,同一条数据多人标注(背靠背方式也是常用的一种标注方式,用于提高标注质量)
导入与导出
支持多文件上传,导入文件格式可以是文本, json, CoNLL(常用于NER),导出文件为json。唯一不足时多文件,不能自动区分。不过可以通过json格式增加额外的字段来实现这一功能。
标签添加
支持自定义标签颜色,标签对应的值,堪称傻瓜式配置。
角色权限管理
用户角色分为标注人员,审核人员和超级管理员。
增加用户可以在 http://127.0.01:8000/admin/ 中添加,或者命令行 doccano createuser --username user --password pass
额外功能
单一账户实测可以同时标注,多账户可以在项目中设置是否共享标注结果。
除此之外,标注平台还包含一些统计功能和辅助功能。
标注平台使用注意事项:
- 如果有预标注标签,下标是不计算空格的,否则标签很容易跑偏。
- 尽量保证导入数据无BOM utf-8格式。
- Label的key范围只有0~9 a~z,如果生成文件超过这个范围,会无法导入哟。
参考:https://blog.csdn.net/liuxing93619/article/details/120792216
文本标注开源系统Doccano、Label Studio、BRAT比较相关推荐
- A.2【数据标注】:基于Label studio的训练数据标注指南:信息抽取(实体关系抽取)、文本分类等
NLP专栏简介:数据增强.智能标注.意图识别算法|多分类算法.文本信息抽取.多模态信息抽取.可解释性分析.性能调优.模型压缩算法等 专栏详细介绍:NLP专栏简介:数据增强.智能标注.意图识别算法|多分 ...
- 【文本标注】文本标注工具brat的使用
brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息: (1)实体:命名实体,可用于NER: (2)关系:实体间关系,可用于关系抽取: (3)事件:实体参与的事 ...
- 百度地图添加自定义点标记、文本标注、点标记
网页效果:添加文字标签 工作中遇到百度地图做相关的需求,在此做记录分享 <!DOCTYPE html> <html lang="zh-CN"> <he ...
- 百度地图添加文本标注+信息窗口
效果图: 网页效果:添加文字标签 需求: 页面展示marker marker旁边有标注 点击marker时有弹窗提示具体信息 鼠标移除时关闭弹窗提示 <!DOCTYPE html> < ...
- 试用开源标注平台 Label Studio
数据标注是人工智能背后的女人.-- 我说的 初探 在 reddit 上看到一个人提了一个问题:What is your favourite (free) labelling tool?,你最喜欢的(免 ...
- 构想:中文文本标注工具(内附多个开源文本标注工具)
■ 项目地址 | https://github.com/crownpku/Chinese-Annotator 自然语言处理的大部分任务是监督学习问题.序列标注问题如中文分词.命名实体识别,分类问题如关 ...
- 文本标注工具BRAT的安装与配置
文本标注工具BRAT的安装与配置 因此博客是安装完成之后回顾下写的,所以没有配图说明,仅记录下安装步骤及出现的一些问题,具体安装路线如下: 1.win10下VirtualBox与Ubuntu的安装 B ...
- ubuntu下文本标注工具BRAT全程离线安装
1 Apache离线安装 1.1 软件下载 1.1.1 httpd文件 从http://httpd.apache.org/download.cgi下载httpd文件 1.1.2 apr文件 可到官网h ...
- 文本标注平台doccano的搭建
一.简介 doccano是一个开源的人工文本标注工具.它为文本分类,序列标记和序列到序列任务提供了文本标注功能.我们可以通过该工具标记数据以供情感分析.命名实体识别.文本摘要等任务使用.限免就来简单介 ...
最新文章
- js基础--获取浏览器当前页面的滚动条高度的兼容写法
- SQL SERVER中架构的理解
- ORA-07445 ERROR on auto execute of job 8913
- [Linux] 内核模块proc使用 实例:统计所有进程的信息
- tar ,cpio打包解压. shell脚本for,while,until循环. rpm包管理,select循环菜单,函数function,yum...
- 前台传JSON到后台
- css-font字体和文本样式
- 移除mac下 .Ds_Store的解决办法
- php基础-基本语法
- oracle32转64,Oracle10g下载地址--多平台下的32位和64位 (转)
- Zabbix篇四:钉钉机器人报警
- 【学习笔记】流畅的Python第二版【第一章】
- PostgreSql 批量修改数据库下所有表 owner
- 数据结构目录树(严蔚敏王道)版
- (前端发邮件)vue中使用smtp.js发送邮件
- 植物DNA甲基化专题 | nature:油棕Karma转座子表观遗传重要发现
- x64dbg入门学习
- 基于安卓的高校程序设计类课程考核平台的设计与实现
- 用python 画一个美国队长盾牌
- TeXstudio编译提示缺少.sty文件