竞品分析:

Label Studio 多模态数据标注首选,当然也可以做文本标注,但是角色权限管理没有doccano完善。

BRAT 老牌文本标注工具,擅长关系标注,构建知识图谱数据集比较有优势。界面比较粗超。

Doccano:提供了文本分类,序列标注和序列到序列的标注功能,可以为情绪分析,命名实体识别,文本摘要等创建标记数据。

Doccano标注平台UI风格不错。

主要特点:

  1. 数据导入导出
  2. 标签添加
  3. 角色权限管理
  4. 能否实现单账户同时标注,同一条数据多人标注(背靠背方式也是常用的一种标注方式,用于提高标注质量)

导入与导出
支持多文件上传,导入文件格式可以是文本, json, CoNLL(常用于NER),导出文件为json。唯一不足时多文件,不能自动区分。不过可以通过json格式增加额外的字段来实现这一功能。

标签添加
支持自定义标签颜色,标签对应的值,堪称傻瓜式配置。

角色权限管理
用户角色分为标注人员,审核人员和超级管理员。

增加用户可以在 http://127.0.01:8000/admin/ 中添加,或者命令行 doccano createuser --username user --password pass

额外功能
单一账户实测可以同时标注,多账户可以在项目中设置是否共享标注结果。

除此之外,标注平台还包含一些统计功能和辅助功能。

标注平台使用注意事项:

  1. 如果有预标注标签,下标是不计算空格的,否则标签很容易跑偏。
  2. 尽量保证导入数据无BOM utf-8格式。
  3. Label的key范围只有0~9 a~z,如果生成文件超过这个范围,会无法导入哟。

参考:https://blog.csdn.net/liuxing93619/article/details/120792216

文本标注开源系统Doccano、Label Studio、BRAT比较相关推荐

  1. A.2【数据标注】:基于Label studio的训练数据标注指南:信息抽取(实体关系抽取)、文本分类等

    NLP专栏简介:数据增强.智能标注.意图识别算法|多分类算法.文本信息抽取.多模态信息抽取.可解释性分析.性能调优.模型压缩算法等 专栏详细介绍:NLP专栏简介:数据增强.智能标注.意图识别算法|多分 ...

  2. 【文本标注】文本标注工具brat的使用

    brat是linux下的一款应用于webserver端的文本标注工具,可用于标注如下类型信息: (1)实体:命名实体,可用于NER: (2)关系:实体间关系,可用于关系抽取: (3)事件:实体参与的事 ...

  3. 百度地图添加自定义点标记、文本标注、点标记

    网页效果:添加文字标签 工作中遇到百度地图做相关的需求,在此做记录分享 <!DOCTYPE html> <html lang="zh-CN"> <he ...

  4. 百度地图添加文本标注+信息窗口

    效果图: 网页效果:添加文字标签 需求: 页面展示marker marker旁边有标注 点击marker时有弹窗提示具体信息 鼠标移除时关闭弹窗提示 <!DOCTYPE html> < ...

  5. 试用开源标注平台 Label Studio

    数据标注是人工智能背后的女人.-- 我说的 初探 在 reddit 上看到一个人提了一个问题:What is your favourite (free) labelling tool?,你最喜欢的(免 ...

  6. 构想:中文文本标注工具(内附多个开源文本标注工具)

    ■ 项目地址 | https://github.com/crownpku/Chinese-Annotator 自然语言处理的大部分任务是监督学习问题.序列标注问题如中文分词.命名实体识别,分类问题如关 ...

  7. 文本标注工具BRAT的安装与配置

    文本标注工具BRAT的安装与配置 因此博客是安装完成之后回顾下写的,所以没有配图说明,仅记录下安装步骤及出现的一些问题,具体安装路线如下: 1.win10下VirtualBox与Ubuntu的安装 B ...

  8. ubuntu下文本标注工具BRAT全程离线安装

    1 Apache离线安装 1.1 软件下载 1.1.1 httpd文件 从http://httpd.apache.org/download.cgi下载httpd文件 1.1.2 apr文件 可到官网h ...

  9. 文本标注平台doccano的搭建

    一.简介 doccano是一个开源的人工文本标注工具.它为文本分类,序列标记和序列到序列任务提供了文本标注功能.我们可以通过该工具标记数据以供情感分析.命名实体识别.文本摘要等任务使用.限免就来简单介 ...

最新文章

  1. js基础--获取浏览器当前页面的滚动条高度的兼容写法
  2. SQL SERVER中架构的理解
  3. ORA-07445 ERROR on auto execute of job 8913
  4. [Linux] 内核模块proc使用 实例:统计所有进程的信息
  5. tar ,cpio打包解压. shell脚本for,while,until循环. rpm包管理,select循环菜单,函数function,yum...
  6. 前台传JSON到后台
  7. css-font字体和文本样式
  8. 移除mac下 .Ds_Store的解决办法
  9. php基础-基本语法
  10. oracle32转64,Oracle10g下载地址--多平台下的32位和64位 (转)
  11. Zabbix篇四:钉钉机器人报警
  12. 【学习笔记】流畅的Python第二版【第一章】
  13. PostgreSql 批量修改数据库下所有表 owner
  14. 数据结构目录树(严蔚敏王道)版
  15. (前端发邮件)vue中使用smtp.js发送邮件
  16. 植物DNA甲基化专题 | nature:油棕Karma转座子表观遗传重要发现
  17. x64dbg入门学习
  18. 基于安卓的高校程序设计类课程考核平台的设计与实现
  19. 用python 画一个美国队长盾牌
  20. TeXstudio编译提示缺少.sty文件

热门文章

  1. 2021年南京大学软件工程专硕考研初试410分(数学满分)总成绩第二上岸经验贴
  2. eclipse黄色波浪线去除
  3. 微处理器基本功能及主要性能指标
  4. Java基础知识(七) 输入输出流
  5. 关于企业邮箱域名备案方法
  6. 100天精通Andriod逆向——第2天:Android基础知识和jadx的使用
  7. 「DLP-KDD 2021征文」及上届论文全集,包含深度学习推荐/广告系统、多目标、模型服务等
  8. Eclipse Plungins--Pydev
  9. 关于结构体,枚举,联合的一些知识
  10. 数据分析中的漏斗模型