今天再详细介绍一下Prodigy工具和YEDDA工具。

Prodigy工具

支持实体标注,分类标注,情感标注,但是都是英文的。有一个基于Prodigy的中文github项目。Prodigy官方项目地址:https://prodi.gy/ 。由于其是收费的,所以没有必要再去深究了。这里给出它的文本分类标注界面和实体识别标注界面。

这里要强调一下,那个所谓的基于Prodigy思想的中文版根本就不能用,github也很久没更新了,完全就是花架子,issuses里的内容也基本是有问无答,如果有哪个大神把它调出来了,欢迎投稿,或者告诉我。deepwel/Chinese-Annotator,居然还有700个星,真是没有天理。

YEDDA

YEDDA可以进行chunk/entity/event三种标注任务。它使用tkinter开发,当前只支持在Python2.7下运行。对外提供两种用户界面,一种是标注员界面(终端执行python YEDDA.py),一种是管理员界面(终端执行python YEDDA_Admin.py)。标注员界面用于给句子做标注,管理员界面提供针对同一文件的不同人员标注结果的对比等功能。标注界面如下图所示

其中的按钮的大致功能为`Open`按钮用于打开待校对的文件。`ReMap`用于将用户设置的标注快捷键更新到当前配置文件。`NewMap`按钮用于将用户设置的标注快捷键保存到新的配置文件。`RMOn`是打开机器自动标注功能,`RMOff`是关闭机器自动标注功能。`Export`到处当前标注后的文本。`Quit`退出当前标注。字母`A`,`B`,`C`,`D`,`E`,`F`,`G`分别对应右侧所列功能的快捷键,比如Location地名的快捷键为`D`。`Cursor`表示当前光标在文本中的为止,`RMModel`指的是是否启动了机器自动标注。`Map Templates`快捷键配置文件名。

YEDDA的缺点有:

(1)可标记种类数只有7种

(2)没有情感类别或分类类别的标记功能

(3)一次性将文本内容全部展示出来不利于标注者标记

(4)没有分词功能也不能使用自己的分词器

(5)没有类别预测功能

(6)只能运行在Python2.7版本下。

可改进的点有:

(1)添加类别预测展示及标注功能

(2)添加标注进度展示区

(3)添加分词功能

(4)添加实体识别功能

(5)导出时,计算本次标注后系统预测的准确率

github地址:

jiesutd/YEDDA​github.com

标注工具_语料标注工具(3)相关推荐

  1. 标注工具_语料标注工具(2)

    继续总结语料标注工具 3. BRAT BRAT虽然也是实体.实体关系.事件抽取的标注工具,但是中文里有人利用它标注了情感语料. 项目地址: http://brat.nlplab.org/introdu ...

  2. 最好用的_古书制作工具_古籍排版工具_古文排版_自动生成古书_多种古书风格_古籍制作工具

    古书制作工具_古籍排版工具使用方法 前言 最好用的古书制作工具, 最好用的古籍排版工具, 最好用的古籍制作工具, 最好用的古文排版, 自动生成古书, 多种古书风格 一.看下源图片见最后面 二.使用步骤 ...

  3. 最好用的_古书制作工具_古籍排版工具_古文排版_自动生成古书_多种古书风格_古籍制作工具_个性化书籍制作工具

    古书制作工具_古籍排版工具使用方法 前言 最好用的古书制作工具, 最好用的古籍排版工具, 最好用的古籍制作工具, 最好用的古文排版, 自动古书排版, 自动书籍排版, 自动生成古书, 多种古书风格 可自 ...

  4. python 语料标注_语料标注工具(3)

    今天再详细介绍一下Prodigy工具和YEDDA工具. Prodigy工具 支持实体标注,分类标注,情感标注,但是都是英文的.有一个基于Prodigy的中文github项目.Prodigy官方项目地址 ...

  5. seo自动工具_【SEO工具】搭建一个网站需要用到哪些SEO工具?

    ? 前言:SEO常用工具建站篇的内容来自最近建站的操作经验,之后还会推荐其他常用SEO工具也会分享自己写的工具,欢迎关注. " 内容大纲: 建站系统 首页关键词挖掘和布局 内容采集和发布 内 ...

  6. seo伪原创工具_伪原创工具哪个好用?

    在日常优化工作过程中,一个站长是需要同时管理好几个网站的,所以导致没有时间或精力写出更多的原创内容,在这个时候就需要借助伪原创工具来实现内容更新的目的了,比较实用的伪原创工具主要有:石青.小发猫.魔术 ...

  7. 制定交叉编译工具_制作交叉编译工具链的方法总结(详细)

    网上这类文章比较多,但是都不是很具体,刚好有门课结课论文要写这个,所以就总结了一下.以下的过程都是在ubuntu7.10上实际运行过的. 手工制作交叉编译工具 在制作工具开始前先要选好所需要的Binu ...

  8. 速卖通关键词挖掘工具_利用SEO工具挖掘同行竞争对手关键词数据快速布局网站词库...

    工欲善其事必先利其器,这句话告诉我们,善用工具,往往会起到很好的效果.对于SEO来说,做排名有很多方面的工作,这其中网站内容是非常重要的部分.而网站内容是围绕关键词的布局而展开.所以一个网站的关键词布 ...

  9. 关键词挖掘工具_关键词拓展工具集合

    优化网站的关键词,首先要建立关键词库,那么要拓展和挖掘海量的关键词,我们除了手动去搜索引擎里搜索,收集下拉框.相关搜索,还有没有更丰富的关键词挖掘工具呢?那么,今天网睿seo公司的就会给大家分享下目前 ...

最新文章

  1. python 判断线程状态_Python线程指南
  2. MySQL 关闭子表的外键约束检察
  3. linux shmget shmctl
  4. .NET Core前后端分离快速开发框架(Core.3.1+AntdVue)
  5. oracle导入视图报错,exp/imp 报错处理(EXP-00003 / IMP-00019 / IMP-00058)
  6. java post 图片上传_java 发送 post 请求上传图片
  7. WSPSRV.EXE错误导致ISA中断
  8. Linux centos hook,centos7 U盘安装卡在 starting dracut initqueue hook
  9. 经典排序算法(二)--桶排序Bucket Sort
  10. 万能打印之Delphi 2010实现(序言)
  11. 晶振 Crystal
  12. java实现随机抽取题目_随机抽取样本问题蓄水池算法按权重抽取问题
  13. 如何降低网站跳出率方法
  14. 身份证阅读器身份证读卡器Linux系统二次开发包(含Linux身份证相片解码库)
  15. 蓝桥 盾神与积木游戏(Java)
  16. HBuilder创建App并打包发布
  17. ********随便看看**********
  18. 第一次的博客 告诫自己及目标
  19. Messari年度报告-2022
  20. 2019年经开区第四届青少年信息学竞赛小学组试题

热门文章

  1. 计算机网络-TCP协议
  2. 【C 语言】指针间接赋值 ( 直接修改 和 间接修改 指针变量 的值 | 在函数中 间接修改 指针变量 的值 | 在函数中 间接修改 外部变量 的原理 )
  3. 【Windows 逆向】内存地址分析 ( 内存条 | 虚拟内存 | 内存地址及寻址范围 | 内存地址与数据的关系 )
  4. 【Android 逆向】Android 进程注入工具开发 ( 注入代码分析 | 注入工具收尾操作 | 关闭注入的动态库 | 恢复寄存器 | 脱离远程调试附着 )
  5. 【Android 逆向】ELF 文件格式 ( ELF 文件头 | ELF 文件头标志 | ELF 文件位数 | ELF 文件大小端格式 )
  6. 【Android 安装包优化】使用 lib7zr.so 动态库处理压缩文件 ( jni 中 main 函数声明 | 命令行处理 | jni 调用 lib7zr.so 函数库处理压缩文件完整代码 )
  7. 【Kotlin】扩展接收者 与 分发接收者 ( 类内部扩展用法 | 注意事项 | open 修饰扩展 )
  8. 【Android 应用开发】Android资源文件 - 使用资源存储字符串 颜色 尺寸 整型 布尔值 数组
  9. DonkeyID---php扩展-64位自增ID生成器
  10. 机器学习公开课笔记(1):机器学习简介及一元线性回归