标注工具_语料标注工具(3)
今天再详细介绍一下Prodigy工具和YEDDA工具。
Prodigy工具
支持实体标注,分类标注,情感标注,但是都是英文的。有一个基于Prodigy的中文github项目。Prodigy官方项目地址:https://prodi.gy/ 。由于其是收费的,所以没有必要再去深究了。这里给出它的文本分类标注界面和实体识别标注界面。
这里要强调一下,那个所谓的基于Prodigy思想的中文版根本就不能用,github也很久没更新了,完全就是花架子,issuses里的内容也基本是有问无答,如果有哪个大神把它调出来了,欢迎投稿,或者告诉我。deepwel/Chinese-Annotator,居然还有700个星,真是没有天理。
YEDDA
YEDDA可以进行chunk/entity/event三种标注任务。它使用tkinter开发,当前只支持在Python2.7下运行。对外提供两种用户界面,一种是标注员界面(终端执行python YEDDA.py),一种是管理员界面(终端执行python YEDDA_Admin.py)。标注员界面用于给句子做标注,管理员界面提供针对同一文件的不同人员标注结果的对比等功能。标注界面如下图所示
其中的按钮的大致功能为`Open`按钮用于打开待校对的文件。`ReMap`用于将用户设置的标注快捷键更新到当前配置文件。`NewMap`按钮用于将用户设置的标注快捷键保存到新的配置文件。`RMOn`是打开机器自动标注功能,`RMOff`是关闭机器自动标注功能。`Export`到处当前标注后的文本。`Quit`退出当前标注。字母`A`,`B`,`C`,`D`,`E`,`F`,`G`分别对应右侧所列功能的快捷键,比如Location地名的快捷键为`D`。`Cursor`表示当前光标在文本中的为止,`RMModel`指的是是否启动了机器自动标注。`Map Templates`快捷键配置文件名。
YEDDA的缺点有:
(1)可标记种类数只有7种
(2)没有情感类别或分类类别的标记功能
(3)一次性将文本内容全部展示出来不利于标注者标记
(4)没有分词功能也不能使用自己的分词器
(5)没有类别预测功能
(6)只能运行在Python2.7版本下。
可改进的点有:
(1)添加类别预测展示及标注功能
(2)添加标注进度展示区
(3)添加分词功能
(4)添加实体识别功能
(5)导出时,计算本次标注后系统预测的准确率
github地址:
jiesutd/YEDDAgithub.com
标注工具_语料标注工具(3)相关推荐
- 标注工具_语料标注工具(2)
继续总结语料标注工具 3. BRAT BRAT虽然也是实体.实体关系.事件抽取的标注工具,但是中文里有人利用它标注了情感语料. 项目地址: http://brat.nlplab.org/introdu ...
- 最好用的_古书制作工具_古籍排版工具_古文排版_自动生成古书_多种古书风格_古籍制作工具
古书制作工具_古籍排版工具使用方法 前言 最好用的古书制作工具, 最好用的古籍排版工具, 最好用的古籍制作工具, 最好用的古文排版, 自动生成古书, 多种古书风格 一.看下源图片见最后面 二.使用步骤 ...
- 最好用的_古书制作工具_古籍排版工具_古文排版_自动生成古书_多种古书风格_古籍制作工具_个性化书籍制作工具
古书制作工具_古籍排版工具使用方法 前言 最好用的古书制作工具, 最好用的古籍排版工具, 最好用的古籍制作工具, 最好用的古文排版, 自动古书排版, 自动书籍排版, 自动生成古书, 多种古书风格 可自 ...
- python 语料标注_语料标注工具(3)
今天再详细介绍一下Prodigy工具和YEDDA工具. Prodigy工具 支持实体标注,分类标注,情感标注,但是都是英文的.有一个基于Prodigy的中文github项目.Prodigy官方项目地址 ...
- seo自动工具_【SEO工具】搭建一个网站需要用到哪些SEO工具?
? 前言:SEO常用工具建站篇的内容来自最近建站的操作经验,之后还会推荐其他常用SEO工具也会分享自己写的工具,欢迎关注. " 内容大纲: 建站系统 首页关键词挖掘和布局 内容采集和发布 内 ...
- seo伪原创工具_伪原创工具哪个好用?
在日常优化工作过程中,一个站长是需要同时管理好几个网站的,所以导致没有时间或精力写出更多的原创内容,在这个时候就需要借助伪原创工具来实现内容更新的目的了,比较实用的伪原创工具主要有:石青.小发猫.魔术 ...
- 制定交叉编译工具_制作交叉编译工具链的方法总结(详细)
网上这类文章比较多,但是都不是很具体,刚好有门课结课论文要写这个,所以就总结了一下.以下的过程都是在ubuntu7.10上实际运行过的. 手工制作交叉编译工具 在制作工具开始前先要选好所需要的Binu ...
- 速卖通关键词挖掘工具_利用SEO工具挖掘同行竞争对手关键词数据快速布局网站词库...
工欲善其事必先利其器,这句话告诉我们,善用工具,往往会起到很好的效果.对于SEO来说,做排名有很多方面的工作,这其中网站内容是非常重要的部分.而网站内容是围绕关键词的布局而展开.所以一个网站的关键词布 ...
- 关键词挖掘工具_关键词拓展工具集合
优化网站的关键词,首先要建立关键词库,那么要拓展和挖掘海量的关键词,我们除了手动去搜索引擎里搜索,收集下拉框.相关搜索,还有没有更丰富的关键词挖掘工具呢?那么,今天网睿seo公司的就会给大家分享下目前 ...
最新文章
- python 判断线程状态_Python线程指南
- MySQL 关闭子表的外键约束检察
- linux shmget shmctl
- .NET Core前后端分离快速开发框架(Core.3.1+AntdVue)
- oracle导入视图报错,exp/imp 报错处理(EXP-00003 / IMP-00019 / IMP-00058)
- java post 图片上传_java 发送 post 请求上传图片
- WSPSRV.EXE错误导致ISA中断
- Linux centos hook,centos7 U盘安装卡在 starting dracut initqueue hook
- 经典排序算法(二)--桶排序Bucket Sort
- 万能打印之Delphi 2010实现(序言)
- 晶振 Crystal
- java实现随机抽取题目_随机抽取样本问题蓄水池算法按权重抽取问题
- 如何降低网站跳出率方法
- 身份证阅读器身份证读卡器Linux系统二次开发包(含Linux身份证相片解码库)
- 蓝桥 盾神与积木游戏(Java)
- HBuilder创建App并打包发布
- ********随便看看**********
- 第一次的博客 告诫自己及目标
- Messari年度报告-2022
- 2019年经开区第四届青少年信息学竞赛小学组试题
热门文章
- 计算机网络-TCP协议
- 【C 语言】指针间接赋值 ( 直接修改 和 间接修改 指针变量 的值 | 在函数中 间接修改 指针变量 的值 | 在函数中 间接修改 外部变量 的原理 )
- 【Windows 逆向】内存地址分析 ( 内存条 | 虚拟内存 | 内存地址及寻址范围 | 内存地址与数据的关系 )
- 【Android 逆向】Android 进程注入工具开发 ( 注入代码分析 | 注入工具收尾操作 | 关闭注入的动态库 | 恢复寄存器 | 脱离远程调试附着 )
- 【Android 逆向】ELF 文件格式 ( ELF 文件头 | ELF 文件头标志 | ELF 文件位数 | ELF 文件大小端格式 )
- 【Android 安装包优化】使用 lib7zr.so 动态库处理压缩文件 ( jni 中 main 函数声明 | 命令行处理 | jni 调用 lib7zr.so 函数库处理压缩文件完整代码 )
- 【Kotlin】扩展接收者 与 分发接收者 ( 类内部扩展用法 | 注意事项 | open 修饰扩展 )
- 【Android 应用开发】Android资源文件 - 使用资源存储字符串 颜色 尺寸 整型 布尔值 数组
- DonkeyID---php扩展-64位自增ID生成器
- 机器学习公开课笔记(1):机器学习简介及一元线性回归