实体-关系信息抽取上线使用F1值87.1% (附数据集)
向AI转型的程序员都关注了这个号????????????
机器学习AI算法工程 公众号:datayx
基于 TensorFlow 的实体及关系抽取,2019语言与智能技术竞赛信息抽取(实体与关系抽取)任务解决方案。
给定schema约束集合及句子sent,其中schema定义了关系P以及其对应的主体S和客体O的类别,例如(S_TYPE:人物,P:妻子,O_TYPE:人物)、(S_TYPE:公司,P:创始人,O_TYPE:人物)等。任务要求参评系统自动地对句子进行分析,输出句子中所有满足schema约束的SPO三元组知识Triples=[(S1, P1, O1), (S2, P2, O2)…]。输入/输出: (1) 输入:schema约束集合及句子sent (2) 输出:句子sent中包含的符合给定schema约束的三元组知识Triples
例子 输入句子: "text": "《古世》是连载于云中书城的网络小说,作者是未弱"
输出三元组: "spo_list": [{"predicate": "作者", "object_type": "人物", "subject_type": "图书作品", "object": "未弱", "subject": "古世"}, {"predicate": "连载网站", "object_type": "网站", "subject_type": "网络小说", "object": "云中书城", "subject": "古世"}]}
数据简介
本次竞赛使用的SKE数据集是业界规模最大的基于schema的中文信息抽取数据集,其包含超过43万三元组数据、21万中文句子及50个已定义好的schema,表1中展示了SKE数据集中包含的50个schema及对应的例子。数据集中的句子来自百度百科和百度信息流文本。数据集划分为17万训练集,2万验证集和2万测试集。其中训练集和验证集用于训练,可供自由下载。
项目代码和数据集 获取:
关注微信公众号 datayx 然后回复 文本标注 即可获取。
AI项目体验地址 https://loveai.tech
“信息抽取”任务冠军队伍报告
阅读过本文的人还看了以下文章:
TensorFlow 2.0深度学习案例实战
基于40万表格数据集TableBank,用MaskRCNN做表格检测
《基于深度学习的自然语言处理》中/英PDF
Deep Learning 中文版初版-周志华团队
【全套视频课】最全的目标检测算法系列讲解,通俗易懂!
《美团机器学习实践》_美团算法团队.pdf
《深度学习入门:基于Python的理论与实现》高清中文PDF+源码
特征提取与图像处理(第二版).pdf
python就业班学习视频,从入门到实战项目
2019最新《PyTorch自然语言处理》英、中文版PDF+源码
《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码
《深度学习之pytorch》pdf+附书源码
PyTorch深度学习快速实战入门《pytorch-handbook》
【下载】豆瓣评分8.1,《机器学习实战:基于Scikit-Learn和TensorFlow》
《Python数据分析与挖掘实战》PDF+完整源码
汽车行业完整知识图谱项目实战视频(全23课)
李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材
笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!
《神经网络与深度学习》最新2018版中英PDF+源码
将机器学习模型部署为REST API
FashionAI服装属性标签图像识别Top1-5方案分享
重要开源!CNN-RNN-CTC 实现手写汉字识别
yolo3 检测出图像中的不规则汉字
同样是机器学习算法工程师,你的面试为什么过不了?
前海征信大数据算法:风险概率预测
【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类
VGG16迁移学习,实现医学图像识别分类工程项目
特征工程(一)
特征工程(二) :文本数据的展开、过滤和分块
特征工程(三):特征缩放,从词袋到 TF-IDF
特征工程(四): 类别特征
特征工程(五): PCA 降维
特征工程(六): 非线性特征提取和模型堆叠
特征工程(七):图像特征提取和深度学习
如何利用全新的决策树集成级联结构gcForest做特征工程并打分?
Machine Learning Yearning 中文翻译稿
蚂蚁金服2018秋招-算法工程师(共四面)通过
全球AI挑战-场景分类的比赛源码(多模型融合)
斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)
python+flask搭建CNN在线识别手写中文网站
中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程
不断更新资源
深度学习、机器学习、数据分析、python
搜索公众号添加: datayx
机大数据技术与机器学习工程
搜索公众号添加: datanlp
长按图片,识别二维码
实体-关系信息抽取上线使用F1值87.1% (附数据集)相关推荐
- ####好好好######信息抽取——实体关系联合抽取
信息抽取--实体关系联合抽取 目录 简介 实体关系联合抽取 Model 1: End-to-End Relation Extraction using LSTMs on Sequences and T ...
- 知识图谱专栏简介:数据增强,智能标注,文本信息抽取(实体关系事件抽取)、知识融合算法方案、知识推理、模型优化、模型压缩技术等
知识图谱专栏简介:数据增强,智能标注,文本信息抽取(实体关系事件抽取).知识融合算法方案.知识推理.模型优化.模型压缩技术等 专栏链接:NLP知识图谱相关技术业务落地方案和码源 NLP知识图谱相关技术 ...
- 论文阅读课3-GraphRel: Modeling Text as Relational Graphs for(实体关系联合抽取,重叠关系,关系之间的关系,自动提取特征)
文章目录 abstract 1.Introduction 2.相关工作 3.回顾GCN 4.方法 4.1第一阶段 4.1.1 Bi-LSTM 4.1.2 Bi_GCN 4.1.3 实体关系抽取 4.2 ...
- 论文学习10-Joint entity recognition and relation extraction as a multi-head selection problem(实体关系联合抽取模型
文章目录 abstract 1.introduction 2. 相关工作 2.1 命名实体识别 2.2 关系抽取 2.3 实体关系联合抽取模型 3.联合模型 3.1 Embedding层 3.2 bi ...
- 基于关系图的实体关系联合抽取
点击上方,选择星标或置顶,每天给你送干货! 阅读大概需要10分钟 跟随小博主,每天进步一丢丢 作者:Chevalier 原文链接:https://zhuanlan.zhihu.com/p/757458 ...
- GPLinker:基于GlobalPointer的实体关系联合抽取
©PaperWeekly 原创 · 作者 | 苏剑林 单位 | 追一科技 研究方向 | NLP.神经网络 两年前,在百度的"2019 语言与智能技术竞赛"(下称 LIC2019)中 ...
- 文献阅读6-Entity-Relation Extraction as Multi-turn Question Answering(实体关系联合抽取,层次标签依赖关系,multi-turn QA)
文章目录 abstract 1.Introduction 3.相关工作 2.2MRC(机器阅读理解) 2.3 非QA->QA 3.数据集和任务 3.1别人的数据集 3.2我们建立的数据集RESU ...
- 论文学习11-Adversarial training for multi-context joint entity and relation extraction(实体关系买抽取模型,对抗学习
文章目录 1. introduction 2.相关工作 3.Model 3.1 Joint learning as head selection 3.2 AT 4.实验设置 5.结果 6.总结 实体关 ...
- 实体-关系联合抽取:Incremental Joint Extraction of Entity Mentions and Relations
论文地址:https://www.aclweb.org/anthology/P14-1038.pdf 文章标题:Incremental Joint Extraction of Entity Menti ...
最新文章
- Google Test(GTest)使用方法和源码解析——Listener技术分析和应用
- MySQL高级 - 锁 - MyISAM表锁 - 读锁
- CentOS7的yum安装mysql
- layui table reload post请求_如何实现在Layui框架中完成父窗口刷新(更新)
- 6.第一个程序Hello World
- UI资源模板| 针对iOS系统设计的购物APP移动应用UI设计套件
- Python+numpy实现函数向量化
- logo下方显示技术支持信息_LOGO墙形象设计的几种方案
- OpenCV_(Fit Line with points)用直线拟合一组点
- Java To CSharp源代码转换
- USBCAN、CAN分析仪、CANCANFD综合测试分析软件LKMaster主要功能一览
- 2021年中国果汁产量、需求量及主要类型贸易情况分析[图]
- postgres数据库表空间收缩之pg_squeeze,pg_repack
- 苹果审核状态为Metadata Rejected下的问题
- 视频捕捉全教程(vc+vfw)
- Todesk远程连接时一直显示密码错误
- poi对word读取(文本和图片)、修改、保存操作及word转换为PDF
- 项目一15 服务器端VisualSVN安装配置 客户端TortoriesSVN安装与使用SVN
- 地址栏中的#能不能去掉?
- 《鲁滨逊漂流记》的读后感作文札记2600字
热门文章
- 存货控制中的ABC分类释义
- iOS开发--xcode快捷键
- 从0开始搭建基于Zookeeper的Spark集群
- career english
- Matlab APP designer 里的grid on 和hold on
- OpenCV-美食—鲜美滤镜
- git 历史操作日志_git的历史记录
- oracle 返回hashmap,解决:oracle+myBatis ResultMap 类型为 map 时返回结果中存在 timestamp 时使用 jackson 转 json 报错...
- lambda python aws_AWS Lambda Layer For Python Pakage
- 分数的计算机应用教案,计算机应用实训实验