关注上方深度学习技术前沿”,选择“星标公众号”

资源干货,第一时间送达!

本资源整理了342个中文、英文等NLP相关的公开数据集,涉及文本分类、实体识别&词性标注、搜索匹配、推荐系统、指代消歧、百科数据、预训练词向量or模型等。

源数据集网址:https://datasets.quantumstat.com/

为了防止上述网页加载不了,可以在后台回复:NLP_开源数据集,直接获取链接pdf资源

源数据集列表

重磅!自然语言处理技术交流群已成立!

欢迎各位NLPer加入自然语言处理技术交流群,目前群内已有百余人!本群旨在交流文本分类、语音识别、阅读理解、机器翻译、情感分析、信息检索、问答系统自然语言处理领域内容。自然语言处理领域前沿信息将会第一时间在群里发布!欢迎大家进群一起交流学习!

麻烦大家进群后请备注:研究方向+地点+学校/公司+昵称(如文本分类+杭州+浙大+小民)

广告商、博主请绕道!

???? 长按识别,即可入群!

最详细的NLP开源数据集分享--包含342个公开数据集相关推荐

  1. 知识图谱(KG)存储、可视化、公开数据集、图计算、图编程工具分享

    知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘.分析.构建.绘制 ...

  2. 【各个领域公开数据集查找和下载】【定期更新】

    各个领域公开数据集查找和下载 写在前面的话 网站 博客 领域 金融 交通 商业 推荐系统 医疗健康 图像数据 综合图像 场景图像 Web标签图像 人形轮廓图像 视觉文字识别图像 特定一类事物图像 材质 ...

  3. 基于Python的世界各个国家的幸福度的公开数据集的数据挖掘

    目录 一. 问题背景 1 二. 准备工作 2 三. 具体实施 2 1.数据存储及基本加载 2 数据整理到数组之中 2 2.数据清洗 2 ① 多余列清除 2 ② 列属性归一 3 ③ 空值处理 4 3.数 ...

  4. 成熟的AI应该自己写代码,IBM发布5亿行代码数据集,包含55种语言|开源

    转载自:量子位 在ImageNet频频出现在计算机视觉研究的今天,IBM也为智能编码(AI for Code)带来了它的专属数据集--CodeNet. 1400万个编程项目,5亿行代码,超过55种的不 ...

  5. 机器学习和数据科学的最佳公共数据集机器学习、数据科学、情感分析、计算机视觉、自然语言处理 (NLP)、临床数据等的最佳公共数据集。

    数据集查找器 Google 数据集搜索   Google 数据集搜索Google 数据集搜索:与Google Scholar的工作方式类似,数据集搜索可让您在托管数据集的任何地方查找数据集,无论是出版 ...

  6. 最新中文NLP开源工具箱来了!支持6大任务,面向工业应用 | 资源

    铜灵 发自 凹非寺 量子位 出品 | 公众号 QbitAI 对于开发者来说,又有一个新的NLP工具箱可以使用了,代号PaddleNLP,目前已开源. 在这个基于百度深度学习平台飞桨(PaddlePad ...

  7. 上百个Android开源项目分享

    转载地址:[http://blog.csdn.net/bboyfeiyu/article/details/12234163] 上百个Android开源项目分享,希望对android开发有帮助. And ...

  8. 数据集收集-包含《COVID-19》,《英国在线零售业务》,《电商行业用户行为分析数据集》,《电商婴儿用户》,《亚马逊手机》等17个数据集,用于数据分析挖掘,kaggle比赛练习

    COVID-19数据集 本数据集记录了2019年12月01日至2020年7月24日,每日精确到国家.省.市的确诊.疑似.治愈.死亡人数.2020年02月07后数据从今日头条接口采集,每小时57分自动更 ...

  9. 【开源】23个优秀的机器学习数据集

    点击上方"小白学视觉",选择加"星标"或"置顶" 重磅干货,第一时间送达 作者 | Nikola M. Zivkovic 译者 | 王强 策 ...

最新文章

  1. 关于Android 隐藏 API 和内部 API的查看与使用
  2. 【工具类】加密工具---MD5使用
  3. 2020-11-23(Windows系统的dll注入 )
  4. Python与R的区别和联系
  5. mysql免安装数据库用法_MySQL数据库之mysql免安装制作使用说明
  6. 《机器学习实战》-线性回归
  7. response.getWriter()和jsp中out对象的区别
  8. 机器学习用于金融市场预测难在哪?
  9. ansible免密登录和账号登录方式
  10. Java多线程及并发
  11. [译]GLUT教程 - 整合代码3
  12. ubuntu配置spyder和jupyter notebook的工作目录
  13. python剑指offer替换空格_《剑指Offer》字符串 替换空格
  14. C#通过Kernel32.dll动态调用C++生成dll相关接口(结构体转换)相关问题整理
  15. 数值变量值相等性的判断
  16. 本次安装visual studio所用的安装程序不完整_阁楼影院安装案例
  17. 关于android中的ramdisk.img及uImage无法包含驱动模块(*.ko)的问题
  18. jspstudy启动mysql失败_解决Mysql5.7.17在windows下安装启动时提示不成功问题
  19. 网页版bpc电波对时_电波表对时软件下载-BPC(中国码)电波表对时模拟软件 20170308 官方版 - 河东下载站...
  20. VB6.0 组织json对象并生成json字符串

热门文章

  1. 从assemblyer Instructure deepth understander C principle
  2. APP超越预期效果的6种方法
  3. 委托(一个主窗体统计多个从窗体的按钮单击的次数)
  4. 用Python解“求整数段和”题
  5. 用C语言解“用天平找小球”题
  6. c语言选择题写小写字母表,C语言选择题(最全版).doc
  7. 排序算法四:归并排序
  8. python学习笔记之编写readConfig读写配置文件
  9. 数据挖掘学到最后全是数学
  10. 怎么证明正态分布积分结果为1?I^2是什么意思 (极坐标 分部积分法 雅可比行列式在积分坐标变换中 )