最近需要从文本中抽取结构化信息,收集到很多数据,遂整理了一下,后续会不断更新。

涉及内容包括:中英文敏感词、语言检测、中外手机/电话归属地/运营商查询、名字推断性别、手机号抽取、身份证抽取、邮箱抽取、中日文人名库、中文缩写库、拆字词典、词汇情感值、停用词、反动词表、暴恐词表、繁简体转换、英文模拟中文发音、汪峰歌词生成器、职业名称词库、同义词库、反义词库、否定词库、汽车品牌词库、汽车零件词库、连续英文切割、各种中文词向量、公司名字大全、古诗词库、IT词库、财经词库、成语词库、地名词库、历史名人词库、诗词词库、医学词库、饮食词库、法律词库、汽车词库、动物词库、中文聊天语料、中文谣言数据

下载地址:https://download.csdn.net/download/m0_38106923/10804731

自然语言处理常用数据集相关推荐

  1. 04_机器学习概述,什么是机器学习,应用场景,数据来源与类型,网上可用的数据集、常用数据集数据的结构组成、特征工程是什么、意义、特征抽取、sklearn特征抽取API、文本特征抽取(学习笔记)

    机器学习概述 人工智能.机器学习.深度学习之间的关系 机器学习框架 Pytorch Caffe2 theano Chainer Scikit-learn 语言支持 机器学习书籍 <面向机器智能 ...

  2. CV:计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念)、早期/中期/近期应用领域(偏具体应用)、经典CNN架构(偏具体算法)概述、常用工具/库/框架/产品、环境安装、常用数据集、编程技巧

    CV:计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念).早期/中期/近期应用领域(偏具体应用).经典CNN架构(偏具体算法)概述.常用工具/库/框架/产品.环境安装.常用数据集.编程技巧 ...

  3. 标识别,人脸识别等常用数据集

    参考博客: https://www.cnblogs.com/weiyinfu/p/8016405.html#32 常用数据集 一.Cifar数据集 Hinton参与收集 彩色图像(RGB) 图像尺寸相 ...

  4. 【深度学习】机器学习\深度学习常见相关公开数据集汇总(图像处理相关数据集、自然语言处理相关数据集、语音处理相关数据集)

    一.前言 1. 介绍 常来说,深度学习的关键在于实践.从图像处理到语音识别,每一个细分领域都有着独特的细微差别和解决方法. 然而,你可以从哪里获得这些数据呢?现在大家所看到的大部分研究论文都用的是专有 ...

  5. 【NLP】6 gensim word2vec基于中文语料库实战——中文wiki百科、清华大学自然语言处理实验室数据集、搜狗全网新闻数据集

    gensim word2vec自己寻找语料库训练模型--非gensim data 1. 数据下载 2. 中文wiki百科 2.1 数据获取 2.2 数据处理 3. 清华大学自然语言处理实验室数据集 4 ...

  6. 自然语言推理和数据集

    自然语言推理和数据集 Natural Language Inference and the Dataset 情绪分析的问题.此任务旨在将单个文本序列分类为预定义的类别,例如一组情感极性.然而,当需要判 ...

  7. 无人驾驶常用数据集---图像语义分割数据集--Cityscapes数据集的解读(for 小白)

    ** 无人驾驶常用数据集–图像语义分割数据集–Cityscapes数据集的解读(for 小白) ** 一.什么是Cityscapes数据集? Cityscapes是关于城市街道场景的语义理解图片数据集 ...

  8. Dataset:数据集集合(综合性)——机器学习、深度学习算法中常用数据集大集合(建议收藏,持续更新)

    Dataset:数据集集合(综合性)--机器学习.深度学习算法中常用数据集大集合(建议收藏,持续更新) 目录 常规数据集 各大方向分类数据集汇总 具体数据集分类 相关文章 DL:关于深度学习常用数据集 ...

  9. CV:人工智能之计算机视觉方向的简介(CV发展史+常用数据集+CV职位)、传统方法对比CNN类算法、计算机视觉十大应用(知识导图+经典案例)之详细攻略

    CV:人工智能之计算机视觉方向的简介(CV发展史+常用数据集+CV职位).传统方法对比CNN类算法.计算机视觉十大应用(知识导图+经典案例)之详细攻略 目录 计算机视觉的简介 1.计算机视觉的研究方向 ...

最新文章

  1. Linux-CentOS 7 增加root分区容量
  2. Unity插件之NGUI学习(4)—— 创建UI2DSprite动画
  3. 由浅入深剖析硬盘固件
  4. java jint,JNI:将unsigned int转换为jint
  5. 业务库负载翻了百倍,我做了什么来拯救MySQL架构
  6. Python手写神经网络实现3层感知机
  7. zabbix 监控 3com
  8. 查找某个数据,找到后把符合条件数据的一行复制到另外一个地方
  9. poi导出excel日期格式问题
  10. ZigBee-CC2530单片机 - 4路硬件定时器PWM输出
  11. php中文手册 最新评论整合,ThinkPHP整合百度Ueditor
  12. Spring Cloud 入门手册
  13. 天王表的网络营销战略
  14. 【web前端】前端性能优化指南,还不来看看?
  15. 到底还有没有月薪3万以下的程序员?程序员工资真的这么高!
  16. 聊下git merge --squash
  17. 物联网+区块链溯源方案
  18. MySQLamp;amp;JDBC回顾——MySQL
  19. requestAnimationFrame动画控制详解
  20. 【BBED】BBED模拟并修复ORA-08102错误

热门文章

  1. linux 6.4 图形界面,为CentOS 6.4安装图形界面并用VNC远程连接
  2. The destination folder does not exist or is not writeable
  3. Found option without preceding group in config file E:\mysql\mysql-5.7.23-winx64\my.ini at line 1!
  4. P2245 星际导航
  5. VLOG丨树莓派Raspberry Pi 3安装PLEX并挂载USB硬盘打造最牛的微型家庭影音服务器2018...
  6. hdu5296 01字典树
  7. eclipse调用JNI之环境的搭建
  8. mybatis 使用resultMap实现数据库的操作
  9. int与string转换
  10. C# Attribute简介