1. 免费电子书下载网站

  • 古登堡计划:Project Gutenberg offers 55,277 free ebooks to download.

    • The Tragedy of Romeo and Juliet by William Shakespeare 支持以下格式:

      • html;
      • epub;
      • kindle;
      • plain text UTF-8;

2. Amazon S3 云存储

  • 文本

    • https://s3.amazonaws.com/text-datasets/nietzsche.txt

3. 新闻类

  • BBC:Insight - BBC Datasets

(自然语言处理)语料、文本数据集清单相关推荐

  1. 情感分析︱网络公开的免费文本语料训练数据集汇总

    每每以为攀得众山小,可.每每又切实来到起点,大牛们,缓缓脚步来俺笔记葩分享一下吧,please~ --------------------------- 包括:一些免费的语料库+一些有效分词软件 还有 ...

  2. msra数据集_干货下载 | 中文自然语言处理 语料/数据集

    来源:GitHub 作者:SophonPlus ChineseNlpCorpus 搜集.整理.发布中文自然语言处理 语料/数据集,与有志之士共同促进中文自然语言处理 的 发展. 情感/观点/评论 倾向 ...

  3. 使用Amazon SageMaker 构建基于自然语言处理的文本摘要应用

    背景介绍 文本摘要,就是对给定的单个或者多个文档进行梗概,即在保证能够反映原文档的重要内容的情况下,尽可能地保持简明扼要.质量良好的文摘能够在信息检索过程中发挥重要的作用,比如利用文摘代替原文档参与索 ...

  4. ICCV2021- 牛津大学新的预训练视频文本数据集WebVid-2M,设计用于端到端检索的联合视频和图像编码器!代码已开源!...

    关注公众号,发现CV技术之美 ▊ 写在前面 视频文本检索的挑战包括视觉网络结构的设计 和训练数据的性质 ,因为可用的大规模视频文本训练数据集 (例如HowTo100M) 是noisy的,因此只能通过大 ...

  5. cs224u 自然语言推理:任务和数据集-1

    cs224u 自然语言推理:任务和数据集-1 nli_01_task_and_data.ipynb __author__ = "Christopher Potts" __versi ...

  6. 自然语言处理之文本情感分析

    1.导语 深度学习近些年取得突破性的发展,目前深度学习技术在人工智能领域应用最广泛的两方面就是CV(计算机视觉)和NLP(自然语言处理),在本次夏虹老师的<人工智能>课程上,我和我的小组成 ...

  7. Dataset:fetch_20newsgroups(20类新闻文本)数据集的简介、安装、使用方法之详细攻略

    Dataset:fetch_20newsgroups(20类新闻文本)数据集的简介.安装.使用方法之详细攻略 目录 fetch_20newsgroups(20类新闻文本)数据集的简介 1.数据集信息 ...

  8. NLP之词向量:利用word2vec对20类新闻文本数据集进行词向量训练、测试(某个单词的相关词汇)

    NLP之词向量:利用word2vec对20类新闻文本数据集进行词向量训练.测试(某个单词的相关词汇) 目录 输出结果 设计思路 核心代码 输出结果 寻找训练文本中与morning最相关的10个词汇: ...

  9. ML之SVM:利用SVM算法(超参数组合进行多线程网格搜索+3fCrVa)对20类新闻文本数据集进行分类预测、评估

    ML之SVM:利用SVM算法(超参数组合进行多线程网格搜索+3fCrVa)对20类新闻文本数据集进行分类预测.评估 目录 输出结果 设计思路 核心代码 输出结果 Fitting 3 folds for ...

最新文章

  1. Linux 0.11进程运行轨迹的跟踪,进程运行轨迹的跟踪与统计
  2. access开发精要(1)-字段验证
  3. Windows下动态加载可执行代码原理简述
  4. jmeter修改redis_jmeter如何访问redis服务缓存
  5. 前端开发css禁止选中文本
  6. Window环境下使用C#调用VBScript、JavaScript等脚本
  7. Android Application基本组成部分
  8. MATLAB二次规划和整数规划
  9. 视频格式转换(avi、wmv、flv、mkv、rmvb、rm、3gp转MP4、MP3)边学边开发
  10. win11系统管理员身份在哪里?怎么设置
  11. 若依前后端分离打包发布(jar,nginx)
  12. 大学专业有C语言专业吗,大学里哪些专业开设C语言、数电、模电、单片机、嵌入式等课程?...
  13. Java现在好找工作吗?
  14. 针对IE浏览器的兼容性ie7、ie8、ie9
  15. Scratch 被禁止访问;Linux 内核历史报告2020 等开源之道每周评论2020 09 15
  16. 小米9等备份原机的基带相关分区镜像防止基带未知丢失ADB指令-icloudelectron修正
  17. 【MM ECC VS S4】MM模块中ECC与S4的区别
  18. 网页中视频内容自动播放
  19. 7-23 币值转换 (20 分)
  20. 【怎么辨别一个公司是不是外包?】

热门文章

  1. 让memcached和mysql更好的工作
  2. php 判断赋值 简写,PHP IF 判断简写
  3. linux中.开头的变量,linux中的变量
  4. SQL 基础面试题(四)
  5. js深拷贝和浅拷贝对数组的影响_浅拷贝与深拷贝(JavaScript)
  6. python如何求列表中的众数_算法(LeetCode)六种方法求数组中的绝对众数
  7. mysql 导出dmp文件_PLSQL Developer导入导出表数据结构
  8. 剑指offer面试题12. 矩阵中的路径(矩阵搜索)(深度优先搜索)(剪枝)
  9. 剑指offer面试题10- II. 青蛙跳台阶问题(动态规划)(递归)(斐波那契数列)
  10. 求解线性方程组(SVD,QR,Gauss,LU)