5800对句子,人工标注

关于语料的来源和标注方式参考readme

样本如下, 非常简单明了:

下载地址:https://www.microsoft.com/en-us/download/details.aspx?id=52398

Quality #1 ID #2 ID #1 String #2 String
1 702876 702977 Amrozi accused his brother, whom he called "the witness", of deliberately distorting his evidence. Referring to him as only "the witness", Amrozi accused his brother of deliberately distorting his evidence.
0 2108705 2108831 Yucaipa owned Dominick's before selling the chain to Safeway in 1998 for $2.5 billion. Yucaipa bought Dominick's in 1995 for $693 million and sold it to Safeway for $1.8 billion in 1998.
1 1330381 1330521 They had published an advertisement on the Internet on June 10, offering the cargo for sale, he added. On June 10, the ship's owners had published an advertisement on the Internet, offering the explosives for sale.
0 3344667 3344648 Around 0335 GMT, Tab shares were up 19 cents, or 4.4%, at A$4.56, having earlier set a record high of A$4.57. Tab shares jumped 20 cents, or 4.6%, to set a record closing high at A$4.57.
1 1236820 1236712 The stock rose $2.11, or about 11 percent, to close Friday at $21.51 on the New York Stock Exchange. PG&E Corp. shares jumped $1.63 or 8 percent to $21.03 on the New York Stock Exchange on Friday.
1 738533 737951 Revenue in the first quarter of the year dropped 15 percent from the same period a year earlier. With the scandal hanging over Stewart's company, revenue the first quarter of the year dropped 15 percent from the same period a year earlier.



微软的MSR paraphrase数据集相关推荐

  1. 【人脸识别】解析MS-Celeb-1M人脸数据集及FaceImageCroppedWithAlignment.tsv文件提取

    更多内容关注微信公众号:ML_Study 1,MS-Celeb-1M数据集:  MSR IRC是目前世界上规模最大.水平最高的图像识别赛事之一,由MSRA(微软亚洲研究院)图像分析.大数据挖掘研究组组 ...

  2. 目标检测数据集MSCOCO简介

    简介 介绍一下目标检测领域另外一个比较有名的数据集 MS COCO (Microsoft COCO: Common Objects in Context) . MSCOCO 数据集是微软构建的一个数据 ...

  3. 机器学习数据集!CV、NLP 一应俱全

    本文介绍一个机器学习大型数据集的汇总网站,网站目前提供约 70 个最新数据集,涵盖了计算机视觉.自然语言理解和音频三大领域. 还在愁到哪里找到需要的机器学习数据集吗? 每年都有很多大型.高质量的数据集 ...

  4. 新闻推荐数据集MIND介绍

    目录 新闻推荐数据集介绍 MIND数据集简介 MIND数据集的构造 MIND数据集里的一个标签样本形式 MIND数据集里的news MIND数据集的划分 MIND数据集的具体数值 MIND数据集与以前 ...

  5. 机器学习入坑指南(十):猫狗大战之数据集准备

    猫狗大战是 kaggle 的一个著名比赛项目,即编写一个算法使机器能够区分猫和狗(图片).前面我们已经尝试过使用深度学习的方法识别手写数字图片,效果似乎还不错,稍加改进,就可以应用到这个问题上. 对于 ...

  6. 深度学习应用篇-计算机视觉-语义分割综述[5]:FCN、SegNet、Deeplab等分割算法、常用二维三维半立体数据集汇总、前景展望等

    [深度学习入门到进阶]必看系列,含激活函数.优化策略.损失函数.模型调优.归一化算法.卷积模型.序列模型.预训练模型.对抗神经网络等 专栏详细介绍:[深度学习入门到进阶]必看系列,含激活函数.优化策略 ...

  7. 制作目标检测数据集入门到精通(一)常用数据集(及下载数据网站)汇总

    目录 前言 1.目标识别知名数据集 1.1 PASCAL VOC 1.2 MS COCO 1.3 ImageNet 2 人脸识别相关 2.1 FERET人脸数据库 2.2 CMU Multi-PIE人 ...

  8. 语义分割-深度学习算法总结(2018)-论文翻译(附带相关数据集)

    太优秀了,收藏用!转载自:https://www.cnblogs.com/Jie-Liang/archive/2017/06/29/6902375.html 论文原文地址:https://arxiv. ...

  9. 研究院机制:微软的另一块肌肉

    微软迄今还没有凭仰慕自身的研发力量真正打赢过一次战役--DOS.Windows.开发工具.Office.IE等里程碑式的产品,都不是微软件自己的原创.但这并不防碍微软写就了30年来最辉煌的一部企业史. ...

最新文章

  1. Tomaso Poggio:深度学习需要从炼金术走向化学
  2. 移动端以刻度或尺度滑动方式选择年龄收入等
  3. flink实时同步mysql_基于Canal与Flink实现数据实时增量同步(一)
  4. 多语言应用开发中本地化信息对照表
  5. Tomcat服务器安装PFX格式证书
  6. 漫步微积分六——极限的概念
  7. 均值(Mean)和均值标准误差(S.E. Mean)
  8. 28篇论文、6 大主题带你一览 CVPR 2020 研究趋势
  9. DesignSurface简介
  10. 【倒计时】用JS写出京东倒计时效果
  11. Java 防止 SQL 注入工具类
  12. InfluxDB查询 tag和field列名字重复
  13. 招商银行笔试题 公司年会
  14. 批量爬取链家房源信息
  15. 数商云电子元器件B2B商城系统
  16. 土地覆盖/土地利用简介及数据集
  17. python自动读取短信_自动化测试-自动获取手机短信验证码
  18. 30句2018年精彩走心的文案,没事可以学习下,了解其中的文字意义
  19. 奇绩创坛分享:从科学家到创业者的科技创新
  20. 这些曾经世界第一的手游,现在全都凉了

热门文章

  1. 【java框架】MyBatis-Plus(1)--MyBatis-Plus快速上手开发及核心功能体验
  2. 台式低速常温离心机S400操作规程
  3. hud抬头显示器哪个好_什么样的HUD抬头显示器好?圆盾用是实力说话
  4. Linux学习笔记---阿里云
  5. 计算机平面设计与工程论文,浅谈计算机平面设计和设计软件相互结合
  6. 微信公众号订阅通知(go+vue)
  7. 网易人工智能事业部:“悄无声息”再捞金!
  8. 【系统分析师】操作系统
  9. 河南省周口市安吉软件测试培训中心第一次软件测试课程——软件测试期末考试(含答案)
  10. 微信公众号 创建菜单post数据格式