2018 Byte Cup 国际机器学习竞赛(以下简称 Byte Cup)是一项面向全球的机器学习竞赛,旨在促进机器学习的学术研究和具体应用。

Byte Cup 2018 的主题是自动生成文本标题。自从互联网诞生以来,人类产生和获取的文字信息量增加了很多。移动互联网更是能让每个人随时随地都可以接收到最新的信息,并且可以随时随地创作内容。内容信息的过载让机器创作变得十分重要。

首先,机器创作标题和摘要可以快速总结文章内容,方便迅速浏览。其次,根据今日头条等产品的数据,内容创造和内容的阅读量符合幂律:大量内容只有很少的人阅读。如果这部分内容可以由机器自动创作,可以极大地减小成本。此外,自动摘要和自动标题生成也是自然语言处理领域的重要研究课题。

目前,比赛已经进入了测试集阶段,为期一周,我们收集了以下资料,帮你快速进入文本摘要和标题生成这一领域。

PaperWeekly 曾于 2016 年发表了一系列关于自动摘要生成的文章,全面地介绍了这一领域的各种进展,同时介绍了不少领域内的经典论文。


目录:

https://rsarxiv.github.io/tags/自动文摘/


自动文摘(一)

https://rsarxiv.github.io/2016/03/20/自动文摘(一)/

自动文摘(二)

https://rsarxiv.github.io/2016/03/30/自动文摘(二)/


自动文摘(三)

https://rsarxiv.github.io/2016/04/06/自动文摘(三)/

自动文摘(四)

https://rsarxiv.github.io/2016/04/17/自动文摘(四)/

自动文摘(五)

https://rsarxiv.github.io/2016/04/24/自动文摘(五)/

自动文摘(六)

https://rsarxiv.github.io/2016/04/30/自动文摘(六)/

自动文摘(七)

https://rsarxiv.github.io/2016/05/07/自动文摘(七)/

自动文摘(八)

https://rsarxiv.github.io/2016/05/10/自动文摘(八)/

自动文摘(九)

https://rsarxiv.github.io/2016/05/11/自动文摘(九)/

自动文摘(十)

https://rsarxiv.github.io/2016/05/12/自动文摘(十)/

自动文摘(十一)

https://rsarxiv.github.io/2016/05/12/自动文摘(十一)/

自动文摘(十二)

https://rsarxiv.github.io/2016/05/17/自动文摘(十二)/

自动文摘(十三)

https://rsarxiv.github.io/2016/05/18/自动文摘(十三)/

著名的 IT 博主阮一峰也曾用深入浅出的语言描述了这个领域内的一篇经典论文(1958 年 IBM),并附上了 C# 和 Python 链接:

《TF-IDF与余弦相似性的应用(三):自动摘要》,阮一峰:


http://www.ruanyifeng.com/blog/2013/03/automatic_summarization.html

2004 年,Mihalcea R, Tarau P 等人在 ACL 上发表了一篇基于 TextRank 进行文本摘要的论文。以下是一篇 TextRank 文本摘要的介绍:

《使用TextRank算法为文本生成关键字和摘要》,乐天笔记:

https://www.letiantian.me/2014-12-01-text-rank/

代码:

https://github.com/letiantian/TextRank4ZH

此后,Seq2Seq 和 Attention 等技术,将自动摘要带上了一个新的台阶,也是当前主流的标题生成方法。参考:

《玩转Keras之Seq2Seq自动生成标题》

代码:

https://github.com/bojone/seq2seq/blob/master/seq2seq.py

?

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

关于PaperWeekly


PaperWeekly 是一个推荐、解读、讨论、报道人工智能前沿论文成果的学术平台。如果你研究或从事 AI 领域,欢迎在公众号后台点击「交流群」,小助手将把你带入 PaperWeekly 的交流群里。

▽ 点击 | 阅读原文 | 访问大赛主页

Byte Cup 2018机器学习大赛进入冲刺阶段,最全资料帮你快速上手!相关推荐

  1. Byte Cup 2018国际机器学习竞赛夺冠记

    9 月份,我们两位同学一起组队,参加 Byte Cup 2018 机器学习比赛.本次比赛由中国人工智能学会和字节跳动主办,IEEE 中国代表处联合组织.比赛的任务是文章标题自动生成.最终,我们队伍获得 ...

  2. 帮初学者快速上手机器学习,这有一份Colab资源大全

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI Google Colab是帮你快速了解Python代码的利器,你可以直接在上面运行一些好玩好用的Jupyter Notebook项目. 对 ...

  3. RISC-V应用创新大赛 | 一文详解RVB2601套件 助你快速上手赢比赛

    简介:参加RISC-V应用创新大赛 赢取开发资源和好礼 上周我们发布了平头哥芯片开放社区×阿里云天池"RISC-V应用创新大赛"正式开赛! 为大家介绍了RISC-V应用创新大赛的赛 ...

  4. 利用机器学习分析脑电数据(原理分析+示例代码+快速上手)

    由于本人对于脑机接口以及脑电技术的极度爱好(其实目的是:是把U盘插到大脑里,然后就不用学习了哈哈哈哈),近几月看了较多这方面的内容,变打算写下博客总结分析一下. 目录 一.  机器学习分析简介 二.机 ...

  5. 2018年HBase生态社群画像 +最全资料汇总下载

    HBaseCon 亚洲大会全部PPT:下载 钉群直播全部资料下载:下载 9届Meetup视频和PPT下载:下载 <58HBase平台实践和应用 -平台建设篇> 何良均/张祥 58同城 查看 ...

  6. 第二届Byte Cup来袭,赢得2万美元奖金,登上字节跳动面试直通车

    2018 Byte Cup 国际机器学习竞赛(以下简称 ByteCup)是一项面向全球的机器学习竞赛,由中国人工智能学会和字节跳动联合主办,数据竞赛平台 biendata.com 承办,旨在促进机器学 ...

  7. 2018年计算机职称考试冲刺,2018年中级会计职称考试冲刺阶段学习计划

    2018年中级会计师考试冲刺阶段复习时间段是8月12日至9月8日.经过前面一段时间的复习,相信考生已经对全书的内容有了一定的了解和掌握.在此小编为大家总结了2018年中级会计职称考试冲刺阶段学习计划, ...

  8. 2021-MAXP-DGL图机器学习大赛-Graph@ICT-复盘与总结【rank6】

    2021-MAXP-DGL图机器学习大赛-Graph@ICT-复盘与总结 文章目录 2021-MAXP-DGL图机器学习大赛-Graph@ICT-复盘与总结 写在前面 初赛:超长战线 前期:顺风顺水到 ...

  9. 机器学习中一阶段网络是啥_机器学习项目的各个阶段

    机器学习中一阶段网络是啥 Many businesses and organizations are turning to machine learning for solutions to chal ...

最新文章

  1. linux su切换用户提示 Authentication failure的解决方法
  2. elasticsearch 后置过滤器(Post Filter)
  3. 关键字提取_SEO怎么做?从排名和关键字优化入手
  4. 各大型网站架构分析收集Z
  5. 选择之后触_发宜常梳:4种材质的梳子,我们最常用的梳子却对头发最不好,该如何选择?...
  6. 数据库时间字段排序问题
  7. rzsz for linux,linux下如何安装rzsz
  8. Dubbo之RPC架构
  9. 第八节:语法总结(2)(匿名类、匿名方法、扩展方法)
  10. linux环境用tar报错,Linux环境使用TAR命令快速部署安装Oracle
  11. 如何JQ将下拉列表的值传送给php,JQuery设置获取下拉菜单某个选项的值(比较全)...
  12. 用JNDI连接数据库
  13. CentOS的ssh sftp配置及权限设置整理
  14. 软件项目管理 project 实验
  15. dnf自动刷图python_dnf卡盟_【python接口自动化】- openpyxl读取excel数据
  16. pc端js在线预览Word、Excel
  17. 第2章第5节:文本框的使用:复制和移动文本框 [PowerPoint精美幻灯片实战教程]
  18. Python 创建一维数组、二维数组和N维数组
  19. 小女子做销售 四大温柔手段
  20. [BZOJ]4987: Tree 树形DP

热门文章

  1. python数组用sum求和_对python中array.sum(axis=?)的用法介绍
  2. eclipse里启动tomcat无法通过127.0.0.1访问
  3. python面对对象编程------3:写集合类的三种方法
  4. Angular学习(7)- 模板2
  5. Xib/Storyboard碰到不同版本的Xcode真是想死啊!
  6. 如何将Arraylist转成string输出?
  7. C++ Q16: dereferencing
  8. 读取xml文件基于xpath
  9. repeate 绑定展开的第三只小板凳
  10. react 子组件ref_React中Ref 的使用方法详解