现代信息爆炸般地产生,信息如海如潮。信息分类,不仅有利于加快信息检索速度,且有利于提高查准率。Internet是信息的重要载体,深入地研究与探讨网上信息自动分类的方法、技术和理论,已成为时代的迫切需求和新的研究热点。

针对文本智能分类技术的研究,TinyMind策划了一次练习赛,深入分析文本内在结构和语义信息,构建文本分类模型,实现精准分类。

规则及评估

报名页面: https://www.tinymind.cn/competitions/46

本练习赛以学习交流为主,赛题长期有效。如果你有一定NLP基础,希望充实自己的实战能力或结交志同道合的伙伴,欢迎踊跃参赛,欢迎加入交流群~

扫码添加助手备注“新闻分类”进群~~

赛题介绍

通过长文本数据正文(article),预测文本对应的类别(class)

参赛者使用已标记好的训练数据集进行模型训练,然后使用训练好的模型对测试数据集进行推断,推断结果按照要求格式保存为csv文档,上传到TinyMind测评系统,得到评分与排名。

评分标准

采用各个品类F1指标的算术平均值,它是Precision 和 Recall 的调和平均数。F1越高,则结果越好。

其中,Pi是表示第i个种类对应的precision, Ri是表示第i个种类对应recall。

奖励

1、自上线之日起,排行榜前5名达到80分(含)以上的团队将获得由矩池云(MATPool )提供的GPU(2080ti )运算时长100小时,获奖人产生后立即发放。

MATPool 矩池云,国内领先的GPU云共享平台,通过连接闲置的GPU节点,提供稳定而强大的GPU算力,支持多种应用场景,支持Jupyter、TensorFlow等多种环境,助力您的深度学习任务。官网:https://www.matpool.com/?from=tinymind

2、自上线之日起,排行榜前10名达到80分(含)以上的团队将获赠《文本数据管理与分析——信息检索与文本挖掘的实用导论》书籍一本,获奖人产生后立即寄送。

简介:信息检索与数据挖掘领域世界知名学者、ACM Fellow、美国伊利诺伊大学香槟分校(UIUC)翟成祥教授厚积薄发之作,基于UIUC数据管理与分析相关课程多年的积累,覆盖作者两门在线课程“文本检索与搜索引擎”和“文本挖掘与分析”的主要内容。 本书以文本数据处理为核心,从理论到实践介绍了文本数据管理与分析的关键问题,广泛涵盖了信息检索和文本数据挖掘领域的主要概念、技术和方法,并包括许多专门设计并辅以配套软件工具包(例如META)的动手练习,来帮助读者学习如何运用文本挖掘和信息检索的技术来分析和处理现实世界中的文本数据,以及如何试验数据和为具体应用任务来改进一些算法。详细介绍:https://item.jd.com/12591034.html

感谢MATPool 矩池云、机械工业出版社华章科技奖品赞助!

 

报名页面:https://www.tinymind.cn/competitions/46

新闻智能分类练习赛开始报名啦!最先达到80分就可以领GPU,技术书籍!相关推荐

  1. NLP入门竞赛,搜狗新闻文本分类!拿几十万奖金!

    该数据集来自若干新闻站点2012年6月-7月期间国内,国际,体育,社会,娱乐等18个频道的新闻数据. 根据新闻正文内容分析新闻的类别数据集官网链接: http://www.sogou.com/labs ...

  2. Task01——零基础入门NLP - 新闻文本分类之赛题理解

    本篇目标 首先本篇文章会对赛题进行介绍以及个人对赛题的理解,带大家接触NLP的预处理.模型构建和模型训练等知识点. 赛题介绍 赛题名称:零基础入门NLP - 新闻文本分类 赛题任务:赛题以自然语言处理 ...

  3. NLP入门竞赛,搜狗新闻文本分类

    该数据集来自若干新闻站点2012年6月-7月期间国内,国际,体育,社会,娱乐等18个频道的新闻数据. 根据新闻正文内容分析新闻的类别数据集官网链接: http://www.sogou.com/labs ...

  4. 零基础入门NLP - 新闻文本分类

    本文是对阿里云新人竞赛中的"零基础入门NLP - 新闻文本分类"解体过程进行的记录,目前仅使用了textCNN模型进行预测,后续还会考虑使用LSTM进行对比. 赛题数据 赛题以新闻 ...

  5. 【项目实战课】NLP入门第1课,人人免费可学,基于TextCNN的新闻文本分类实战...

    欢迎大家来到我们的项目实战课,本期内容是<基于TextCNN的新闻文本分类实战>. 所谓项目课,就是以简单的原理回顾+详细的项目实战的模式,针对具体的某一个主题,进行代码级的实战讲解,可以 ...

  6. 基于BERT的新闻文本分类

    2017年Transformer模型横空出世,encoder-decoder的创新效果显著,2018年Google又提出了BERT预训练模型,可谓是大大推动了NLP的进步,关于transformer和 ...

  7. NPL基础入门之新闻本分类赛题理解Test1

    NPL基础入门之新闻文本分类赛题理解Test1 赛题背景 评测标准 赛题背景 赛题以新闻数据为赛题数据,数据集报名后可见并可下载.赛题数据为新闻文本,并按照字符级别进行匿名处理.整合划分出14个候选分 ...

  8. 深度学习实战3-文本卷积神经网络(TextCNN)新闻文本分类

    文章目录 一.前期工作 1. 设置GPU 2. 导入预处理词库类 二.导入预处理词库类 三.参数设定 四.创建模型 五.训练模型函数 六.测试模型函数 七.训练模型与预测 今天给大家带来一个简单的中文 ...

  9. 新闻本文分类-01赛题理解

    该文是连载文章,基于新闻文本分类赛题从而入门自然语言处理.主要从赛题理解.数据读取与数据分析.基于机器学习的文本分类.基于深度学习的文本分类这四部分来学习NLP. 一.赛题背景 本次新人赛是Dataw ...

最新文章

  1. CSS flex 用法
  2. 吴恩达 coursera ML 第十五课总结+作业答案
  3. c++ 遍历所有点且距离最短_C/C++ 图的最短路径 Dijkstra 算法
  4. Exception in thread http-bio-8081-exec-3 java.lang.OutOfMemoryError: PermGen space
  5. 电脑录屏工具_这四款录屏工具,也许是电脑录屏软件中免费、无广告且最实用的,程序员必备...
  6. python中函数包括标准库函数吗_Python标准库:内置函数divmod(a, b)
  7. netstat命令查看网络信息
  8. 200行Python实现简单的区块链系统
  9. java 代码效率_提高代码性能效率总结(一)--Java
  10. Ps 初学者教程,如何在图片中创建双重曝光效果?
  11. 代码实现自动剪辑视频
  12. Android 查看是否支持指定解码器(H265)
  13. Android 语音助手
  14. 黑暗幽灵(DCM)木马详细分析
  15. Update 语法全介绍
  16. Warning: count(): Parameter must be an array or an object that implements Countable快速解决方法
  17. ios关联启动_部落冲突电脑版与IOS设备关联教程
  18. 数据分析之Excel的基本功能(下)
  19. 最全Markdown教程
  20. #036数字信息指南十分钟速成课

热门文章

  1. elasticsearch简介
  2. Java 多线程(六) synchronized关键字详解
  3. php减少损耗的方法之一 缓存对象
  4. linux c一站式编程 pdf,《Linux·C编程一站式学习》·(宋劲杉)·文字版.pdf
  5. java和jdbc对应关系,JDBC类型与JAVA类型对应关系
  6. php中mvc控制器作用,理解PHP中的MVC编程之控制器
  7. python 抛出异常raise
  8. VMware workstation中rhel安装VMware tools失败
  9. SpringBoot------添加保存时自动编译插件
  10. C#ListView控件添加Checkbox复选框并获取选中的数目,检查checkbox是否勾选