(文章来自公众号:Python或R人工智能学习,ID:Python_R_wu,后附学习资料。)

随着人工智能的发展,越来越多的公司开始举办大数据比赛,题目类型也越来越丰富,短视频、自动驾驶等题材越来越多。下面是截止到9月还在进行中的比赛,大家选择性参加,以赛促学。公众号后附学习资料。

天 池

01)2018广东工业智造大数据创新大赛——智能算法赛¥550,000

智能算法赛以“铝型材表面瑕疵识别”为主题,选择佛山市南海区铝型材标杆企业的真实痛点作为赛题场景,寻求解决方案,助力企业实现转型升级,提升行业竞争力。

02)广东工业智造大数据创新大赛 - 应用创新赛¥610,000

大赛以工业智能制造为主题,选题围绕供、研、产、销4大环节展开,寻找领先的产业应用。希望参赛组织的作品能有效追溯产品质量产生原因、生产低效原因、能源高消耗原因等,并对相应的生产过程参数进行实时自动调优,从而持续加强生产过程的质量、效率及能耗的保障能力,最终实现智能化制造。

03)2018之江杯全球人工智能大赛(零样本图像目标识别) ¥2,780,000

零样本学习是AI识别方法之一。简单来说就是识别从未见过的数据类别,即训练的分类器不仅仅能够识别出训练集中已有的数据类别,还可以对于来自未见过的类别的数据进行区分。

04)2018之江杯全球人工智能大赛(视频识别&问答) ¥2,780,000

参赛者需对给定的短视频进行内容识别和分析,并回答每一个视频对应的问题。

05)阿里巴巴大数据智能云上编程大赛 ¥300,000

参赛队伍将得到气象业务人员在预报中所广泛参考的多种格点降水预报(集合预报)的结果,需要选手综合考虑各种预报的误差规律,将各个预报的结果融合分析,得到资料覆盖区域(东经118°~121°,北纬28.5°~31.5°,也即杭州及周边区域)的未来24小时降水预报结果。

06)第三届阿里云安全算法挑战赛 ¥300,000

恶意软件是一种被设计用来对目标计算机造成破坏或者占用目标计算机资源的软件,传统的恶意软件包括蠕虫、木马等,这些恶意软件严重侵犯用户合法权益,甚至将为用户及他人带来巨大的经济或其他形式的利益损失。近年来随着虚拟货币进入大众视野,挖矿类的恶意程序也开始大量涌现,黑客通过入侵恶意挖矿程序获取巨额收益。当前恶意软件的检测技术主要有特征码检测、行为检测和启发式检测等,配合使用机器学习可以在一定程度上提高泛化能力,提升恶意样本的识别率。

DataFountain

01)2018CCF-自动驾驶三维点云分割 ¥1,000,000

赛题要求参赛者给出测试数据中每个点的类别预测,共同探索针对自动驾驶的高效三维点云分割方案。

02)面向电信行业存量用户的智能套餐个性化匹配模型¥1,000,000

此题利用已有的用户属性(如个人基本信息、用户画像信息等)、终端属性(如终端品牌等)、业务属性、消费习惯及偏好分匹配用户最合适的套餐,对用户进行推送,完成后续个性化服务。

03)基金间的相关性预测¥1,000,000

参赛者需要根据给出的基金净值、基金业绩比较基准、对应指数行情、基金间相关性等数据,构建模型、算法进行训练。然后针对我们提供的测试样本,通过您的算法或模型预测出之后一段时间内基金间的相关性情况。

04)汽车行业用户观点主题及情感识别¥1,000,000

参赛队伍需要对文本内容中的讨论主题和情感信息来分析评论用户对所讨论主题的偏好。讨论主题可以从文本中匹配,也可能需要根据上下文提炼。

05)供应链需求预测¥1,000,000

考虑商品在制造,国际航运,海关清关,商品入仓的供应链过程,实际的产品准备时长不同,将问题简化为统一在45天内完成,供应链预测目标市场为沙特阿拉伯,预测45天后5周每周(week1~week5)的销量。

06)互联网金融平台用户评价观点提取¥1,000,000

参赛者根据用户评论数据进行分析,提取用户对于平台的评价或印象,要求相同或相似评价进行聚合处理。同时,分析新闻事件对用户评论观点随时间变化的影响。

07)“AIIA”杯-国家电网-电力专业领域词汇挖掘 ¥18万现金+20万合作奖

对给定的电力文本数据,利用专业领域词发现算法来挖掘电力专业词汇。参赛者需要根据提供的电力语料,对比通用语料(建议采用维基百科),开发专业词发现程序,寻找出专属于电力领域的词汇。电力语料格式为一个Txt文本集,该文本包含了10000篇电力科技论文(已打乱顺序)。

08)2018 中国气象“神气”大数据算法与应用大赛-算法赛¥100,000

天空的薄云,往往是天气晴朗的象征;而那些低而厚密的云层,常常是阴雨风雪的预兆。我们希望选手基于大赛提供的海量云彩图片,通过深度学习训练模型,识别图片中不同类型的云彩,预测大赛提供的测试云彩图片。

09)2018 中国气象“神气”大数据算法与应用大赛-应用赛¥100,000

参赛选手结合气象数据与自有数据,寻找跨界新思路。参赛选手可以根据自有的农、林、牧、渔、交通、海事等数据,与比赛提供的气象数据关联,在比赛指定的计算平台进行计算,找到跨界结合的关联点,为这些行业的新发展提供全新思路和解决方案,解决行业痛点,提升行业效率。

10)2018 中国气象“神气”大数据算法与应用大赛-创意赛¥100,000

参赛选手结合气象数据与自有数据,寻找跨界新思路。参赛选手可以根据自有的农、林、牧、渔、交通、海事等数据,与比赛提供的气象数据关联,在比赛指定的计算平台进行计算,找到跨界结合的关联点,为这些行业的新发展提供全新思路和解决方案,解决行业痛点,提升行业效率。

AI Challenger

01)观点型问题阅读理解¥600,000

机器阅读理解是指让计算机阅读文本,随后让计算机解答与文中信息相关的问题。本次竞赛将重点针对阅读理解中较为复杂的,需要利用整篇文章中多个句子的信息进行综合才能得到正确答案的观点型问题。

02)细粒度用户评论情感分析¥600,000

在线评论的细粒度情感分析对于深刻理解商家和用户、挖掘用户情感等方面有至关重要的价值,并且在互联网行业有极其广泛的应用,主要用于个性化推荐、智能搜索、产品反馈、业务安全等。本次比赛我们提供了一个高质量的海量数据集,共包含6大类20个细粒度要素的情感倾向。参赛人员需根据标注的细粒度要素的情感倾向建立算法,对用户评论进行情感挖掘,组委将通过计算参赛者提交预测值和场景真实值之间的误差确定预测正确率,评估所提交的预测算法

03)英中文本机器翻译¥300,000

英中机器文本翻译作为此次比赛的任务之一,目标是评测各个团队机器翻译的能力。本次机器翻译语言方向为英文到中文。测试文本为口语领域数据。参赛队伍需要根据评测方提供的数据训练机器翻译系统,可以自由的选择机器翻译技术。例如,基于规则的翻译技术、统计机器翻译及神经网络机器翻译等。

04)短视频实时分类¥600,000

近几年发展极快的短视频行业具有明显的娱乐性和流行性,深受人们喜爱。为促进短视频领域理论与实践的共同发展,我们提供了业内首个大规模多标签短视频实时分类数据集,用于短视频分类任务的训练与测试工作。数据集共包含20万条短视频,涵盖舞蹈、健身、唱歌等63类流行元素。本数据集分为训练集(12万)、验证集(3万)、测试集A(3万)、测试集B(3万)。本数据集采用多标签分类体系,标签信息包含视频主体、场景、动作等多个维度,标注信息将几乎包含视频中展现的所有元素。

本次短视频实时分类竞赛将运行时间作为重要指标参与评估,将促进视频分类算法在工业界的应用。

视频中通常包含丰富的语义信息,例如视频主体、场景、动作以及人物属性等内容。对丰富的语义信息及其依赖关系进行建模是视频分类的关键。因此本次竞赛的数据集采用多标签分类体系,这对参数选手也提出了更高的挑战。

05)无人驾驶视觉感知¥600,000

自动驾驶过程中,我们需要基于视觉传感器判断周围的障碍物,同时也需要根据交通规则找出可行驶区域。在工业落地场景中,我们经常需要在模型的准确率和硬件资源中做出权衡。由于资源有限,很多时候我们无法同时使用多个模型。这个时候,多任务学习就是一个很好的解决方法。在这道题目中,我们希望你使用一个模型,同时解决“目标检测”和”可行驶区域分割“两个子问题。本赛道的数据均来自于BDD100K ( http://bdd-data.berkeley.edu/ )。请选手自行进入网站下载数据集。对于测试集A和测试集B,我们选取了BDD 测试集中的一部分数据,选手可下载我们选取的列表。

06)天气预报¥100,000

本次竞赛将观测仪器和数值预报得到的数据集分别称为“观测”和“睿图”数据集。参赛队伍可以结合上述两个数据集,设计天气预报算法与模型,预报当前时刻至第二天15:00(北京时23:00)的逐时天气状态,包括:① 2-m温度(t2m);② 2-m相对湿度(rh2m);③ 10-m风速(w10m)。

07)农作物病害检测¥100,000

病虫害的诊断对于农业生产来说至关重要。本次农作物病虫害识别比赛邀请参赛者设计算法与模型,对图像中的农作物叶子进行病虫害识别。组委会将通过将参赛者提交的识别结果与真实标注作比较,得出准确率(accuracy),并结合答辩表现,评估参赛者的算法模型。

08)眼底水肿病变区域自动分割¥100,000

视网膜水肿是一种眼部疾病,严重时会导致视力下降从而影响正常的生活。现在医学使用OCT(光学相干断层成像)辅助医生对视网膜水肿的判断。尽早的发现水肿症状,能够对疾病的治疗起到关键性作用。而设计算法通过眼部OCT来进行水肿检测是一项计算机视觉的任务。本次比赛邀请参赛者设计算法和模型,针对给出的眼部OCT样本,检测视网膜水肿类型并对病变区域进行体素级标记。组委会将通过计算参赛者提交的类型标签以及体素标记与真实的标注计算误差确定预测准确率,评估所提交的预测算法。

09)零样本学习¥60,000

我们提供一个大规模图像属性数据集,包含78,017张图片、230个类别、359种属性,用于本次零样本学习(zero-shot learning)竞赛。

华为大数据平台

01)未来应用创新大赛-未开始

为鼓励开发者和学生开发创新,大力发展AR、NFC的智能手机终端产品,华为开发者联盟举办未来应用创新大赛,为各参赛者提供一个交流的平台,鼓励大家点燃创意火花,扶持优秀的开发团队,充分挖掘具有创新性、实用性、前瞻性的内容,打造引领国内外最优的云服务体验。

讯飞AI开发者大赛

暂无比赛

DataCastle

01)BOT智能汽车技术挑战赛——机器学习预测汽车流量¥150,000

提供总共2000辆上汽新能源车和非新能源车历史出行数据(初赛数据集1000辆,复赛数据集1000辆)期待参赛团队运用机器学习和人工智能的技术,开发算法模型,通过算法进行精准车流量预测,探索人工智能技术在汽车出行场景创新应用的更多可能。

02)BOT新零售技术挑战赛——图像识别分析导购行为¥170,000

要求参赛者使用线下零售真实场景数据训练模型算法,即通过给出的比赛数据,检测、分析、判断导购和顾客属性,分析导购行为等,提高优化品牌店铺运营效率和店铺管理效率,优化运营营销策略、提高销售转换率、提升服务效率和消费体验等助力零售产业升级。比赛期望参赛者可以提出好的算法,通过人工智能辅助手段,高效准确分析导购行为、深度洞察消费者行为和需求。

03)第3届 融360天机智能金融算法挑战赛¥300,000

本届赛题共有三道,分别是“拒绝推断”、“特征挖掘”、“多金融场景下的模型训练”,总奖金池高达30万。

04)2018科大讯飞AI营销算法大赛¥60,000

讯飞AI营销广告点击率预估,预测广告被点击的概率。

05)“神策杯”2018高校算法大师赛 ¥mac pro

个性化推荐系统是神策智能系统的一个重要方面,精准的理解资讯的主题,是提升推荐系统效果的重要手段。 神策数据以一个真实的业务案例作为依托,提供了上千篇资讯文章及其关键词,参赛者需要训练出一个”关键词提取”的模型,提取10万篇资讯文章的关键词。

06)西南财经大学“新网银行杯”数据科学竞赛 ¥31,000

初赛任务:预测验证集上的客户违约概率,通过大赛网页提交预测结果。

07)金链盟中国区块链应用大赛¥2,150,000

本次大赛分为初赛、复赛、决赛三个阶段,赛题涉及金融、公益、医疗、教育、供应链、版权、司法等领域。

08)汉字档案手写识别大赛(华录杯复赛)¥31,000

本次任务中,参赛队伍将获得某公司人力部门所提供的近1000份应聘人员登记表格扫描图片,其中包含应聘人员的性别、民族、生日和教育经历等基本信息(姓名联系方式亲属等个人身份敏感信息已进行严格脱敏处理),还包括应聘者的个人学术或生活中所获荣誉与工作技能。参赛者需要利用得到的近1000张扫描件进行模型构建,从每个pdf文件中监测到表格,并从表格中提取指定类别的内容,准确地识别更多的类似档案扫描文件。

09)政府开放数据创意赛(华录杯复赛)¥180,000

针对“数智天津”这一主题,参赛者需要以多种数据融合使用的模式,围绕但不限于以下几类主题,设计并开发出能够帮助天津市政府智慧管理城市、有效解决问题的数据应用解决方案。

10)成都市开放数据创新应用大赛 ¥620,000

参赛选手围绕“数聚成都 智慧未来”主题,分析挖掘城市中各种公共数据之间的价值,并自主选择研究方向、确认赛题,最终提出创意方案。

百度点石

01)"探寻地球密码"天宫数据利用大赛¥60,000

在“天宫二号”成功发射两周年之际,计划以“天宫一号”、“天宫二号”所获取的高质量宽波段成像仪、三维成像微波高度计、高光谱成像仪数据产品为数据源,面向当前较为热门的遥感图像典型场景智能识别以及多源数据的交叉应用两个方向,举办“天宫数据利用大赛”。一方面,扩大天宫二号数据的国内外影响力;另一方面,充分挖掘数据的价值,促进遥感图像智能处理技术的发展、成果产出和人才的培养。

Biendata

01)2018自动驾驶模拟大赛 ¥12,500

本次比赛将分为线上和线下两个阶段。线上阶段将使用赛车模拟器(具体情况请见“数据页面”),模拟器中的赛车可收集前方的路面图片(一秒约30帧,类似真实无人车模型中的摄像头),无人驾驶程序或人类玩家可以通过方向盘角度和油门大小控制车辆行进方向和速度。

02) Byte Cup 2018 国际机器学习竞赛 $20,000

Topbuzz是字节跳动在为北美和巴西的用户创造的一站式内容消费平台,它利用机器学习算法为用户提供个性化视频、GIF图、本地新闻及重大新闻。目前,Topbuzz每天都会发布大量的文章,但如何为创作者提供更好的标题选择是Topbuzz目前面临的一个问题。为解决这一问题,此次竞赛任务是为Topbuzz提供的英文文章自动生成标题。

JDATA

暂无

ATEC蚂蚁开发者大赛

暂无

Kesci

01)首届生物特征识别技术开发者大赛 (2018) ¥200,000

赛题一:基于百度 PaddlePaddle 完成有灰度图的人脸验证(算法题)赛题二:云从人脸识别技术在智慧校园中的应用(产品设计题)

02)同盾科技声纹识别建模大赛 ¥ 276,000

要求基于给定的训练数据建立模型,从而可对任给定的两段语音数据,模型输出这两段语音是由同一个人说的概率p, p∈[0,1]

python 哪些比赛-国内数据挖掘比赛有哪些?相关推荐

  1. 【干货】Kaggle 数据挖掘比赛经验分享(mark 专业的数据建模过程)

    简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台.笔者从 2013 年开始,陆续参加了多场 Kaggle上面举办的比赛,相继获得了 C ...

  2. Kaggle 数据挖掘比赛经验分享 (转载)

     [干货]Kaggle 数据挖掘比赛经验分享 (转载) 标签: 数据挖掘数据科学家机器学习kaggle 2017-05-21 19:25 99人阅读 评论(0) 收藏 举报 本文章已收录于: 分类 ...

  3. kl散度度量分布_数据挖掘比赛技巧——确定数据同分布

    在数据挖掘比赛中,很重要的一个技巧就是要确定训练集与测试集特征是否同分布,这也是机器学习的一个很重要的假设[1].但很多时候我们知道这个道理,却很难有方法来保证数据同分布,这篇文章就分享一下我所了解的 ...

  4. kaggle账号_Kaggle 数据挖掘比赛经验分享

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 腾讯广告算法大赛 作者 | 陈成龙 Kaggle 于 2010 年创立,专注数据科学,机器学 ...

  5. Kaggle 数据挖掘比赛经验分享(转)

    原作者:陈成龙 简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台.笔者从 2013 年开始,陆续参加了多场 Kaggle上面举办的比赛 ...

  6. 【干货】Kaggle 数据挖掘比赛经验分享

    [干货]Kaggle 数据挖掘比赛经验分享 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台.笔者从 2013 年开始,陆续参加了多场 Ka ...

  7. 【干货】Kaggle数据挖掘比赛经验分享,陈成龙博士整理!

    来源:腾讯广告算法大赛(ID:TSA-Contest) 作者简介 陈成龙, 2015 年博士毕业于中山大学,研究图像篡改检测,在图像领域顶级期刊IEEE TIP上发表论文2篇,Kaggle Crowd ...

  8. Kaggle 数据挖掘比赛经验分享

    kaggle历期比赛解决方案汇总 - 简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台.笔者从 2013 年开始,陆续参加了多场 Ka ...

  9. 数据挖掘比赛常用数据处理函数

    文章目录 写在前面 1.pandas apply applymap map 的使用 2. csr csc 稀疏矩阵 3. pandas 表连接 并显示连接后的NaN值 输出数组中出现次数最多的元素 v ...

最新文章

  1. Rails全局处理Error
  2. java编译器 Javac 编译原理
  3. python文档的数据读取,把读取数据写入到新的表里
  4. 有关于idea快捷键冲突的问题
  5. java不使用除号实现除法运算_LeetCode29 Medium 不用除号实现快速除法
  6. DateTimePicker 日期时间选择器报错 Cannot read property ‘getHours‘ of undefined, 无法选中`[__ob_: observer__]`时做判断
  7. matlab机械臂工作空间代码_老外研发模拟肌肉运动的机械臂,与人类协同工作动作完美同步...
  8. 零售创新决胜新消费暨2021中国网络零售TOP100榜单
  9. 已知数组存放一批QQ号码,QQ号码最长为11位,最短为5位String[] strs = {“12345“,“67891“,“12347809933“,“98765432102“,“67891“,“1
  10. Springt Boot(7)----一种快捷搭建Spring Boot应用
  11. win10 Abaqus2018 血泪备注
  12. 无法删除文件 无法读取源文件或磁盘_U盘损坏“无法读取文件”不要慌,教你一招马上回血复活...
  13. php大马程序_php大马是什么
  14. J2SDK 安装配置指南
  15. CAD-Arcgis 坐标校正
  16. 移动体验大作战,冰桶算法全盘点
  17. Centos 设置开机自动启动脚本
  18. 用AI如何预测《权力的游戏》死亡名单?真是神了!
  19. FFMPEG直播推流
  20. 小程序毕设作品之微信美食菜谱小程序毕业设计成品(3)后台功能

热门文章

  1. win10的怎么调计算机亮度,win10电脑亮度怎么调
  2. 数据中心交换机与普通交换机有什么不同?
  3. 针式打印机连续打印多走纸_针织打印机以及更多开放源代码的艺术品
  4. 个人对软件工程的期望及个人目标
  5. 计算机网络_选择题(一)
  6. 第一章 集总参数电路中电压、电流的约束关系
  7. keil问题:报 ***WARNING L25: DATA TYPES DIFFERENT 警告,是什么问题?
  8. 谷歌2022学术指标出炉!Nature继续霸榜,CVPR第4,计算机5顶会入Top20
  9. fadeIn fadeOut
  10. 前端通过Ajax请求从后台返回数据到页面显示,实现分页功能