「赠书」贾扬清推荐,国内首本数据竞赛图书
点击上方蓝色“程序猿DD”,选择“设为星标”
回复“资源”获取独家整理的学习资料!
天池平台已经举办了超过 200 场来自真实业务场景的竞赛,每场赛事沉淀的课题和数据集,将在天池保留和开放。天池平台已成为在校学生踏入职场前的虚拟实践基地,也成为聚集40万数据人才,孵化2000余家数据创新工作室的数据智能大社区。
七年前,天池团队的几名创始成员带着“让全世界没有能力Access到大数据的人可以公平地Access到大数据” 的信念,走上了建设天池的道路。
这7年间,天池举办了超过200场来自真实业务场景的竞赛。
从2014年的首场天池天猫推荐算法挑战赛到2015年的阿里巴巴集团算法黄金联赛,天池在阿里巴巴经济体内各条业务线成功地燃起了一把火,电商、金融、物流、文娱业务都相继在天池开放数据并举办算法竞赛。与此同时,高校也弥漫着浓浓的天池竞赛风,很多学生通过参加天池竞赛拿到了阿里巴巴校招的Offer。
为了满足社区开发者的学习诉求,帮助其更快地入门和成长,阿里云天池平台不仅把每场赛事沉淀的课题和数据集在天池永久保留和开放,还思考如何把头部玩家沉淀的珍贵解决方案和技术分享出来,让他们的经验成为某种可参考、可依循的轨迹,帮助初级开发者入门。
显然,一本基于天池大数据竞赛实战经验和技术积累、从应用场景出发的算法图书是最好的输出形式,因此,天池平台联合电子工业出版社博文视点出版了《阿里云天池大赛赛题解析——机器学习篇》,并且正式预售啦!
天池平台 著
国内第一本针对竞赛实操的图书
揭开人工智能算法的神秘面纱
透析大赛专业选手的解题思路
▼
↓ 本书详情↓
四大经典场景无保留全解密
多年来,阿里云的天池大赛深受海内外热爱人工智能的学生的欢迎,大赛提供了海量的实际应用场景数据,其都是学生在校园场景中难以触及的。
天池团队从200多场竞赛中筛选了最典型的四大竞赛——
工业蒸汽预测
天猫用户重复购买预测
O2O优惠券预测
阿里云安全恶意程序检测
每个竞赛都从赛题理解、数据探索、特征工程、模型训练、模型验证、特征优化、模型融合7个步骤展开讲解、层层递进,解析竞赛内容和解决方案,并提供全部的源码、数据集。
为了让学习者更方便参与进来,天池还提供了免费的线上编码环境PAI DSW(Data Science Workshop),你无需下载和安装任何编程环境,在任何平台(Mac\Windows\Linux等)都可以无缝参与使用,点击这里查看DSW使用方法。
人人受用的实操手册
如果你想开始你的算法学习和竞赛之路,
如果你想在竞赛中取得更好的成绩,
如果你想知道普通选手和优秀选手的差距,
如果你也想通过竞赛拿到更好的offer……
那么无论你是小白还是大神,我都推荐你学习本书。
作为小白,这是一本很适合的竞赛入门书,也是一本很好的算法学习实践图书;作为大神,你可以通过本书实战内容梳理自己的竞赛知识点和技能圈,查漏补缺,更上一层楼!
▊ 本书结构
赛题一 工业蒸汽量预测
1 赛题理解
1.1 赛题背景
1.2 赛题目标
1.3 数据概览
1.4 评估指标
1.5 赛题模型
2 数据探索
2.1 理论知识
2.2 赛题数据探索
3 特征工程
3.1 特征工程的重要性和处理
3.2 数据预处理和特征处理
3.3 特征降维
3.4 赛题特征工程
4 模型训练
4.1 回归及相关模型
4.2 赛题模型训练
5 模型验证
5.1 模型评估的概念和方法
5.2 模型调参
5.3 赛题模型验证和调参
6 特征优化
6.1 特征优化的方法93
6.2 赛题特征优化
7 模型融合
7.1 模型优化
7.2 赛题模型融合
赛题二 天猫用户重复购买预测
1 赛题理解
1.1 赛题背景
1.2 数据介绍
1.3 评估指标
1.4 赛题分析
2 数据探索
2.1 理论知识
2.2 赛题数据探索
3 特征工程
3.1 特征工程介绍
3.2 赛题特征工程思路
3.3 赛题特征工程构造
4 模型训练
4.1 分类的概念
4.2 分类相关模型
5 模型验证
5.1 模型验证指标
5.2 赛题模型验证和评估
6 特征优化
6.1 特征选择技巧
6.2 赛题特征优化
赛题三 O2O优惠券预测
1 赛题理解
1.1 赛题介绍
1.2 赛题分析
2 数据探索
2.1 理论知识
2.2 初步的数据探索
2.3 数据分布
3 特征工程
3.1 赛题特征工程思路
3.2 赛题特征构建
3.3 对特征进行探索
4 模型训练
4.1 模型训练与评估
4.2 不同算法模型的性能对比
4.3 结果输出
5 模型验证
5.1 评估指标
5.2 交叉验证
5.3 模型比较
5.4 验证结果可视化
5.5 结果分析
5.6 模型调参
5.7 实际方案
6 提交结果
6.1 整合及输出结果
6.2 结果提交及线上验证
赛题四 阿里云安全恶意程序检测
1 赛题理解
1.1 赛题介绍
1.2 赛题分析
2 数据探索
2.1 训练集数据探索
2.2 测试集数据探索
2.3 数据集联合分析
3 特征工程与基线模型
3.1 特征工程概述
3.2 构造线下验证集
3.3 基线模型
4 高阶数据探索
4.1 变量分析
4.2 高阶数据探索实战
5 特征工程进阶与方案优化
5.1 pivot特征构建
5.2 业务理解和结果分析
5.3 特征工程进阶实践
6 优化技巧与解决方案升级
6.1 优化技巧:Python处理大数据的技巧
6.2 深度学习解决方案:TextCNN建模
7 开源方案学习
天池大赛提供了一个“云”上的练兵场,让所有对人工智能应用感兴趣的开发者都能很容易地触达业界的实际需求和场景。基于天池的实际案例,本书向读者提供了一手的体感和经验,非常值得一读。
—— 阿里巴巴副总裁 贾扬清
—— 了解本书详情 ——
赠书活动
截止时间:2020年9月20日 17:00
如何抽奖:扫描下方二维码,关注公众号,回复关键词 :抽奖
「赠书」贾扬清推荐,国内首本数据竞赛图书相关推荐
- 国内首本数据竞赛图书《阿里云天池大赛赛题解析——机器学习篇》今日开启预售!
天池平台已经举办了超过 200 场来自真实业务场景的竞赛,每场赛事沉淀的课题和数据集,将在天池保留和开放.天池平台已成为在校学生踏入职场前的虚拟实践基地,也成为聚集40万数据人才,孵化2000余家数据 ...
- 国内首本Android开发图书之双剑
国内首本Android开发图书之双剑Google Android SDK开发范例大全 (china-pub首发热卖中) [市场价]¥79.00 [PUB价]¥59.25 详情查看:http://www ...
- 有没有什么高效「炼丹」神器可以推荐?复旦fastNLP团队祭出内部调参利器fitlog...
机器之心报道 参与:Racoon X.张倩 集 Tabular 显示实验结果.自定义备忘.前端操作删除/隐藏记录.自动 git commit 等诸多功能于一体,这个调参神器助你高效「炼出金丹」. 「有 ...
- 周五周末每天1小时,未成年人网游「防沉迷」靠刷脸、大数据验证身份?
周末不能补课,平时也不能玩游戏. 本文转自机器之心 8 月 30 日,国家新闻出版署发布了<关于进一步严格管理切实防止未成年人沉迷网络游戏的通知>,限制 18 岁以下未成年人每天玩网络游戏 ...
- 阿里巴巴集团副总裁贾扬清:开源大数据生态前瞻
2019阿里云峰会·上海开发者大会于7月24日盛大开幕,本次峰会与未来世界的开发者们分享开源大数据.IT基础设施云化.数据库.云原生.物联网等领域的技术干货,共同探讨前沿科技趋势.本文整理自开源大数据 ...
- 微软旷视人脸识别100%失灵!照片「隐身衣」,帮你保护照片隐私数据
本文经AI新媒体量子位(公众号ID:QbitAI)授权转载,转载请联系出处. 左图,右图,你能看出区别吗? 其实,算法已经悄悄给右边的照片加上了微小的修改. 但就是这样肉眼根本看不出来的扰动,就能10 ...
- 【数据竞赛】2020年11月国内大数据竞赛信息-奖池5000万
2020年11月:下面是截止到2020年11月国内还在进行中的大数据比赛题目,非常丰富,大家选择性参加,初学者可以作为入门练手,大佬收割奖金,平时项目不多的,比赛是知识非常好的实践方式,本号会定期发布 ...
- 多特征值数据预处理_「人工智能」No.6 特征工程之数据预处理
[导读:当今人类即将或者已然了进入智能时代,这是·情报通·人工智能科普系列第[6]篇文章,欢迎阅读和收藏!] 1 基本概念 "数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已 ...
- python学生数据完善程序_「Python」每日一练:学生数据完善程序
编程题 1.现有一程序已创建了4个列表,这4个列表中有添加元素,但列表中的数据不完善,有一定的错误,内容如下所示: list1=["学号","姓名"," ...
最新文章
- 敏捷开发中的故事点到底是什么?如何预估故事点?
- SalttSack自动化运维(二)——环境安装及部署
- Linux Kernel TCP/IP Stack — L1 Layer — NIC Controller — NAPI
- 舞蹈 | 拉丁美洲的节奏
- mfc中的.rc和.rc2出错fatal error RC1015: cannot open include file 'res\ModalD
- Polly的7种策略
- SAP 导出 HTML,【我sap这导出数据表格export.mhtml怎么转换为 excel 工作表.xlsx】excel生成html表格数据...
- [机器学习-实践篇]学习之线性回归、岭回归、Lasso回归,tensorflow实现的线性回归
- Cannot open precompiled header file: 'Debug/***.pch': No such file or directory
- 你不是编程挺厉害的吗?这都做不出来 | 硕士写给自己:努力应该适可而止
- 斜杠的意思是或还是和_pua是什么意思?我pua pua的解释给我老婆听!
- OpenShift免费空间绑定顶级域名(图文教程)
- Aircrack 破解无线网密码 (跑字典法)
- 乔布斯鲜为人知的私生活:低调、曾经多情
- 进制转换(C++实现)
- Dummy variable (变量dummy化)
- 刀片服务器如何选择操作系统,刀片服务器如何选择操作系统?
- mysql查询今年过去的天数
- 调整变速器后拨详细图文教程
- Windows 缺失msvcp140.dll文件