国内首本数据竞赛图书《阿里云天池大赛赛题解析——机器学习篇》今日开启预售!
天池平台已经举办了超过 200 场来自真实业务场景的竞赛,每场赛事沉淀的课题和数据集,将在天池保留和开放。天池平台已成为在校学生踏入职场前的虚拟实践基地,也成为聚集40万数据人才,孵化2000余家数据创新工作室的数据智能大社区。
七年前,天池团队的几名创始成员带着*“让全世界没有能力Access到大数据的人可以公平地Access到大数据” *的信念,走上了建设天池的道路。
这7年间,天池举办了超过200场来自真实业务场景的竞赛。从2014年的首场天池天猫推荐算法挑战赛到2015年的阿里巴巴集团算法黄金联赛,天池在阿里巴巴经济体内各条业务线成功地燃起了一把火,电商、金融、物流、文娱业务都相继在天池开放数据并举办算法竞赛。与此同时,高校也弥漫着浓浓的天池竞赛风,很多学生通过参加天池竞赛拿到了阿里巴巴校招的Offer。
为了满足社区开发者的学习诉求,帮助其更快地入门和成长,阿里云天池平台不仅把每场赛事沉淀的课题和数据集在天池永久保留和开放,还思考如何把头部玩家沉淀的珍贵解决方案和技术分享出来,让他们的经验成为某种可参考、可依循的轨迹,帮助初级开发者入门。显然,一本基于天池大数据竞赛实战经验和技术积累、从应用场景出发的算法图书是最好的输出形式,因此,天池平台联合电子工业出版社博文视点出版了《阿里云天池大赛赛题解析——机器学习篇》,并且正式预售啦!
天池平台 著
国内第一本针对竞赛实操的图书揭开人工智能算法的神秘面纱透析大赛专业选手的解题思路
四大经典场景无保留全解密
多年来,阿里云的天池大赛深受海内外热爱人工智能的学生的欢迎,大赛提供了海量的实际应用场景数据,其都是学生在校园场景中难以触及的。天池团队从200多场竞赛中筛选了最典型的四大竞赛——
工业蒸汽预测
天猫用户重复购买预测
O2O优惠券预测
阿里云安全恶意程序检测
每个竞赛都从赛题理解、数据探索、特征工程、模型训练、模型验证、特征优化、模型融合7个步骤展开讲解、层层递进,解析竞赛内容和解决方案,并提供全部的源码、数据集。为了让学习者更方便参与进来,天池还提供了免费的线上编码环境PAI DSW(Data Science Workshop),你无需下载和安装任何编程环境,在任何平台(Mac\Windows\Linux等)都可以无缝参与使用,点击这里查看DSW使用方法。
人人受用的实操手册
如果你想开始你的算法学习和竞赛之路,如果你想在竞赛中取得更好的成绩,如果你想知道普通选手和优秀选手的差距,如果你也想通过竞赛拿到更好的offer……那么无论你是小白还是大神,我都推荐你学习本书。作为小白,这是一本很适合的竞赛入门书,也是一本很好的算法学习实践图书;作为大神,你可以通过本书实战内容梳理自己的竞赛知识点和技能圈,查漏补缺,更上一层楼!
▊ 本书结构
赛题一 工业蒸汽量预测
1 赛题理解
1.1 赛题背景1.2 赛题目标1.3 数据概览1.4 评估指标1.5 赛题模型
2 数据探索
2.1 理论知识2.2 赛题数据探索
3 特征工程
3.1 特征工程的重要性和处理3.2 数据预处理和特征处理3.3 特征降维3.4 赛题特征工程
4 模型训练
4.1 回归及相关模型4.2 赛题模型训练
5 模型验证
5.1 模型评估的概念和方法5.2 模型调参5.3 赛题模型验证和调参
6 特征优化
6.1 特征优化的方法936.2 赛题特征优化
7 模型融合
7.1 模型优化7.2 赛题模型融合赛题二 天猫用户重复购买预测**1 赛题理解**1.1 赛题背景1.2 数据介绍1.3 评估指标1.4 赛题分析
2 数据探索
2.1 理论知识2.2 赛题数据探索
3 特征工程
3.1 特征工程介绍3.2 赛题特征工程思路3.3 赛题特征工程构造
4 模型训练
4.1 分类的概念4.2 分类相关模型
5 模型验证
5.1 模型验证指标5.2 赛题模型验证和评估
6 特征优化
6.1 特征选择技巧6.2 赛题特征优化赛题三 O2O优惠券预测**1 赛题理解**1.1 赛题介绍1.2 赛题分析
2 数据探索
2.1 理论知识2.2 初步的数据探索2.3 数据分布
3 特征工程
3.1 赛题特征工程思路3.2 赛题特征构建3.3 对特征进行探索
4 模型训练
4.1 模型训练与评估4.2 不同算法模型的性能对比4.3 结果输出
5 模型验证
5.1 评估指标
5.2 交叉验证
5.3 模型比较
5.4 验证结果可视化
5.5 结果分析5.6
模型调参5.7
实际方案
6 提交结果
6.1 整合及输出结果
6.2 结果提交及线上验证
赛题四 阿里云安全恶意程序检测
1 赛题理解
1.1 赛题介绍
1.2 赛题分析
2 数据探索
2.1 训练集数据探索
2.2 测试集数据探索
2.3 数据集联合分析
3 特征工程与基线模型
3.1 特征工程概述
3.2 构造线下验证集
3.3 基线模型
4 高阶数据探索
4.1 变量分析
4.2 高阶数据探索实战
5 特征工程进阶与方案优化
5.1 pivot特征构建
5.2 业务理解和结果分析
5.3 特征工程进阶实践
6 优化技巧与解决方案升级
6.1 优化技巧:Python处理大数据的技巧
6.2 深度学习解决方案:TextCNN建模
7 开源方案学习
天池大赛提供了一个“云”上的练兵场,让所有对人工智能应用感兴趣的开发者都能很容易地触达业界的实际需求和场景。基于天池的实际案例,本书向读者提供了一手的体感和经验,非常值得一读。
—— 阿里巴巴副总裁 贾扬清
更多科技资讯请见微信公众号:博文视点Broadview(微信号:bvbooks)
国内首本数据竞赛图书《阿里云天池大赛赛题解析——机器学习篇》今日开启预售!相关推荐
- 阿里云天池大赛赛题解析——机器学习篇
阿里云天池大赛赛题解析--机器学习篇 (豆瓣)图书阿里云天池大赛赛题解析--机器学习篇 介绍.书评.论坛及推荐 https://book.douban.com/subject/35192976/ 阿里 ...
- 阿里云天池大赛赛题解析——机器学习篇 | 留言赠书
国内第一本针对竞赛实操的图书:<阿里云天池大赛赛题解析--机器学习篇>,正式发售. 阿里云天池7年200多场数据大赛精华提取录 为什么写这本书 七年前,天池团队的几名创始成员带着" ...
- 【阿里云天池大赛赛题解析 机器学习篇】卡方检验
卡方检验针对分类变量,是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大:反之,二者偏差越小:若两个值完全相等时 ...
- 阿里云天池大赛赛题(机器学习)——天猫用户重复购买预测(完整代码)
目录 赛题背景 全代码 导入包 读取数据(训练数据前10000行,测试数据前100条) 读取全部数据 获取训练和测试数据 切分40%数据用于线下验证 交叉验证:评估估算器性能 F1验证 Shuffle ...
- 阿里云天池大赛赛题(机器学习)——工业蒸汽量预测(完整代码)
目录 赛题背景 全代码 导入包 导入数据 合并数据 删除相关特征 数据最大最小归一化 画图:探查特征和标签相关信息 对特征进行Box-Cox变换,使其满足正态性 标签数据统计转换后的数据,计算分位数画 ...
- 阿里云天池大赛赛题(机器学习)——阿里云安全恶意程序检测(完整代码)
目录 赛题背景 全代码(ML 和 DL) 特征工程进阶与方案优化 代码 特征工程进阶部分 基于LightGBM 的模型验证 模型测试 深度学习解决方案:TextCNN建模 代码 数据读取 数据预处理 ...
- 阿里云天池大赛赛题(机器学习)——O2O优惠券预测(完整代码)
目录 赛题背景 全代码 算法包及全局变量 工具函数 训练及结果输出 算法分析 调参 整合及输出结果 赛题实践 结果生成 绘制学习曲线 参数调优 赛题背景 O2O行业天然关联着数亿消费者,各类App每天 ...
- 阿里云天池大赛赛题解析——深度学习篇
阿里云天池大赛赛题解析--深度学习篇 (豆瓣)图书阿里云天池大赛赛题解析--深度学习篇 介绍.书评.论坛及推荐 https://book.douban.com/subject/35596114/
- 【赠书】阿里云天池大赛赛题解析,深度学习篇!
阿里云天池作为国内知名的竞赛平台和AI社区,自诞生以来就一直秉持着让更多人公平获得大数据的理念.也正因此,天池每场经典赛事沉淀的课题和数据集都会永久保留和开放.截至目前,天池平台已举办了超过20 ...
最新文章
- makefile讲义(1)——makefile基础(概述)
- springmvc + jquery 错误.ClassNotFoundException: org.apache.taglibs.standard.tlv.JstlCoreTLV
- gbdt和xgboost区别
- Struts2框架执行流程
- Spring MVC中的拦截器/过滤器HandlerInterceptorAdapter的使用
- Java基础 Day04(个人复习整理)
- All-In-One Code Framework [一站式示例代码库] 【转】
- eclipse 编码设置之BOM丢失
- Ubuntu ufw 取消 网关到 224.0.0.1 multicast 日志
- 官网下载Tomcat
- linux ubuntu安装教程 pdf,Ubuntu下安装PDF阅读器Okular
- md5算法大作战推html5版本,MD5大作战
- HaaS EDU K1设备资源总体介绍
- Android11 手动屏幕亮度调节流程代码追踪;
- Derek Sivers:我是一个慢思考者(译)
- 桌面小部件Wight父类AppWidgetProvider的三个方法
- vulcan测试记录
- 【DB笔试面试594】在Oracle中,关键字NOLOGGING、APPEND和PARALLEL提高DML性能方面有什么差别?...
- MCU接入阿里物联网平台遇到的各种坑
- python numpy array 数组维度转换(转维)