《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施
@[TOC]《零基础入门数据挖掘 - 二手车交易价格预测》baseline实施
《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施
前面陆陆续续学习机器学习大概有有2个月的时间,西瓜书没有看完,吴恩达的视频也没有看完。春节期间开始参加阿里巴巴智能运维算法大赛,和小伙伴一起通力合作,勉强进入复赛,感到力有不逮,基础不够牢固。前几天看到天池举行了《零基础入门数据挖掘 - 二手车交易价格预测》的比赛,并且出了官方Baseline。
初略的看了一遍Baseline,感觉写的非常好,数据分析EDA、特征工程、参数调整等等全部都有,并且出了官方教程,感觉就是一本零基础入门的宝书。
下面将我实施Baseline的过程写下来,供大家参考。
Fork Baseline
Baseline的链接在这里
最新版本为V11。
- 点击右上角的“Fork”按钮,fork到自己的天池实验室空间;
- 标题可以修改,你可以下载Notebook到本地运行。
修改数据集
我试过使用天池的公共数据集,不稳定,会出现不能读取的问题。
上传数据到自己的个人空间。
- 在个人空间建子目录“zero”;
- 上传文件到目录“zero”
- 在Notebook里检查文件
修改提交文件路径
将提交文件路径也设置到刚才新建的目录里。
运行Baseline Notebook
这个Baseline写的很好,做了上面的配置后,就可以正常运行了。
- 运行Notebook;
可以点击中间的按钮单步执行,也可以点击右面的按钮执行全部程序。
- 下载提交文件
- 到比赛页面提交即可。
Baseline在没有修改的情况下,成绩大概的680分。
《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施相关推荐
- Task 3 特征工程 Datawhale零基础入门数据挖掘- 二手车交易价格预测
Task 3 特征工程 Datawhale零基础入门数据挖掘- 二手车交易价格预测 Tips:此部分为零基础入门数据挖掘的Task3特征工程部分,主要包含各种特征工程以及分析方法 赛题:零基础入没人能 ...
- 零基础入门数据挖掘——二手车交易价格预测:baseline
零基础入门数据挖掘 - 二手车交易价格预测 赛题理解 比赛要求参赛选手根据给定的数据集,建立模型,二手汽车的交易价格. 赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台 ...
- 零基础入门数据挖掘 - 二手车交易价格预测
1.赛题数据 赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量.为了保证比赛的公平性,将会 ...
- 20200404零基础入门数据挖掘 - 二手车交易价格预测笔记(5)
五.模型融合 5.1 模型融合目标 对于多种调参完成的模型进行模型融合,因为多个模型组合在一起通常可以产生更强大的模型. 5.2 内容介绍 模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式. ...
- 20200322零基础入门数据挖掘 - 二手车交易价格预测笔记(2)
二.EDA-数据探索性分析 前面的步骤就不做赘述了,我在下载好资料后,在jupyter notebook里将数据导入,随后进行课程内容的一系列指导操作,熟悉数据集,包括: 2.1 载入各种数据科学以及 ...
- 入门数据挖掘(二手车交易价格预测案例)(二):特征工程
特征工程 1 特征工程目标 2 内容介绍 3 代码示例 3.1 删除异常值 3.2 特征构造 特征筛选 经验总结 上一篇我们已经进行了数据探索性分析,对数据的特征有了初步的了解.下面我们就要进行特征工 ...
- 【算法竞赛学习】二手车交易价格预测-Baseline
二手车交易价格预测-Baseline Baseline-v1.0 版 Tip:这是一个最初始baseline版本,抛砖引玉,为大家提供一个基本Baseline和一个竞赛流程的基本介绍,欢迎大家多多交流 ...
- 【直播】王茂霖:二手车交易价格预测 Baseline 提高(河北高校数据挖掘邀请赛)
二手车交易价格预测 Baseline 提高 目前 河北高校数据挖掘邀请赛 正在如火如荼的进行中.为了大家更好的参赛,王茂霖分享了 从0梳理1场数据挖掘赛事!,完整梳理了从环境准备.数据读取.数据分析. ...
- 数据挖掘入门:二手车交易价格预测
题目和数据来源于:阿里天池数据挖掘学习赛 备注:本篇文章主要目的是为了通过阿里天池的入门教程,保存一下数据挖掘中的一般步骤,因此解释性工作较少,主要是方便自己未来作为参照使用. 其中下面的主要代码参考 ...
最新文章
- styleable cannot be resolved or is not a field
- Hexo自定义页面的两种方法
- c#的chart标题_C#中CHART画图
- 安装Oracle 10g sys,system 密码忘记设置解决办法
- 动态规划解题思路与总结(三万字)
- Vue实现仿音乐播放器4-Vue-router实现音乐导航菜单切换
- PHP判断变量内容是什么编码(gbk?utf-8) mb_detect_encoding
- 在windows下运行spark
- 云小课 |选定合适的证书,做“有证”的合规域名
- ReactNative中iOS和Android的style分开设置教程
- OkHttp文件上传下载
- 基于SSM的物业管理系统-JSP MYSQL小区物业费管理系统
- 《C++新经典》第17章 并发与多线程
- img下方出现空隙的原因及解决办法
- FZU 1573 大学自习室
- 901虎年期待和变元的哥德尔数配置——哥德尔原著英译本拆解汉译之五
- OSG-简单模型控制
- Linux-CentOS 安装配置ExifTool
- 【为什么换了固态硬盘电脑会快?详解硬盘与内存的关系】
- 第一个被赋予公明身份的机器人_索菲亚成为首位被授予公民身份的机器人
热门文章
- Git 比 SVN 强在哪些地方?
- 年度重磅!《2022华为开发者宝典》多元生态技术精选,学练考一站式能力进阶
- 【内网安全】 横向移动WmiSmbCrackMapExecProxyChainsImpacket
- 博客之星csdn评论怎么加链接(csdn怎么在评论里加链接)
- a113 智能音箱芯片方案_收藏:10大芯片厂商,推出20款智能音箱解决方案
- wangeditor:一个页面使用多个wangeditor编辑器,并对wangeditor进行组件封装以及上传图片到自己的服务器
- 【动态规划/背包问题】背包问题第一阶段最终章:混合背包问题
- postman——post请求数据类型有哪些?
- Lenovo Modern ImController 服务卸载工具
- uniapp 本地打包apk 修改版本号