@[TOC]《零基础入门数据挖掘 - 二手车交易价格预测》baseline实施

《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施

前面陆陆续续学习机器学习大概有有2个月的时间,西瓜书没有看完,吴恩达的视频也没有看完。春节期间开始参加阿里巴巴智能运维算法大赛,和小伙伴一起通力合作,勉强进入复赛,感到力有不逮,基础不够牢固。前几天看到天池举行了《零基础入门数据挖掘 - 二手车交易价格预测》的比赛,并且出了官方Baseline。
  初略的看了一遍Baseline,感觉写的非常好,数据分析EDA、特征工程、参数调整等等全部都有,并且出了官方教程,感觉就是一本零基础入门的宝书。
  下面将我实施Baseline的过程写下来,供大家参考。

Fork Baseline

Baseline的链接在这里
最新版本为V11。

  1. 点击右上角的“Fork”按钮,fork到自己的天池实验室空间;
  2. 标题可以修改,你可以下载Notebook到本地运行。

修改数据集

我试过使用天池的公共数据集,不稳定,会出现不能读取的问题。
上传数据到自己的个人空间。

  1. 在个人空间建子目录“zero”;
  2. 上传文件到目录“zero”
  3. 在Notebook里检查文件

修改提交文件路径

将提交文件路径也设置到刚才新建的目录里。

运行Baseline Notebook

这个Baseline写的很好,做了上面的配置后,就可以正常运行了。

  1. 运行Notebook;
    可以点击中间的按钮单步执行,也可以点击右面的按钮执行全部程序。
  2. 下载提交文件
  3. 到比赛页面提交即可。

Baseline在没有修改的情况下,成绩大概的680分。

《零基础入门数据挖掘 - 二手车交易价格预测》Baseline实施相关推荐

  1. Task 3 特征工程 Datawhale零基础入门数据挖掘- 二手车交易价格预测

    Task 3 特征工程 Datawhale零基础入门数据挖掘- 二手车交易价格预测 Tips:此部分为零基础入门数据挖掘的Task3特征工程部分,主要包含各种特征工程以及分析方法 赛题:零基础入没人能 ...

  2. 零基础入门数据挖掘——二手车交易价格预测:baseline

    零基础入门数据挖掘 - 二手车交易价格预测 赛题理解 比赛要求参赛选手根据给定的数据集,建立模型,二手汽车的交易价格. 赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台 ...

  3. 零基础入门数据挖掘 - 二手车交易价格预测

    1.赛题数据 赛题以预测二手车的交易价格为任务,数据集报名后可见并可下载,该数据来自某交易平台的二手车交易记录,总数据量超过40w,包含31列变量信息,其中15列为匿名变量.为了保证比赛的公平性,将会 ...

  4. 20200404零基础入门数据挖掘 - 二手车交易价格预测笔记(5)

    五.模型融合 5.1 模型融合目标 对于多种调参完成的模型进行模型融合,因为多个模型组合在一起通常可以产生更强大的模型. 5.2 内容介绍 模型融合是比赛后期一个重要的环节,大体来说有如下的类型方式. ...

  5. 20200322零基础入门数据挖掘 - 二手车交易价格预测笔记(2)

    二.EDA-数据探索性分析 前面的步骤就不做赘述了,我在下载好资料后,在jupyter notebook里将数据导入,随后进行课程内容的一系列指导操作,熟悉数据集,包括: 2.1 载入各种数据科学以及 ...

  6. 入门数据挖掘(二手车交易价格预测案例)(二):特征工程

    特征工程 1 特征工程目标 2 内容介绍 3 代码示例 3.1 删除异常值 3.2 特征构造 特征筛选 经验总结 上一篇我们已经进行了数据探索性分析,对数据的特征有了初步的了解.下面我们就要进行特征工 ...

  7. 【算法竞赛学习】二手车交易价格预测-Baseline

    二手车交易价格预测-Baseline Baseline-v1.0 版 Tip:这是一个最初始baseline版本,抛砖引玉,为大家提供一个基本Baseline和一个竞赛流程的基本介绍,欢迎大家多多交流 ...

  8. 【直播】王茂霖:二手车交易价格预测 Baseline 提高(河北高校数据挖掘邀请赛)

    二手车交易价格预测 Baseline 提高 目前 河北高校数据挖掘邀请赛 正在如火如荼的进行中.为了大家更好的参赛,王茂霖分享了 从0梳理1场数据挖掘赛事!,完整梳理了从环境准备.数据读取.数据分析. ...

  9. 数据挖掘入门:二手车交易价格预测

    题目和数据来源于:阿里天池数据挖掘学习赛 备注:本篇文章主要目的是为了通过阿里天池的入门教程,保存一下数据挖掘中的一般步骤,因此解释性工作较少,主要是方便自己未来作为参照使用. 其中下面的主要代码参考 ...

最新文章

  1. styleable cannot be resolved or is not a field
  2. Hexo自定义页面的两种方法
  3. c#的chart标题_C#中CHART画图
  4. 安装Oracle 10g sys,system 密码忘记设置解决办法
  5. 动态规划解题思路与总结(三万字)
  6. Vue实现仿音乐播放器4-Vue-router实现音乐导航菜单切换
  7. PHP判断变量内容是什么编码(gbk?utf-8) mb_detect_encoding
  8. 在windows下运行spark
  9. 云小课 |选定合适的证书,做“有证”的合规域名
  10. ReactNative中iOS和Android的style分开设置教程
  11. OkHttp文件上传下载
  12. 基于SSM的物业管理系统-JSP MYSQL小区物业费管理系统
  13. 《C++新经典》第17章 并发与多线程
  14. img下方出现空隙的原因及解决办法
  15. FZU 1573 大学自习室
  16. 901虎年期待和变元的哥德尔数配置——哥德尔原著英译本拆解汉译之五
  17. OSG-简单模型控制
  18. Linux-CentOS 安装配置ExifTool
  19. 【为什么换了固态硬盘电脑会快?详解硬盘与内存的关系】
  20. 第一个被赋予公明身份的机器人_索菲亚成为首位被授予公民身份的机器人

热门文章

  1. Git 比 SVN 强在哪些地方?
  2. 年度重磅!《2022华为开发者宝典》多元生态技术精选,学练考一站式能力进阶
  3. 【内网安全】 横向移动WmiSmbCrackMapExecProxyChainsImpacket
  4. 博客之星csdn评论怎么加链接(csdn怎么在评论里加链接)
  5. a113 智能音箱芯片方案_收藏:10大芯片厂商,推出20款智能音箱解决方案
  6. wangeditor:一个页面使用多个wangeditor编辑器,并对wangeditor进行组件封装以及上传图片到自己的服务器
  7. 【动态规划/背包问题】背包问题第一阶段最终章:混合背包问题
  8. postman——post请求数据类型有哪些?
  9. Lenovo Modern ImController 服务卸载工具
  10. uniapp 本地打包apk 修改版本号