数据挖掘流程记录

数据清洗

  • 数据清洗之异常值处理的常用方法
  • 异常值的处理
  • 异常值处理
  • 箱型图

特征选择

  • 特征选择方法最全总结
  • 数据挖掘之特征选择_dragon的专栏-CSDN博客_数据挖掘特征选择

比赛实战项目推荐

1.天池二手车交易价格预测:

项目地址:

零基础入门数据挖掘 - 二手车交易价格预测-天池大赛-阿里云天池

https://github.com/datawhalechina/team-learning-data-mining/blob/master/SecondHandCarPriceForecast/

项目笔记:

Datawhale 零基础入门数据挖掘-Baseline-天池实验室

Datawhale 零基础入门数据挖掘-Task2 数据分析-天池实验室

Datawhale 零基础入门数据挖掘-Task3 特征工程-天池实验室

Datawhale 零基础入门数据挖掘-Task4 建模调参-天池实验室

Datawhale 零基础入门数据挖掘-Task5 模型融合-天池实验室

天池二手车交易价格预测Task3-特征工程

零基础入门数据挖掘-课程汇总

数据挖掘比赛笔记总结相关推荐

  1. 【干货】Kaggle 数据挖掘比赛经验分享(mark 专业的数据建模过程)

    简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台.笔者从 2013 年开始,陆续参加了多场 Kaggle上面举办的比赛,相继获得了 C ...

  2. Kaggle 数据挖掘比赛经验分享 (转载)

     [干货]Kaggle 数据挖掘比赛经验分享 (转载) 标签: 数据挖掘数据科学家机器学习kaggle 2017-05-21 19:25 99人阅读 评论(0) 收藏 举报 本文章已收录于: 分类 ...

  3. kl散度度量分布_数据挖掘比赛技巧——确定数据同分布

    在数据挖掘比赛中,很重要的一个技巧就是要确定训练集与测试集特征是否同分布,这也是机器学习的一个很重要的假设[1].但很多时候我们知道这个道理,却很难有方法来保证数据同分布,这篇文章就分享一下我所了解的 ...

  4. kaggle账号_Kaggle 数据挖掘比赛经验分享

    文章发布于公号[数智物语] (ID:decision_engine),关注公号不错过每一篇干货. 来源 | 腾讯广告算法大赛 作者 | 陈成龙 Kaggle 于 2010 年创立,专注数据科学,机器学 ...

  5. Kaggle 数据挖掘比赛经验分享(转)

    原作者:陈成龙 简介 Kaggle 于 2010 年创立,专注数据科学,机器学习竞赛的举办,是全球最大的数据科学社区和数据竞赛平台.笔者从 2013 年开始,陆续参加了多场 Kaggle上面举办的比赛 ...

  6. python数据挖掘学习笔记】十九.鸢尾花数据集可视化、线性回归、决策树花样分析

    #2018-04-05 16:57:26 April Thursday the 14 week, the 095 day SZ SSMR python数据挖掘学习笔记]十九.鸢尾花数据集可视化.线性回 ...

  7. python数据挖掘学习笔记】十六.逻辑回归LogisticRegression分析鸢尾花数据

    但是很多时候数据是非线性的,所以这篇文章主要讲述逻辑回归及Sklearn机器学习包中的LogisticRegression算法 #2018-03-28 16:57:56 March Wednesday ...

  8. python数据挖掘学习笔记】十四.Scipy调用curve_fit实现曲线拟合

    #2018-03-28 10:02:08 March Wednesday the 13 week, the 087 day SZ SSMR python数据挖掘学习笔记]十四.Scipy调用curve ...

  9. python数据挖掘学习笔记】十三.WordCloud词云配置过程及词频分析

    #2018-03-28 09:59:40 March Wednesday the 13 week, the 087 day SZ SSMR 11,12因为涉及到数据库被我暂时放弃了 python数据挖 ...

最新文章

  1. map for循环_如何用Map、Filter和Reduce替换Python For循环?
  2. 虚拟专题:知识图谱 | 其他文章
  3. Matlab 生成vhdl,matlab - 使用HDL Workflow Advisor将Matlab代码转换为vhdl - 堆栈内存溢出...
  4. P2574 XOR的艺术
  5. [CodeForces 372A] Counting Kangaroos is Fun
  6. servlet的请求转发与重定向
  7. 安卓第十三天笔记-服务(Service)
  8. 为什么有些PDF打印不了
  9. js中如何获取font标签中的内容
  10. unity shader 溶解,上下左右,cutoff
  11. 情侣博客,我也想做一个。
  12. 深入理解风控中的 KS 原理
  13. 基于Win10单机部署kubernetes应用
  14. EPSON RX8010SJ RTC 调试笔记之五, 时钟及日历解析
  15. 我的理想200字计算机工程师,我的理想:工程师
  16. ISDN线路编码介绍
  17. strust框架下默认Action default-action-ref 出现HTTP Status 500错误
  18. Axure原型模板、元件库、组件库
  19. 一个事物两个方面的对比举例_对比:把两种相反的事物或一种事物相对立的两个方面作比较. 作用:鲜明地突出了主要事物或事物的主要方面的××特征....
  20. abb和plcsocket通讯_ABB控制系统与Siemens PLC间的数据通讯

热门文章

  1. 通过v$sqlarea,v$sql查询最占用资源的查询
  2. 【DFS】LeetCode 77. Combinations
  3. LeetCode 110. Balanced Binary Tree
  4. 【To Do】程序员面试金典——18.11最大子方阵
  5. 剑指offer——面试题56:链表中环的入口
  6. 前端跨域之Jsonp实现原理及.Net下Jsonp的实现
  7. CMakeFiles/species.inc.dir/build.make:57: recipe for target 'CMakeFiles/species.inc' failed
  8. git的安装和简单使用
  9. 网络虚拟化基础协议之Geneve
  10. 免费素材:包含 250+ 组件的 DO UI Kit