先把来源写上

来源:贪心学院,https://www.zhihu.com/people/tan-xin-xue-yuan/activities

knn回归作业

二手车估计案例

import pandas as pd
import matplotlib
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
#读取数据
df = pd.read_csv('data.csv')
df  # data frame

数据预处理

  • Color 是文本,onehot
  • 文本转数字
  • 标准化

onehot编码用get_dummies

#清洗数据
# 把颜色独热编码
df_colors = df['Color'].str.get_dummies().add_prefix('Color: ')
# 把类型独热编码
df_type = df['Type'].apply(str).str.get_dummies().add_prefix('Type: ')
# 添加独热编码数据列
df = pd.concat([df, df_colors, df_type], axis=1)
# 去除独热编码对应的原始列
df = df.drop(['Brand', 'Type', 'Color'], axis=1)df

# 数据转换
matrix = df.corr()
f, ax = plt.subplots(figsize=(8, 6))
sns.heatmap(matrix, square=True)
plt.title('Car Price Variables')

sns.pairplot(df[['Construction Year', 'Days Until MOT', 'Odometer', 'Ask Price']], size=3)
plt.show()


numpy.ravelj就是reshape(-1, order=order)

from sklearn.neighbors import KNeighborsRegressor
from sklearn.model_selection import train_test_split
from sklearn import preprocessing  # 预处理
from sklearn.preprocessing import StandardScaler  # 标准化
import numpy as npX = df[['Construction Year', 'Days Until MOT', 'Odometer']]
y = df['Ask Price'].values.reshape(-1, 1) # Series 转 ndarray
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=41)X_normalizer = StandardScaler() # N(0,1)
# 先用x_train   fit
X_train = X_normalizer.fit_transform(X_train)
X_test = X_normalizer.transform(X_test)y_normalizer = StandardScaler()
y_train = y_normalizer.fit_transform(y_train)
y_test = y_normalizer.transform(y_test)knn = KNeighborsRegressor(n_neighbors=2)
# knn.fit(X_train, y_train.ravel())
knn.fit(X_train, y_train)#Now we can predict prices:
y_pred = knn.predict(X_test)
y_pred_inv = y_normalizer.inverse_transform(y_pred)
y_test_inv = y_normalizer.inverse_transform(y_test)# Build a plot
plt.scatter(y_pred_inv, y_test_inv)
plt.xlabel('Prediction')
plt.ylabel('Real value')# Now add the perfect prediction line
diagonal = np.linspace(500, 1500, 100)
plt.plot(diagonal, diagonal, '-r')
plt.xlabel('Predicted ask price')
plt.ylabel('Ask price')
plt.show()print(y_pred_inv)

贪心科技机器学习训练营(三)相关推荐

  1. 近期活动盘点:高级机器学习训练营、基于神经网络的代码自动生成” “开放学术图谱”、西山金融科技产业创新论坛...

    想知道近期有什么最新活动?大数点为你整理的近期活动信息在此: 清华唐杰教授授课 高级机器学习训练营 我们都知道随着数据复杂度的不断提高,经典机器学习算法已经很难满足实际需求,当前,针对复杂数据对象.复 ...

  2. 机器学习训练营-基于XGBoost的分类预测学习笔记

    文章目录 前言 一.学习知识点概要 二.学习内容 1 XGBoost的应用及优缺点 1.1 XGBoost的应用 1.2 XGBoost的优缺点 2 基于天气数据集的XGBoost分类实战 2.1 目 ...

  3. 龙珠机器学习训练营-LightGBM笔记

    本学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容,学习链接为:添加链接描述 1.学习知识点概要 了解 LightGBM 的参数与相关知识: 掌握 LightGBM 的Python调用并将其运用到 ...

  4. 重修-龙珠计划机器学习训练营task3-LightGBM学习笔记

    文章标题:龙珠计划机器学习训练营task3-LightGBM学习笔记 一.学习知识点概要 LightGBM是2017年由微软推出的可扩展机器学习系统,是微软旗下DMKT的一个开源项目,由2014年首届 ...

  5. 机器学习训练营--快来一起挖掘幸福感吧

    文章目录 前言 一.赛题理解 1.1 实验环境 1.2 背景介绍 1.3 数据信息 1.4 评价指标 二.探索性数据分析(EDA)& 特征工程 2.1 为什么要做探索性数据分析 2.2 探索性 ...

  6. 天池龙珠计划——机器学习训练营 Task3

    目录 前言 LightGBM介绍 实战 前言 笔记,记录龙珠机器学习训练营Task3,关于lightgbm的学习.与前两个阶段一样,主要重心放在实际应用上,毕竟学习这个主要是用于一些比赛. Light ...

  7. 龙珠机器学习训练营机器学习基础知识笔记

    本学习笔记为阿里云天池龙珠计划机器学习训练营的学习内容,学习链接为:添加链接描述 学习知识点概要 1.了解 逻辑回归 的理论 2.掌握 逻辑回归 的 sklearn 函数调用使用并将其运用到鸢尾花数据 ...

  8. 重修-龙珠计划机器学习训练营task1-part2学习笔记

    文章标题:龙珠计划机器学习训练营task1-part2学习笔记 一.学习知识点概要 利用鸢花数据(iris)进行逻辑回归方法的训练,该数据集一共包含5个变量,其中4个特征变量,1个目标分类变量.共有1 ...

  9. 机器学习(三)树模型

    机器学习(一)LR 机器学习(二)SVM 机器学习(三)树模型 机器学习(四)聚类 机器学习(三)树模型 目录 二.树模型 1.ID3 2.C4.5 3.CART树 (1)算法步骤 (2)举例 (3) ...

  10. Python机器学习(三)--决策树算法

    Python机器学习(三)--决策树算法 原创  2014年07月14日 13:57:55

最新文章

  1. docker容器互联
  2. 重磅直播|结构光的非线性问题与校正
  3. Vue自定义指令实现下拉加载:v-loadmore
  4. 一种去中心化的manager设计思路
  5. 【PHP发展史】PHP5.2 到 PHP5.6 中新增的功能详解
  6. Xcode5 如何添加一个Github/Repository 并且Checkout
  7. Java IO多路复用机制详解
  8. 【在线学习版】欢迎使用Markdown编辑器(可以多开网页看着编辑)
  9. 微导管行业调研报告 - 市场现状分析与发展前景预测
  10. NOI Linux 2.0版发布
  11. 用计算机画图教案评价,电脑画图教案
  12. Java之秒杀活动解决方案
  13. 微信图片去除马赛克_怎么给图片打上马赛克(模糊处理、涂抹)
  14. 爬虫第二弹:千图网电商淘宝模板图片下载
  15. e3是合法浮点数吗_下面四个选项中,均是合法浮点数的是()
  16. DELL笔记本电脑电池不充电以及键盘失灵问题
  17. win32游戏开发(2) --连连看游戏制作(vc++版)
  18. Delphi CreateMutex 防止程序多次运行
  19. 计算机技术网络信息安全
  20. android 监听手机屏幕唤醒和睡眠广播

热门文章

  1. 开普勒行星运动三定律
  2. windows powershell 将U盘启动盘还原回普通U盘
  3. excel批量删除所有空白行
  4. centos ipv6 网卡_centOS添加ipv6支持(仅限已分配ipv6地址和网关)
  5. C语言中的除法运算符( /)
  6. 关于数组中的大括号{}和数组的遍历
  7. excel文件保护忘记密码解除
  8. 小波变换(matlab)-常见脚本函数
  9. 汉字在c语言中用什么表示,在C语言中显示汉字
  10. java源码之 io 流源码解读(一)