简单的数据分析--超简易

  • 前言
  • 总结

前言

这里的数据集合我们只针对于excel,其他数据格式之后再进行总结,本片分享包括通过代码导入数据集、对数据集进行切片操作(这一步主要实现得到自变量和因变量)、对于数据集进行训练集和测试集的划分、拟合模型,验证模型。这里没有什么复杂的代码逻辑只是需要记清楚做几件事情的代码语法即可,接下来我们直接上代码。

# 一个简单的一元线性回归模型# 导入我们需要的几个python包,这里有numpy、matplotlib、pandas
import numpy as np
import matplotlib.pyplot as plt
import pandas as pd# 导入我们需要的数据集
dataset=pd.read_excel(r'绝对路径+文件')
X=dataset.iloc[:,9].tolist()
y=dataset.iloc[:,13].tolist()# 将数据集划分为训练集与测试集
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size = 1/3, random_state = 0)# 特征缩放,如果我们两列的数据规模相差过大需要对数据进行特征缩放
"""from sklearn.preprocessing import StandardScaler
sc_X = StandardScaler()
X_train = sc_X.fit_transform(X_train)
X_test = sc_X.transform(X_test)
sc_y = StandardScaler()
y_train = sc_y.fit_transform(y_train)"""# 这里用到了机器学习中经典的Scikit-Learn包
from sklearn.linear_model import LinearRegression
regressor = LinearRegression()
regressor.fit(X_train, y_train)# 经过对模型的拟合,我们这里需要对测试集进行验证
y_pred = regressor.predict(X_test)# 对训练集进行可视化
plt.scatter(X_train, y_train, color = 'red')
plt.plot(X_train, regressor.predict(X_train), color = 'blue')
plt.title('Salary VS Experience (training set)')
plt.xlabel('Years of Experience')
plt.ylabel('Salary')
plt.show()# 对测试集进行可视化
plt.scatter(X_test, y_test, color = 'red')
plt.plot(X_train, regressor.predict(X_train), color = 'blue')
plt.title('Salary VS Experience (test set)')
plt.xlabel('Years of Experience')
plt.ylabel('Salary')
plt.show()

总结

这个只是数据分析代码模板中最简单地一个开始,这里我们主要需要掌握数据分析,数据我们怎么去拿,拿到数据之后如何去划分,怎么去处理,最后是怎样去跟模型进行拟合,拟合之后如何对数据进行验证以及可视化。

超简单的数据分析模板相关推荐

  1. LayUI超简单导出execl模板(无数据模板)

    因业务需求,点击按钮,生成一个execl模板,给用户按照模板填写数据 然后发现Layui自带一个带出execl的功能,可以作为生成execl模板直接使用,无后端交互,直接前端生成,并且只需几行数据. ...

  2. python在docx指定位置插表格_超简单Python将指定数据插入到docx模板指定位置渲染并保存...

    超简单Python将指定数据插入到docx模板渲染并生成 最近有一个需求,制作劳动合同表,要从excel表格中将每个人的数据导入到docx劳动合同中,重复量很大,因此可以使用python高效解决.为了 ...

  3. python与excel表格-超简单:用Python让Excel飞起来

    超简单:用Python让Excel飞起来 作者:王秀文;郭明鑫;王宇韬 编著 出版日期:2020年07月 文件大小:20.30M 支持设备: ¥45.00在线试读 适用客户端: 言商书局 iPad/i ...

  4. 基于vue-cli、elementUI的Vue超简单入门小例子

    基于vue-cli.elementUI的Vue超简单入门小例子 这个例子还是比较简单的,独立完成后,能大概知道vue是干嘛的,可以写个todoList的小例子. 开始写例子之前,先对环境的部署做点简单 ...

  5. 【微信小程序系列】微信小程序超简单教程,基本语法,获取用户基本数据信息,实现对云数据库的增删改查及小程序外部api的引用示例(附源码)

    [微信小程序系列]微信小程序超简单教程 小程序项目结构 静态页面的构成 HTML:结构 css:样式 js:行为 小程序 页面全部存放在pages, 而且pages目录只能存放页面 页面包括4个文件, ...

  6. html多张图片合在一块,多张照片怎么拼在一起?10张以上多图拼图方法 超简单! (全文)...

    近日,有小伙伴在"电脑百事网"公众号后台留言,问到这样一个问题"10张以上多张照片怎么拼在一起?",对于懂Ps的用户来说,拼图再简单不过了,但如果是问到如何拼图 ...

  7. 设计模式超简单的解释!

    设计模式超简单的解释!(本项目从 design-patterns-for-humans fork) 介绍 设计模式是反复出现问题的解决方案; 如何解决某些问题的指导方针.它们不是可以插入应用程序并等待 ...

  8. C# Winfrom Excel表格导出 Aspose.Cells超简单方式

    C# Winfrom Excel表格导出 Aspose.Cells超简单方式 首先需要下载 Aspose.Cells.dll,Aspose.Slides.dll,Aspose.Words.dll 这三 ...

  9. 超简单定制一个Notes库专门设置和存储用户头像

    大家好,才是真的好. 本篇依旧是技术讲解.我们先仔细讲述Sametime中的头像设置,即通过设置Domino目录中个人相应的PhotoURL字段,引用一个图片的URL地址,该用户即可读取到该图片作为头 ...

最新文章

  1. java类的注释模板_IDEA添加Java类注释模版的方法
  2. Protocol Buffer序列化协议及应用
  3. 使用高防后,服务器还是会受到***这是为什么?
  4. tornado连接数据库
  5. 微信小程序没登录跳到登录页怎么做_微信小程序手机端如何实现登录页面跳转含有Tabar页面...
  6. java抽象继承-模板方法
  7. ios逆向小试牛刀之操作手记
  8. 晨哥真有料丨到底合适重要,还是感觉重要!
  9. CentOS7安装配置启动MySQL(附解决password does not satisfy)
  10. jq实现剪裁图片设置为头像
  11. dom控制html元素编号,JavaScript DOM对象控制HTML元素详解
  12. de4dot构建过程
  13. 彻底解决[未识别的网络][公共网络]的问题
  14. Git 笔记 - git rebase
  15. 土气和洋气的方法不用π求圆的面积
  16. YAHOO工具库提供的方法
  17. TOPMOST窗口属性失效的一种场景
  18. 各大搜索引擎爬虫UA
  19. 基于区块链技术nbsp;Bitt推出巴巴…
  20. 【北邮国院大二下】产品开发与营销知识点整理 Topic11

热门文章

  1. 中国电脑教育报:搜索引擎十年有多少故事
  2. ubuntu14.04 配置 tftp 服务器
  3. 2021赣一中高考成绩查询,2021江西省十大重点高中排名
  4. 编译原理:高级程序设计语言的语法描述
  5. 送书|获取旅游景点信息及评论并作词云、数据可视化
  6. 百度网盘下载文件教程
  7. Tomcat 运行报错 - This is very likely to create a memory leak
  8. 中考大数据大连79_中考大数据 | 2018年大连部分重点高中生源情况汇总!
  9. showDoc的基本使用方法
  10. c语言版算法题“喝汽水”(或汽水可乐)