2019118_四个化学数据分析(3)
import pandas as pd
from pylab import mpl
mpl.rcParams['font.sans-serif'] = ['FangSong'] # 指定默认字体
mpl.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题
import matplotlib.pyplot as plt
%matplotlib inline
test=pd.read_excel('数据.xlsx')
test.head()
温度/℃ | 0.001 | 0.005 | 0.01 | 0.02 | 0.04 | 0.06 | 0.08 | 0.1 | 0.5 | |
---|---|---|---|---|---|---|---|---|---|---|
0 | 0 | 1.0002 | 1.0002 | 1.0002 | 1.0002 | 1.0002 | 1.0002 | 1.0002 | 1.0002 | 1.0000 |
1 | 20 | 135.2300 | 1.0017 | 1.0017 | 1.0017 | 1.0017 | 1.0017 | 1.0017 | 1.0017 | 1.0015 |
2 | 40 | 144.4700 | 28.8600 | 1.0078 | 1.0078 | 1.0078 | 1.0078 | 1.0078 | 1.0078 | 1.0076 |
3 | 60 | 153.7100 | 30.7100 | 15.3400 | 1.0710 | 1.0710 | 1.0710 | 1.0710 | 1.0710 | 1.0169 |
4 | 80 | 162.9500 | 32.5700 | 16.2700 | 8.1190 | 4.0440 | 1.0292 | 1.0292 | 1.0292 | 1.0290 |
test.info()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 35 entries, 0 to 34
Data columns (total 10 columns):
温度/℃ 35 non-null int64
0.001 35 non-null float64
0.005 35 non-null float64
0.01 35 non-null float64
0.02 35 non-null float64
0.04 35 non-null float64
0.06 35 non-null float64
0.08 35 non-null float64
0.1 35 non-null float64
0.5 35 non-null float64
dtypes: float64(9), int64(1)
memory usage: 2.8 KB
test.hist(figsize=(20,10))
array([[<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87C47BA8>,<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87CB1550>,<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87CCBBE0>],[<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87CFD278>,<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87D22908>,<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87D22940>],[<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87D7F668>,<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87DA6CF8>,<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87DD93C8>],[<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87E01A58>,<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87E33128>,<matplotlib.axes._subplots.AxesSubplot object at 0x0000026E87E5B7B8>]],dtype=object)
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-niQ1ySLM-1574997331548)(output_4_1.png)]
预测温度/℃
y = test['温度/℃']
X = test.drop(['温度/℃'],axis=1)
print('data shape: {0}; no. positive: {1}; no. negative: {2}'.format(X.shape, y[y==1].shape[0], y[y==0].shape[0]))
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.1)
data shape: (35, 9); no. positive: 0; no. negative: 1
基于xgboost的预测算法
from sklearn import linear_model
model =XGBRegressor(max_depth = 2)
model.fit(X_train, y_train)
train_score = model.score(X_train, y_train)
test_score = model.score(X_test, y_test)
print('train score: {train_score:.6f}; test score: {test_score:.6f}'.format(train_score=train_score, test_score=test_score))
D:\anaconda\lib\site-packages\xgboost\core.py:587: FutureWarning: Series.base is deprecated and will be removed in a future versionif getattr(data, 'base', None) is not None and \[20:26:54] WARNING: C:/Jenkins/workspace/xgboost-win64_release_0.90/src/objective/regression_obj.cu:152: reg:linear is now deprecated in favor of reg:squarederror.
train score: 0.999972; test score: 0.990900
2019118_四个化学数据分析(3)相关推荐
- python第四章课后答案4.7_Python数据分析实战作业 第四章 Python数据分析实战 习题...
第四章 Python数据分析实战 习题(数据见附件sizhang.xlsx) 班主任现有一班级的两张表,如下. 表一:成绩表 学 号C#线 代Python 16010203788896 表二:信息表 ...
- 利用python进行数据分析——第十四章_数据分析案例
文章目录 本章中的数据文件可从下面的github仓库中下载 利用python进行数据分析(第二版) 一.从Bitli获取 1.USA.gov数据 1.1纯python时区计数 1.2使用pandas进 ...
- (四)揭开数据分析方案的神秘面纱——一案在手,成竹在胸
一.研方案的作用 研究方案可用来指导我们的数据采集和分析工作,一案在手,成竹在胸. 二.如何才能写一份优秀的研究方案 一个假设 不要把撰写研究方案当成写计划书,而是要作为讲演稿来准备. 两个要求 理论 ...
- 化学数据分析计算机,化学实验数据分析系统1.1
设计.发明的目的和基本思路.创新点.技术关键和主要技术指标 化学实验的内容涉及多个领域,具有公式多.数据多.数据处理复杂的特点.数据处理包括函数计算.直线拟合.曲线处理.作图,数据和误差分析等方面. ...
- 化学数据分析计算机,浅谈数据处理在化学分析中的应用
摘要:介绍了数据处理在化学分析中的内容,集中阐述了数据处理在化学分析中的应用方面和具体内容,并且对数据处理在化学分析中的处理和分析进行了详细的探究,给数据处理在化学分析中的应用带来了先进的指导意义. ...
- 常用的四种大数据分析方法
本文主要讲述数据挖掘分析领域中,最常用的四种数据分析方法:描述型分析.诊断型分析.预测型分析和指令型分析. 当刚涉足数据挖掘分析领域的分析师被问及,数据挖掘分析人员最重要的能力是什么时,他们给出了五花 ...
- 产品经理经验谈50篇(四):数据分析常用方法及应用案例解析
01对比细分 在互联网的数据分析中, 经常我们去分析比如今天的活跃人数降低了, 我们经常要从多个维度去分析为什么降低. 同时我们还要跟上周, 昨天, 去年同期等做对比, 分析虽然是降低了, 但对比去年 ...
- 分析思维 第四篇:数据分析入门阶段——描述性统计分析和相关分析
数据分析的入门思维,首先要认识数据,然后对数据进行简单的分析,比如描述性统计分析和相关性分析等. 一,认识变量和数据 变量和数据是数据分析中常用的概念,用变量来描述事物的特征,而数据是变量的具体值,把 ...
- 【Python数据挖掘课程】四.决策树DTC数据分析及鸢尾数据集分析
今天主要讲述的内容是关于决策树的知识,主要包括以下内容: 1.分类及决策树算法介绍 2.鸢尾花卉数据集介绍 3.决策树实现鸢尾数据集分析 ...
- MATLAB实验四:MATLAB数据分析
导入指定文件,并对学生成绩进行分析(记录你的指令和结果) 说明:本题请先将实验素材提供的成绩单文件scoresheet.xlsx的数据导入到matlab中,再完成后面的问题.这里你可以尝试用impor ...
最新文章
- php session 跨子域和跨服务器解决方式
- 全球及中国电动自行车零件和配件行业运营状况及未来发展趋势预测报告2022年版
- selenium模拟登陆去哪儿网
- r语言list添加元素_Redis数据结构 List 类型】List 类型生产中的应用 消息队列、排行榜、朋友圈、监控程序的实现...
- 《Effective Java 3rd》读书笔记——泛型
- 如何下载微信开发者工具?
- python试卷河南理工大学官网_河南理工大学试卷模板
- python显示图片固定大小
- dubbo调用原理,过程(知其然,知其所以然)
- 小蝌蚪找妈妈(召唤神龙)源码
- 纽约州推出“被遗忘权”提案 用户或能要求将个人隐私信息从搜索结果中移
- teamviewer 使用数量到达上限_Teamviewer使用新问题之:同一账号在不同设备上使用已达上限...
- mysql max where_MAX函数中的where子句mysql
- 数据结构笔记(持续更新)
- 【C/C++牛客每日必刷】--- 牛客刷题系列
- java照片切换播放音乐_音乐播放器-图片切换-轮播图效果
- 封基表现继续好于大盘
- 牛小骥和严恭敏松组合中Qk的计算方法对比
- 个性代码注释 大合集
- 这都是什么奇葩网站,最后一个根本玩不转
热门文章
- lsb_release -a 查询Linux系统版本
- .Net MVC框架 + WCF 搭建 集群开发
- 一步步开发自己的博客 .NET版(3、注册登录功能)
- Netsuite Foreign Currency Revaluation 外币评估
- vs2010 sp1 安装Silverlight5 语言版本不匹配 解决方案
- 常用排序算法之插入排序 ( 直接插入排序、希尔排序 )
- 试用EF开发WEB应用程序(15): EF Servlet, or EFSP?
- java day14 【List、Set、数据结构、Collections】
- go install
- Ruby on Rails 目录结构