python数据挖掘实验报告1

python数据挖掘实验报告1

实验内容及步骤(包含简要的实验步骤流程)

1.使用Pandas_datareader获取任意两支股票近三个月的交易数据。做出收盘价的变动图像。

2.使用Pandas_datareader获取世界银行数据库中美国(USA)、瑞典(SWE)、瑞士(CHE)三个国家近20年的NY.GDP.PCAP.KD数据,作图分析。

3.对于泰坦尼克的数据集,试分析幸存与否与独立登船的相关性(alone数据列)。

1.取五粮液(000858.sz)和古井贡酒(000596.sz)两只股票的三个月交易数据,做出收盘的变动图像。

#导入pandas_datareader/datetime/seaborn/matplotlib库

import pandas_datareader.data as webdata

import datetime

import seaborn as sns

import matplotlib.pyplot as plt

#处理Seaborn图表内嵌中文字体问题

plt.rcParams['font.sans-serif']=['SimHei']

plt.rcParams['axes.unicode_minus'] = False

sns.set_style({'font.sans-serif':['simhei','Arial']})

#用datatime生成日期数据

start_time = datetime.datetime(2020,6,30)

end_time = datetime.datetime(2020,9,30)

#通过Yahoo财经,查询股票信息

stock_code1 = input('美股直接输入股票代码如GOOG \n港股输入代码+对应股市,如腾讯:0700.hk \n国内股票需要区分上证和深证,股票代码后面加.ss或者.sz\n你要查询的股票代码是:')

stock_info1 = webdata.get_data_yahoo(stock_code1,start_time,end_time)

#展示前5行

#print(stock_info1.head())

stock_code2 = input('另一只要查询的股票代码是:')

stock_info2 = webdata.get_data_yahoo(stock_code2,start_time,end_time)

#绘制股票价格波动图

print('股票收盘价对比:')

sns.set()

plt.figure(figsize=(10,4))

plt.plot(stock_info1['Close'],'r-',label=stock_code1)

plt.plot(stock_info2['Close'],'k--',label=stock_code2)

plt.legend()

plt.savefig('股票收盘.png')

plt.show()

这里在做的时候,要pip下载一个datetime的库。要升级pip版本,按照cmd的提示命令就可以升级了。

使用Pandas_datareader获取世界银行数据库中美国(USA)、瑞典(SWE)、瑞士(CHE)三个国家近20年的NY.GDP.PCAP.KD数据,并作图分析。

#导入wb用于查询世界银行数据

#http://ju.outofmemory.cn/entry/308589

#https://pandas-datareader.readthedocs.io/en/latest/readers/world-bank.html?highlight=

#pandas_datareader.wb

import pandas_datareader.wb as worldbank

import matplotlib.pyplot as plt

import pandas as pd

import seaborn as sns

#处理Seaborn图表内嵌中文字体问题

sns.set()

sns.set_style({'font.sans-serif':['simhei','Arial']})

plt.rcParams['font.sans-serif']=['SimHei']

plt.rcParams['axes.unicode_minus'] = False

start_year = 1999

end_year = 2019

#查询数据库中所有国家信息

#countries = worldbank.get_countries()

#读取美国(USA)、瑞典(SWE)、瑞士(CHE)的NY.GDP.PCAP.KD数据

dat = worldbank.download(indicator="NY.GDP.PCAP.KD", country=["USA", "SWE","CHE"], start=start_year, end=end_year)

dat2draw=dat.unstack(level=0)

#dat2draw.plot()

plt.figure(figsize=(10,4))

plt.plot(dat2draw.iloc[:,0],'r-',label="SWE")

plt.plot(dat2draw.iloc[:,1],'b-*',label="CHE")

plt.plot(dat2draw.iloc[:,2],'g--',label="USA")

plt.title("人均GDP对比(美元计价)",fontsize=20)

plt.legend()

plt.savefig("三国GDP.png",dpi=300, bbox_inches="tight")

这里有个小疑问就是dataframe的切片,[:0]切出来的和dat里面看到的不一样,查了百度好像也不是很明白。

3.对于泰坦尼克的数据集,试分析幸存与否与独立登船的相关性(alone数据列)

import matplotlib.pyplot as plt

from matplotlib import pyplot as plt

import seaborn as sns

#处理Seaborn图表内嵌中文字体问题

plt.rcParams['font.sans-serif']=['SimHei']

plt.rcParams['axes.unicode_minus'] = False

sns.set_style('whitegrid',{'font.sans-serif':['simhei','Arial']})

#载入泰坦尼克数据库,显示乘客信息的头5行

PasTit = sns.load_dataset('titanic')

print('前5行数据:')

print(PasTit.head())

#统计幸存者是否独立登船

survived=PasTit.groupby(['alone','survived']).size().unstack()

survived['sum']=survived[0]+survived[1]

survived['生还率']=survived[1]/survived['sum']

print()

print('乘客按照是否独立登船:')

print('False:不是独立登船;True:独立登船')

print(survived)

#幸存与否与独立登船相关性分析(相关系数)

X=PasTit['survived']

Y=PasTit['alone']

print(X.corr(Y))

#生成相关性热力图

plt.subplots(figsize=(9, 5)) # 设置画面大小

sns.heatmap(survived, annot=True, vmax=1, square=True, cmap="Blues")

plt.savefig('热力图.png')

plt.show()

这里有疑问的是形成的表格数据,必须要用survived这个参数才能生成热力图,不是很明白为什么。

形成的表格做条形图也做不出想要的效果,试了很长时间没有画出来。上课的时候再去询问一下老师。

五、实验总结(包括心得体会、问题回答及实验改进意见,可附页)

通过本次实验

1.巩固了Python程序编制,Numpy、Pandas、seaborn和Matplotlib包的使用。

2.掌握使用Pandas_datareader获取基本的数据,使用webdata.get_data_yahoo的方法从yahoo财经获取财经信息。

3.使用Matplotlib、seaborn做出收盘价的变动图像、近20年的NY.GDP.PCAP.KD数据和相关系数热力图

4.发现了一些要注意的点和疑惑的地方,对dataframe生成、索引切片和matplotlib画图还存在疑问,留存上课询问老师。

python数据挖掘实验报告1相关教程

怎么用Python初步实现页面对象和测试用例的分离?举个登录的栗子

怎么用Python初步实现页面对象和测试用例的分离?举个登录的栗子 一、代码 来自文件index_page.py fromselenium.webdriver.support.waitimportWebDriverWaitfromselenium.webdriver.supportimportexpected_conditionsasECfromselenium.webdriver.common.byimp

Python pip下载requests库超时

Python pip下载requests库超时 通过以下命令下载requests库时,报请求超时 pip install requests 超时如图: pypi.python.org 请求不了,可以通过请求国内镜像库处理 pip install --index https://pypi.mirrors.ustc.edu.cn/simple/ requests 结果:

Python基础汇总

Python基础汇总 Python基础汇总 basic.py #标识符:我们自己在写代码的时候,取的名字。命名的符号。#项目名projectname#包名packagename#模块名.pypython文件名#规范:1.由字母数字下划线组成,但是不能以数字开头。#2.见名知意#3.不同的字母,数字之间,用

Python的IDE ==== Atom

Python的IDE ==== Atom 最近学Python,需要整一个顺手的IDE。 朋友力荐Atom , 于是下载了一个1.53版本的,这玩意儿是GitHub搞的,应该是开源的。 安装后又装了两个插件,一个是缩进的,一个是 运行程序的 首先打开setting 然后搜索 autocomplete-python 这个

Python学习之路——(四)函数的参数和变量

Python学习之路——(四)函数的参数和变量 一.学习内容 1.Python函数的形参和实参 ,关键词参数和默认值参数 2.python只有函数没有过程 3.局部变量和全局变量。局部变量和全局变量互不影响,因为储存空间不同 可以定义两个相同的变量名。但防止混淆局部变量和

安装anaconda+jupyter+python3.6

安装anaconda+jupyter+python3.6 官网只有最新版的,所以我在这个镜像网站下载的: https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/ 然后还需要知道python版本和anaconda版本对应关系: https://blog.csdn.net/yuejisuo1948/article/details/810438

Python爬取新浪新闻数据写入Excel

Python爬取新浪新闻数据写入Excel 先爬取最新消息列表,再循环爬取对应url中的新闻详细数据 # -*- coding: utf-8 -*-Spyder Editornews.py.import requestsfrom bs4 import BeautifulSoupfrom datetime import datetimeimport jsonimport xlwtdef get_list(ur

python Flask框架学习——include语句

python Flask框架学习——include语句 include语句 include 语句可以把一个模板引入到另外一个模板中,类似于把一个模板的代码copy到另外一个模板的指定位置 格式: {% include 网页名称.html’ %} 应用 创建 header.html h3网页头/h3 创建 footer.html h3网

python与数据挖掘 上机实验_python数据挖掘实验报告1相关推荐

  1. python顺序结构实验_Python程序设计实验报告二:顺序结构程序设计

    安徽工程大学 Python程序设计 实验报告 班级 物流192 姓名方伟虎学号3190505205 成绩 日期 2020.3.20 指导老师修宇 [实验名称] 实验二 顺序结构程序设计(验证性实验) ...

  2. python顺序结构实验_Python程序设计实验报告二:顺序结构程序设计(验证性实验)...

    安徽工程大学 Python程序设计 实验报告 班级 物流191 姓名姚彩琴学号3190505129 成绩 日期 2020.3.3 指导老师修宇 [实验名称] 实验二 顺序结构程序设计(验证性实验) [ ...

  3. python组合数据类型实验_Python程序设计实验报告七:组合数据类型

    安徽工程大学 Python程序设计 实验报告 班级  物流192   姓名刘晨晨学号3190505214 日期   2020.5.27    指导老师修宇 [实验名称]实验七 组合数据类型 [实验目的 ...

  4. python数据挖掘是什么_python数据挖掘是什么

    数据挖掘(data mining,简称DM),是指从大量的数据中,通过统计学.人工智能.机器学习等方法,挖掘出未知的.且有价值的信 息和知识的过程. python数据挖掘常用模块 numpy模块:用于 ...

  5. python回归分析实验_python线性回归实验

    实验 算法 python 线性回归实验 [实验名称] Python 线性回归实验 [实验要求] 掌握 Python 线性回归模型应用过程,根据模型要求进行数据预处理,建模,评价与应用: [背景描述] ...

  6. python中的json结构_python数据挖掘_Json结构分析

    json是一种轻量级的数据交换格式,也可以说是一种配置文件的格式 这种格式的文件是我们在数据处理经常会遇到的 python提供内置的模块json,只需要在使用前导入即可 你可以通过帮助函数查看json ...

  7. python 高等数学实验_Python数学实验与建模

    本书以Python软件为基础,介绍了数学建模的各种常用算法及其软件实现,内容涉及高等数学.工程数学中的相关数学实验.数学规划.插值与拟合.微分方程.差分方程.评价预测.图论模型等. 更多科学出版社服务 ...

  8. python编程设计圆柱体积_PYTHON程序设计实验2

    安徽工程大学 Python程序设计 实验报告 班级  物流191   姓名邹缕学号3190505117 成绩 日期     2020.3.22      指导老师修宇 实验二 顺序结构程序设计(验证性 ...

  9. python数据挖掘视频课程_Python数据挖掘应用班——3天视频

    一.课程目标 1.数据分析工作中遇到的典型数据分析和挖掘案例进行深刻地分析 2.初学者快速掌握Python 数据分析和数据挖掘(含机器学习)的思想和方法 3.形成科学有效的知识和能力结构体系框架,为今 ...

  10. python数据挖掘主要特点_python数据挖掘(从数据集中抽取特征)

    大多数数据挖掘算法都依赖于数值或类别型特征,从数据集中抽取数值和类别型特征,并选出最佳特征. 特征可用于建模, 模型以机器挖掘算法能够理解的近似的方式来表示现实 特征选择的另一个优点在于:降低真实世界 ...

最新文章

  1. 波士顿动力机器狗再进化:已学会自主规划路线
  2. cocos2dx - Lua 语言
  3. Django使用心得(四)
  4. 【Python小游戏】当当当当 万众瞩目得《滑雪大冒险》来啦~(附源码)
  5. 在SAP HANA Express Edition里创建数据库表
  6. vue seo关键词设置_SEO关键词优化排名的几个技巧
  7. 三菱四节传送带控制梯形图_一文讲透FX5U PLC程序控制指令及步进梯形图编程
  8. python的颜色有哪些_Python颜色分类及格式
  9. java邮箱_java发送邮件(qq邮箱)
  10. python遍历数组冒泡排序_Python算法(一) 数组冒泡排序(难度等级:easy)
  11. sudo -u hdfs hdfs balancer出现异常 No lease on /system/balancer.id
  12. 从Iris数据集开始---机器学习入门
  13. 二分法查找是基于有序_【二分查找】May1th “First Bad Version (Python3)”
  14. Win10内存占用过高但是实际没有多少进程
  15. 大学“电路分析基础”试题合集第四章
  16. 基于ssm的大学校园兼职平台系统
  17. uploader.lib php,Lib/Upload.php · 跳跳虎1986/cwj - Gitee.com
  18. 微信公众平台-微信发送朋友、分享到QQ、分享QQ空间、分享腾讯微博-JSSDk接口
  19. Spring+quartz 动态任务调度
  20. 详细设计说明书(机房收费系统)

热门文章

  1. case when 多条件 oracle,casewhen(casewhen同时满足多条件)
  2. 《SVN web管理工具CollabNetSubversionEdge》
  3. 适合初学者 :用Google map street view api 实现批量下载谷歌地图街景 in python
  4. Nero 7序列号的验证方法
  5. Godot官网新闻翻译 - 2016年
  6. 时间序列信号处理系列-基于Python的同步压缩变换
  7. vs2010sp1安装失败问题
  8. Android HttpClient用法
  9. javascript gba游戏模拟器
  10. DHCP、PNF、SXE、DNS等综合实验