数据科学库之——numpy
本节主要讲解的是numpy的使用。
文章目录
- 什么是numpy
- numpy创建数组(矩阵)
- numpy中常见的更多数据类型
- 数据类型的操作
- 数组的形状
- 数组和数的计算
- 数组和数组的计算
- 一维二维三维数组
- numpy读取数据
- numpy中数值的修改
- numpy中布尔索引
- numpy中三元运算符
- numpy中的clip(裁剪)
- numpy中的nan和inf
- numpy中的nan的注意点
- numpy中常用统计函数
- 数组的拼接
- numpy生成随机数
- numpy的注意点copy和view
什么是numpy
一个在Python中做科学计算的基础库,重在数值计算,也是大部分PYTHON科学计算库的基础库,多用于在大型、多维数组上执行数值运算。
numpy创建数组(矩阵)
numpy中常见的更多数据类型
数据类型的操作
数组的形状
数组和数的计算
数组和数组的计算
一维二维三维数组
什么叫三维数组,是一个 3*n的矩阵吗?
不!当然不是。
在numpy中可以理解为方向,使用0,1,2…数字表示,对于一个一维数组,只有一个0轴,对于2维数组(shape(2,2)),有0轴和1轴,对于三维数组(shape(2,2, 3)),有0,1,2轴
有了轴的概念之后,我们计算会更加方便,比如计算一个2维数组的平均值,必须指定是计算哪个方向上面的数字的平均值
那么问题来了:
在前面的知识,轴在哪里?
回顾np.arange(0,10).reshape((2,5)),reshpe中2表示0轴长度(包含数据的条数)为2,1轴长度为5,2X5一共10个数据
可见3n的矩阵是一个二维数组,三维数组有可能指的是n个nn的矩阵的集合。
numpy读取数据
CSV:Comma-Separated Value,逗号分隔值文件
显示:表格状态
源文件:换行和逗号分隔行列的格式化文本,每一行的数据表示一条记录
由于csv便于展示,读取和写入,所以很多地方也是用csv的格式存储和传输中小型的数据,为了方便教学,我们会经常操作csv格式的文件,但是操作数据库中的数据也是很容易的实现的
np.loadtxt(fname,dtype=np.float,delimiter=None,skiprows=0,usecols=None,unpack=False)
现在这里有一个英国和美国各自youtube1000多个视频的点击,喜欢,不喜欢,评论数量([“views”,“likes”,“dislikes”,“comment_total”])的csv,运用刚刚所学习的只是,我们尝试来对其进行操作
数据来源:https://www.kaggle.com/datasnaek/youtube/data
转置是一种变换,对于numpy中的数组来说,就是在对角线方向交换数据,目的也是为了更方便的去处理数据
numpy中数值的修改
numpy中布尔索引
numpy中三元运算符
numpy中的clip(裁剪)
numpy中的nan和inf
nan(NAN,Nan):not a number表示不是一个数字
什么时候numpy中会出现nan:
当我们读取本地的文件为float的时候,如果有缺失,就会出现nan
当做了一个不合适的计算的时候(比如无穷大(inf)减去无穷大)
inf(-inf,inf):infinity,inf表示正无穷,-inf表示负无穷
什么时候回出现inf包括(-inf,+inf)
比如一个数字除以0,(python中直接会报错,numpy中是一个inf或者-inf)
那么如何指定一个nan或者inf呢?
注意他们的type类型
numpy中的nan的注意点
在一组数据中单纯的把nan替换为0,合适么?会带来什么样的影响?
比如,全部替换为0后,替换之前的平均值如果大于0,替换之后的均值肯定会变小,所以更一般的方式是把缺失的数值替换为均值(中值)或者是直接删除有缺失值的一行。
numpy中常用统计函数
t.sum(axis=None)#求和
t.mean(a,axis=None)#均值:受离群点的影响较大
np.median(t,axis=None)#中值
t.max(axis=None)# 最大值
t.min(axis=None)#最小值
np.ptp(t,axis=None)#极值:即最大值和最小值只差
t.std(axis=None)#标准差
数组的拼接
numpy生成随机数
numpy的注意点copy和view
a=b 完全不复制,a和b相互影响
a = b[:],视图的操作,一种切片,会创建新的对象a,但是a的数据完全由b保管,他们两个的数据变化是一致的,
a = b.copy(),复制,a和b互不影响
数据科学库之——numpy相关推荐
- 机器学习-数据科学库-day6
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 机器学习-数据科学库-day6 pandas学习 动手练习 pandas中的时间序列 生成一段时间范围 关于频率的更多缩写 在Data ...
- 机器学习-数据科学库-day5
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 机器学习-数据科学库-day5 pandas学习 pandas之DataFrame pandas常用统计方法 将字符串离散化 数据合并 ...
- 机器学习-数据科学库-day1
机器学习-数据科学库-day1 机器学习-数据科学库-day1 matplotlib 机器学习-数据科学库-day1 数据分析课程包括: 基础概念与环境 matplotlib numpy pandas ...
- python数据科学库_Python数据科学库
python数据科学库 什么是数据科学? (What is Data Science?) We live in an information age, where the challenge is t ...
- Python 数据科学库入门
Python 数据科学库入门 1.Numpy 1.1Numpy 简介 Numpy(Numerical Python) Numpy:提供了一个在 Python 中做科学计算的基础库,重在数值计算,主要用 ...
- 数据科学库笔记(四)pandas
文章目录 (一)什么是pandas (二) pandas安装 2.1 直接命令安装 2.2 下载pipy文件安装 (三)pandas的常用数据类型 3.1 pandas之Series创建 3.2 pa ...
- 机器学习-数据科学库:Pandas总结(1)
机器学习-数据科学库:Pandas总结(1) Pandas pandas的常用数据类型 pandas之Series创建 pandas之Series切片和索引 pandas之读取外部数据 pandas之 ...
- Python数据科学库(三)
Python数据科学库(三) 一.基本图形画法 (一)散点图 1.使用 2.参数 (二)折线图 1.使用 2.参数 3.案例 (三)条形图 1.使用 (1)水平条形图 (2)垂直条形图 2.参数 (四 ...
- HuaPu在学:机器学习——数据科学库【matplotlib】
数据科学库[matplotlib] 文章目录 数据科学库[matplotlib] 前言 一.数据分析介绍及环境安装 1.为什么要数据分析??? 2.环境安装 二.matplotlib 1.为什么学习m ...
最新文章
- OpenCL编程详细解析与实例
- 为什么阿里P8、P9技术大牛反复强调“结构化思维”?
- Apache web服务
- python与数据库交互的模块pymysql
- Zabbix 添加端口监控链接
- java kiwi_[转] Java 8 开发的 4 大顶级技巧
- windows环境设置mysql自动备份(测试成功)
- nessus 命令行新建用户_【笔记3】命令行基础
- 3 矩阵运算_FlyAI小课堂:小白学PyTorch(11) 常见运算详解
- html5掷骰子的小demo
- jsp购物车简单实现思想(一)
- JNI/NDK入门指南之JNI数据类型,描述符详解
- bestcoder#22NPY and girls
- welearn综合教程网课答案
- springboot后端接受图片到本地
- c语言考场排座系统,具才考场座次编排系统
- 虚幻四蓝图实战(下车减速人物加速蓝图接口通信)
- 文案生成 python_用 Python 开发一个【视频营销号】生成器
- 英语感叹句的构成规则
- jq里的event对象
热门文章
- 机器人叶韵_绝命响应:以为叶韵绿光袜已经够时尚,看到辣妈光脚后,我恋爱了...
- 中国经济预计2028年超过美国!为什么?看解读!
- Excel提取某一列中的数字
- 商业的基础逻辑(一)
- 快充充电器5V-9V升压给12.6V三节串联锂电池充电芯片的方案板
- python大数据分析入门实例-Python大数据分析与机器学习商业案例实战
- 被通知一个月离职,我修改了项目中的所有注释……
- [Python] pop()函数
- 基于springboot的医院后勤管理系统毕设
- java定义geinfo_Java ResourceInfo類代碼示例