深度学习常用python库学习笔记

常用的4个库
一、Numpy库
- 1、数组的创建
- - （1）np.array()
  - （2）np.zeros()
  - （3）np.ones()
  - （4）np.empty()
  - （5）np.arange()
  - （6）np.random.normal()
- 2、数组的计算
- - （1）np.dot(arr1,arr2)
  - （2）矩阵的其它计算
  - (3)矩阵转置
  - （4）基本数组统计方法
  - （5）numpy.linalg函数
- 3、数组的索引与切片
二、Pandas库
- 1、Series
- - （1）将列表转化为Series
  - （2）Ser设置索引
  - （3）Series 可以用字典实例化
  - （4）可以通过Series的values和index属性获取其数组表示形式和索引对象
  - （5）可以通过索引选取Series中的单个或一组值
  - （6）Series中最重要的一个功能是：它会在算术运算中自动对齐不同索引的数据
  - （7）切片操作
  - （8）Series对象本身及其索引都有一个name属性，该属性跟pandas其他的关键功能关系非常密切.
- 2、DataFrame
- - （1）用多维数组字典、列表字典生成 DataFrame
  - （2）使用columns参数设置列顺序
  - （3）用 Series 字典或字典生成 DataFrame
  - （4）获取DataFrame的列为Series
  - （5）列可以通过赋值的方式进行修改
PIL库
Matplotlib库
说明

常用的4个库

numpy是Python科学计算库的基础。包含了强大的N维数组对象和向量运算。

pandas是建立在numpy基础上的高效数据分析处理库，是Python的重要数据分析库。

Matplotlib是一个主要用于绘制二维图形的Python库。用途：绘图、可视化

PIL库是一个具有强大图像处理能力的第三方库。用途：图像处理

一、Numpy库

numpy中文网

1、数组的创建

（1）np.array()

import numpy as np
array1 = np.array([[1,2,3],[4,5,6]])

（2）np.zeros()

生成指定shape全0数组

zeroarray = np.zeros((2,3))
print(aeroarray)

[[0. 0. 0.][0. 0. 0.]]

（3）np.ones()

生成指定shape的全1数组

onearray = np.ones((3,4))
print(onearray)

[[1. 1. 1. 1.][1. 1. 1. 1.][1. 1. 1. 1.]]

（4）np.empty()

创建的数组初始内容是随机的

（5）np.arange()

生成的是一个数组

array = np.arange(10,31,5)
print(array)

[10 15 20 25 30]

（6）np.random.normal()

#给定均值/标准差/维度的正态分布
np.random.normal(1.75, 0.1, (2, 3))

array([[1.79250628, 1.83204225, 1.71973433],[1.58555017, 1.66339554, 1.70447666]])

2、数组的计算

（1）np.dot(arr1,arr2)

矩阵乘法

arr3 = np.array([[1,2,3],[4,5,6]])
arr4 = np.ones([3,2],dtype=np.int64)
print(arr3)
print(arr4)
print(np.dot(arr3,arr4))

[[1 2 3][4 5 6]]
[[1 1][1 1][1 1]]
[[ 6  6][15 15]]

（2）矩阵的其它计算

import numpy as np
arr3 = np.array([[1,2,3],[4,5,6]])
print(arr3)
print(np.sum(arr3,axis=1)) #axis=1,每一行求和 axie=0,每一列求和
print(np.max(arr3))
print(np.min(arr3))
print(np.mean(arr3))
print(np.argmax(arr3))
print(np.argmin(arr3))

运行结果

[[1 2 3][4 5 6]]
[ 6 15]
6
1
3.5
5
0

(3)矩阵转置

arr3_tran = arr3.transpose()
print(arr3_tran)print(arr3.flatten())

运行结果

[[1 4][2 5][3 6]]
[1 2 3 4 5 6]

（4）基本数组统计方法

方法	说明
sum	对数组中全部或某轴向的元素求和。零长度的数组的sum为0
mean	算术平均数。零长度的数组的mean为NaN
std,var	分别为标准差和方差，自由度可调（默认为n）
min,max	最小值，最大值
argmin, argmax	最小和最大元素的索引
cumsum	所有元素的累加
cumprod	所有元素的累积

（5）numpy.linalg函数

3、数组的索引与切片

arr5 = np.arange(0,6).reshape([2,3])
print(arr5)
print(arr5[1])
print(arr5[1][2])
print(arr5[1,2])print(arr5[1,:])
print(arr5[:,1])
print(arr5[1,0:2])

运行结果：

[[0 1 2][3 4 5]]
[3 4 5]
5
5
[3 4 5]
[1 4]
[3 4]

二、Pandas库

pandas是python第三方库，提供高性能易用数据类型和分析工具。
pandas基于numpy实现，常与numpy和matplotlib一同使用。
更多学习：Pandas中文网
Pandas 核心数据结构如下图：

1、Series

Series是一种类似于一维数组的对象，它由一维数组（各种numpy数据类型）以及一组与之相关的数据标签（即索引）组成。
可理解为带标签的一维数组，可存储整数、浮点数、字符串、Python 对象等类型的数据。

（1）将列表转化为Series

import pandas as pd
import numpy as nps = pd.Series(['a','b','c','d','e'])
print(s)

运行结果

0    a
1    b
2    c
3    d
4    e
dtype: object

（2）Ser设置索引

Seris中可以使用index设置索引列表。
与字典不同的是，Seris允许索引重复。

s = pd.Series(['a','b','c','d','e'],index=[100,200,100,400,500])
print(s)

结果

100    a
200    b
100    c
400    d
500    e
dtype: object

（3）Series 可以用字典实例化

d = {'b': 1, 'a': 0, 'c': 2}
pd.Series(d)

运行结果：

b    1
a    0
c    2
dtype: int64

（4）可以通过Series的values和index属性获取其数组表示形式和索引对象

print(s)
print(s.values)
print(s.index)

100    a
200    b
100    c
400    d
500    e
dtype: object
['a' 'b' 'c' 'd' 'e']
Int64Index([100, 200, 100, 400, 500], dtype='int64')

（5）可以通过索引选取Series中的单个或一组值

print(s[100])
print(s[[400, 500]])

得到结果：

100    a
100    c
dtype: object
400    d
500    e
dtype: object

（6）Series中最重要的一个功能是：它会在算术运算中自动对齐不同索引的数据

Series 和多维数组的主要区别在于， Series 之间的操作会自动基于标签对齐数据。因此，不用顾及执行计算操作的 Series 是否有相同的标签。

obj1 = pd.Series({"Ohio": 35000, "Oregon": 16000, "Texas": 71000, "Utah": 5000})
print(obj1)
obj2 = pd.Series({"California": np.nan, "Ohio": 35000, "Oregon": 16000, "Texas": 71000})
print(obj2)
print(obj1 + obj2)

结果如下：

Ohio      35000
Oregon    16000
Texas     71000
Utah       5000
dtype: int64
California        NaN
Ohio          35000.0
Oregon        16000.0
Texas         71000.0
dtype: float64
California         NaN
Ohio           70000.0
Oregon         32000.0
Texas         142000.0
Utah               NaN
dtype: float64

（7）切片操作

s = pd.Series(np.array([1,2,3,4,5]), index=['a', 'b', 'c', 'd', 'e'])print(s[1:])print(s[:-1])print(s[1:] + s[:-1])

b    2
c    3
d    4
e    5
dtype: int64
a    1
b    2
c    3
d    4
dtype: int64
a    NaN
b    4.0
c    6.0
d    8.0
e    NaN
dtype: float64

（8）Series对象本身及其索引都有一个name属性，该属性跟pandas其他的关键功能关系非常密切.

import pandas as pd
import numpy as npobj1 = pd.Series({'California':np.nan,'Ohio':35000,'Oregon':16000,'Texas':71000})
print(obj1)obj1.name = 'population'
obj1.index.name = 'state'
print(obj1)

California        NaN
Ohio          35000.0
Oregon        16000.0
Texas         71000.0
dtype: float64
state
California        NaN
Ohio          35000.0
Oregon        16000.0
Texas         71000.0
Name: population, dtype: float64

2、DataFrame

DataFrame是一个表格型的数据结构，类似于Excel或sql表
它含有一组有序的列，每列可以是不同的值类型（数值、字符串、布尔值等）
DataFrame既有行索引也有列索引，它可以被看做由Series组成的字典（共用同一个索引）

（1）用多维数组字典、列表字典生成 DataFrame

import pandas as pd
data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'], 'year': [2000, 2001, 2002, 2001, 2002], 'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
frame = pd.DataFrame(data)
print(frame)

state  year  pop
0    Ohio  2000  1.5
1    Ohio  2001  1.7
2    Ohio  2002  3.6
3  Nevada  2001  2.4
4  Nevada  2002  2.9

（2）使用columns参数设置列顺序

#如果指定了列顺序，则DataFrame的列就会按照指定顺序进行排列
frame1 = pd.DataFrame(data, columns=['year', 'state', 'pop'])
print(frame1)

结果：

 year   state  pop
0  2000    Ohio  1.5
1  2001    Ohio  1.7
2  2002    Ohio  3.6
3  2001  Nevada  2.4
4  2002  Nevada  2.9

跟原Series一样，如果传入的列在数据中找不到，就会产生NAN值

data = {'state': ['Ohio', 'Ohio', 'Ohio', 'Nevada', 'Nevada'], 'year': [2000, 2001, 2002, 2001, 2002], 'pop': [1.5, 1.7, 3.6, 2.4, 2.9]}
frame2 = pd.DataFrame(data, columns=['year', 'state', 'pop', 'debt'], index=['one', 'two', 'three', 'four', 'five'])
print(frame2)

 year   state  pop debt
one    2000    Ohio  1.5  NaN
two    2001    Ohio  1.7  NaN
three  2002    Ohio  3.6  NaN
four   2001  Nevada  2.4  NaN
five   2002  Nevada  2.9  NaN

（3）用 Series 字典或字典生成 DataFrame

d = {'one': pd.Series([1., 2., 3.], index=['a', 'b', 'c']),'two': pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])}
print(pd.DataFrame(d))

  one  two
a  1.0  1.0
b  2.0  2.0
c  3.0  3.0
d  NaN  4.0

（4）获取DataFrame的列为Series

#通过类似字典标记的方式或属性的方式，可以将DataFrame的列获取为一个Series,返回的Series拥有原DataFrame相同的索引
frame2 = pd.DataFrame(data, columns=['year', 'state', 'pop', 'debt'], index=['one', 'two', 'three', 'four', 'five'])
print(frame2['state'])

one        Ohio
two        Ohio
three      Ohio
four     Nevada
five     Nevada
Name: state, dtype: object

（5）列可以通过赋值的方式进行修改

frame2['debt'] = 16.5
print(frame2)

       year   state  pop  debt
one    2000    Ohio  1.5  16.5
two    2001    Ohio  1.7  16.5
three  2002    Ohio  3.6  16.5
four   2001  Nevada  2.4  16.5
five   2002  Nevada  2.9  16.5

PIL库

PIL库是一个具有强大图像处理能力的第三方库。

图像的组成：由RGB三原色组成,RGB图像中，一种彩色由R、G、B三原色按照比例混合而成。0-255区分不同亮度的颜色。

图像的数组表示：图像是一个由像素组成的矩阵，每个元素是一个RGB值。

Image 是 PIL 库中代表一个图像的类（对象）

from PIL import Image
import matplotlib.pyplot as plt#读取图片
img = Image.open(r'E:\CS\深度学习\T.jpg')plt.imshow(img)
plt.show()#获得图像的模式
img_mode = img.mode
print(img_mode)#获取图像宽度和高度
width,height = img.size
print(width,height)#图片旋转
img_rotate = img.rotate(45)
plt.imshow(img_rotate)
plt.show()#图片裁剪
img_crop = img.crop((677,0,1823,1273))
plt.imshow(img_crop)
plt.show()#图片放缩
img_resize = img.resize((int(width*0.6),int(height*0.6)),Image.ANTIALIAS)
plt.imshow(img_resize)
plt.show()#图片左右翻转
img_lr = img.transpose(Image.FLIP_LEFT_RIGHT)
plt.imshow(img_lr)
plt.show()
#图片上下镜像
img_bt = img_lr.transpose(Image.FLIP_TOP_BOTTOM)
plt.imshow(img_bt)
plt.show()

Matplotlib库

Matplotlib中文网

Matplotlib库由各种可视化类构成，内部结构复杂。

matplotlib.pylot是绘制各类可视化图形的命令字库。

import matplotlib.pyplot as plt
import numpy as npx = np.linspace(-1,1,50) #等差数列
y1 = 2*x + 1
y2 = x**2#传入x,y1通过plot()绘制折线图
plt.figure()
plt.plot(x,y1)#创建新窗口绘制第二幅图形
plt.figure(figsize=(7,5))
plt.plot(x,y2)#显示图形
plt.show()

运行得到：

import matplotlib.pyplot as plt
import numpy as npx = np.linspace(-1,1,50)
y1 = x*2 + 1
y2 = x**2plt.figure(figsize = (7,5))#生成绘制窗口
plt.plot(x,y1,color='red',linewidth=1)#绘制第一条曲线并设置颜色线宽
plt.plot(x,y2,color='blue',linewidth=5)#绘制第二条曲线并设置颜色线宽#设置坐标标签和字号
plt.xlabel('x',fontsize=20)
plt.ylabel('y',fontsize=20)#显示图像
plt.show()

运行得到：

import matplotlib.pyplot as plt
import numpy as npx = np.linspace(-1,1,50)
y1 = x*2 + 1
y2 = x**2#绘制曲线
a1, = plt.plot(x,y1,color='red',linewidth=1)
a2, = plt.plot(x,y2,color='blue',linewidth=5)#设置图例
plt.legend(handles=[a1,a2],labels=['aa','bb'],loc='best')#设置x,y坐标标签
plt.xlabel('x')
plt.ylabel('y')#设置显示范围
plt.xlim((0,1))  #x轴只截取一段进行显示
plt.ylim((0,1))  #y轴只截取一段进行显示#显示图形
plt.show()

运行得到：

import numpy as np
import matplotlib.pyplot as pltdots1 =np.random.rand(50)
dots2 =np.random.rand(50)
#绘制散点图
plt.scatter(dots1,dots2,c='red',alpha=0.5) #c表示颜色，alpha表示透明度
plt.show()

import matplotlib.pyplot as plt
import numpy as npx = np.arange(10)
y = 2**x+10plt.bar(x,y,facecolor='#9999ff',edgecolor='white')
plt.show()

x = np.arange(10)
y = 2**x+10
plt.bar(x,y,facecolor='#9999ff',edgecolor='white')
for ax,ay in zip(x,y):plt.text(ax,ay,'%.1f' % ay,ha='center',va='bottom')
plt.show(

说明

还在学习中会不断修改，如有错误欢迎指正

深度学习常用python库学习笔记相关推荐

深度学习入门之Python小白逆袭大神系列（三）—深度学习常用Python库
深度学习常用Python库介绍目录深度学习常用Python库介绍简介 Numpy库 padas库 PIL库 Matplotlib库简介 Python被大量应用在数据挖掘和深度学习领域,其中使用 ...
Python语言学习：Python语言学习之正则表达式常用函数之re.search方法【输出仅一个匹配结果(内容+位置)】、re.findall方法【输出所有匹配结果(内容)】案例集合之详细攻略
Python语言学习:Python语言学习之正则表达式常用函数之re.search方法[输出仅一个匹配结果(内容+位置)].re.findall方法[输出所有匹配结果(内容)]案例集合之详细攻略导读 ...
1000+ 常用 Python 库一览
点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达来源 | 法纳斯特这次给大家总结整理了1000+常用Python库 ...
wxpython dataview处理大量数据_38个常用Python库：数值计算、可视化、机器学习等8大领域都有了...
作者 | 李明江张良均周东平张尚佳来源 | 大数据DT 原文 | 38个常用Python库:数值计算.可视化.机器学习等8大领域都有了 Python作为一个设计优秀的程序语言,现在已广泛应用于 ...
简述与机器学习相关的十大常用Python库，极简化算法编程
原创博文,欢迎转载,转载时请务必附上博文链接,感谢您的尊重. 前言初学Python的时候,我一直不太理解Python的魅力到底在哪,相比Java,它除了换一种简洁的语法,好像没什么场景是不可替代的. ...
FM算法以及常用python库
FM算法以及常用python库 Factorization Machines: 适用于高维稀疏数据集进行特征组合,发现特征隐藏信息.在CTR,推荐系统中用的很多,这些情况下我也没有用过. 通过目标函数 ...
数据分析与挖掘中常用Python库的介绍与实践案例
数据分析与挖掘中常用Python库的介绍与实践案例一.Python介绍现在python一词对我们来说并不陌生,尤其是在学术圈,它的影响力远超其它任何一种编程语言, 作为一门简单易学且功能强大的编程 ...
python语言学习：python语言学习中的定义类、定义函数、封装api等详细攻略
python语言学习:python语言学习中的定义类.定义函数.封装api等详细攻略目录 python语言学习中的定义类 python语言学习中的定义函数 python语言学习中封装api pyth ...
[CTF] python的pip源更改及常用python库
windows下更改pip为清华大学开源命令行以管理员方式运行 pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/s ...

深度学习常用python库学习笔记

深度学习常用python库学习笔记

常用的4个库

一、Numpy库

1、数组的创建

（1）np.array()

（2）np.zeros()

（3）np.ones()

（4）np.empty()

（5）np.arange()

（6）np.random.normal()

2、数组的计算

（1）np.dot(arr1,arr2)

（2）矩阵的其它计算

(3)矩阵转置

（4）基本数组统计方法

（5）numpy.linalg函数

3、数组的索引与切片

二、Pandas库

1、Series

（1）将列表转化为Series

（2）Ser设置索引

（3）Series 可以用字典实例化

（4）可以通过Series的values和index属性获取其数组表示形式和索引对象

（5）可以通过索引选取Series中的单个或一组值

（6）Series中最重要的一个功能是：它会在算术运算中自动对齐不同索引的数据

（7）切片操作

（8）Series对象本身及其索引都有一个name属性，该属性跟pandas其他的关键功能关系非常密切.

2、DataFrame

（1）用多维数组字典、列表字典生成 DataFrame

（2）使用columns参数设置列顺序

（3）用 Series 字典或字典生成 DataFrame

（4）获取DataFrame的列为Series

（5）列可以通过赋值的方式进行修改

PIL库

Matplotlib库

说明

深度学习常用python库学习笔记相关推荐

最新文章

热门文章