1、isin()
作用:isin()接受一个列表,判断该列中元素是否在列表中。
(1)如果是一个序列或者数组,那么判断该位置的值,是否在整个序列或者数组中

import pandas as pd
df = pd.DataFrame({'A':[1,2,3],'B':['a','b','f']})
df.isin([1,'2','5','f'])


(2)对pd中某一列的值做判断

df['C'] = [7,8,9]
df.C.isin([7,9,10])

2、Numpy常见运算 - np.around、np.floor、np.ceil、np.where
np.where()
(1)np.where(condition,x,y):满足条件(condition),输出x,不满足输出y。

import numpy as np
condition = np.arange(10)
np.where(condition>5,1,0)
>>>
array([0, 0, 0, 0, 0, 0, 1, 1, 1, 1])

(2)np.where(condition):只有条件 (condition),没有x和y,则输出满足条件 (即非0) 元素的坐标。

import numpy as np
a = np.array([2,4,6,8,10,11])
np.where(a>5)                        #返回索引
>>>
(array([2, 3, 4, 5]),)a[np.where(a>5)]               #等价于a[a>5]
>>>
array([ 6,  8, 10, 11])

np.around: 返回四舍五入后的值,可指定精度。
用法:around(a, decimals=0, out=None)
参数;a 输入数组,decimals 要舍入的小数位数。 默认值为0。 如果为负,整数将四舍五入到小数点左侧的位置

n = np.array([-0.746, 4.6, 9.4, 7.447, 10.455, 11.555])
np.around(n,decimals = 1)
>>>
array([-0.7,  4.6,  9.4,  7.4, 10.5, 11.6])

np.floor : 返回不大于输入参数的最大整数。 即对于输入值 x ,将返回最大的整数 i ,使得 i <= x。 注意在Python中,向下取整总是从 0 舍入。

n = np.array([-1.7, -2.5, -0.2, 0.6, 1.2, 2.7, 11])
np.floor(n)
>>>
array([-2., -3., -1.,  0.,  1.,  2., 11.])

np.ceil 函数返回输入值的上限,即对于输入 x ,返回最小的整数 i ,使得 i> = x。

n = np.array([-1.7, -2.5, -0.2, 0.6, 1.2, 2.7, 11])
np.ceil(n)
>>>
array([-1., -2., -0.,  1.,  2.,  3., 11.])

3、tqdm():进度条配置

import time
from tqdm import tqdm
for i in tqdm(range(100)):  time.sleep(0.01)

4、unique()与nunique()
(1)unique()
统计list、series中的不同值的个数,返回的是list.

(2) nunique()
可直接统计dataframe中每列的不同值的个数,也可用于series,但不能用于list.返回的是不同值的个数.

df=pd.DataFrame({'A':[0,1,1],'B':[0,5,6]})
print(df.nunique())

5、sort_values()函数用途
pandas中的sort_values()函数原理类似于SQL中的order by,可以将数据集依照某个字段中的数据进行排序,该函数即可根据指定列数据也可根据指定行的数据排序。
用法:DataFrame.sort_values(by=‘##’,axis=0,ascending=True, inplace=False, na_position=‘last’)

df=pd.DataFrame({'col1':['A','A','B',np.nan,'D','C'],'col2':[2,1,9,8,7,7],'col3':[0,1,9,4,2,8]
})
print(df)
df.sort_values(by=['col1'],na_position='first')


6、enumerate
用法:enumerate(sequence, [start=0])
参数:sequence – 一个序列、迭代器或其他支持迭代对象。start – 下标起始位置。
返回值:返回 enumerate(枚举) 对象。

seq = ['one', 'two', 'three']
for i, element in enumerate(seq):print(i,element)
>>>
0 one
1 two
2 three

7、广义表head与tail的用法

df = pd.DataFrame({'A':[1,2,3],'B':[4,5,6]})
print(df.head(1))
print(df.tail(1))


8、pd.drop_duplicates()
通过SQL中关键字distinct的用法来理解,根据指定的字段对数据集进行去重处理。
用法:DataFrame.drop_duplicates(subset=None, keep=‘first’, inplace=False)
参数:
subset–根据指定的列名进行去重,默认整个数据集
keep–可选{‘first’, ‘last’, False},默认first,即默认保留第一次出现的重复值,并删去其他重复的数据,False是指删去所有重复数据。
inplace–是否对数据集本身进行修改,默认False

df=pd.DataFrame({'a':[1,2,4,3,3,3,4],'b':[2,3,3,4,4,5,3]
})
df.drop_duplicates(['a'],keep='first')         #根据a列进行去重

数据分析-np、pd常用函数相关推荐

  1. numpy随机生成01矩阵_Python数据分析Numpy库常用函数详解,提到循环就该想到的库...

    Python进行数据分析的核心库肯定是Pandas,该库差不多可以解决结构化数据的绝大部分处理需求.在<Python数据分析常用函数及参数详解,可以留着以备不时之需 >一文中也已经对该库的 ...

  2. 数据分析之EXCEL常用函数总结

    今天通过excel分析数据的时候,突然大脑宕机,瞬间想不起来excel各种函数的用法,下面整理了一下excel的常用函数 1.用函数识别重复数据的方法,COUNTIF函数 CUOUNTIF(range ...

  3. frac函数_20个能够有效提高 Pandas数据分析效率的常用函数,附带解释和例子

    Pandas是一个受众广泛的python数据分析库.它提供了许多函数和方法来加快数据分析过程.pandas之所以如此普遍,是因为它的功能强大.灵活简单. 本文将介绍20个常用的 Pandas 函数以及 ...

  4. 数据分析常用函数—pd.merge

      数据分析是现在的热门,学会用python处理数据,让你从繁琐的工作中解脱出来.本文详细阐述数据分析常用函数之merge函数.    文章目录 一.merge函数参数详解 二.merge函数简单实例 ...

  5. python数据分析 - numpy | ndarray数组 | numpy常用函数

    文章目录 数据分析 numpy概述 numpy历史 numpy的核心:多维数组 numpy基础 ndarray数组 内存中的ndarray对象 ndarray数组对象的特点 ndarray数组对象的创 ...

  6. 数据分析之numpy基础/matplotlib绘图/numpy常用函数/杂项功能

    文章目录 数据分析 numpy概述 numpy`历史` numpy的核心:多维数组 numpy基础 ndarray数组 内存中的ndarray对象 ndarray数组对象的特点 ndarray数组对象 ...

  7. Python数据分析常用函数及参数详解,可以留着以备不时之需

    利用Python进行数据分析最核心的库就是Pandas,可以说,掌握了Pandas库,Python数据分析就属于中阶水平了. 在<一次简单.完整的全流程数据分析,让我们不再害怕Python &g ...

  8. python数据分析函数大全_python中数据分析常用函数整理

    一. apply函数 作用:对 DataFrame 的某行/列应用函数之后,Apply 返回一些值.函数既可以使用默认的,也可以自定义.注意:在第二个输出中应用 head() 函数,因为它包含了很多行 ...

  9. 《Python数据分析基础教程:NumPy学习指南(第2版)》笔记5:第三章 常用函数1——文件读写、算术平均值、最大值最小值、极值

    本章将介绍NumPy的常用函数.具体来说,我们将以分析历史股价为例,介绍怎样从文件中载入数据,以及怎样使用NumPy的基本数学和统计分析函数.这里还将学习读写文件的方法,并尝试函数式编程和NumPy线 ...

最新文章

  1. Spring MVC入门
  2. Go 性能优化技巧 8/10
  3. 团队作业(四):描述设计
  4. 镗孔指令g76格式_数控车床螺纹切削指令G32,用途广泛,可分度车削多头螺纹
  5. Android 触摸及手势操作GestureDetector
  6. mysql数据库在哪里写语句_Mysql数据库操作语句
  7. 极简代码(一)—— 精确率和错误率的计算
  8. [Asp.Net Core]Session的使用
  9. 景区门票预约系统如何开发
  10. 一款经典的 jQuery Lightbox 灯箱效果
  11. Grub4dos安装和启动完全指南
  12. MT7658芯片组资料,MT7658处理器参数介绍
  13. 赵小楼《天道》《遥远的救世主》深度解析(125)做你该做的,受你该受的
  14. 农信社计算机类试卷,农信社真题:开封农村信用社计算机考试试题合集
  15. Error creating bean with name ‘sqlSessionFactory‘ defined in class path resource [applicationContext
  16. KBU1010-ASEMI电源控制柜整流桥
  17. 【车辆计数】基于matlab光流法行驶车辆检测计数【含Matlab源码 627期】
  18. Direx 自学总结一
  19. Desktop Central 应用规范报告—如何利用BYOD(二)
  20. fs.mkdir创建目录报错

热门文章

  1. AD软件PCB转PADS
  2. Pytest 如何组织冒烟测试及执行冒烟用例
  3. CS很难发论文?这些技巧你都get了吗?
  4. 洲际酒店优悦会精英会籍延长12个月;美素佳儿合作京东超市力保宝宝口粮 | 美通企业日报...
  5. 蓝桥杯Python组的规矩
  6. 找出相似的图片--C#
  7. ds数据与mysql_比较CCDS数据库和R包内置数据集的差异
  8. 基于单片机的太阳能热水器辅助控制系统
  9. 还在纠结毕业后是去大公司还是小公司工作?我来告诉你至少应该去初创公司工作一次的5大理由
  10. 某国企 测试工程师 面试记录 2021-11-04