利用python进行数据分析学习笔记(2)
只是个人笔记,没有观赏价值。
'''
7.2 检测和过滤异常值
'''data = pd.DataFrame(np.random.randn(1000, 4))
data.describe()col = data[2]
col
col[np.abs(col) > 3]data
data.head()
data.columnnames =['a', 'b', 'c', 'd']
###################
# columnnames 不会改变列的名字, 那会改变什么呢?
data
data.columns = ['a', 'b', 'c', 'd']
data[data['a'] > 3].idxmax()
data['a'] > 3
data[data['a'] > 3]
c = data['c']
c.idxmax()
c
data['c'].nlargest()
c.argmax(2)
np.argpartition(c, )
x = np.array([4, 3, 2, 1])
np.argpartition(x, 3)[0]
np.argpartition(x, 3)
np.argpartition(x,3)
np.argpartition(x,2)
np.argpartition(x,5)
np.argwhere(x, 3)data[(np.abs(data)> 3).any(1)]
data[data>3].any(1)
(data>3).any(1)######################### 看来必须用上面的方式写,data[(data>3.5).any(1)]data[(np.abs(data) > 3).any(1)]
col[(np.abs(col) > 2).any(1)]
data[(data > 3).any(1)]
data[(data > 3).any(1)]
data[(data > 3).any()]data[np.abs(data) > 3] = np.sign(data) * 3
data
data.describe()
这里学习一下any的应用。
dataframe 里查找某个符合条件的数字
data = pd.DataFrame({'name':['张三', '李四', '王五', '赵六', '陈七', '郑八', '周九'],'age':np.random.randint(10, 30, 7)
})
data
data.loc[data['age']> 20, 'age']
data.loc[data['age']> 20, 'name']
data.loc[data['age']> 20, 'name'].values
使用loc,就可以得到想要的结果。
'''
如果我想批量替换,把大于25的替换25, 那么该这样。
'''
data[data['age']>20] =20
data
利用python进行数据分析学习笔记(2)相关推荐
- 利用python进行数据分析学习笔记
利用python进行数据分析 numpy:数组与向量化计算 pandas pandas读取和写入数据集及文件格式 数据清洗与准备 数据规整:连接.联合和重排列 绘图与可视化 数据聚合与分组操作 时间序 ...
- 利用Python进行数据分析学习笔记六:数据清洗和准备
一.处理缺失数据 在许多数据分析⼯作中,缺失数据是经常发⽣的.pandas的⽬标之⼀就是尽量轻松地处理缺失数据. 例如,pandas对象的所有描述性统计默认都不包括缺失数据. 缺失数据在pandas中 ...
- python数据笔记分析_利用 Python 进行数据分析学习笔记(一)
数据分析是产品经理的必备技能之一,今年有意在提升自己这方面的能力.为了系统地学习,花了 20 个小时左右的时间在 Coursera 上学完的<用 Python 玩转数据分析>. 课程简介 ...
- 利用python进行数据分析学习笔记 第7章(3)
''' python 使用正则表达式, 也可以先 编译一个正则, 然后,用这个正则 去 match ,search , findall ''' text = "text my * IOD s ...
- 利用python进行统计分析学习笔记 第7章
第7章,基本功能部分,讲到了函数应用和映射 这里作者说了. ,将函数应用到由各列或行所形成的一维数组上.DataFrame 的apply方法即可实现此功能: 然后又说, 元素级的Python函数也是可 ...
- Python数据分析学习笔记05:用户画像
Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...
- python客户画像_Python数据分析学习笔记05:用户画像
Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...
- Python数据分析学习笔记:使用SciKit-Learn进行数据规范化
Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作.不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果 ...
- Python数据分析学习笔记:计算向量夹角
Python数据分析学习笔记:计算向量夹角 通过计算两个向量夹角了解两个向量之间的相关性. # 计算向量夹角import numpy as npdef included_angle(a, b):a_n ...
最新文章
- 常用地理数据平台及环境数据资源 (GIS)
- JSR349(Bean Validation 1.1)
- 自学大数据:用以生产环境的Hadoop版本比较
- Spring3.0 AOP 详解
- SAE 助力「海底小纵队学英语」全面拥抱 Serverless,节省 25% 以上成本
- html下拉列表插件,js+CSS实现模拟华丽的select控件下拉菜单效果
- 你永远不知道女生裙子下面藏着什么
- Java,JavaFX的流利设计风格文本字段和密码字段
- AUTOSAR从入门到精通100讲(十八)-AUTOSAR操作系统OS
- VisualCode 查看代码历史版本、还原代码到既定历史版本
- Redis 消息队列的三种方案(List、Streams、Pub/Sub)
- 2021社区居家养老现状与未来趋势报告
- rem适配的浏览器_移动端网页布局适配rem方案小结
- 如何用 RFM 模型扒出 B 站优质 UP 主?| 附实战代码
- Android App 开发入门
- 瞎扯:修仙文明VS科技文明发展潜力
- 离线语音控制命令识别,全向麦、会议蓝牙音箱方案
- 现在人工智能自动修复老照片的效果有好?
- 羞羞的和成人机器人恋爱,或许这是“寂寞经济”催生的新风口
- 程序员分享:最近面试 Java 后端开发的感受
热门文章
- python图像拼接过渡自然_python实现图像拼接功能
- Cuboid特征提取算法
- 【控制】《多智能体系统的动力学分析与设计》徐光辉老师-第4章-带有事件驱动控制的分数阶多智能体系统的一致性
- 【数理知识】《随机过程》方兆本老师-第6章-鞅过程及其性质
- 3.1 基础模型-深度学习第五课《序列模型》-Stanford吴恩达教授
- 爱国者强烈推荐:nanopiR1——你懂的功能,懂你的开发板
- linux7 开ftp,linux centos 7 开启 ftp
- 深度解析(十五)哈夫曼树
- 探寻教育信息化着力点,创新四川省教育厅IT管理
- 简单用数组模拟顺序栈(c++)