只是个人笔记,没有观赏价值。

'''
7.2 检测和过滤异常值
'''data = pd.DataFrame(np.random.randn(1000, 4))
data.describe()col = data[2]
col
col[np.abs(col) > 3]data
data.head()
data.columnnames =['a', 'b', 'c', 'd']
###################
#  columnnames 不会改变列的名字, 那会改变什么呢?
data
data.columns = ['a', 'b', 'c', 'd']
data[data['a'] > 3].idxmax()
data['a'] > 3
data[data['a'] > 3]
c = data['c']
c.idxmax()
c
data['c'].nlargest()
c.argmax(2)
np.argpartition(c, )
x = np.array([4, 3, 2, 1])
np.argpartition(x, 3)[0]
np.argpartition(x, 3)
np.argpartition(x,3)
np.argpartition(x,2)
np.argpartition(x,5)
np.argwhere(x, 3)data[(np.abs(data)> 3).any(1)]
data[data>3].any(1)
(data>3).any(1)######################### 看来必须用上面的方式写,data[(data>3.5).any(1)]data[(np.abs(data) > 3).any(1)]
col[(np.abs(col) > 2).any(1)]
data[(data > 3).any(1)]
data[(data > 3).any(1)]
data[(data > 3).any()]data[np.abs(data) > 3] = np.sign(data) * 3
data
data.describe()

这里学习一下any的应用。

dataframe 里查找某个符合条件的数字

data = pd.DataFrame({'name':['张三', '李四', '王五', '赵六', '陈七', '郑八', '周九'],'age':np.random.randint(10, 30, 7)
})
data
data.loc[data['age']> 20, 'age']
data.loc[data['age']> 20, 'name']
data.loc[data['age']> 20, 'name'].values

使用loc,就可以得到想要的结果。

'''
如果我想批量替换,把大于25的替换25, 那么该这样。
'''
data[data['age']>20] =20
data

利用python进行数据分析学习笔记(2)相关推荐

  1. 利用python进行数据分析学习笔记

    利用python进行数据分析 numpy:数组与向量化计算 pandas pandas读取和写入数据集及文件格式 数据清洗与准备 数据规整:连接.联合和重排列 绘图与可视化 数据聚合与分组操作 时间序 ...

  2. 利用Python进行数据分析学习笔记六:数据清洗和准备

    一.处理缺失数据 在许多数据分析⼯作中,缺失数据是经常发⽣的.pandas的⽬标之⼀就是尽量轻松地处理缺失数据. 例如,pandas对象的所有描述性统计默认都不包括缺失数据. 缺失数据在pandas中 ...

  3. python数据笔记分析_利用 Python 进行数据分析学习笔记(一)

    数据分析是产品经理的必备技能之一,今年有意在提升自己这方面的能力.为了系统地学习,花了 20 个小时左右的时间在 Coursera 上学完的<用 Python 玩转数据分析>. 课程简介 ...

  4. 利用python进行数据分析学习笔记 第7章(3)

    ''' python 使用正则表达式, 也可以先 编译一个正则, 然后,用这个正则 去 match ,search , findall ''' text = "text my * IOD s ...

  5. 利用python进行统计分析学习笔记 第7章

    第7章,基本功能部分,讲到了函数应用和映射 这里作者说了. ,将函数应用到由各列或行所形成的一维数组上.DataFrame 的apply方法即可实现此功能: 然后又说, 元素级的Python函数也是可 ...

  6. Python数据分析学习笔记05:用户画像

    Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...

  7. python客户画像_Python数据分析学习笔记05:用户画像

    Python数据分析学习笔记05:用户画像 一.用户画像 用户画像是指根据用户的属性.用户偏好.生活习惯.用户行为等信息而抽象出来的标签化用户模型.通俗说就是给用户打标签,而标签是通过对用户信息分析而 ...

  8. Python数据分析学习笔记:使用SciKit-Learn进行数据规范化

    Python数据分析学习笔记:使用SciKit-Learn进行数据规范化 数据规范化是数据挖掘的一项基础工作.不同评价指标往往具有不同的量纲,数值见的差别可能很大,不进行处理可能会影响到数据分析的结果 ...

  9. Python数据分析学习笔记:计算向量夹角

    Python数据分析学习笔记:计算向量夹角 通过计算两个向量夹角了解两个向量之间的相关性. # 计算向量夹角import numpy as npdef included_angle(a, b):a_n ...

最新文章

  1. 常用地理数据平台及环境数据资源 (GIS)
  2. JSR349(Bean Validation 1.1)
  3. 自学大数据:用以生产环境的Hadoop版本比较
  4. Spring3.0 AOP 详解
  5. SAE 助力「海底小纵队学英语」全面拥抱 Serverless,节省 25% 以上成本
  6. html下拉列表插件,js+CSS实现模拟华丽的select控件下拉菜单效果
  7. 你永远不知道女生裙子下面藏着什么
  8. Java,JavaFX的流利设计风格文本字段和密码字段
  9. AUTOSAR从入门到精通100讲(十八)-AUTOSAR操作系统OS
  10. VisualCode 查看代码历史版本、还原代码到既定历史版本
  11. Redis 消息队列的三种方案(List、Streams、Pub/Sub)
  12. 2021社区居家养老现状与未来趋势报告
  13. rem适配的浏览器_移动端网页布局适配rem方案小结
  14. 如何用 RFM 模型扒出 B 站优质 UP 主?| 附实战代码
  15. Android App 开发入门
  16. 瞎扯:修仙文明VS科技文明发展潜力
  17. 离线语音控制命令识别,全向麦、会议蓝牙音箱方案
  18. 现在人工智能自动修复老照片的效果有好?
  19. 羞羞的和成人机器人恋爱,或许这是“寂寞经济”催生的新风口
  20. 程序员分享:最近面试 Java 后端开发的感受

热门文章

  1. python图像拼接过渡自然_python实现图像拼接功能
  2. Cuboid特征提取算法
  3. 【控制】《多智能体系统的动力学分析与设计》徐光辉老师-第4章-带有事件驱动控制的分数阶多智能体系统的一致性
  4. 【数理知识】《随机过程》方兆本老师-第6章-鞅过程及其性质
  5. 3.1 基础模型-深度学习第五课《序列模型》-Stanford吴恩达教授
  6. 爱国者强烈推荐:nanopiR1——你懂的功能,懂你的开发板
  7. linux7 开ftp,linux centos 7 开启 ftp
  8. 深度解析(十五)哈夫曼树
  9. 探寻教育信息化着力点,创新四川省教育厅IT管理
  10. 简单用数组模拟顺序栈(c++)