Pandas、Numpy使用时常见问题
DataFrame多索引读取
相关数据及输出结果见下图:
data_pre=np.zeros(90000).reshape(100,900)
# print(data_pre)
df_similarity=pd.DataFrame(data=data_pre,index=df_test.index,columns=df_train.index)
print(df_similarity)
print(df_similarity['岁月神偷',2010])
多索引提取信息时,如上图可以看出DataFrame对应的行索引和列索引都有title和release_date两个索引,在读取某一行的信息时,应该表明两个索引才可以输出正确结果。如上图输入索引名为:['岁月神偷',2010]两个索引时,才可以输出对应的以此为列索引的指定列的内容。
DataFrame指定位置数据的提取
根据关键字
df.loc['关键字']
根据对应的行数或者列数
df.iloc[]
此外,在进行数据分析处理时,务必确保时间复杂度相对较低,否则影响总体效果。
比如,能够使用Pandas或者Numpy科学分析库的函数,就尽量不要使用多重for循环去迭代,造成时间复杂度指数级增长(在做课设的时候,我就是有一个地方用了三重for循环嵌套,导致计算结果又慢,又容易出错,最后换成Numpy中的库函数,就迅速解决了)
因此,灵活掌握Numpy和Pandas库中的函数还是十分重要的(虽然其中不少函数的参数确实有点多......)
pd.read_csv中读出的数据和DataFrame搞混
这个问题当时我也挺糊涂的,就是当你使用Pandas中的read_csv函数时,比如说见下图
data1 = pd.read_csv('film_info.csv', sep=',', header=0, delimiter=None, names=None, skiprows=None, nrows=None,encoding='gbk', index_col=None, usecols=None)
data1=pd.DataFrame(data=data1,index=None,columns['title','score','release_date','types','regions'])
上述代码中,假如直接对data1使用下列操作,而没有再次定义Dataframe,将data1的数据导入
all_countries=""
for i in range(0,2000):all_countries=all_countries+','+data1['regions'][i]
程序会报错,因为不能对read_csv读取出的对象直接使用DataFrame的相关操作。
Pandas、Numpy使用时常见问题相关推荐
- 超详细消息队列MQ使用时常见问题以及解决办法
消息队列常见问题的解决办法 会出现问题总结 问题解决 消息队列造成系统可用性降低 系统复杂性增加 消息丢失问题 消息被重复消费 消息积压过多 没有什么问题是加一层解决不了的,如果有,那么久加两层,今天 ...
- html条码枪响应慢,条码扫描枪使用时的常见问题
原标题:条码扫描枪使用时的常见问题 1.为什么将扫描枪连接到电脑后没反映? 答:将扫描枪连接到电脑后,是否启动声音,如果没启动声音,请检查一下您所用的连接线是否正常,电脑是否正常.如果连接线确认正常, ...
- 蠎周刊418 ~Pandas DataFrame: 使处理数据令人愉快
原文: PyCoder's Weekly - Issue #418 200429 Zoom.Quiet(大妈) 用时 42 分钟 完成快译 200429 Zoom.Quiet(大妈) 用时 37 分钟 ...
- 超级攻略!Pandas\NumPy\Matrix用于金融数据准备
来源:数据STUDIO 数据准备是一项必须具备的技术,是一个迭代且灵活的过程,可以用于查找.组合.清理.转换和共享数据集,包括用于分析/商业智能(BI).数据科学/机器学习(ML)和自主数据集成中.具 ...
- #第17篇分享:python数据处理-pandas,numpy,matplotlib
#python数据处理-pandas,numpy,matplotlib: 对于数据来说,有数据爬取-爬虫,数据处理-就是今天学习的,以及数据分析-sklearn,tensoflow机器学习及深度学习: ...
- 前端 重构时需要注意的事项_驾驶式扫地车的功能特点和使用时需要注意事项...
扫地车 随着经济的发展,人们的生活水平不断提高,对生活环境的要求也越来越高,于是许多工厂.物业.超市.社区.市政单位等开始购买扫地车来进行路面清洁.一是清洗效果好,二是效率高,可以节省人工成本.扫地车 ...
- 有没搞错?Java 对象不使用时要赋值为 null?
点击上方蓝色"方志朋",选择"设为星标"回复"666"获取独家整理的学习资料! 许多Java开发者都曾听说过"不使用的对象应手动赋 ...
- 主成分分析(Principle Component Analysis)PCA的核心思想是什么?PCA算法的优缺点?增量PCA模型, 随机PCA, 模型、 核化PCA分别是什么?使用时如何选择?
主成分分析(Principle Component Analysis)PCA的核心思想是什么?增量PCA模型, 随机PCA, 模型. 核化PCA分别是什么?使用时如何选择? 主成分分析(Princip ...
- 场效应管的判别、检测及使用时的注意事项!
一.用指针式万用表对场效应管进行判别 1)用测电阻法判别结型场效应管的电极 根据场效应管的PN结正.反向电阻值不一样的现象,可以判别出结型场效应管的三个电极.具体方法:将万用表拨在R×1k档上,任选两 ...
最新文章
- 文件分享微信小程序的设计与开发 Java开发微信小程序 毕业设计
- 创建git项目的feature分支以及下载特定分支的仓库代码
- 脚本调用后台代码 asp.net ajax
- 【Android RTMP】RTMPDump 封装 RTMPPacket 数据包 ( 关键帧数据格式 | 非关键帧数据格式 | x264 编码后的数据处理 | 封装 H.264 视频数据帧 )
- 紫书动规 例题9-10 UVA - 1626 Brackets sequence 区间dp
- dev c++代码自动补全_让代码自动补全的全套流程
- jQuery.fn.load调用时给url加selector之后执行脚本的方法
- 一颗接一颗的飞鸽传书
- php 原子性,PHP下O_APPEND模式的原子性
- java制作玩游戏并支付游戏币_java 学习第三天小练习
- 推特称攻击者利用其 API 匹配用户名和电话号码
- paper 134:结构张量structure tensor(二)
- fit函数 model_函数式 API
- 计算机专业面试 英文,计算机专业英文面试自我介绍.doc
- 第三章: 微信小程序底部导航栏的实现(详细)
- ZEMAX实例学习1:单透镜(a singlet)
- 城市生态规划关键技术方法之六:情景分析方法
- 玉米社:抖音玩法和运营机制,学会这些技巧,轻松上热门
- 等保测评一体机是什么?由哪些安全模板组成?
- css图片锯齿,CSS 锯齿实现