Pandas出现KeyError及其分析解决
写在前面
今天在用爬虫及Pandas
更新股票日线数据的时候发现KeyError
报错,后面跟了一个DataFrame
列索引,一开始以为是索引修改列的值导致的问题,修改为.loc
错误依然出现,后来将列值的内容修改方法改为.apply(lambda)
问题依然出现。就在百思不得其解时,我发现了问题所在。。。
报错详细信息
主要配置及环境
Windows 10 64位
Python:3.6.8
Pandas:1.0.3
报错内容
Traceback (most recent call last):File "E:\py36\lib\site-packages\pandas\core\indexes\base.py", line 2646, in get_locreturn self._engine.get_loc(key)File "pandas\_libs\index.pyx", line 111, in pandas._libs.index.IndexEngine.get_locFile "pandas\_libs\index.pyx", line 138, in pandas._libs.index.IndexEngine.get_locFile "pandas\_libs\hashtable_class_helper.pxi", line 1619, in pandas._libs.hashtable.PyObjectHashTable.get_itemFile "pandas\_libs\hashtable_class_helper.pxi", line 1627, in pandas._libs.hashtable.PyObjectHashTable.get_item
KeyError: 'turnover'During handling of the above exception, another exception occurred:Traceback (most recent call last):File "E:\aaaDesktop\test.py", line 34, in <module>df['turnover'] = df['turnover'] * 100File "E:\py36\lib\site-packages\pandas\core\frame.py", line 2800, in __getitem__indexer = self.columns.get_loc(key)File "E:\py36\lib\site-packages\pandas\core\indexes\base.py", line 2648, in get_locreturn self._engine.get_loc(self._maybe_cast_indexer(key))File "pandas\_libs\index.pyx", line 111, in pandas._libs.index.IndexEngine.get_locFile "pandas\_libs\index.pyx", line 138, in pandas._libs.index.IndexEngine.get_locFile "pandas\_libs\hashtable_class_helper.pxi", line 1619, in pandas._libs.hashtable.PyObjectHashTable.get_itemFile "pandas\_libs\hashtable_class_helper.pxi", line 1627, in pandas._libs.hashtable.PyObjectHashTable.get_item
KeyError: 'turnover'
[Finished in 5.4s]
问题解决
代码主要流程:
抓取Sina财经的日线数据接口(有需要者可以私信我了解更多),抓取交易日所有交易的股票数据,进行数据处理、整合为DataFrame并逐行读取存入CSV文件。
既然不是索引的问题,那就只有一直往上追溯,结果发现,在 设置抓取函数的循环跳出条件 时,由于各大网站最近在备案&更新,导致空数据页面显示内容变成了一个字符串类型的空列表。。。于是只要将循环跳出的条件设置为:
if eval(content) == []:
就可以解决问题了。
举一反三
由于这次的经验,我发现在出现KeyError报错的时候,需要先查看数据是不是存在空值,尤其是程序里面有爬虫代码的时候,更需要注意。网站经常在变,不过基本上没有大的变化,万变不离其宗,掌握大的方法就可以了。
P.S. 本文为小白的理解与看法,有用就点个赞吧。
Pandas出现KeyError及其分析解决相关推荐
- python读取文件路径乱码 linux_Python之pandas读写文件乱码的解决方法
Python之pandas读写文件乱码的解决方法 python读写文件有时候会出现 'XXX'编码不能打开XXX什么的,用记事本打开要读取的文件,另存为UTF-8编码,然后再用py去读应该可以了.如果 ...
- ORA-04030: 在尝试分配...字节(...)时进程内存不足的原因分析解决方法
ORA-04030: 在尝试分配...字节(...)时进程内存不足的原因分析解决方法 参考文章: (1)ORA-04030: 在尝试分配...字节(...)时进程内存不足的原因分析解决方法 (2)ht ...
- Transaction rolled back because it has been marked as rollback-only分析解决方法
Transaction rolled back because it has been marked as rollback-only分析解决方法 参考文章: (1)Transaction rolle ...
- oracle 服务器硬盘满了,【案例】Oracle服务器diag进程占据了12g的磁盘空间分析解决办法...
[案例]Oracle服务器diag进程占据了12g的磁盘空间分析解决办法 时间:2016-11-13 20:10 来源:Oracle研究中心 作者:网络 点击: 次 天萃荷净 Oracle ...
- [转]关于形如--error LNK2005: xxx 已经在 msvcrtd.lib ( MSVCR90D.dll ) 中定义--的问题分析解决...
关于形如--error LNK2005: xxx 已经在 msvcrtd.lib ( MSVCR90D.dll ) 中定义--的问题分析解决 转自:http://hi.baidu.com/qinfen ...
- 通俗易懂地解决中文乱码问题(2) --- 分析解决Mysql插入移动端表情符报错 ‘incorrect string value: '\xF0......
原文:[原创]通俗易懂地解决中文乱码问题(2) --- 分析解决Mysql插入移动端表情符报错 'incorrect string value: '\xF0... 这篇blog重点在解决问题,如果你对 ...
- 死锁问题案例分析解决
C++11 - thread多线程编程,线程互斥和同步通信,死锁问题分析解决_大秦坑王的专栏-CSDN博客 top命令的用法_zhuoya_的博客-CSDN博客_top命令
- Python Subprocess Popen 管道阻塞问题分析解决
Python Subprocess Popen 管道阻塞问题分析解决 参考文章: (1)Python Subprocess Popen 管道阻塞问题分析解决 (2)https://www.cnblog ...
- 关于形如--error LNK2005: xxx 已经在 msvcrtd.lib ( MSVCR90D.dll ) 中定义--的问题分析解决
关于形如--error LNK2005: xxx 已经在 msvcrtd.lib ( MSVCR90D.dll ) 中定义--的问题分析解决 参考文章: (1)关于形如--error LNK2005: ...
最新文章
- 人民币小写转大写php实现
- Oracle-SYSAUX表空间解读
- 编译原理习题(含答案)——4-7语法分析——MOOC哈尔滨工业大学陈鄞配套_学习通_慕课堂
- cocoapods安装
- 【转】C# Stream篇(—) -- Stream基类
- 《C和指针》——数组的奇怪形式
- 超赞!arXiv论文如何一键链接解读视频,这个浏览器扩展帮你实现
- NodeJs将项目上传至服务器
- 注解 @EnableFeignClients 与 @ComponentScan 有冲突
- Win32写一个极简定时关机软件的全部过程讲解
- 基于ARM的SoC设计入门
- ArcGIS中的GeoDatabase(地理数据库)功能,你可能不够了解
- jq ajax传参的两种方式
- Java版飞翔的小鸟代码完整
- linux如何设置默认浏览器,如何从命令行设置默认浏览器?
- Python win32com 操作word 插入回车符,换行符
- 西瓜视频直播助手下载与安装过程 0523
- Python最强干货,建议收藏!!
- 如何将一个陈旧的游戏翻新?以中国象棋为例展开的头脑风暴
- MongoDB--Linux下搭建的副本集集群(踩过的坑,血和泪的教训)