UserWarning: Ignoring URL ‘xxx‘ since it exceeds Excel‘s limit of 65,530 URLS per worksheet.
最近爬虫使用时出现警告!!!
原因是Exce表限制URL类型数据量为65530,超出的部分会被舍弃。
导致url 数据缺失。
解决方法:
将strings_to_urls自动转换功能关闭即可。
原代码:
# 保存信息data = pd.DataFrame(columns=['行业类型', '职位', '职位详情连接', '薪资', '经验要求', '学历要求', '工作性质', '到岗', '招聘人数', '年龄要求', '性别要求', '婚姻要求', '城市', '职位详情', '发布时间', '公司名称', '公司详情页', '公司类型', '公司性质', '所在地区', '公司规模', '公司简介'])for item in lists:data.loc[len(data)] = [item[0], item[1], item[2], item[3], item[4], item[5], item[6], item[7],item[8],item[9], item[10], item[11], item[12], item[13], item[14], item[15],item[16],item[17], item[18], item[19], item[20], item[21]]data.to_excel(r'D:\(测试).xlsx')
修改后的代码:
# 保存信息
data = pd.DataFrame(columns=['行业类型', '职位', '职位详情连接', '薪资', '经验要求', '学历要求', '工作性质', '到岗', '招聘人数', '年龄要求', '性别要求', '婚姻要求', '城市', '职位详情', '发布时间', '公司名称', '公司详情页', '公司类型', '公司性质', '所在地区', '公司规模', '公司简介'])
for item in lists:data.loc[len(data)] = [item[0], item[1], item[2], item[3], item[4], item[5], item[6], item[7],item[8],item[9], item[10], item[11], item[12], item[13], item[14], item[15],item[16],item[17], item[18], item[19], item[20], item[21]]with pd.ExcelWriter(r'D:\(测试).xlsx', engine='xlsxwriter', options={'strings_to_urls': False}) as writer:data.to_excel(writer, index=False)
UserWarning: Ignoring URL ‘xxx‘ since it exceeds Excel‘s limit of 65,530 URLS per worksheet.相关推荐
- Pandas 写入excel报错UserWarning: Ignoring URL
报错如下: UserWarning: Ignoring URL..................................................with link or locati ...
- TortoiseSVN Unable to connect to a repository at URL XXX
在Checkout资源库时,出现如下错误: Unable toconnectto a repositoryat URL XXX Error Unable to connect to a reposit ...
- WebService工具类调用远程接口服务时java.io.IOException: Server returned HTTP response code: 500 for URL XXX
问题描述:在本地测试时,使用个人封装的Webservice代码工具类调用远程接口服务时,一切正常.但是一旦将该代码放到一个已有项目的中使用时,就会出现如下所示的错误提示 java.io.IOExcep ...
- Springboot关于 Circular view path [xxx]: would dispatch back to the current handler URL [xxx] again
Springboot关于 Circular view path [xxx]: would dispatch back to the current handler URL [xxx] again报错问 ...
- .net连接DB2的异常SQL0666 - SQL query exceeds specified time limit or storage limit.错误处理
SQL0666 - SQL query exceeds specified time limit or storage limit. 原因:查询超时 解决办法: set the DbCommand.C ...
- entrypoint size limit: The following entrypoint(s) combined asset size exceeds the recommended limit
webpack打包提示文件体积过大导致 The following asset(s) exceed the recommended size limit (244 KiB). This can imp ...
- The following entrypoint(s) combined asset size exceeds the recommended limit (244 KiB).
笔者遇到的问题是:vue项目部署成功,也能访问,唯独就是界面加载不出来,通过logs日志:tail error.log命令,打印出:说一部分js.css文案not found****,笔者cd到项目目 ...
- webpack打包时提示:The following entrypoint(s) combined asset size exceeds the recommended limit
如果webpack打包时提示:The following entrypoint(s) combined asset size exceeds the recommended limit,可以设置 &q ...
- git错误:exceeds file size limit of 100.0 MB remote: error: hook declined to update refs/heads/master
今天在git上提交了一个大于100M的文件,结果发现报错如下: remote: warning: Large files detected. remote: error: File a/b/c is ...
最新文章
- pytorch使用horovod多gpu训练
- jira 审批流程_博兴县行政审批服务局推暖心服务工程 企业开办实现“全程网办”_博兴新闻...
- mysql创建外键级联更新_MySQL中利用外键实现级联删除、更新
- 01:操作系统(centos,redhat):性能监控和网络命令
- RabbitMQ教程C#版 “Hello World”
- ic 卡获取帐号apdu指令_非接触IC卡片APDU指令系统介绍..docx
- Java中代理的简明使用
- 计算机程序设计 大作业 vb,成人《VB程序设计》标准化大作业(答案)1
- mysql rs.next_JDBC结果集rs.next()注意事项
- ubuntu终端快速启动应用程序
- 【英语阅读】纽约时报 | “杀死我们的将是饥饿,而不是新冠病毒”
- 前方高能!看小伙是怎么表白粉丝的
- 电脑显示器连接主机 没反应 no signal!!
- android+通过菜单跳转页面,【风马一族_Android】通过菜单的点击,跳转到不同界面...
- 团队作业四-WBS练习
- LEAM(生活/生命体验算法模型)
- img取消无图片时的默认边框
- java什么是monitor和Monitor监视器锁、对象布局
- oracle exp 详解,oracle exp 详解
- 知道创宇研发技能表v3.1
热门文章
- 图解:什么是红黑树?(下篇)
- 计算机网络第三章——数据链路层(仅记录我所认为重要的知识点)
- 吴恩达2022机器学习——第二部分高级学习算法第二周笔记
- 合肥一中2021高考成绩查询,2021年合肥重点高中名单及排名,合肥高中高考成绩排名榜...
- 百度回复针对目前相关性问题
- 剑指Offer49—丑数
- 丑数求解以及丑数的优化
- 【教学类-15-02】20221119《姓名描字帖-A4竖版(2*7)普通中号字》(大班适合中层次幼儿)
- day21Java-常用对象网络编程Socket-TCP协议
- mysql查附近500米商户_mysql查询附近门店