最近爬虫使用时出现警告!!!

原因是Exce表限制URL类型数据量为65530,超出的部分会被舍弃。

导致url 数据缺失。

解决方法:

将strings_to_urls自动转换功能关闭即可。

原代码:

# 保存信息data = pd.DataFrame(columns=['行业类型', '职位', '职位详情连接', '薪资', '经验要求', '学历要求', '工作性质', '到岗', '招聘人数', '年龄要求', '性别要求', '婚姻要求', '城市', '职位详情', '发布时间', '公司名称', '公司详情页', '公司类型', '公司性质', '所在地区', '公司规模', '公司简介'])for item in lists:data.loc[len(data)] = [item[0], item[1], item[2], item[3], item[4], item[5], item[6], item[7],item[8],item[9], item[10], item[11], item[12], item[13], item[14], item[15],item[16],item[17], item[18], item[19], item[20], item[21]]data.to_excel(r'D:\(测试).xlsx')

修改后的代码:

# 保存信息
data = pd.DataFrame(columns=['行业类型', '职位', '职位详情连接', '薪资', '经验要求', '学历要求', '工作性质', '到岗', '招聘人数', '年龄要求', '性别要求', '婚姻要求', '城市', '职位详情', '发布时间', '公司名称', '公司详情页', '公司类型', '公司性质', '所在地区', '公司规模', '公司简介'])
for item in lists:data.loc[len(data)] = [item[0], item[1], item[2], item[3], item[4], item[5], item[6], item[7],item[8],item[9], item[10], item[11], item[12], item[13], item[14], item[15],item[16],item[17], item[18], item[19], item[20], item[21]]with pd.ExcelWriter(r'D:\(测试).xlsx', engine='xlsxwriter', options={'strings_to_urls': False}) as writer:data.to_excel(writer, index=False)

UserWarning: Ignoring URL ‘xxx‘ since it exceeds Excel‘s limit of 65,530 URLS per worksheet.相关推荐

  1. Pandas 写入excel报错UserWarning: Ignoring URL

    报错如下: UserWarning: Ignoring URL..................................................with link or locati ...

  2. TortoiseSVN Unable to connect to a repository at URL XXX

    在Checkout资源库时,出现如下错误: Unable toconnectto a repositoryat URL XXX Error Unable to connect to a reposit ...

  3. WebService工具类调用远程接口服务时java.io.IOException: Server returned HTTP response code: 500 for URL XXX

    问题描述:在本地测试时,使用个人封装的Webservice代码工具类调用远程接口服务时,一切正常.但是一旦将该代码放到一个已有项目的中使用时,就会出现如下所示的错误提示 java.io.IOExcep ...

  4. Springboot关于 Circular view path [xxx]: would dispatch back to the current handler URL [xxx] again

    Springboot关于 Circular view path [xxx]: would dispatch back to the current handler URL [xxx] again报错问 ...

  5. .net连接DB2的异常SQL0666 - SQL query exceeds specified time limit or storage limit.错误处理

    SQL0666 - SQL query exceeds specified time limit or storage limit. 原因:查询超时 解决办法: set the DbCommand.C ...

  6. entrypoint size limit: The following entrypoint(s) combined asset size exceeds the recommended limit

    webpack打包提示文件体积过大导致 The following asset(s) exceed the recommended size limit (244 KiB). This can imp ...

  7. The following entrypoint(s) combined asset size exceeds the recommended limit (244 KiB).

    笔者遇到的问题是:vue项目部署成功,也能访问,唯独就是界面加载不出来,通过logs日志:tail error.log命令,打印出:说一部分js.css文案not found****,笔者cd到项目目 ...

  8. webpack打包时提示:The following entrypoint(s) combined asset size exceeds the recommended limit

    如果webpack打包时提示:The following entrypoint(s) combined asset size exceeds the recommended limit,可以设置 &q ...

  9. git错误:exceeds file size limit of 100.0 MB remote: error: hook declined to update refs/heads/master

    今天在git上提交了一个大于100M的文件,结果发现报错如下: remote: warning: Large files detected. remote: error: File a/b/c is ...

最新文章

  1. pytorch使用horovod多gpu训练
  2. jira 审批流程_博兴县行政审批服务局推暖心服务工程 企业开办实现“全程网办”_博兴新闻...
  3. mysql创建外键级联更新_MySQL中利用外键实现级联删除、更新
  4. 01:操作系统(centos,redhat):性能监控和网络命令
  5. RabbitMQ教程C#版 “Hello World”
  6. ic 卡获取帐号apdu指令_非接触IC卡片APDU指令系统介绍..docx
  7. Java中代理的简明使用
  8. 计算机程序设计 大作业 vb,成人《VB程序设计》标准化大作业(答案)1
  9. mysql rs.next_JDBC结果集rs.next()注意事项
  10. ubuntu终端快速启动应用程序
  11. 【英语阅读】纽约时报 | “杀死我们的将是饥饿,而不是新冠病毒”
  12. 前方高能!看小伙是怎么表白粉丝的
  13. 电脑显示器连接主机 没反应 no signal!!
  14. android+通过菜单跳转页面,【风马一族_Android】通过菜单的点击,跳转到不同界面...
  15. 团队作业四-WBS练习
  16. LEAM(生活/生命体验算法模型)
  17. img取消无图片时的默认边框
  18. java什么是monitor和Monitor监视器锁、对象布局
  19. oracle exp 详解,oracle exp 详解
  20. 知道创宇研发技能表v3.1

热门文章

  1. 图解:什么是红黑树?(下篇)
  2. 计算机网络第三章——数据链路层(仅记录我所认为重要的知识点)
  3. 吴恩达2022机器学习——第二部分高级学习算法第二周笔记
  4. 合肥一中2021高考成绩查询,2021年合肥重点高中名单及排名,合肥高中高考成绩排名榜...
  5. 百度回复针对目前相关性问题
  6. 剑指Offer49—丑数
  7. 丑数求解以及丑数的优化
  8. 【教学类-15-02】20221119《姓名描字帖-A4竖版(2*7)普通中号字》(大班适合中层次幼儿)
  9. day21Java-常用对象网络编程Socket-TCP协议
  10. mysql查附近500米商户_mysql查询附近门店