从网页获取数据,对于爬虫等方法是很快,但是网页文件通常对新手不友好,结构格式什么的很复杂,对于无写爬虫代码能力的小白就只能复制粘贴数据了,一点点从网页上把数据复制,然后粘贴到excel里面。

但是对于复制粘贴,也有快速的方法。

主要依靠pandas库里面的pd.read_clipboard()实现,该函数可以读取剪贴板,变为数据框。

具体使用方法演示如下:

首先我找了一个案例网站,还是东方财富网,财报数据:

2022年中报业绩大全 _ 数据中心 _ 东方财富网 (eastmoney.com)

到这个网站我们先复制一下第一页的数据。

注意我这里复制的时候没有复制标题,因为东方财富网这个标题不规范,行数不一样,所以我们复制的时候就复制下面的数据就行。

当然存储下来的数据也没有标题,不过标题就一行,可以后面再去手动加。

写一个Python脚本,运行:

import pandas as pd
data=pd.DataFrame()while True:a=input('退出就输入n,回车或任意键继续')if a=='n':breakdf=pd.read_clipboard(header=None)data=data.append(df)data.to_excel('复制粘贴的数据.xlsx',index=False)

每一次我们复制了新的数据,就按一次回车就行,然后再去复制下一页,回车让数据进去,然后循环往复.........当然回车前输入任意别的字符也可以,如果复制完了就输入“n”然后回车退出。

退出后该目录下就会自动多出一个excel文件:

我这里复制了四次,然后存储下来,看看结果:

效果还不错,列名没有后面可以自己加。然后复制了4页就是200条数据,也是对得上,没问题。


复制什么别的数据也是可以的,只要列数都是一样,每次回车新复制的数据都会追加进去。

如果感觉要复制的量太多也可以分批完成,先复制1-5页存下来看看效果,然后继续复制6-10....最后合并一下就行。

python自动化小技巧08——从剪贴板读取数据(快速复制粘贴)相关推荐

  1. 小技巧 - 解决 webp 格式图片的快速复制粘贴

    图片地址:https://mmbiz.qpic.cn/mmbiz_png/KzkuB2Hqt7Myugic18mnX30IYDPjVW119E5OcA7yS8icnsibLfxFfIsP63mTZEb ...

  2. Python自动化小技巧01——清洗并替换文件名称

    本次开启一个新栏目,主要是使用Python的一些小技巧和方法,去简化生活中的一些重复性的劳动.这些py文件可以当做脚本使用,代码写好后可以全自动,点一下运行就能使用. 这些技巧和方法不涉及数据科学领域 ...

  3. Python自动化小技巧11——excel文件的文字内容筛选

    上一期讲述了怎么讲多个excel多sheet表进行批量合并,本次案例就是来讲讲合并之后对数据进行清洗整理的过程,筛掉无用的数据. 这个案例中博主是处理文本,主要是各大平台上的新闻的文字.筛选就是把那些 ...

  4. Python自动化小技巧06——任意图片做出二维码

    Python做二维码是很有趣的小项目.这段代码很简单,新手也能很快学会. 而且很实用,组建活动,送礼物,表白啥都能用的上. 主要依靠MyQR这个库来实现,先来看看效果: 我们将下面这个表情包,变为一个 ...

  5. Python自动化小技巧14——自动批量发送邮件(带各种附件)

    案例背景 我的博客下面评论都是各种要数据的......一个一个发其实很浪费时间的,每次输入评论者的邮箱,然后打开数据所在的文件夹,上传,填写标题正文,发送....... 一模一样的流程,所以这种重复性 ...

  6. Python自动化小技巧07——符号计算求方程解、二重积分

    平时做高数数分的作业,手算定积分二重积分什么的太复杂了,虽然scipy能实现在方程和定积分上面求数值解,但是很多时候我们的题目里面都会带着a.x等未知参数,这个时候涉及符号运算,需要用到Python的 ...

  7. Python自动化小技巧10——excel文件批量多sheet表合并

    本次案例背景是博主之前实习时遇到的问题,就是有很多个excel表: 每个工作簿里面又有很多sheet子表: 想要把这些子表合并在一起,多个excel工作簿也要合并到一起,手工肯定慢,这种重复性的劳动交 ...

  8. Python自动化小技巧13——批量下载北交所上市公司年报

    案例背景 同学问能不能爬虫下载年报,要下很多公司,一个一个搜索下载太慢了... 这种重复性的劳动交给Python脚本可太适合了 核心思想还是使用selenium库去模拟人输入股票代码和搜索下载. 北交 ...

  9. Python常用小技巧(五)——批量读取json文件

    Python常用小技巧(五)--批量读取json文件 前言:其实Python能够批量读取很多文件,这里,本人以json文件为例(json是标注图片时生成的文件,记录有标注的坐标和标签,友情推荐标注图片 ...

最新文章

  1. tomcat默认用户名密码修改
  2. linux 主目录 配置文件
  3. (转) RabbitMQ学习之发布/订阅(java)
  4. 以后台服务的形式启动nodejs应用
  5. python爬虫网页图片并保存到本地
  6. bitnami下mysql配置-包含phpMyAdmin配置
  7. VIIRS SDR数据预处理(一)
  8. AI技术的苹果iPhone XS Max双卡双待7纳米6.5寸512GB顶配12799元(公号回复“苹果AI”下载PDF资料)
  9. 代码比较工具——DiffMerge的安装教程
  10. 医学影像常用Python包
  11. 吉他铺怎么看(很全)
  12. 大幅提升CLIP图像分类准确率-Tip-Adapter
  13. left join和left semi join的区别
  14. 【清明特辑】那些虽败犹荣的科技先烈们
  15. 【Error】解决:Not creating XLA devices, tf_xla_enable_xla_devices not set
  16. 用户画像数据指标体系之风险控制维度
  17. 微信公众平台不应是自媒体唯一的内容输出来源
  18. DHCP协议详解,报文内容,如何查看报文,为什么offer报文会以广播的形式进行发送
  19. 同济计算机考研分数线,2016年同济大学考研分数线公布
  20. 诺基亚S60手机使用Gravity访问Twitter的方法

热门文章

  1. 华擎H97 Performance 1150主板板载千兆网卡手动从百兆切换千兆设置
  2. 大话设计模式学习 C++
  3. Jquery 给div设置背景图
  4. 饿了么在即时零售的胜算
  5. 2017年程序猿的九大提升点(微记录)
  6. go语言web开发1 相关知识
  7. 『Java安全』Tomcat内存马_动态注册Listener内存马
  8. cmos逻辑门传输延迟时间_集基耦合双稳电路,集成化单稳电路,数字逻辑电路,门电路,触发器...
  9. 酷播云html5倍速功能视频播放器,可以倍速播放视频的浏览器插件
  10. 什么是机器学习PAI