在搜集并整理了获取基金数据方法 https://blog.csdn.net/fuyouhan/article/details/120595188
发现还有另外一种通过访问网页并提取数据的方法。这里分享给大家。

思路: 通过chrome driver获取指定urls的数据并解析为dataframes,然后保存为excel的多个sheet
具体步骤:

  1. 安装chrome浏览器,可以从腾讯安装 https://pc.qq.com/search.html#!keyword=chrome
  2. 运行代码:
    • 该代码自动下载chrome版本对应的最新chrome driver
    • 通过该chrome driver自动打开网址,加载数据
    • 解析数据,并保存为excel
"""
通过chrome driver获取指定urls的数据并解析为dataframes,然后保存为excel的多个sheet
6. 安装chrome浏览器,可以从腾讯安装 https://pc.qq.com/search.html#!keyword=chrome
7. 该代码自动下载chrome LATEST driver
8. 通过该chrome自动打开网址,加载数据
9. 解析数据,并保存为excel
"""
from selenium import webdriver
from webdriver_manager.chrome import ChromeDriverManagerimport pandas as pd
from bs4 import BeautifulSoup
import time
import datetimedef getData(key, url):"""通过chrome driver获取指定URL的数据并生成dataframe"""driver = webdriver.Chrome(ChromeDriverManager().install())driver.get(url)time.sleep(10)soup = BeautifulSoup(driver.page_source, features="lxml")dbtable = soup.findAll(name="table", attrs={"id": "dbtable"})all_dict = {}for i in range(len(column_name_list)):all_dict[column_name_list[i]] = []trs_item = dbtable[0].tbody.findAll(name="tr")for tr_item in trs_item:ids = tr_item.findAll(name="td")for i in range(len(column_name_list)):all_dict[column_name_list[i]].append(ids[i + 2].text)#pd.DataFrame(all_dict).to_csv("{}.csv".format(key), encoding='utf_8_sig', index=False)data = pd.DataFrame(all_dict)print("%s,nums=%d,%s" % (key, len(data), url))print(data)data.to_csv("{}.csv".format(key), encoding='utf_8_sig', index=False)driver.close()return  dataif __name__ == "__main__":#driver = webdriver.Chrome(ChromeDriverManager().install())url_dict = {"全部": "http://fund.eastmoney.com/data/fundranking.html#tall;c0;r;szzf;pn10000;ddesc;qsd20201031;qed20211031;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb","股票型": "http://fund.eastmoney.com/data/fundranking.html#tgp;c0;r;szzf;pn10000;ddesc;qsd20201031;qed20211031;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb","混合型": "http://fund.eastmoney.com/data/fundranking.html#thh;c0;r;szzf;pn10000;ddesc;qsd20201031;qed20211031;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb","债券型": "http://fund.eastmoney.com/data/fundranking.html#tzq;c0;r;szzf;pn10000;ddesc;qsd20201031;qed20211031;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb","指数型": "http://fund.eastmoney.com/data/fundranking.html#tzs;c0;r;szzf;pn10000;ddesc;qsd20201031;qed20211031;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb"}column_name_list = ["基金代码", "基金简称", "日期", "单位净值", "累计净值", "日增长率", "近1周", "近1月", "近3月", "近6月", "近1年", "近2年", "近3年","今年来", "成立来", "自定义", "手续费"]today = datetime.datetime.now().strftime('%Y%m%d_%H%M%S')filename = "基金排行%s.xlsx" % todaydata = pd.DataFrame()with pd.ExcelWriter(filename) as writer:for key, url in url_dict.items():print(">>>>> Get Data for %s" % key)data = getData(key, url)print(">>>>> Save Data for %s" % key)data.to_excel(writer, key, encoding='utf_8_sig', index=False)

运行结果:

C:\py\venv\Scripts\python.exe C:/py/test.py
[WDM] - [WDM] - ====== WebDriver manager ======
>>>>> Get Data for 全部
[WDM] - Current google-chrome version is 95.0.4638
[WDM] - Get LATEST driver version for 95.0.4638
[WDM] - Get LATEST driver version for 95.0.4638
[WDM] - Trying to download new driver from https://chromedriver.storage.googleapis.com/95.0.4638.54/chromedriver_win32.zip
[WDM] - Driver has been saved in cache [C:\Users\anna\.wdm\drivers\chromedriver\win32\95.0.4638.54]
全部,nums=9238,http://fund.eastmoney.com/data/fundranking.html#tall;c0;r;szzf;pn10000;ddesc;qsd20201031;qed20211031;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb基金代码    基金简称     日期    单位净值  ...     今年来     成立来     自定义    手续费
0     001970  泰信鑫选灵活  11-05  1.3610  ...  14.27%  36.10%  10.71%  0.15%
1     002580  泰信鑫选灵活  11-05  1.3550  ...  14.73%  34.96%  11.15%  0.00%
2     012728  国泰中证动漫  11-05  1.0495  ...     ---   4.95%  -1.73%  0.10%
3     012729  国泰中证动漫  11-05  1.0484  ...     ---   4.84%  -1.83%  0.00%
4     012769  华夏中证动漫  11-05  1.0723  ...     ---   7.23%   0.60%  0.00%
...      ...     ...    ...     ...  ...     ...     ...     ...    ...
9233  013850  同泰优选配置  11-04  1.0008  ...     ---   0.08%   0.00%  0.00%
9234  013849  同泰优选配置  11-04  1.0009  ...     ---   0.09%   0.00%  0.06%
9235  014046  交银医药创新  11-05  3.3731  ...     ---   0.00%     ---  0.00%
9236  014051  平安安盈灵活  11-05  2.8516  ...     ---  -0.73%     ---  0.00%
9237  013950  交银先锋混合  11-05  2.8005  ...     ---   0.00%     ---  0.00%[9238 rows x 17 columns]
>>>>> Save Data for 全部
[WDM] - [WDM] - ====== WebDriver manager ======
>>>>> Get Data for 股票型
[WDM] - Current google-chrome version is 95.0.4638
[WDM] - Get LATEST driver version for 95.0.4638
[WDM] - Driver [C:\Users\anna\.wdm\drivers\chromedriver\win32\95.0.4638.54\chromedriver.exe] found in cache
股票型,nums=1850,http://fund.eastmoney.com/data/fundranking.html#tgp;c0;r;szzf;pn10000;ddesc;qsd20201031;qed20211031;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb基金代码    基金简称     日期    单位净值  ...     今年来      成立来     自定义    手续费
0     012728  国泰中证动漫  11-05  1.0495  ...     ---    4.95%  -1.73%  0.10%
1     012729  国泰中证动漫  11-05  1.0484  ...     ---    4.84%  -1.83%  0.00%
2     012769  华夏中证动漫  11-05  1.0723  ...     ---    7.23%   0.60%  0.00%
3     012768  华夏中证动漫  11-05  1.0728  ...     ---    7.28%   0.65%  0.12%
4     001167  金鹰科技创新  11-05  1.3910  ...  24.75%   39.10%  31.46%  0.15%
...      ...     ...    ...     ...  ...     ...      ...     ...    ...
1845  011602  前海开源公共  11-05  0.8139  ...     ---  -18.61%  -9.01%  0.00%
1846  011601  前海开源公共  11-05  0.8159  ...     ---  -18.41%  -8.79%  0.15%
1847  013475  华宝中证智能  11-05  0.9948  ...     ---   -0.52%     ---  0.10%
1848  013476  华宝中证智能  11-05  0.9948  ...     ---   -0.52%     ---  0.00%
1849  014046  交银医药创新  11-05  3.3731  ...     ---    0.00%     ---  0.00%[1850 rows x 17 columns]
>>>>> Save Data for 股票型
>>>>> Get Data for 混合型
[WDM] - [WDM] - ====== WebDriver manager ======
[WDM] - Current google-chrome version is 95.0.4638
[WDM] - Get LATEST driver version for 95.0.4638
[WDM] - Driver [C:\Users\anna\.wdm\drivers\chromedriver\win32\95.0.4638.54\chromedriver.exe] found in cache
混合型,nums=5053,http://fund.eastmoney.com/data/fundranking.html#thh;c0;r;szzf;pn10000;ddesc;qsd20201031;qed20211031;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb基金代码    基金简称     日期    单位净值  ...     今年来      成立来     自定义    手续费
0     001970  泰信鑫选灵活  11-05  1.3610  ...  14.27%   36.10%  10.71%  0.15%
1     002580  泰信鑫选灵活  11-05  1.3550  ...  14.73%   34.96%  11.15%  0.00%
2     004666  长城久嘉创新  11-05  2.0266  ...  41.76%  102.66%  37.62%  0.15%
3     010052  长城久嘉创新  11-05  2.0237  ...     ---   10.19%   3.40%  0.00%
4     290011  泰信中小盘精  11-05  4.4110  ...  18.13%  416.04%  24.30%  0.15%
...      ...     ...    ...     ...  ...     ...      ...     ...    ...
5048  012639  富国智优精选  11-04  1.0132  ...     ---    1.32%   1.17%  0.00%
5049  013850  同泰优选配置  11-04  1.0008  ...     ---    0.08%   0.00%  0.00%
5050  013849  同泰优选配置  11-04  1.0009  ...     ---    0.09%   0.00%  0.06%
5051  014051  平安安盈灵活  11-05  2.8516  ...     ---   -0.73%     ---  0.00%
5052  013950  交银先锋混合  11-05  2.8005  ...     ---    0.00%     ---  0.00%[5053 rows x 17 columns]
>>>>> Save Data for 混合型
[WDM] - [WDM] - ====== WebDriver manager ======
[WDM] - Current google-chrome version is 95.0.4638
[WDM] - Get LATEST driver version for 95.0.4638
>>>>> Get Data for 债券型
[WDM] - Driver [C:\Users\anna\.wdm\drivers\chromedriver\win32\95.0.4638.54\chromedriver.exe] found in cache
债券型,nums=2133,http://fund.eastmoney.com/data/fundranking.html#tzq;c0;r;szzf;pn10000;ddesc;qsd20201031;qed20211031;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb基金代码    基金简称     日期    单位净值  ...      今年来      成立来     自定义    手续费
0     005717  兴业机遇债券  11-05  1.3307  ...   13.64%   41.85%   9.88%  0.08%
1     008222  兴业机遇债券  11-05  1.3614  ...   13.25%   35.46%   9.43%  0.00%
2     009512  天弘添利债券  11-05  1.3173  ...   30.03%   31.73%  18.35%  0.08%
3     164206  天弘添利债券  11-05  1.6455  ...   29.64%  164.92%  17.95%  0.00%
4     001257  兴业收益增强  11-05  1.5340  ...   11.00%   53.40%   8.21%  0.08%
...      ...     ...    ...     ...  ...      ...      ...     ...    ...
2128  005891  先锋博盈纯债  11-05  0.9343  ...  -13.65%   -6.57%  -8.21%  0.00%
2129  006147  宝盈融源可转  11-05  1.1748  ...   -1.30%   17.48%   4.62%  0.08%
2130  006148  宝盈融源可转  11-05  1.1671  ...   -1.55%   16.71%   4.31%  0.00%
2131  006831  鹏扬利沣短债    ---     ---  ...      ---    0.00%     ---  0.00%
2132  011955  招商招祥纯债    ---     ---  ...      ---    0.00%     ---     --[2133 rows x 17 columns]
>>>>> Save Data for 债券型
>>>>> Get Data for 指数型
[WDM] - [WDM] - ====== WebDriver manager ======
[WDM] - Current google-chrome version is 95.0.4638
[WDM] - Get LATEST driver version for 95.0.4638
[WDM] - Driver [C:\Users\anna\.wdm\drivers\chromedriver\win32\95.0.4638.54\chromedriver.exe] found in cache
指数型,nums=1354,http://fund.eastmoney.com/data/fundranking.html#tzs;c0;r;szzf;pn10000;ddesc;qsd20201031;qed20211031;qdii;zq;gg;gzbd;gzfs;bbzt;sfbb基金代码    基金简称     日期    单位净值  ...      今年来      成立来      自定义    手续费
0     012728  国泰中证动漫  11-05  1.0495  ...      ---    4.95%   -1.73%  0.10%
1     012729  国泰中证动漫  11-05  1.0484  ...      ---    4.84%   -1.83%  0.00%
2     012769  华夏中证动漫  11-05  1.0723  ...      ---    7.23%    0.60%  0.00%
3     012768  华夏中证动漫  11-05  1.0728  ...      ---    7.28%    0.65%  0.12%
4     004752  广发中证传媒  11-05  0.7421  ...  -13.10%  -25.79%  -22.10%  0.12%
...      ...     ...    ...     ...  ...      ...      ...      ...    ...
1349  502023  鹏华国证钢铁  11-05  1.6850  ...   28.72%   20.20%   46.35%  0.12%
1350  008189  国泰中证钢铁  11-05  1.5119  ...   27.68%   51.19%   45.22%  0.10%
1351  008190  国泰中证钢铁  11-05  1.5040  ...   27.37%   50.40%   44.80%  0.00%
1352  013475  华宝中证智能  11-05  0.9948  ...      ---   -0.52%      ---  0.10%
1353  013476  华宝中证智能  11-05  0.9948  ...      ---   -0.52%      ---  0.00%[1354 rows x 17 columns]
>>>>> Save Data for 指数型进程已结束,退出代码为 0

python爬取 东方财富/天天基金网 基金排行数据相关推荐

  1. 使用python爬取东方财富网机构调研数据

    最近有一个需求,需要爬取东方财富网的机构调研数据.数据所在的网页地址为: 机构调研 网页如下所示: 可见数据共有8464页,此处不能直接使用scrapy爬虫进行爬取,因为点击下一页时,浏览器只是发起了 ...

  2. python培训机构调研最多的股票_使用python爬取东方财富网机构调研数据

    标签: 最近有一个需求,需要爬取东方财富网的机构调研数据.数据所在的网页地址为: 机构调研 网页如下所示: 可见数据共有8464页,此处不能直接使用scrapy爬虫进行爬取,因为点击下一页时,浏览器只 ...

  3. python爬取东方财富网资金流向数据(在本地生成csv文件)

    今天我们来试着用python爬取东方财富网资金流向的表格数据. 第一步:程序及应用的准备 首先我们需要安装selenium库,使用命令pip install selenium;然后我们需要下载对应的c ...

  4. 爬取东方财富网股票行情数据和资讯

    爬取东方财富网股票行情数据和资讯 这个需求源于我的一个练手项目 本篇博客参考:https://zhuanlan.zhihu.com/p/50099084 该博客介绍的东西本博客不做论述 使用技术: 语 ...

  5. 利用python爬取东方财富网股吧评论并进行情感分析(一)

    利用python爬取东方财富网股吧评论(一) python-东方财富网贴吧文本数据爬取 分享一下写论文时爬数据用到的代码,有什么问题或者改善的建议的话小伙伴们一起评论区讨论.涉及内容在前人的研究基础之 ...

  6. 练习:使用Python爬取COVID-19疫情国内当日数据

    练习:使用Python爬取COVID-19疫情国内当日数据 推荐公众号:数据酷客 (里面有超详细的教程) 代码来源数据酷客公众号教程 URL它是Uniform Resource Locator的缩写, ...

  7. python爬取股票信息_利用Python爬取网易上证所有股票数据(代码

    利用Python爬取网易上证所有股票数据(代码 发布时间:2018-04-14 17:30, 浏览次数:1261 , 标签: Python import urllib.request import r ...

  8. 如何使用python编程抢京东优惠券 知乎_学好Python爬取京东知乎价值数据

    原标题:学好Python爬取京东知乎价值数据 Python爬虫为什么受欢迎 如果你仔细观察,就不难发现,懂爬虫.学习爬虫的人越来越多,一方面,互联网可以获取的数据越来越多,另一方面,像 Python这 ...

  9. python如何爬取实时人流量_使用python爬取微信宜出行人流量数据

    代码地址:https://liujiao111.github.io/2019/06/18/easygo/ 工具介绍: 该工具基于微信中的宜出行提供的数据接口进行爬取,能够爬取一定范围内的当前时间点的人 ...

  10. 使用python爬取BOSS直聘岗位数据并做可视化(Boss直聘对网页做了一些修改,现在的代码已经不能用了)

    使用python爬取BOSS直聘岗位数据并做可视化 结果展示 首页 岗位信息 岗位详情 薪资表 学历需求 公司排名 岗位关键词 福利关键词 代码展示 爬虫代码 一.导入库 二.爬取数据 1.爬取数据代 ...

最新文章

  1. Kaggle神器LightGBM最全解读!
  2. 使用FIO对SATA、SSD和PCIe Flash进行测试
  3. Aim Controller:所有游戏都支持的PSVR
  4. 多图长文 | 聊聊C端转型B端产品那些事
  5. 倍数应用题后面需要带单位吗_【小学数学】必考应用题解答思路,多种问题轻松解决!...
  6. 遇到一个php的错误,php初学者常见的几个错误及解决方法
  7. java 面向对象之内存管理
  8. 删除同样元素(线性表)
  9. 校招行测笔试--资料分析
  10. MAML: meta learning 论文分析
  11. SpringBoot 教程核心功能-Web 开发(请求处理)
  12. linux下scala脚本运行报错error: expected class or object definition 解决方案
  13. 2019年1月22日 总结
  14. 成都盛铭轩:客服应该怎么做
  15. JavaScript 《公司开发功能》 99+ 大合集
  16. 各大APP注册时发送短信验证码是怎么实现的?
  17. 四川计算机二级成绩查询2020年9月,【2020年9月四川计算机二级考试成绩查询入口】- 环球网校...
  18. 常见硬件术语手册!绝对权威!(转!)七、显示卡术语解释
  19. python求不同分辨率图像的峰值信噪比,一文搞懂
  20. 关于STARMAC旋翼机的计算系统组成分析

热门文章

  1. 拉姆达Lambda表达式对list分页,获取list总页数
  2. WPS自动生成目录,目录里显示图片如何解决
  3. 学习笔记--数据通信与计算机网络
  4. 微分方程模型_MIT—微分方程笔记03 一阶线性常微分方程解法
  5. 工业控制网络通信协议概览 2020年7月27日
  6. 怎么查计算机的ip,教你如何查询电脑ip地址的方法
  7. 代码查重 EOJ Monthly 2018.4
  8. 安装11.2.0.3时,OUI的log报错:OUI-10066:Not All The Dependencies For The Component ... Could Be Found
  9. 行驶证识别技术-快速提取行驶证信息办理业务
  10. C++输入大写字母转小写字母