大家好,前几天有个粉丝找我获取基金信息,这里拿出来分享一下,感兴趣的小伙伴们,也可以积极尝试。喜欢记得收藏、关注、点赞。

注:文末提供完整资料、代码

数据获取

这里我们的目标网站是某基金官网,需要抓取的数据如下图所示。

可以看到上图中基金代码那一列,有不同的数字,随机点击一个,可以进入到基金详情页,链接也非常有规律,以基金代码作为标志的。

其实这个网站倒是不难,数据什么的,都没有加密,网页上的信息,在源码中都可以直接看到。

这样就降低了抓取难度了。通过浏览器抓包的方法,可以看到具体的请求参数,而且可以看到请求参数中只有pi在变化,而这个值恰好对应的是页面,直接构造请求参数就可以了。

代码实现过程

找到数据源之后,接下来就是代码实现了,一起来看看吧,这里给出部分关键代码。

获取股票id数据

response = requests.get(url, headers=headers, params=params, verify=False)pattern = re.compile(r'.*?"(?P<items>.*?)".*?', re.S)result = re.finditer(pattern, response.text)ids = []for item in result:# print(item.group('items'))gp_id = item.group('items').split(',')[0]

结果如下图所示:

之后构造详情页链接,获取详情页的基金信息,关键代码如下:

response = requests.get(url, headers=headers)
response.encoding = response.apparent_encoding
selectors = etree.HTML(response.text)
danweijingzhi1 = selectors.xpath('//dl[@class="dataItem02"]/dd[1]/span[1]/text()')[0]
danweijingzhi2 = selectors.xpath('//dl[@class="dataItem02"]/dd[1]/span[2]/text()')[0]
leijijingzhi = selectors.xpath('//dl[@class="dataItem03"]/dd[1]/span/text()')[0]
lst = selectors.xpath('//div[@class="infoOfFund"]/table//text()')

结果如下图所示:

将具体的信息做相应的字符串处理,然后保存到csv文件中,结果如下图所示:

有了这个,你可以做进一步的统计和数据分析了。

总结

这篇文章主要分享了使用Python网络爬虫获取基金数据信息,这个项目不算太难,里边稍微有点小坑,欢迎大家积极尝试。

这篇文章主要是以【股票型】的分类做了抓取,其他的类型,我就没做了,欢迎大家尝试,其实逻辑都是一样的,改下参数就可以了。

联系方式

目前开通了技术交流群,群友已超过3000人,添加时最好的备注方式为:来源+兴趣方向,方便找到志同道合的朋友

  • 方式1、添加微信号:dkl88191,备注:来自CSDN
  • 方式2、微信搜索公众号:Python学习与数据挖掘,后台回复:加群

真香啊,手把手教你使用 Python 获取基金信息相关推荐

  1. 手把手教你使用Python获取B站视频并在本地实现弹幕播放功能

    点击上方"Python爬虫与数据挖掘",进行关注 回复"书籍"即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 少小虽非投笔吏,论功还欲请长缨. ...

  2. 干货福利!手把手教你用python获取上千张cosplay小姐姐的美照

    最近的一段时间里,小编喜欢上了CosPlay的展出,小姐姐们的CosPlay展真的是让我很是欣赏,于是,我回到家里就从网上来看展出,但是一个个网页查看太过繁琐-- 既然是玩Python,不如写个代码搞 ...

  3. 【手把手教你】Python获取财经数据和可视化分析

    内容来自:微信公众号:python金融量化 关注可了解更多的金融与Python干货. "巧妇难为无米之炊",找不到数据,量化分析也就无从谈起.对于金融分析者来说,获取数据是量化分析 ...

  4. python基金比较上机题_手把手教你用python选基金

    买基金是上班族用零钱进行投资的正确姿势.而自己用数据来选基金比听别人推荐买什么基金要好上一百倍. 步骤如下: 1.获取网上的基金的排名信息,使用四四三三法则筛选出排名靠前的基金.2.获取网上的基金的基 ...

  5. python基金筛选_手把手教你用python选基金

    买基金是上班族用零钱进行投资的正确姿势.而自己用数据来选基金比听别人推荐买什么基金要好上一百倍. 步骤如下: 1.获取网上的基金的排名信息,使用四四三三法则筛选出排名靠前的基金.2.获取网上的基金的基 ...

  6. python玩王者荣耀皮肤碎片怎么获得_手把手教你使用python获取王者荣耀英雄及皮肤高清图片...

    # -*- coding: utf-8 -*- """ __title__ = '爬取王者荣耀英雄及皮肤高清图片' __author__ = '张佑' __mtime__ ...

  7. garch预测 python_【2019年度合辑】手把手教你用Python做股票量化分析

    引言 不知不觉,2019年已接近尾声,Python金融量化公众号也有一年零两个月.公众号自设立以来,专注于分享Python在金融量化领域的应用,发布了四十余篇原创文章,超过两万人关注.这一路走来,有过 ...

  8. 用python画皇冠_手把手教你用 Python 绘制酷炫的桑基图!

    原标题:手把手教你用 Python 绘制酷炫的桑基图! 作者 | 周志鹏 责编 | 郭 芮 最近,不止一次收到小伙伴的截图追问: "这个图叫什么???" "这个图真好看! ...

  9. python新手入门代码-新手必看:手把手教你入门 Python

    原标题:新手必看:手把手教你入门 Python 本文为 AI 研习社编译的技术博客,原标题 : Learning Python: From Zero to Hero 翻译 |永恒如新的日常校对 | 酱 ...

  10. 手把手教你学Python之波士顿房价预测(scikit-learn的应用)

    目录 1.波士顿房价预测介绍 2.线性回归算法 3.调用scikit-learn库实现房价预测 1.波士顿房价预测介绍 问题描述:波士顿房价数据集统计的是20世纪70年代中期波士顿郊区房价的中位数,统 ...

最新文章

  1. 《强化学习周刊》第28期:UNCC提出全新脑-机交互学习模式:内在互动强化学习...
  2. Image Reflection
  3. 微信小程序 --- 图片自适应、本地图片的使用
  4. webpack 打包ts项目_使用webpack打包ts
  5. xcom2.0_发布Xcom 2,Elliot Quest,Mesa图形库以及更多开放式游戏新闻
  6. Facebook 默认开发环境采用 VS Code
  7. 2019-12-02 调用C++高精度时钟 std::chrono::high_resolution_clock的方法
  8. Gitlab利用Webhook实现Push代码后的Jenkins自动构建
  9. 每天一道剑指offer-把数组排成最小的数
  10. python中缀表达式转后缀表达式_中缀表达式转换成后缀表达式
  11. 6大黑科技app合集,绝对让你大开眼界
  12. 完美解决failed to open stream: HTTP request failed!(file_get_contents引起的)
  13. 计算机配置单性价比高,i5电脑主机配置单,性价比高
  14. 街头篮球服务器维护中怎么,《街头篮球》生涯联赛FAQ 已经进行了一个多月了...
  15. 【Vue】win10启动vue项目报错: errno: -4058, code: ‘ENOENT‘, syscall: ‘spawn cmd‘
  16. 360漏洞修复卡在正在安装的解决方法
  17. 天龙八部怀旧服服务器维护,新天龙八部怀旧服游戏2月4日全服更新维护公告
  18. win10移动热点按钮打开后立刻自动关闭
  19. RPG Maker MV 做任务
  20. 王树尧老师运筹学课程笔记 06 线性规划与单纯形法(几何意义)

热门文章

  1. MDK3358平台QT示例-ADS1110温度采集示例
  2. 卷皮网aso优化数据分析报告
  3. stata行logistic回归交互项(交互作用)的可视化分析(1)
  4. 如何使用c语言开发ebpf程序
  5. bmvc哪个出版社出版_在出版饮食上
  6. 黄渤海浅层气的分布及特征综述
  7. node.js 上传文件比较 busboy vs. formidable vs. multer vs. multiparty
  8. Ubuntu16安装VScode、linux安装vscode、极简极稳安装vscode、umake安装vscode
  9. dht11 java_树莓派使用DHT11温湿度传感器
  10. 网站文章内容发现重复率过高的解决办法