1.首先使用xpath获取网页中的表格数据,需要下载谷歌及与之版本相同的相关程序,

链接如下:ChromeDriver Mirror

我下载的正好是压缩过后就是如下程序:

2.然后就是连接mysql数据库,建立一个数据表,代码如下:

#导入模块
from selenium import webdriver  #导入模块
import time
from lxml import etree
import pymysql

#链接MySQL数据库
conn = pymysql.connect(host='localhost',user='root',password='zysmn',database='111',port=3306,charset='utf8')
#执行数据库操作
cursor = conn.cursor()
#执行查询操作
cursor.execute("drop table if exists 中国宝安资金流向")
#创建表,批量插入列名
sql="""
    create table 中国宝安资金流向(
    日期 VARCHAR(255),
    收盘价 VARCHAR(255),
    涨跌幅 VARCHAR(255),
    主力净流入净额 VARCHAR(255),
    主力净流入净占比 VARCHAR(255),
    超大单净流入净额 VARCHAR(255),
    超大单净流入净占比 VARCHAR(255),
    大单净流入净额 VARCHAR(255),
    大单净流入净占比 VARCHAR(255),
    中单净流入净额 VARCHAR(255),
    中单净流入净占比 VARCHAR(255),
    小单净流入净额 VARCHAR(255),
    小单净流入净占比 VARCHAR(255)
    )
    """
#游标功能执行这个SQL语句,提供存储数据的一个游标接口,通过游标获取数据
cursor.execute(sql)
#使用sql语句,这里要接收的参数都用%s占位符。注意:无论插入的数据是什么类型,占位符都用%s
sql_1 = "insert into 中国宝安资金流向 values(%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s,%s)"

3.最后就是爬取数据了,先读取之前下载好的程序,再选择爬取的网页链接:

driver = webdriver.Chrome(executable_path = r'C:\Users\ASUS\Desktop\chromedriver.exe')
#获取网页
driver.get('https://data.eastmoney.com/zjlx/000009.html')
#延迟执行的2秒
time.sleep(2)
#获取页面源码
source = driver.page_source
#解析源码
mytree = etree.HTML(source)
#定位表格//*[@id="table_ls"]/table/tbody/tr,返回列表
tables = mytree.xpath('//*[@id="table_ls"]/table/tbody/tr')

#循环表格
for i in range(len(tables)):
    #取出所有td标签下的文本
    trs = tables[i].xpath('.//text()')
    cursor.execute(sql_1,tables[i].xpath('.//text()'))
#保存对数据库的修改
conn.commit()
#关闭游标
cursor.close()
#关闭连接
conn.close()
#关闭网页
driver.quit()

最后的运行结果:

python爬取东方财富网,并将数据导入mysql相关推荐

  1. 使用python爬取东方财富网机构调研数据

    最近有一个需求,需要爬取东方财富网的机构调研数据.数据所在的网页地址为: 机构调研 网页如下所示: 可见数据共有8464页,此处不能直接使用scrapy爬虫进行爬取,因为点击下一页时,浏览器只是发起了 ...

  2. python培训机构调研最多的股票_使用python爬取东方财富网机构调研数据

    标签: 最近有一个需求,需要爬取东方财富网的机构调研数据.数据所在的网页地址为: 机构调研 网页如下所示: 可见数据共有8464页,此处不能直接使用scrapy爬虫进行爬取,因为点击下一页时,浏览器只 ...

  3. python爬取东方财富网资金流向数据(在本地生成csv文件)

    今天我们来试着用python爬取东方财富网资金流向的表格数据. 第一步:程序及应用的准备 首先我们需要安装selenium库,使用命令pip install selenium;然后我们需要下载对应的c ...

  4. 爬取东方财富网股票行情数据和资讯

    爬取东方财富网股票行情数据和资讯 这个需求源于我的一个练手项目 本篇博客参考:https://zhuanlan.zhihu.com/p/50099084 该博客介绍的东西本博客不做论述 使用技术: 语 ...

  5. 利用python爬取东方财富网股吧评论并进行情感分析(一)

    利用python爬取东方财富网股吧评论(一) python-东方财富网贴吧文本数据爬取 分享一下写论文时爬数据用到的代码,有什么问题或者改善的建议的话小伙伴们一起评论区讨论.涉及内容在前人的研究基础之 ...

  6. python爬取火车票网的时刻表数据

    python爬取火车票网的时刻表数据 导包 import re,requests,datetime,time,json from prettytable import PrettyTable from ...

  7. 爬虫学习笔记(用python爬取东方财富网实验)

    参考文章以及视频:(11条消息) 爬虫实战 | 爬取东方财富网股票数据_简说Python的博客-CSDN博客.手把手教你从东方财富网上获取股票数据_哔哩哔哩_bilibili.[Python爬虫案例] ...

  8. python爬取东方财富网中的资金流向表

    因为东方财富网中的资金流向表是一个动态的数据,所以采用selenium模块进行爬取. 爬取东方财富网的资金流向表的具体步骤: 1.获取初始的URL 2.爬取对应的URL地址的网页,获取新的URL地址 ...

  9. Python爬取东方财富网任意股票任意时间段的Ajax动态加载股票数据

    导言 最近由于需求想爬取以下东方财富网的股票数据,但是发现没有想象那么简单,接下来我会讲述一下我遇到的问题以及是如何解决,最后成功的爬出了想要的数据. 查看网页源码 首先我们F12打开东方财富网网页源 ...

  10. python财务报表分析-用Python爬取东方财富网上市公司财务报表

    ♚ 作者:苏克,零基础.转行python爬虫与数据分析 博客:https://www.makcyun.top 摘要: 现在很多网页都采取JavaScript进行动态渲染,其中包括Ajax技术.有的网页 ...

最新文章

  1. 【spring】spring基于xml的声明式事务控制
  2. 20060911: 新机器·流氓软件
  3. SSH远程联机Linux服务器简易安全设定
  4. 元素周期表超清pdf_重磅分享||化学II卷5个大题汇编PDF
  5. 技术人写作和写代码一样重要
  6. 链接访问后刷新颜色回到初始_如何使链接可访问(提示:颜色不够)
  7. 探讨继承与实现(二)
  8. 四款855旗舰对比:除开价格,各有优点
  9. objC 类名后圆括号的意义
  10. 《信息管理学基础》——娄策群(第二版)第一章答案
  11. 整理了20个数据可视化大屏,源码限时领取!
  12. 等保三级 MySql数据库通用测评知识
  13. 项目管理常用的七大工具
  14. 揭秘封包辅助外G:封包外G初体验(四)
  15. table表格表头单元格添加斜线
  16. 前沿综述:细数2018年最好的词嵌入和句嵌入技术
  17. node--puppeteer网页截屏
  18. 滴滴云部署 Hadoop2.7.7+Hive2.3.4
  19. 短信包对比 - 2021.5
  20. 如何隐藏控制台程序的窗口

热门文章

  1. vue3 ref及reactive响应式原理案例 语法糖/非语法糖
  2. vivo 新机现身 GeekBench 数据库
  3. 管理c语言程序设计报告,c语言程序设计报告图书管理系统
  4. MinGW下载文件的说明
  5. CameraX获取摄像头YUV数据
  6. 美团前端面试(一面)面试题总结
  7. 黑马程序员------毕老师视频笔记第七天------面向对象(抽象类)
  8. 从itms-services协议中获取ipa的下载地址
  9. 什么样的离开会让老板念念不忘
  10. Android S静态广播注册流程(广播2)