问 题

想用python爬虫获取中证指数官网上的几个主要指数的每日估值更新,但是下载下来的页面内容却没有想要的数据。想要的数据前面有个JavaScript标签,是不是光靠python没办法获取这个数据?求大神解惑指点。

例如想要获取上证指数的静态市盈率,当前是16.27。

获取到的页面代码只能看到标签,没有获取到这个标签里面的值。

不知道这个应该怎么处理,还请各位大神指点,谢谢。

代码:

import requests

from bs4 import BeautifulSoup

import os

headers = {'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1(KHTML,LIKE Gecko) Chrome/22.0.1207.1 Safari/537.1"}

all_url = 'http://www.csindex.com.cn/sseportal/csiportal/zs/jbxx/daily_index_info.jsp'

start_html = requests.get(all_url, headers = headers)

print(start_html.text)

解决方案

下面是代码:

#coding=utf-8

import requests

from itertools import groupby

url = 'http://www.csindex.com.cn/sseportal/ps/zhs/hqjt/csi/show_zsgz.js'

r = requests.get(url)

text = r.text.replace('"', '').replace('var zsgz','').split('\r\n')

content = [_.split('=') for _ in text if _ and not _.startswith('00')]

rows = []

for _, lst in groupby(content, key=lambda x: int(x[0]) / 10):

row = tuple([v for k, v in lst])

rows.append(row)

print rows

扫一扫关注IT屋

微信公众号搜索 “ IT屋 ” ,选择关注与百万开发者在一起

python爬取javascript变量数据_javascript - [新手]python爬虫爬取中证指数官网数据相关推荐

  1. python爬取率_[新手]python爬虫爬取中证指数官网数据

    想用python爬虫获取中证指数官网上的几个主要指数的每日估值更新,但是下载下来的页面内容却没有想要的数据.想要的数据前面有个JavaScript标签,是不是光靠python没办法获取这个数据?求大神 ...

  2. scrapy爬虫实战——米哈游官网数据爬取

    项目总览 前言 项目建立 爬虫代码编写 爬虫运行 导出到Excel 后记 前言 scrapy是一个强大的爬虫框架,熟练地使用它几乎可以随心所欲地抓取任何网页上想要获得的数据.笔者初学爬虫,需要项目练手 ...

  3. python爬取饿了么评论_爬取饿了么官网数据 scrapy

    展开全部 Scrapy框架的初步运用 上午刚配置好scrapy框架,32313133353236313431303231363533e58685e5aeb931333363393734下午我就迫不及待 ...

  4. python和javascript哪个好_JavaScript与Python:主要区别

    Python与JavaScript之间的主要区别在于它们的用法.Python有许多用途,包括数据科学和Web应用程序的后端.JavaScript主要用于Web应用程序的前端,很少在浏览器外部使用. P ...

  5. python网站数据写入mysql_python网络爬虫抓取动态网页并将数据存入数据库MySQL

    简述 以下的代码是使用python实现的网络爬虫,抓取动态网页 http://hb.qq.com/baoliao/ .此网页中的最新.精华下面的内容是由JavaScript动态生成的.审查网页元素与网 ...

  6. Python爬虫-2019年我破解了商标网数据爬虫-破解反爬技术那些事情

    Python爬虫-2019年我破解了商标网!数据爬虫-破解反爬技术那些事情 由于自己一直做Python大数据挖掘技术开发,最近有不少的朋友要做大数据分析,找我帮忙商标网的数据挖掘,实现爬取中国商标网全 ...

  7. python爬取豆瓣电影top250的代码_Python爬虫——爬取豆瓣电影Top250代码实例

    利用python爬取豆瓣电影Top250的相关信息,包括电影详情链接,图片链接,影片中文名,影片外国名,评分,评价数,概况,导演,主演,年份,地区,类别这12项内容,然后将爬取的信息写入Excel表中 ...

  8. websect爬取小米官网数据

    webesct 首先要下载webesct nom i websect 老规矩,还是爬取小米官网的数据QAQ,现在要爬取的是这个: const $ = require("websect&quo ...

  9. Python 爬取网页信息并保存到本地爬虫爬取网页第一步【简单易懂,注释超级全,代码可以直接运行】

    Python 爬取网页信息并保存到本地[简单易懂,代码可以直接运行] 功能:给出一个关键词,根据关键词爬取程序,这是爬虫爬取网页的第一步 步骤: 1.确定url 2.确定请求头 3.发送请求 4.写入 ...

最新文章

  1. 【Windows 逆向】使用 CE 工具挖掘关键数据内存真实地址 ( 逐层分析分析 静态地址 到 动态地址 的寻址 + 偏移 过程 ) ★
  2. Arduino--库函数头文件
  3. POJ 1745 Divisibility【DP】
  4. 汇编语言的简答入门--斐波那契数列(递归)
  5. (29)System Verilog进程间同步(旗语semaphore)
  6. 《程序员修炼之道》---- 修的是什么
  7. wince 德赛187a__艾默生CT M8x0-03200066A
  8. 爬取百度图片——详细思路
  9. 如果你还是“程序员”,我劝你别创业!
  10. 根据不同时区来计算当前时间
  11. java迭代例子_Java 迭代器的代码实例详解
  12. 中国英语市场营销分析与竞争形势调研报告2022版
  13. NT_iOS笔记—判断iPhone6
  14. 【leetcode】108. 将有序数组转换为二叉搜索树
  15. 入侵FBI(www.fbi.gov)核心网络全过程
  16. zzulioj1123: 最佳校友
  17. 转一篇十几年前的旧文,与各位共赏之
  18. python数字计算公式_python数的运算
  19. linux+电音制作软件,电音制作入门:读懂全球最受欢迎的软件合成器Serum㈦
  20. 青璃手游怎么用电脑玩 青璃手游模拟器玩法教程

热门文章

  1. 个人认为最好用的ssh(shell)连接工具加ssh连接linux 服务器(centos 8)
  2. paramiko下载文件夹
  3. android TV盒子开发心得(一)
  4. 原生js获取cookie值
  5. excel mysql 参数查询语句_如何用SQL语句查询Excel数据
  6. ios13测试版怎么卸载软件,iOS13怎么删除软件,长按无法删除卸载APP解决方法
  7. word 插入一条横线
  8. python画cpk图_TensorFlow MNIST手写数据集的实现方法
  9. [Realtek sdk-3.4.14b]RTL8197FH-VG增加IPv6功能支持
  10. 敲代码时使用什么样的背景比较护眼