import requests
from lxml import etree
import re
import pandas as pdresult = set()
# 获取沪市股票代码(6开头)
web = requests.get('http://quote.eastmoney.com/stock_list.html#sz')
html = etree.HTML(web.text)
html_data = html.xpath('//*[@id="quotesearch"]/ul[1]/li/a')
p1 = re.compile(r'[(](\d+)[)]', re.S)
for i in html_data:a = re.findall(p1,i.text)[0]if a.startswith('6'):result.add(a)# 获取深市股票代码(3开头或者0开头)
html_data = html.xpath('//*[@id="quotesearch"]/ul[2]/li/a')
p1 = re.compile(r'[(](\d+)[)]', re.S)
for i in html_data:a = re.findall(p1,i.text)[0]if a.startswith('3') or a.startswith('0'):result.add(a)def get_yahoo_crumb_cookie():"""Get Yahoo crumb cookie value."""res = requests.get('https://finance.yahoo.com/quote/SPY/history')yahoo_cookie = res.cookies['B']yahoo_crumb = Nonepattern = re.compile('.*"CrumbStore":\{"crumb":"(?P<crumb>[^"]+)"\}')for line in res.text.splitlines():m = pattern.match(line)if m is not None:yahoo_crumb = m.groupdict()['crumb']return yahoo_cookie, yahoo_crumb
create_newhigh_stock_code =[]
cookie, crumb = get_yahoo_crumb_cookie()for i in result:try:if i.startswith('6'):symbol = i+'.ss'else:symbol = i+'.sz' print('正在查询股票代码:',symbol)params = {'symbol': symbol,'period1': 0,'period2': int(time.time()),'interval': '1d','crumb': crumb,}url_price = 'https://query1.finance.yahoo.com/v7/finance/download/{symbol}'response = requests.get(url_price, params=params, cookies={'B': cookie})# 去除首行的标题string = response.textp1 = re.compile(r'^[a-zA-Z, \n]+')string = re.sub(p1,'',string)# 转化 为DataFramelst = []for j in string.split('\n'):lst.append(j.split(','))df = pd.DataFrame(lst,columns=['Date','open','high','low','close','adj close','volume'])df.drop(df[df['high']=='null'].index,inplace=True)  #删除空值df['high']  = df['high'].astype('float')            #转化为数字if df.iloc[df['high'].idxmax(axis=0)].Date>'2019-09-01':#是否近一个月创新高create_newhigh_stock_code.append(i)print('加入某支股票:',i)except:continue#写入文件
with open(r'F:\google\Application\stock.txt', 'w') as f:f.write('\n'.join(create_newhigh_stock_code))

爬取沪深股票并找出最近1个月创出新高的股票相关推荐

  1. python爬取沪深所有股票数据并生成Excel文件

    爬取沪深所有股票数据并生成Excel文件 一.分析需求 1.对于沪深两市的各只股票,获取其:'股票代码', '股票名称', '最高', '最低', '涨停', '跌停', '换手率', '振幅', ' ...

  2. python中飞机票购买程序_「最低折扣机票查询」Python 爬取携程所有机票找出最低折扣机票,让你无忧回家过年 - seo实验室...

    最低折扣机票查询 前言 对于平时出行大多数人都是选择坐高铁,当然了如果这是对于距离比较近的行程是最划算的,如果对于路途长远的人言,提前购买飞机票价格可能比高铁票更加的便宜,如果我们可以爬取机票数据并分 ...

  3. Python爬虫入门:爬虫抓取沪深300指数列表

    使用Python3爬取沪深300指数列表 1. 思路分析 用chrome打开维基百科沪深300的页面,网址为:https://en.wikipedia.org/wiki/CSI_300_Index . ...

  4. Crawl:利用bs4和requests爬取了国内顶级某房源平台(2020年7月2日上海二手房)将近30*100多条数据并进行房价分析以及预测

    Crawl:利用bs4和requests爬取了国内顶级某房源平台(2020年7月2日上海二手房)将近30*100多条数据并进行房价分析以及预测 目录 利用bs4和requests爬取了国内顶级某房源平 ...

  5. php爬新浪股票,GitHub - asa1525/SinaFinance-Crawler: 爬取了深沪股票的资讯,包含标题、时间、来源、内容、关键词、链接和股票ID...

    第二十一天有回想起来记录了 原先预定的爬虫工作终于引来了终点,尽管最后的去重工作还没有做到真正的完善,但从现在开始我会写下我所做到的内容. 我的任务就是爬取新浪财经每只股票资讯页面下所有的新闻,将日期 ...

  6. 从爬取的文章 HTML 中提取出中文关键字

    分2步. 1.从 HTML 中提取出纯文本(去掉标签) import org.htmlparser.NodeFilter; import org.htmlparser.Parser; import o ...

  7. 爬取沪江网考研词汇并按要求存为txt

    存储数据的要求:每遍历一个单词,保存单词汉语翻译到txt文档,并以单词命名,保存到一个文件夹里,便于GUI设计使用. 点击此查看要爬取的网页 思路:大循环找herf进行url拼接,小循环进入数据网页提 ...

  8. Scrapy之Crawlspider实例:爬取沪江网校所有课程信息

    点击此处查看要爬取的网页 如图,利用Crawlspider将所有的课程信息爬取下来,并存入MongoDB数据库 整体思路清晰,简单,不过有一个要注意的点,在插入到数据库的时候 items.py imp ...

  9. python 通达信板块_[python]沪深龙虎榜数据导入通达信的自选板块,并标注于K线图上...

    将沪深龙虎榜数据导入通达信的自选板块,并标注于K线图上 原理:python读取前一次处理完的计算5日后涨跌幅输出的csv文件 文件名前加"[paint]" 安照通达信的画图文件和板 ...

最新文章

  1. 怎樣制作线段动画_PPT动画还能这么做?我擦!动画源文件免费送你
  2. Kvm虚拟机克隆以及添加磁盘
  3. Visual Studio中没有为此解决方案配置选中要生成的项目
  4. LINUX共享内存使用常见陷阱与分析(转)
  5. intellij2018修改代码背景颜色
  6. LeetCode 223. 矩形面积
  7. 老旗舰华为能用上鸿蒙吗,华为完全开放鸿蒙,未来所有手机都能用鸿蒙系统?...
  8. python接口自动化(五)--接口测试用例和接口测试报告模板(详解)
  9. deepin/Ubuntu搭建FTP/SFTP
  10. java 托管 非托管_java jni调用 非托管 dll
  11. 计算机考试试题大一上学期,大一第一学期期末考试计算机试题
  12. 列举几个:MAC OS科研软件推荐
  13. 向量化回测系列2——全市场股票回测
  14. 抓住暴涨点,通达信洗盘回调介入指标公式图解
  15. 文件复制到u盘后文件夹是空的,怎么恢复?
  16. 物理学上四大神兽之拉普拉斯妖是指什么
  17. VMware vCenter vShield配置vxlan时候vib未安装
  18. solr常见问题整理
  19. diy nas配置推荐2019_Server2019+htpc+NAS搭建家庭数据中心+远程唤醒开关机+晒晒桌面...
  20. (一)安全测试基础:安全测试的内容

热门文章

  1. 聊一聊Brodmann大脑皮层分区
  2. Python与医疗图像3
  3. [zoj 3587]Marlon's String[kmp]
  4. (NO.00001)iOS游戏SpeedBoy Lite成形记(十九)
  5. 程序员脱发?看看各个创始人的发量?
  6. 利用CSS浮动制作一个简易导航栏
  7. mybatis学习10
  8. 网络设置巨形帧_NAS的巨型帧(Jumbo_Frame)设置对其传输速度的影响的评测与分析...
  9. XML 链接语言(XLink) 版本 1.0
  10. 金蝶java笔试_金蝶面试题