#静态的数据一般在elements中(复制文字到sources按ctrl+f搜索。找到的为静态),而动态去network中去寻找相关的信息

import requests

import re

def send_request():

headers= {'user-agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36','Cookie':'_uab_collina=159618052151589201474313; JSESSIONID=D33C89D8BEC6A692C79CFA69FC0B0D29; BIGipServerotn=233832970.24610.0000; BIGipServerpool_passport=216859146.50215.0000; RAIL_EXPIRATION=1596443951465; RAIL_DEVICEID=nMo94O2Z21cXLblW7otLoxUZ_LP9Q01PYj_I89OqU6MqjxyX9814Jc3CH5TNwgBVJqnBaBG8OGiBWo2QtNcu5wVu-asNk6YLa49g0fMwVp03XFJQ-GkhHYHcqIgUd-nqQB_VEdWH1Om_D2yAgIu8QcEavt02pmH5; route=c5c62a339e7744272a54643b3be5bf64; _jc_save_fromStation=%u5317%u4EAC%2CBJP; _jc_save_toStation=%u5929%u6D25%2CTJP; _jc_save_fromDate=2020-07-31; _jc_save_toDate=2020-07-31; _jc_save_wfdc_flag=dc'}#创建头部信息

url='https://kyfw.12306.cn/otn/leftTicket/query?leftTicketDTO.train_date=2020-07-31&leftTicketDTO.from_station=BJP&leftTicketDTO.to_station=TJP&purpose_codes=ADULT'#设置编码格式。防止乱码

resp=requests.get(url,headers=headers)

resp.encoding='utf-8'

returnresp

#解析数据

#{}是字典。根据key获取值。

def parse_json(resp,city):

json_ticket=resp.json()#将相应的数据转换为json

data_list=json_ticket['data']['result']#得到车次的列表

lst=[]#列表for item indata_list:

#遍历车次信息进行分割

d=item.split('|')

lst.append([d[3],city[d[6]],city[d[7]],d[31],d[30],d[13]])returnlst'''d[3]从列表中获取索引为3的表示车次

d[6]查询起始站

d[7]查询到达站

d[31]一等座

d[30]表示二等座

d[13]表示出行时间'''#获得station_name的信息

def get_city():

url='https://kyfw.12306.cn/otn/resources/js/framework/station_name.js?station_version=1.9151'headers= {'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/74.0.3729.131 Safari/537.36'}

resp=requests.get(url,headers=headers)

resp.encoding='utf-8'#进行数据的提取(只要一部分)

stations=re.findall('([\u4e00-\u9fa5]+)\|([A-Z]+)',resp.text)

#将列表进行转换为字典

stations_data=dict(stations)

#key与value进行互换

station_d={}#空字典。用于完成上述操作for item instations_data:

station_d[stations_data[item]]=item

#print(station_d)returnstation_d

def start():

lst=parse_json(send_request(),get_city())

#进行数据的筛选(得到有效的数据)for i inlst:if i[3]!='无' and i[3]!='':

print(i)if __name__=='__main__':

start() #开始

python爬取12306_python爬取12306的车次信息相关推荐

  1. Python爬虫——12306网站车次信息

    Python爬虫--12306网站车次信息 相信每一个人都听说过谷歌.百度等浏览器,我们在在输入栏中输入我们想要的关键字,便会出现与我们输入关键字有关的网页.那么这些数据时是怎么来的呢?其实这跟网络爬 ...

  2. python爬取12306_Python爬取12306车次信息代码详解

    详情查看下面的代码: 如果被识别就要添加一个cookie如果没有被识别的话就要一个user-agent就好了.如果出现乱码就设置编码格式为utf-8 #静态的数据一般在elements中(复制文字到s ...

  3. python 爬取12306网站车次信息

    12306网站爬取车次信息 本想着可以做一个类似于查询详细车次信息的小工具,但是不尽人意,12306网站爬取的车次信息加密了,研究了一个下午也没有研究出其中全部的信息解密: 爬取的信息如下(举一个例子 ...

  4. 关于12306查询车次信息python实现思路

    因为过年在家,没什么事做,闲来就想来试试12306抢票软件,目前查询功能已经实现 本来是想用Java来开发的,但是毕竟这种软件python开发效率显然要高的多,正好也是自学python的一次机会,因此 ...

  5. python爬取12306_python爬取12306列车信息

    #!/usr/bin/env python #coding=utf8 #12306查票爬虫 import requests,json,sys #获取地址代码 #https://kyfw.12306.c ...

  6. python爬取12306_Python 爬取12306火车票

    #!/usr/bin/env python#coding:utf-8 """命令行的火车票查看器 Usage: 12306 [-gdtkz] Options: -h,-- ...

  7. python爬取12306_python爬取12306火车车次信息

    #-*- coding:utf-8 -*- importrequestsimportreimportjson#关闭https证书验证警告 requests.packages.urllib3.disab ...

  8. python 12306查询不到车次_python爬取12306火车车次信息

    #-*- coding:utf-8 -*- importrequestsimportreimportjson#关闭https证书验证警告 requests.packages.urllib3.disab ...

  9. java抓取数据包查询12306余票信息

    最近项目比较闲,闲来无事,参照网上的代码实现了一下抓取12306数据包查询余票的代码, 需要的jar包需要全部包含到项目下,代码测试OK,具体代码如下: import java.io.IOExcept ...

最新文章

  1. 英特尔与京东联合强化AI武器:让创新更专注
  2. 步子太快容易牺牲精度,梯度下降复杂度这一简单道理,获严格数学证明
  3. python排行_如何看待Python排名超越C++?
  4. Linux下查看版本及系统信息
  5. python 编程刷题_一起刷题吧 | 100+Python编程题带你快速上手(附答案)
  6. Python OpenCV学习笔记之:使用MOG2视频背景消除
  7. 渗透测试工程师前景_网络安全工程师教你:Kali Linux之Metasploit渗透测试基础(一)...
  8. 京东快捷支付的安全隐患
  9. CSDN日报20170602 ——《程序员、技术主管和架构师》
  10. SPSS实战:多因素方差分析(以随机区组设计为例)
  11. 用计算机证明的定理,定理机器证明
  12. 降维(Dimensionality Reduction) 是机器学习中的一种重要的特征处理手段
  13. 杭州好玩景点攻略200
  14. dhcp设置(Padavan dhcp设置)
  15. java猴子分桃问题_通俗易懂、简单粗暴得解决猴子分桃问题
  16. 拼多多如何优化产品排名位置?
  17. #Ubunt进阶#Ubuntu 13.04 调节笔记本亮度
  18. 阿里云视频点播+项目实战
  19. 爬取唯品会口红数据,这次哪家打折力度最大?我看到0.8折的
  20. 构建技术影响力 5.0

热门文章

  1. SQL SERVER中一些常见性能问题的总结
  2. 【JFreeChart】JFreeChart—输出柱形图
  3. 转:AMS之dumpsys篇
  4. Confluence 6 为发送邮件配置服务器
  5. 0507css3基础:弹性盒子、媒体查询
  6. 不断开心的今天:Google Chrome Englive.cn iPhone Version。
  7. Mongodb账号密码模式的基本认证
  8. html中的meta详解
  9. ANSI,ASCII,Unicode的区别与联系
  10. swagger 修改dto注解_Swagger 详解