我正在使用cookielib,有时在浏览器中打开一个url,通过浏览器发出许多其他请求来下载许多其他文件。我可以使用cookielib或任何其他python库复制相同的行为吗?在

我必须从python脚本发出超过1个GET请求。当我打开网页时,通过分析网络请求,我得到了浏览器发出的所有请求的url。在

我在看是否有什么方法我可以只做一个请求,它像浏览器一样自己获取所有相关的请求。在

我对js或css不是很感兴趣,而是主要的html。在

我尝试了下面的代码,但它无法下载整个页面cj = cookielib.CookieJar()

opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))

response = opener.open('https://applicant.keybank.com/psp/hrsappl/EMPLOYEE/HRMS/c/HRS_HRAM.HRS_CE.GBL?Page=HRS_CE_HM_PRE&Action=A&SiteId=1')

html = response.read()

但是当我按顺序获取另外3个GET url时,它能够在第三个GET响应中给我所需的html。我通过检查浏览器的network标签得到了这些url

^{pr2}$

下面是我正在进行的其他抓取的完整代码response = opener.open('https://applicant.keybank.com/psc/hrsappl/EMPLOYEE/EMPL/s/WEBLIB_PT_NAV.ISCRIPT1.FieldFormula.IScript_UniHeader_Frame?c=NNTCgkqGs001AcPaisqGbYpTu%2fbGx4jx&Page=HRS_CE_HM_PRE&Action=A&SiteId=1&PortalActualURL=https%3a%2f%2fhronline.keybank.com%2fpsc%2fhrshrm%2fEMPLOYEE%2fHRMS%2fc%2fHRS_HRAM.HRS_CE.GBL%3fPage%3dHRS_CE_HM_PRE%26Action%3dA%26SiteId%3d1&PortalContentURL=https%3a%2f%2fhronline.keybank.com%2fpsc%2fhrshrm%2fEMPLOYEE%2fHRMS%2fc%2fHRS_HRAM.HRS_CE.GBL%3fPage%3dHRS_CE_HM_PRE%26Action%3dA%26SiteId%3d1&PortalContentProvider=HRMS&PortalRegistryName=EMPLOYEE&PortalServletURI=https%3a%2f%2fapplicant.keybank.com%2fpsp%2fhrsappl%2f&PortalURI=https%3a%2f%2fapplicant.keybank.com%2fpsc%2fhrsappl%2f&PortalHostNode=EMPL&PortalIsPagelet=true&NoCrumbs=yes')

response.read()

response = opener.open('https://applicant.keybank.com/psc/hrsappl/EMPLOYEE/EMPL/s/WEBLIB_PTPPB.ISCRIPT2.FieldFormula.IScript_TemplatePageletBuilder?PTPPB_PAGELET_ID=KC_LNAV_APPLICANT&target=KCNV_KC_LNAV_APPLICANT_TMPL&Page=HRS_CE_HM_PRE&Action=A&SiteId=1&PortalActualURL=https%3a%2f%2fhronline.keybank.com%2fpsc%2fhrshrm%2fEMPLOYEE%2fHRMS%2fc%2fHRS_HRAM.HRS_CE.GBL%3fPage%3dHRS_CE_HM_PRE%26Action%3dA%26SiteId%3d1&PortalContentURL=https%3a%2f%2fhronline.keybank.com%2fpsc%2fhrshrm%2fEMPLOYEE%2fHRMS%2fc%2fHRS_HRAM.HRS_CE.GBL%3fPage%3dHRS_CE_HM_PRE%26Action%3dA%26SiteId%3d1&PortalContentProvider=HRMS&PortalRegistryName=EMPLOYEE&PortalServletURI=https%3a%2f%2fapplicant.keybank.com%2fpsp%2fhrsappl%2f&PortalURI=https%3a%2f%2fapplicant.keybank.com%2fpsc%2fhrsappl%2f&PortalHostNode=EMPL&PortalIsPagelet=true&NoCrumbs=yes&PortalTargetFrame=TargetContent')

response.read()

response = opener.open('https://hronline.keybank.com/psc/hrshrm/EMPLOYEE/HRMS/c/HRS_HRAM.HRS_CE.GBL?Page=HRS_CE_HM_PRE&Action=A&SiteId=1&PortalActualURL=https%3a%2f%2fhronline.keybank.com%2fpsc%2fhrshrm%2fEMPLOYEE%2fHRMS%2fc%2fHRS_HRAM.HRS_CE.GBL%3fPage%3dHRS_CE_HM_PRE%26Action%3dA%26SiteId%3d1&PortalContentURL=https%3a%2f%2fhronline.keybank.com%2fpsc%2fhrshrm%2fEMPLOYEE%2fHRMS%2fc%2fHRS_HRAM.HRS_CE.GBL%3fPage%3dHRS_CE_HM_PRE%26Action%3dA%26SiteId%3d1&PortalContentProvider=HRMS&PortalCRefLabel=Careers&PortalRegistryName=EMPLOYEE&PortalServletURI=https%3a%2f%2fapplicant.keybank.com%2fpsp%2fhrsappl%2f&PortalURI=https%3a%2f%2fapplicant.keybank.com%2fpsc%2fhrsappl%2f&PortalHostNode=EMPL&NoCrumbs=yes&PortalKeyStruct=yes')

required_html = response.read()

python 模拟浏览器登录获取cookie_使用cookielib模拟浏览器在python中获取url相关推荐

  1. Android多个imei如何获取,如何在Android 10中获取IMEI号,这是获取在Android 10及以下Android 10中获取IMEI号的代码...

    如何在android 10中获取imei编号,这是获取在android 10及以下android 10中获取imei编号的代码. if (android.os.Build.VERSION.SDK_IN ...

  2. php模拟QQ登录获得skey码,php模拟qq登录代码

    php模拟qq登录代码 本文讲述了php如何模拟qq登录,原理是用curl模拟发送post登录,cookie保存本地,这里代码理论可以支持永久单挂qq,下面就让我们来看看吧.<?php $qqn ...

  3. java获取当前项目相对路径,在JAVA文件中获取该项目的相对路径

    在JAVA文件中获取该项目的相对路径 1.基本概念的理解 绝对路径:绝对路径就是你的主页上的文件或目录在硬盘上真正的路径,(URL和物理路径)例如: C:\xyz\test.txt 代表了test.t ...

  4. html 获取文本框值,html - 如何在JavaScript中获取文本框值

    html - 如何在JavaScript中获取文本框值 我正在尝试使用JavaScript从HTML文本框中获取值,但值不是在空格之后 例如: 我只得到:上面的"软件". 我正在使 ...

  5. android xml获取指定,android:如何从xml文件中获取信息?

    我得到一个程序,从一个链接的服务器获取天气.我已经做了一些将字符串结合到URL的字符串.我现在需要从XML文件中获取信息.android:如何从xml文件中获取信息? 这是我的代码:(我更换了,为了安 ...

  6. java 从一个容器获取对象,Java 如何实现从spring容器中获取注入的bean对象

    Java 如何实现从spring容器中获取注入的bean对象 发布时间:2020-11-03 15:27:37 来源:亿速云 阅读:70 作者:Leah 这期内容当中小编将会给大家带来有关Java 如 ...

  7. 服务器如何获取客户端证书,如何在Go HTTPS服务器中获取客户端证书

    我在尝试了解如何在Go Web服务器中获取客户端证书.这里是一个服务器代码:如何在Go HTTPS服务器中获取客户端证书 package main import ( "log" & ...

  8. python模拟用户登录注册定义函数user_python模拟登录通达信

    用字典比用list 好些 list_user={} cmd=raw_input('输入命令 1 注册 2登录 3 退出:') ##print 'cmd:',cmd,cmd <>3,type ...

  9. VC浏览器相关的学习(四)(在BHO中获取IE版本以及获取窗体句柄)

    值得注意的是IE6,IE7,IE8的窗体组织完全不一样,需要用VS自带的工具Spy++查看确定 a 获取IE版本 int CMyRock::GetIEVersion() { CComPtr<ID ...

最新文章

  1. zigbee 串口不稳定_基于项目的ZigBee系统组网介绍
  2. java 及时释放内存_Java 内存释放
  3. QC与IE8 、WINDOWS 7 兼容问题的解决方案
  4. matlab里dcgain,制系统的时域分析
  5. 1.7 什么时候该改变开发_测试集和指标
  6. Delaunay三角化实现原理
  7. java tomcat 日志分析工具_设计一个Tomcat访问日志分析工具
  8. php jq ajax 4个下拉框联动案列,AJAX_AJAX实现下拉框联动,想当年,为了实现三级联动, - phpStudy...
  9. 理解InnoDB数据及索引文件存储格式
  10. CSDN博客积分标准,包括博客勋章等
  11. theos tweak导入自定义类
  12. php 增加空行,php 替换空行 不匹配空行
  13. 乱哄哄,你方唱罢我登场,到头来,都是为他人做嫁衣裳!
  14. 东华大学专业英语 词汇学习
  15. Word合并所有段落再按字数划分段落
  16. 精确率、准确率、召回率
  17. [ISUX转译]iOS7人机界面指南-UI元素(上)
  18. 智能/傻瓜交换机、光纤交换机、普通交换机的区别
  19. 威纶通触摸屏如何在报警的同时,显示出异常数据的当前值?
  20. 互联网程序员各个职位技能图

热门文章

  1. Windows7_x64下编译64位ffmpeg
  2. Text-CNN-文本分类-keras
  3. python 统计文件夹各类格式文件数量, 具通用性
  4. .NET Core 最小化发布
  5. 夺命雷公狗---node.js---3commonJs 与 nodeJs的简介
  6. C#编程语言之读取网页内容(微软官网方法)
  7. 李彦宏被提名工程院院士,而美女教授颜宁落选,当选为美国院士
  8. 法媒评马云996:亚洲独有的洗脑我们不懂
  9. linux运维初学作业,Linux运维班第二次作业(示例代码)
  10. usessl mysql_mysql数据库连接useSSL=true