我必须使用Python来自动访问(阅读)网页.使用Python,我可以轻松访问网页的内容(HTML代码)以及服务器发送的cookie.

现在,在HTML5中,我们有了一个新概念“本地存储”.因此,我需要修改Python脚本,以便还可以读取本地存储中存储的数据.

有可能这样做吗?是否有任何Python库可简化此操作?

解决方法:

是的,但是Python本身不包含JavaScript解释器.

因此,您可以如thibpat所述通过Selenium在Web浏览器实例上执行自定义脚本.

其他选项是运行无头浏览器的PhantomJS.

遍历localStorage的脚本

for (var i = 0; i < localStorage.length; i++){

key=localStorage.key(i);

console.log(key+': '+localStorage.getItem(key));

}

高级脚本

如前所述,HTML5功能浏览器here还应该实现Array.prototype.map.因此脚本将是:

Array.apply(0, new Array(localStorage.length)).map(function (o, i)

{ return localStorage.key(i)+':'+localStorage.getItem(localStorage.key(i)); }

)

Python绑定

您可能希望将Python绑定与桌面开发框架一起使用.例如PyQt.

为什么JavaScript要获取本地存储

Unlike cookies, which can be accessed by both the server and client side, web storage falls exclusively under the purview of client-side scripting.

Web storage data is not automatically transmitted to the server in every HTTP request, and a web server can’t directly write to Web storage. However, either of these effects can be achieved with explicit client-side scripts, allowing for fine-tuning of the desired interaction with the server.

因此,在我看来,本地存储是由网络浏览器(例如Opera)在运行浏览器的硬盘(或云机)上某处存储的数据.因此,要获取它们,您需要本地破解Opera的执行程序,库和/或数据文件,这很难.最简单的方法是应用客户端脚本,即JavaScript.

标签:html5,web-scraping,local-storage,python

来源: https://codeday.me/bug/20191119/2037360.html

python3读取本地_如何使用Python读取本地存储?相关推荐

  1. python读取二进制文件_如何用python读取二进制文件?

    我发现用Python读取二进制文件特别困难.你能帮我一把吗?我需要读取这个文件,在Fortran 90中,该文件很容易被int*4 n_particles, n_groups real*4 group ...

  2. 如何用python读取表格_如何使用Python读取excel文件?(代码示例)

    使用xlrd模块,可以从电子表格中检索信息.例如,可以用Python来读取.写入或修改数据.此外,用户可能必须遍历各种表,并根据一些标准检索数据,或者修改一些行和列,并执行大量工作. xlrd模块用于 ...

  3. python 读取excel图片_如何用Python读取Excel中图片?

    公众号: 早起Python 作者:刘早起 大家好,在使用Python进行办公自动化操作时,一定少不了与Excel表格的交互,我们通常是用pandas处理表格数据,但大多数情况下,都是读取表格中的数值进 ...

  4. 怎么用python读取excel图_如何用Python读取Excel中图片?

    公众号: 早起Python 作者:刘早起 大家好,在使用Python进行办公自动化操作时,一定少不了与Excel表格的交互,我们通常是用pandas处理表格数据,但大多数情况下,都是读取表格中的数值进 ...

  5. python 读取sqlite存入文件_如何通过python读取sqlite数据文件

    sqlite简介:sqlite是一个进程内的库,实现了自给自足的.无服务器的.零配置的.事务性的 SQL 数据库引擎.它的设计目标是嵌入式的,而且目前已经在很多嵌入式产品中使用了它(如安卓系统),它占 ...

  6. python读取大文件性能_强悍的Python读取大文件的解决方案

    Python 环境下文件的读取问题,请参见拙文 Python基础之文件读取的讲解 这是一道著名的 Python 面试题,考察的问题是,Python 读取大文件和一般规模的文件时的区别,也即哪些接口不适 ...

  7. python 读取文本文件_如何在Python中读取大文本文件

    python 读取文本文件 Python File object provides various ways to read a text file. The popular way is to us ...

  8. python读取大文件太慢_强悍的Python读取大文件的解决方案

    Python 环境下文件的读取问题,请参见拙文 Python基础之文件读取的讲解 这是一道著名的 Python 面试题,考察的问题是,Python 读取大文件和一般规模的文件时的区别,也即哪些接口不适 ...

  9. python如何读取log文件_怎么解决Python读取log文件时报错

    怎么解决Python读取log文件时报错 发布时间:2020-05-23 14:15:56 来源:亿速云 阅读:157 作者:鸽子 问题描述: 写了一个读取log文件的Python脚本:# -*- c ...

最新文章

  1. IROS2021|DLL直接点云定位:一种基于点云地图的航空机器人定位方法
  2. tensorflow.python.framework.errors_impl.InvalidArgumentError: 2 root error(s) found.
  3. Silverlight与数据库的三种互操作[源代码]
  4. POJ2431贪心(最少加油次数)
  5. 【流量劫持】躲避 HSTS 的 HTTPS 劫持
  6. Python元组与列表
  7. Vue表单类的父子组件数据传递示例_vue.js_脚本之家
  8. 具有链接资源的Spring RestTemplate
  9. 写得好的html网页,优化网站排名-使用Markdown编写更好的内容和HTML
  10. 【深入浅出etcd系列】4. 客户端
  11. 邻接表的建立与spfa算法
  12. 删除字符串中指定位置的字符
  13. 阿里巴巴《rocketmq开发指南》_主流消息中间件优劣:ActiveMQ,RabbitMQ,Kafka,RocketMQ...
  14. navicat 软件查询mysql表,限制显示条数
  15. 关于vs2008 SP1中CMFCToolBar的一些事儿
  16. oracle数据库怎么切换实例,oracle切换数据库实例
  17. 爆款预订,2022 最值得关注的后台框架——Fantastic-admin
  18. 如何建立个人网站服务器篇
  19. 系统模块化备援 服务器,无法登录到 CMM 以进行英特尔® 模块化服务器系统
  20. linux打开文件脚本,linux脚本文件实现的功能有哪些剧本用工具打开

热门文章

  1. 平均薪资 38.4 万!3 步教你成为区块链开发者,收好这份学习指南!
  2. 程序员平均年薪 70 万、40 岁后收入下滑?尽在 2019 程序员薪资报告
  3. 搭乘云原生与数据中台实践列车 通往数字化转型前沿之旅
  4. 程序员不努力,和咸鱼有什么分别?
  5. CTO 职场解惑指南系列(一)
  6. 轻芒联合创始人、CTO 范怀宇亲述《使用小程序做交互的技巧》
  7. 腾讯:向今日头条开炮,只为1块钱和一声道歉!
  8. 漫画:如何实现抢红包算法?
  9. “滚蛋吧”扎克伯格!
  10. 挖矿机十年变迁,你再也不会用1万比特币买一块披萨