import requests

import time

"""

经验总结:

1.使用selenium解析本地HTML文件方法,

browser.get("file://C:/Users/23242/Desktop/HTML/People List _ USDA ARS.html")

file://很重要不能少;

2.(.text)获取不到时,换成.get_attribute("textContent")

3.(.replace('\n','')).replace(' ',''))替换空格和换行

4.有时候界面的弹出框,并不是一个子ifram 其实代码就在界面上,注意观察

"""

from selenium import webdriver

browser=webdriver.Chrome()

browser.get("file://C:/Users/Desktop/HTML/People List _ USDA ARS.html")

# print(browser.page_source)

# time.sleep(3)

#

button=browser.find_element_by_xpath('//*[@id="prefix-overlay-header"]/button')

button.click()

# 打开所有界面

# button=browser.find_element_by_id('expandAll')

# button.click()

title=browser.find_elements_by_xpath('//ul[@class="usa-accordion-bordered"]/li/button')

print(len(title))

for i in range(0,len(title)):

# print(title[i].text)#打印标题  列表是从0开始  xpath是从1开始

path=('//ul[@class="usa-accordion-bordered"]/li[{0}]/div/ul/li/a').format(i+1)

# print(path)

name=browser.find_elements_by_xpath(path)

# print(len(name))

for j in range(0,len(name)):

name_little=((name[j].get_attribute("textContent")).replace('\n','')).replace(' ','')

# print(name_little)

# print('\n')#打印名字

path_one=('//ul[@class="usa-accordion-bordered"]/li[{0}]/div/ul/li[{1}]').format(i+1,j+1)

# print(path_one)

name_content=browser.find_elements_by_xpath(path_one)

for k in range(len(name_content)):  #打印名字的内容

cont=((name_content[k].get_attribute("textContent")).replace('\n','')).replace(' ','')

print(cont)

c 本地html解析,使用selenium解析本地HTML文件方法相关推荐

  1. java base64转图片并保存_java将base64解析图片保存到本地。

    将base64解析图片保存到本地的两个方法 /** * base64转图片 * @param base64str base64码 * @param savePath 图片路径 * @return */ ...

  2. Flutter 项目编写 第三方插件库文件引入,本地图片 json数据引入解析

    FlutterDemo是如何一步一步搭建起来的 最初就是直接新建flutter项目,就会自动建立一个入门项目.(开始项目前,需先学习Dart语言) flutter项目代码都在lib目录下编写: 新建包 ...

  3. 将 DNSCrypt 部署到 Openwrt 路由器上+ DNSmasq 解析国内域名用本地 DNS[ZT+实践]

    原文地址: 1.https://typcn.com/legacy/blog/posts/openwrt-dnscypt.html 2.http://www.openwrt.pro/post-376.h ...

  4. selenium 解析网页_用Selenium进行网页搜刮

    selenium 解析网页 网页抓取系列 (WEB SCRAPING SERIES) 总览 (Overview) Selenium is a portable framework for testin ...

  5. 数据解析1:XML解析(3)

    XML解析的第二种方法是PULL解析. PULL解析是以事件常量的的方法进行解析,何为事件常量? 当解析器从头到尾解析XML文件时,解析到文档开头定义为解析到一个常量XmlPullParser.STA ...

  6. DNS域名解析服务(正向解析,反向解析,主从解析)

    文章目录 DNS域名解析 DNS系统的作用及类型 DNS系统的作用 DNS类型 BIND的安装文件 正向解析 反向解析 主从复制 主服务器 从服务器 DNS域名解析 [域名]解析是把域名指向网站空间I ...

  7. SAP UI5 应用开发教程之五十四 - 如何将本地 SAP UI5 应用配置到本地 Fiori Launchpad 中的试读版

    一套适合 SAP UI5 初学者循序渐进的学习教程 教程目录 SAP UI5 本地开发环境的搭建 SAP UI5 应用开发教程之一:Hello World SAP UI5 应用开发教程之二:SAP U ...

  8. XML解析:PULL解析

    为什么80%的码农都做不了架构师?>>> 概述: PULL解析器小巧轻便,解析速度快,简单易用,非常适合在Android移动设备中使用,Android系统内部在解析各种XML时也是用 ...

  9. 本地修改服务器上的内容,本地修改指向服务器

    本地修改指向服务器 内容精选 换一换 OBS Browser+是一款用于访问和管理对象存储服务的图形化工具,支持通过配置内网DNS服务器地址的方式,使在华为云上的Windows ECS通过内网直接访问 ...

最新文章

  1. 不扶好眼镜,请别打开这本挑战JS语言特性的书
  2. php抓取新浪微博数据抓取,php利用curl抓取新浪微博内容示例
  3. 机器学习(MACHINE LEARNING)MATLAB经济金融领域简单数学模型和分析
  4. python3获得命令行输入的参数
  5. [Hibernate]关于ID的一个容易混淆的地方
  6. centos连接xrdp桌面黑屏_小鹅通|视频直播桌面共享模式|视频直播OBS使用教程
  7. Python tkinter的text控件加滚动条
  8. 错误解决办法:zipimport.ZipImportError: can't decompress data; zlib not available
  9. 企业常用网管软件介绍及配置说明
  10. java生成uuid主键_java生成UUID
  11. 我的编程之路——VB篇
  12. 【算法】h0145. 会议安排(贪心算法)
  13. 【机器学习】信息熵基础学习
  14. 常州大学计算机专业研究生怎么样,常州大学计算机应用技术考研经验
  15. java ftp上传失败_使用java进行ftp文件上传出现425错误
  16. React Native系列——WebView组件使用介绍
  17. EJB:First component in name xxx not found - Java / Java EE
  18. java 根据excel模板格式导出指定格式的excel
  19. 如何看懂电路图之数字逻辑电路
  20. 华为LAB实验室3-决策树

热门文章

  1. ASP.Net学习笔记008--ASP.Net揭秘之Input版自增补充说明
  2. 【转载】随机游走及马尔科夫链(本体映射相关)
  3. 为什么牛顿法下降的速度比梯度下降的快
  4. VS调试提示无可用源。
  5. 杭电4551生日猜猜猜
  6. C++面试宝典之STL向量容器
  7. 随想录(cloud 网络库)
  8. 随想录(从编程语言到库、框架、软件)
  9. 怎么切换java版本吗_Java切换JDK版本的方法及技巧
  10. 安装sphinx的php扩展,安装php扩展sphinx