c 本地html解析,使用selenium解析本地HTML文件方法
import requests
import time
"""
经验总结:
1.使用selenium解析本地HTML文件方法,
browser.get("file://C:/Users/23242/Desktop/HTML/People List _ USDA ARS.html")
file://很重要不能少;
2.(.text)获取不到时,换成.get_attribute("textContent")
3.(.replace('\n','')).replace(' ',''))替换空格和换行
4.有时候界面的弹出框,并不是一个子ifram 其实代码就在界面上,注意观察
"""
from selenium import webdriver
browser=webdriver.Chrome()
browser.get("file://C:/Users/Desktop/HTML/People List _ USDA ARS.html")
# print(browser.page_source)
# time.sleep(3)
#
button=browser.find_element_by_xpath('//*[@id="prefix-overlay-header"]/button')
button.click()
# 打开所有界面
# button=browser.find_element_by_id('expandAll')
# button.click()
title=browser.find_elements_by_xpath('//ul[@class="usa-accordion-bordered"]/li/button')
print(len(title))
for i in range(0,len(title)):
# print(title[i].text)#打印标题 列表是从0开始 xpath是从1开始
path=('//ul[@class="usa-accordion-bordered"]/li[{0}]/div/ul/li/a').format(i+1)
# print(path)
name=browser.find_elements_by_xpath(path)
# print(len(name))
for j in range(0,len(name)):
name_little=((name[j].get_attribute("textContent")).replace('\n','')).replace(' ','')
# print(name_little)
# print('\n')#打印名字
path_one=('//ul[@class="usa-accordion-bordered"]/li[{0}]/div/ul/li[{1}]').format(i+1,j+1)
# print(path_one)
name_content=browser.find_elements_by_xpath(path_one)
for k in range(len(name_content)): #打印名字的内容
cont=((name_content[k].get_attribute("textContent")).replace('\n','')).replace(' ','')
print(cont)
c 本地html解析,使用selenium解析本地HTML文件方法相关推荐
- java base64转图片并保存_java将base64解析图片保存到本地。
将base64解析图片保存到本地的两个方法 /** * base64转图片 * @param base64str base64码 * @param savePath 图片路径 * @return */ ...
- Flutter 项目编写 第三方插件库文件引入,本地图片 json数据引入解析
FlutterDemo是如何一步一步搭建起来的 最初就是直接新建flutter项目,就会自动建立一个入门项目.(开始项目前,需先学习Dart语言) flutter项目代码都在lib目录下编写: 新建包 ...
- 将 DNSCrypt 部署到 Openwrt 路由器上+ DNSmasq 解析国内域名用本地 DNS[ZT+实践]
原文地址: 1.https://typcn.com/legacy/blog/posts/openwrt-dnscypt.html 2.http://www.openwrt.pro/post-376.h ...
- selenium 解析网页_用Selenium进行网页搜刮
selenium 解析网页 网页抓取系列 (WEB SCRAPING SERIES) 总览 (Overview) Selenium is a portable framework for testin ...
- 数据解析1:XML解析(3)
XML解析的第二种方法是PULL解析. PULL解析是以事件常量的的方法进行解析,何为事件常量? 当解析器从头到尾解析XML文件时,解析到文档开头定义为解析到一个常量XmlPullParser.STA ...
- DNS域名解析服务(正向解析,反向解析,主从解析)
文章目录 DNS域名解析 DNS系统的作用及类型 DNS系统的作用 DNS类型 BIND的安装文件 正向解析 反向解析 主从复制 主服务器 从服务器 DNS域名解析 [域名]解析是把域名指向网站空间I ...
- SAP UI5 应用开发教程之五十四 - 如何将本地 SAP UI5 应用配置到本地 Fiori Launchpad 中的试读版
一套适合 SAP UI5 初学者循序渐进的学习教程 教程目录 SAP UI5 本地开发环境的搭建 SAP UI5 应用开发教程之一:Hello World SAP UI5 应用开发教程之二:SAP U ...
- XML解析:PULL解析
为什么80%的码农都做不了架构师?>>> 概述: PULL解析器小巧轻便,解析速度快,简单易用,非常适合在Android移动设备中使用,Android系统内部在解析各种XML时也是用 ...
- 本地修改服务器上的内容,本地修改指向服务器
本地修改指向服务器 内容精选 换一换 OBS Browser+是一款用于访问和管理对象存储服务的图形化工具,支持通过配置内网DNS服务器地址的方式,使在华为云上的Windows ECS通过内网直接访问 ...
最新文章
- 不扶好眼镜,请别打开这本挑战JS语言特性的书
- php抓取新浪微博数据抓取,php利用curl抓取新浪微博内容示例
- 机器学习(MACHINE LEARNING)MATLAB经济金融领域简单数学模型和分析
- python3获得命令行输入的参数
- [Hibernate]关于ID的一个容易混淆的地方
- centos连接xrdp桌面黑屏_小鹅通|视频直播桌面共享模式|视频直播OBS使用教程
- Python tkinter的text控件加滚动条
- 错误解决办法:zipimport.ZipImportError: can't decompress data; zlib not available
- 企业常用网管软件介绍及配置说明
- java生成uuid主键_java生成UUID
- 我的编程之路——VB篇
- 【算法】h0145. 会议安排(贪心算法)
- 【机器学习】信息熵基础学习
- 常州大学计算机专业研究生怎么样,常州大学计算机应用技术考研经验
- java ftp上传失败_使用java进行ftp文件上传出现425错误
- React Native系列——WebView组件使用介绍
- EJB:First component in name xxx not found - Java / Java EE
- java 根据excel模板格式导出指定格式的excel
- 如何看懂电路图之数字逻辑电路
- 华为LAB实验室3-决策树