Python读取本地html文件,获取其中表格内容
以个人成绩网页页面为例:
右键查看源代码:
右键另存为单独的html文件,然后代码读取并处理
import ref = open("GP.html","r",encoding='utf-8')
html = f.read()table = re.findall(r'<table(.*?)</table>', html, re.S)#查找html中table之间的内容
nowtable = table[0]#前两个表格为成绩信息
nowtable = nowtable.replace('\t','')#将空格换行等去除
nowtable = nowtable.replace('\n','')
nowtable = nowtable.replace(' ','')
nowtable = nowtable.replace(' ','')
td0 = re.findall(r'<tdclass="center">(.*?)</td>', nowtable, re.S)#成绩想关的信息都在tdclass="center"td之间
print("主修课程信息为:\n",td0)
nowtable = table[1]
nowtable = nowtable.replace('\t','')
nowtable = nowtable.replace('\n','')
nowtable = nowtable.replace(' ','')
nowtable = nowtable.replace(' ','')
td1 = re.findall(r'<tdclass="center">(.*?)</td>', nowtable, re.S)
print("选修课信息为:\n",td1)
print("选修课信息第一个值为:\n",td1[0])
结果:
如果想要计算GPA,字符转换为对应的数值进行计算就行了
Python读取本地html文件,获取其中表格内容相关推荐
- python使用xlrd读取xlsx文件_005:【Python读取本地Excel文件】使用xlrd模块来读取本地Excel文件...
使用xlrd模块来读取xls文件 注意:xlrd只能对Excel文件进行"读"操作 1.首先本地新建一个Excel表格(.xls格式),假设表格内容如下: 2.引入xlrd模块(没 ...
- python读取word文档中的表格内容
1. 使用到的库 :docx(python_docx‑0.8.10‑py2.py3‑none‑any.whl) 下载地址:https://download.lfd.uci.edu/pythonlibs ...
- Python读取本地html文件内容存csv
直接上代码 import os from html2text import html2text import csv file_path = './data' file_names = os.list ...
- python播放本地视频_python opencv 读取本地视频文件 修改ffmpeg的方法
Python + opencv 读取视频的三种情况: 情况一:通过摄像头采集视频 情况二:通过本地视频文件获取视频 情况三:通过摄像头录制视频,再读取录制的视频 摄像头采集.本地视频文件的读取.写视频 ...
- html 查看excel表格,html展示excel表格数据-html读取本地excel文件并展示
怎么用html实现excel表格 首先html不能读取本地excel文件 其次就算是javascript 也是不允许的 这是为了安全考虑 如果前端脚本可以读取本地文件 那很不安全 如何将excel上的 ...
- python获取的html转换为json,python读取XML格式文件并转为json格式
XML文件如下: 红楼梦书名> 曹雪芹作者> 描述贾宝玉和林黛玉的爱情故事主要内容> 人民文学出版社出版社> 图书> 一.python读取XML格式文件代码: impor ...
- python处理表格数据-python读取word 中指定位置的表格及表格数据
1.Word文档如下: 2.代码 # -*- coding: UTF-8 -*- from docx import Document def readSpecTable(filename, specT ...
- jquery ajax json文件,jQuery ajax读取本地json文件
jQuery ajax读取本地json文件 json文件 { "first":[ {"name":"张三","sex": ...
- python怎么读取sav格式_利用Python读取外部数据文件
利用Python读取外部数据文件 [color=rgb(0, 0, 0) !important]刘顺祥 [color=rgb(0, 0, 0) !important]摘要: 不论是数据分析,数据可视化 ...
- python读取一个TXT转换成EXCEL表格
[任务]:python读取一个TXT转换成EXCEL表格 [坑1]pycharm安装后代码区不能编辑,是由于最新的pycharm在安装时自动装了vimVim插件, 方法一:在tools-Vim emu ...
最新文章
- Silverlight C# 游戏开发:未写代码先设计
- 小李飞刀:python请你轻轻轻点虐
- 生产者跟消费者问题(C++实现)
- 8、python基础知识-用户输入
- 将Linux系统下交叉编译的依赖库推到ARM平台下无法建立以来关系解决
- DES的原理及python实现
- CSAPP--信息的表示与处理
- github api常用操作
- 数据结构 2-2 线性表的顺序表实现
- 城镇化把握质量 数据分析让管理更创新
- opencv成员函数data,step,at的使用
- 华为手机Android studio 配置ADB wifi 调试
- 机器学习笔记 - 简单了解模式识别
- 服务器怎么用iso文件装系统,u盘使用iso文件安装系统的方法
- 二进制安全学习笔记(2)
- 一图读懂腾讯云SaaS连接生态专场
- python实例属性
- in unnamed module of loader
- 移动web微金所实战项目——导航栏
- 电源常识-变压器同名端