其中有些是我自加的处理,不用搭理
#coding:utf-8
import os
import win32com
import win32com.client as win32
from Ltp import ltp_db
from win32com.client import Dispatch, constants
#获取相对路径下所有word名称
def listdir(path, list_name):
for file in os.listdir(path):
file_path = os.path.join(path, file)
if os.path.isdir(file_path):
listdir(file_path, list_name)
else:
list_name.append(file_path)
def get_column_string(column):
columnStr = str(column)
columnStr = columnStr.replace('\r', '')
columnStr = columnStr.replace('\07', '')
columnStr = columnStr.replace('\n', '')
return columnStr
#解析word文档
def PraseWord(docName,client,conn):
ParaName = []
cursor = conn.cursor()
#路径问题(绝对路径)
#doc = client.Documents.Open(docName)
      #test
client.Documents.Open(r'F:\1.doc')
docStr = client.ActiveDocument
for s in range(len(docStr.Paragraphs)):
ParaStyle = docStr.Paragraphs[s].Range.style
print(ParaStyle,type(ParaStyle))
if ParaStyle == "普通(网站)":
str = docStr.Paragraphs[s].Range.text
if ParaStyle[0].isdigit():
ParaName.append(str)
print (str)
# word中表格数量
numTables = docStr.Tables.Count
#对word中所有表格进行操作
for i in range(1, numTables + 1):
table = docStr.Tables(i)
numRows = table.Rows.Count
for i in range(1, numRows+1):
columnName = get_column_string(table.Cell(i, 1))
content = get_column_string(table.Cell(i, 2))
#内容处理
#todo
#主调用
def insert_Attibute(conn):
cl = win32com.client.Dispatch('Word.Application')
cl.Visible = 1
list_name=[]
#项目路径
listdir("..\sources\属性",list_name)
for i in range(len(list_name)):
PraseWord(list_name[0],cl,conn)

win32com 读doc,doc表格相关推荐

  1. java poi 读word (doc,docx)表格

    项目场景: 最近公司将线下流程线上话,提供上传模板的功能,很多表格都是在word里面生成的,找了很多资料处理docx 跟doc 最后docx 勉强可以用,doc还是不完善,最后只能沟通 限制上传doc ...

  2. python读word中表格

    python读word中表格 #_*_coding:utf-8_*_ from docx import Document import pandas as pdres=[] #docx库不支持doc格 ...

  3. 微型计算机硬件中访问速度最快的,习题一计算机基础知识.doc.doc

    习题一计算机基础知识.doc.doc 习题一 计算机基础知识 选择题 1.微型计算机系统包括 . A.主机和外设 B. 硬件系统和软件系统 C. 主机和各种应用软件 D. 运算器.控制器和存储器 2. ...

  4. 计算机组成原理课程内容,计算机组成原理课程教学大纲.doc.doc

    计算机组成原理课程教学大纲.doc.doc 附件A 计算机组成原理课程教学大纲 课程名称 中文:计算机组成原理 英文: the Principle of Computer Organization 课 ...

  5. 农民伯伯android,Android3.1r1API中文文档——ImageView(cnmahj+农民伯伯).doc.doc

    Android3.1r1API中文文档--ImageView(cnmahj+农民伯伯).doc.doc ImageView 译者署名: cnmahj.农民伯伯 译者博客:/cnmahj 版本:Andr ...

  6. 计算机控制篮球,【精品课程设计】计算机控制技术弱电课程之篮球比赛计时计分器doc.doc...

    [精品课程设计]计算机控制技术弱电课程之篮球比赛计时计分器doc.doc 课程设计 题目 篮球赛计时计分器 二级学院 电子信息与自动化 专 业 电气工程及其自动化 班 级 学生姓名 学号 指导教师 考 ...

  7. 清华大学文件服务器,UserFiles深圳清华大学研究院招标文件-云存储服务器.doc.doc...

    UserFiles深圳清华大学研究院招标文件-云存储服务器.doc.doc 招标编号:______________ 深圳采购招标文件 项目名称: 机柜 采购人名称: 深圳清华大学研究院 第一章 采购公 ...

  8. python doc转docx_利用python中的win32com模块将doc文件转为docx文件

    简介 win32com模块的功能也是非常的强大的,能够处理各种的文件 word操作 如何使用python的win32com模块实现将doc类型文件转成docx类型的文件 import os from ...

  9. matlab读int16读文件_matlab文件读写.doc.doc

    matlab文件读写.doc Matlab文件和数据的导入与导出 在编写一个程序时,经常需要从外部读入数据,或者将程序运行的结果保存为文件.MATLAB使用多种格式打开和保存数据.本章将要介绍 MAT ...

  10. 提升C语言程序运行效率 马尔可夫,计算机程序编程课程设计报告(马尔可夫链算法生成随机可读文本).doc...

    PAGE 1 计算机程序编程课程设计报告 (马尔可夫链算法生成随机可读文本) 引言: 马尔可夫链的数学背景: 马尔可夫链,因安德烈?马尔可夫(A.A.Markov,1856-1922)得名 ,是数学随 ...

最新文章

  1. R语言基于日期范围筛选数据实战(Subset by a Date Range):日期范围之内的数据、日期范围之外的数据、日期之后的数据、日期之前的数据
  2. mc幻想乡java_我的世界1.7.2幻想乡整合版下载_我的世界1.7.2东方幻想乡下载_游戏之家...
  3. Swift URL含有中文的处理
  4. 原型链Object的一些方法
  5. 数据结构-----二叉树,树,森林之间的转换
  6. [LeetCode] 21. Merge Two Sorted Lists ☆
  7. 模板:拉格朗日插值(多项式)
  8. pcie 的function_PCIe扫盲——BDF与配置空间
  9. 在 IntelliJ IDEA 中部署应用到服务器(Eclipse)
  10. np读取csv文件_pythonpandas读写csv数据
  11. dispatch类 java_WebWork2中ServletDispatch类中的service方法
  12. HDU 2152 Fruit (母函数)
  13. 1.node.js 概述
  14. 职场新鲜人必读:那些被“误读”的真经
  15. 学习模式上的记录之统计篇一 秩和检验
  16. vue中获取屏幕高度(封装使用)
  17. Python0基础(中)——期末不挂科
  18. CSS中Margin的注意问题
  19. [长期更新]相似单词对比
  20. 专题 | 项目管理知识、方法论、工具NO.9:你应该知道的项目管理的五个过程组和九大知识领域

热门文章

  1. java swnig 太极,iOS 13 系统那些好玩的桌面小组件
  2. 智慧旅游系统总体设计方案
  3. 史上最管用的C盘深度清理秘籍
  4. 基于SSH的房屋租赁管理系统
  5. JeeWx 微信管家平台,简称“捷微”
  6. java完全自学手册(java完全自学手册pdf洪维恩)
  7. 基于交比不变性的太阳定位算法的研究
  8. SLAM技术与市场杂谈
  9. 前端干货-网站资源收集
  10. Axure一些常用模板下载(免费模板)