我正在尝试使用

Python读取.xls文件.该文件包含多个非ascii字符(即äöü).我已经尝试过使用openpyxls和xlrd(我对xlrd寄予厚望,因为它无论如何都会读取unicode中的所有内容),但都没有工作.

我在尝试从xls打印信息时发现了多个处理编码/解码的答案,但我似乎无法达到那么远.只需尝试读取文件后,此脚本就会出错:

import xlrd

workbook = xlrd.open_workbook('export_data.xls')

导致:

Traceback (most recent call last):

File "C:\Users\Administrator\workspace\tufinderxlstoxml\tufinderxlstoxml2.py", line 2, in

workbook = xlrd.open_workbook('export_data.xls')

File "C:\Python27_32\lib\site-packages\xlrd\__init__.py", line 435, in open_workbook

ragged_rows=ragged_rows,

File "C:\Python27_32\lib\site-packages\xlrd\book.py", line 119, in open_workbook_xls

bk.get_sheets()

File "C:\Python27_32\lib\site-packages\xlrd\book.py", line 705, in get_sheets

self.get_sheet(sheetno)

File "C:\Python27_32\lib\site-packages\xlrd\book.py", line 696, in get_sheet

sh.read(self)

File "C:\Python27_32\lib\site-packages\xlrd\sheet.py", line 796, in read

strg = unpack_string(data, 6, bk.encoding or bk.derive_encoding(), lenlen=2)

File "C:\Python27_32\lib\site-packages\xlrd\biffh.py", line 269, in unpack_string

return unicode(data[pos:pos+nchars], encoding)

UnicodeDecodeError: 'ascii' codec can't decode byte 0x92 in position 55: ordinal not in range(128)

WARNING *** OLE2 inconsistency: SSCS size is 0 but SSAT size is non-zero

*** No CODEPAGE record, no encoding_override: will use 'ascii'

*** No CODEPAGE record, no encoding_override: will use 'ascii'

我也尝试过:

workbook = xlrd.open_workbook('export_data.xls', encoding_override="utf-8")

导致:

Traceback (most recent call last):

File "C:\Users\Administrator\workspace\tufinderxlstoxml\tufinderxlstoxml2.py", line 2, in

workbook = xlrd.open_workbook('export_data.xls', encoding_override="utf-8")

File "C:\Python27_32\lib\site-packages\xlrd\__init__.py", line 435, in open_workbook

ragged_rows=ragged_rows,

File "C:\Python27_32\lib\site-packages\xlrd\book.py", line 119, in open_workbook_xls

bk.get_sheets()

File "C:\Python27_32\lib\site-packages\xlrd\book.py", line 705, in get_sheets

self.get_sheet(sheetno)

File "C:\Python27_32\lib\site-packages\xlrd\book.py", line 696, in get_sheet

sh.read(self)

File "C:\Python27_32\lib\site-packages\xlrd\sheet.py", line 796, in read

strg = unpack_string(data, 6, bk.encoding or bk.derive_encoding(), lenlen=2)

File "C:\Python27_32\lib\site-packages\xlrd\biffh.py", line 269, in unpack_string

return unicode(data[pos:pos+nchars], encoding)

UnicodeDecodeError: 'utf8' codec can't decode byte 0x92 in position 55: invalid start byte

WARNING *** OLE2 inconsistency: SSCS size is 0 but SSAT size is non-zero

并包括顶部各种版本:

# -*- coding: utf-8 -*-

我在Windows Server 2008计算机上的python 2.7上运行它.

python读取xls文件_从python中的xls读取unicode相关推荐

  1. python使用xlrd读取xlsx文件_$ 用python处理Excel文档(1)——用xlrd模块读取xls/xlsx文档...

    本文主要介绍xlrd模块读取Excel文档的基本用法,并以一个GDP数据的文档为例来进行操作. 1. 准备工作: 1. 安装xlrd:pip install xlrd 2. 准备数据集:从网上找到的1 ...

  2. python生成wps文件_使用Python操作XLS文件(wps中叫et)

    一旦TE需要* *信息的列表,我导出一个txt文件与python和扔给他们,但是他们很不开心,哈哈,因为他们想要将数以百计的数据放到xls文件列表输出,工作数量太大,所以我问我出口成xls文件然后给他 ...

  3. python关闭excel文件_利用Python读取和修改Excel文件(包括xls文件和xlsx文件)

    本文介绍一下使用Python对Excel文件的基本操作,包括使用xlrd模块读取excel文件,使用xlwt模块将数据写入excel文件,使用openpyxl模块读取写入和修改excel文件. 目录 ...

  4. python读取sav文件_在Python中读取SPSS(.sav)文件时,获取“title already used as a name or title”错误...

    我正在读一个SPSS文件(.sav).我下面的代码可以读取.sav文件.但是,我遇到了一个非常奇怪的错误.当我试图读取另一个.sav文件时,它会给出以下错误Traceback (most recent ...

  5. 怎么用python读取大文件_使用Python读取大文件的方法

    背景准备试一试:f =开放(\u201C\/道路\/ \/文件\u201D,\u201Cr\u201D)打印()最后:如果f:()调用读()将读取所有文件的内容,如果文件有10 g,记忆会破灭,所以, ...

  6. python处理pcap文件_[转载]Python读取pcap文件

    想试一试读取pcap文件的内容,并且分析出pcap文件头,每一包数据的pcap头,每一包的数据内容(暂时不包括数据包的协议解析),关于pcap文件的格式,可以参看:http://blog.sina.c ...

  7. python读取rtf文件_【Python】【IO】文件读写

    一.打开的文件在使用完后要关闭 >>>f=file('fibs.py') #用''表示文件名 #无''表示变量名 >>>f.read() #打印fibs.py中的内 ...

  8. python如何自动读取excel文件_基于Python的接口自动化-读写excel文件

    引言 使用python进行接口测试时常常需要接口用例测试数据.断言接口功能.验证接口响应状态等,如果大量的接口测试用例脚本都将接口测试用例数据写在脚本文件中,这样写出来整个接口测试用例脚本代码将看起来 ...

  9. python 复制替换文件_在Python中复制和替换文件

    python 复制替换文件 The python language provides a built-in module "shutil", which offers numero ...

最新文章

  1. Python sort
  2. Linux下安装.bundle后缀的程序
  3. 多媒体个人计算机能处理什么,多媒体计算机可以处理的信息类型有哪些
  4. jquerymobile从index.html跳转到另外一个xxxx.html文件,js不执行的解决
  5. [react] 在React中组件的props改变时更新组件的有哪些方法?
  6. svn添加用户.sh
  7. 制备pdms膜的方法_船体用钢板基底超疏水表面的制备和性能
  8. java 防重_如何做一个防重设计
  9. day6-day9代码片段
  10. 排版小知识 1.针对某个对象对齐
  11. js判断是否为手机浏览器
  12. vfp保存为html,建立,生成,运行VFP菜单
  13. 计算机网络第七版答案
  14. 如何压缩pdf文件的大小?
  15. 分享可用的谷歌学术(google scholar) hosts
  16. 鼠标中键控制音量大小
  17. 51单片机实战教程之C语言基础(十 Keil C51函数库)
  18. pymsql模块详解
  19. php底部漂浮广告位代码,DIV+CSS固定底部的漂浮广告
  20. C++STL——List链表的常见用法及函数

热门文章

  1. Cisco路由器安全配置方案
  2. 应用keyup监测输入框兼容IE处理
  3. Python策略模式实现源码分享
  4. [MongoDB]安装MongoDB遇到问题
  5. leetcode 之Rotate List(18)
  6. 【转】JavaScript顶级对象参考模型
  7. Github fork其他项目的分支与主干保持同步
  8. [JavaScriptC#]收藏 备忘
  9. ADSL 定时断线重连bat文件
  10. rm删除报错 :-bash: syntax error near unexpected token `('