使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeError: 'gbk' codec can't encode character '\xa0' in position ... 这个问题。 网络上有很多类似的文件讲述如何解决这个问题,但是无非就是encode,decod

Python Code

sql = "INSERT INTO test(keyword,content) values(\"%s\",\"%s\")"%(keyword,content)

cur.execute(sql)

报错信息

File "D:\Personal\Common.py", line 72, in DataIntoDB

cur.execute(sql)

File "D:\Python\V2.7\lib\site-packages\MySQLdb\cursors.py", line 157, in execute

query = query.encode(charset)

UnicodeEncodeError: 'gbk' codec can't encode character u'\u2027' in position 185: illegal multibyte sequence

参考文章Python2.7编译时报错: 'ascii' codec can't encode characters in position 8-50: ordinal not in range(128) Python2.7在安装时,默认的编码是ascii,当程序中出现非ascii编码时,python的处理常常会报这样的错UnicodeDecodeError: 'ascii' codec can't dec

这个字符,我曾经说他是例如“路易斯‧法比亚诺”中使用的连字点,但实际是错的,看楼层评论里依云的发言。这个符号不在GBK的字集中。

我没用过python的mysql库,不过解决问题的线索是三点:

设置库向mysql提交SQL字符串时,使用UTF8编码。

设置mysql的表格和数据库的整理为utf8 general ci。

21世纪了,写程序要尽量从原生上用utf-8。因为你不能假设用户的输入都在gbk的字集中。,

劝你编码使用UNICODE,就算你用GB18030也会在各个方面遇到不通用。举个简单的例子,有款软件叫做secureCRT,经常用来连ssh,在linux下的版本是不支持gb编码的。再举个例子,python中所有的字符都是用unicode(特指4字节的unicode)来做的,你可以从decode和encode两个函数看出来。,

python mysql 如果使用gbk编码会有很多问题,你可以设置好setdefaultencoding,建立链接时添加个use_unicode=False,这样一般很多类似编码错误都可以避免

:小白个人实践得来,仅供参考

python encoding报错_Python:'gbk' codec can't encode character相关推荐

  1. Python报错UnicodeEncodeError: 'gbk' codec can't encode character '\xa9' in position 1919: illegal mult

    with open("a.html", 'w') as f:f.write(html) python在写入文件时报错 UnicodeEncodeError: 'gbk' codec ...

  2. 报错UnicodeEncodeError: ‘ascii‘ codec can‘t encode character ‘\u7b2c‘ in position 64: ordinal not in r

    报错UnicodeEncodeError: 'ascii' codec can't encode character '\u7b2c' in position 64: ordinal not in r ...

  3. python open报错:‘gbk‘ codec can‘t decode byte 0xbd in position xxxx: illegal multibyte sequence

    python 打开文件: f = open(logpath, 'r') buff = f.read() 出错:UnicodeDecodeError: 'gbk' codec can't decode ...

  4. python encoding报错_Python BeautifulSoup报错encoding error问题

    编码后的html: def getHtml(self,url): headers = { "User-Agent": "Mozilla/5.0 (Windows NT 6 ...

  5. python 编码报错问题 'ascii' codec can't encode characters 解决方法

    python在安装时,默认的编码是ascii, 当程序中出现非ascii编码时,python的处理常常会报这样的错 'ascii' codec can't encode characters pyth ...

  6. python encoding报错_python用requests递归查询页面 报错 ChunkedEncodingError

    我想用递归的方式查询一个网页下面的所有后续页面 /index.php /index_2.php 这样. pages = set() def searchAllPages(url, name): ''' ...

  7. Python 爬起数据时 'gbk' codec can't encode character '\xa0' 的问题

    1.被这个问题折腾了一上午终于解决了,再网上看到有用  string.replace(u'\xa0',u' ') 替换成空格的,方法试了没用. 后来发现 要在open的时候加utf-8才解决问题. 以 ...

  8. 数据存储在.csv文件乱码,数据写入才一部分就报错'gbk' codec can't encode character '\xee' in position 45: illegal multibyte

    使用python爬虫爬取规则数据后转化成来List格式,将其存储在.csv 文件中 使用Python写文件的时候,或者将网络数据流写入到本地文件的时候,大部分情况下会遇到:UnicodeEncodeE ...

  9. Python异常UnicodeEncodeError: 'gbk' codec can't encode character '\uXXX' in position

    从网站上爬文字信息,得到的数据经过筛选存到txt文档里面,但是会报错 UnicodeEncodeError: 'gbk' codec can't encode character '\uXXX' in ...

最新文章

  1. json格式天气数据的获取,jsonp方式获取统计图数据
  2. C++归并排序(附完整源码)
  3. 轻松使用make menuconfig达到内核的升级!
  4. win10快速搭建scala环境
  5. mysql表空间转移_mysql共享表空间扩容,收缩,迁移
  6. gpg: 找不到有效的 openpgp 数据。_萤火数据|找主播堪比相亲找对象,该如何避免心酸血泪史?...
  7. linux 中间代码反编译,[原创]反编译原理(2)-中间表示
  8. SQL语法中的JOIN类型
  9. 案例全是电商零售,B2B的用户画像怎么做???
  10. python中node函数的意思_Node.js 函数
  11. 【代码笔记】iOS-手机系统版本
  12. wps云文档+到计算机,读书笔记:WPS云文档计算机版本
  13. 意外把移动硬盘标记为活动分区怎么办?
  14. Go select chan操作
  15. 自制Openerp图表
  16. Iptables详解七层过滤
  17. 介绍一下openkylin(开放麒麟),优麒麟和统信UOS
  18. RINEX 3.02 版本导航文件格式说明
  19. 移动电子商务网站可用性-商品页面和购物车
  20. VMware-vMotion简介和要求

热门文章

  1. python爬虫——使用xpath爬取搜狗微信文章
  2. linux洪水攻击软件,SYN洪水攻击工具hping SYN-Flooding tool
  3. 商业计划书的标准有哪些
  4. Linux开机报init错误,你好,Linux系统启动报kernelpanic- not syncing: attempted to kil init! 网上的办法我试了没有解决。...
  5. vue中关于el-radio样式修改失效的问题(自定义属性),和实现类似淘宝的码数、款式的选泽按钮
  6. 【苹果推群发】苹果相册推广告协议应用程序将被发送到服务器
  7. 中兴回应被列入被执行人名单;摩拜否认裁员 30%;LG 支持韩国对高通罚款 9 亿美元 | 雷锋早报...
  8. 《被讨厌的勇气》阅读摘录总结
  9. 新/老站长如何有效推广门户网站
  10. 微信小程序-学生登录后跳转-显示教师页面信息