p = re.compile(u'《(.*?)》') # 使用unicode编码

vid_drama_list = p.findall(info_util.get_id_field(vid,"name_cn").decode("utf8")) # utf8解码为unicode

vid_drama_list = [x.encode("utf8") for x in vid_drama_list] # unicode再编码为utf8,防止输出乱码。

注意:

pattern和string中,都需要使用unicode,否则编码不同,结果有误(如:《推拿》,《一切都好》等)。

正则提取编码解码问题相关推荐

  1. Python基础——第二章 第一部分 字符串方法 转义及编码解码

    1.字符串方法 1.1.查 (1)count:统计字符串中某元素出现的次数 >>>zf = 'hello world' >>>zf.count('l') 3 > ...

  2. 基于频谱注意力机制和编码解码模型的时间序列分类研究

    文章来源 浙江大学 2021年硕士论文 小论文 IEEE Spectrum Attention Mechanism for Time Series Classification 1 摘要 本文贡献 时 ...

  3. 【6】爬虫介绍/准备工作/构建流程/获取数据/BeautifulSoup/Re(正则表达式)/正则提取/标签解析/保存数据到excel

    爬虫介绍/准备工作/构建流程/获取数据/BeautifulSoup/Re(正则表达式)/正则提取/标签解析/保存数据到excel 更新时间:2021.9.16 vedio:15,16,17,18,19 ...

  4. python3 转码的函数_python基础3之文件操作、字符编码解码、函数介绍

    内容概要: 一.文件操作 二.字符编码解码 三.函数介绍 一.文件操作 文件操作流程: 打开文件,得到文件句柄并赋值给一个变量 通过句柄对文件进行操作 关闭文件 基本操作: 1 #/usr/bin/e ...

  5. .NET编码解码(HtmlEncode与HtmlEncode)

    原文:.NET编码解码(HtmlEncode与HtmlEncode) 编码代码: System.Web.HttpUtility.HtmlEncode("<a href=\"h ...

  6. js base64 编码解码

    js base64 编码解码 encode decode,可以直接使用 function Base64() {// private property_keyStr = "ABCDEFGHIJ ...

  7. python使用base64编码解码数据

    python使用base64编码解码数据 base64模块是用来作base64编码解码,常用于小型数据的传输.编码后的数据是一个字符串,其包括a-z.A-Z.0-9./.+共64个字符,即可用6个字节 ...

  8. python email模块详解_python模块之email: 电子邮件编码解码 (一、解码邮件)-阿里云开发者社区...

    python自带的email模块是个很有意思的东西,它可以对邮件编码解码,用来处理邮件非常好用. 处理邮件是一个很细致的工作,尤其是解码邮件,因为它的格式变化太多了,下面先看看一个邮件的源文件: Re ...

  9. java 正则提取$ 中内容_JAVA 使用正则从文字中提取想要的内容

    有时候我们想从一段文字中提取想要的内容,如省市区地址中提取出省市,从股票的数据中提取出关键的价格信息,抓取HTML文件后提取内容等等这些场景,这时我们可以使用JAVA正则表达式帮助我们提取出想要的数据 ...

最新文章

  1. June:Datawhale开源学习小程序升级啦!
  2. SQL语言学习(五)流程控制函数学习
  3. [导入]ASP.NET26个常用性能优化方法
  4. CVPR 2020 | 自适应聚合网络AANet:更高效的立体匹配
  5. c语言综合模拟测试题答案,【C语言指针模拟测试题_答案】
  6. OpenHub框架–下一个有趣的功能
  7. xbmc addons
  8. FreeBSD的功能特点
  9. 应用虚拟化之规划篇二 项目流程规划
  10. C语言基础教程之错误处理
  11. ffmpeg4.3.2版本:gstavdemux.c:486:24: error: AVStream has no member named ‘index_entries‘(二十七)
  12. JUC 常用 4 大并发工具类:CountDownLatch、CyclicBarrier、Semaphore、Exchanger
  13. 动手动脑(Java)
  14. 京瓷Kyocera TASKalfa 6002i 一体机驱动
  15. 印前调色的基本规律及视觉效果
  16. JavaScript——数组——slice方法
  17. 8086-逻辑运算指令
  18. 全球各大运营商代码。方便国外卡的朋友修改运营商显示
  19. 用bridge创建虚拟网桥
  20. 全志平台修改CPU频率方法

热门文章

  1. python+scapy 抓包与解析
  2. CSP认证201604-2 俄罗斯方块[C++题解]:模拟、枚举
  3. 《图解HTTP》读书笔记--第7章 确保Web安全的HTTPS
  4. php 获取signature,PHP开发微信无法获取到signature,timestamp,nonce
  5. 如何吧本地仓库提交到github_解锁GitHub(5)之GitHub本地仓库使用
  6. php 匹配一次,PHP Regex匹配最后一次出现的字符串
  7. textview 背景变形_重庆新中式床背景品牌
  8. 加拿大留学商科好还是计算机科学好,去加拿大读商科专业就是要选择这些才最好!...
  9. html单页面显示多个文章,从单个html页面上的多个django应用模型获取数据
  10. oracle瘦连接,java-无法使用jdbc瘦驱动程序连接到oracle数据...