由于python目前不能直接处理中文路径,必须要转化一下,如下例子是下载图片(名字为中文的):

def getInfo(self,imageurl):

response = urllib.request.urlopen(imageurl).read().decode('utf-8')

#         with open("text1.txt",'w',encoding='utf-8') as file:

#             file.write(response)

#         file.close()

imageRe = re.compile(r'

for image in imageRe.findall(response):

pattern = re.compile(r'^(http://.+/)(.+[jpg|JPG])$')

matchUrl = pattern.match(image)

if matchUrl:

'由于Python不能解析中文路径,所以quote一下中文字符'

imagePath = urllib.parse.urljoin(matchUrl.group(1),urllib.parse.quote(matchUrl.group(2)))

self.count  =self.count+1

path = matchUrl.group(2)

print(imageurl)

print(image)

'save picture'

urllib.request.urlretrieve(imagePath, path)

def getLink(self,url):

response = urllib.request.urlopen(url).read().decode('utf-8')

linkRe = re.compile(r'href="(http://.+\d+)" title=')

for link in linkRe.findall(response):

self.getInfo(link)

#         with open("text.txt",'w',encoding='utf-8') as file:

#             file.write(response)

#         file.close()

python路径中有中文_python3 网址路径中带中文的处理办法相关推荐

  1. linux minicon乱码,路径中带中文出现乱码问题

    路径中带中文出现乱码问题 來源:互聯網  2016-05-28 09:34:21  評論 路径中带中文出现乱码问题做项目的时候我们可能会遇到需要使用路径传参数的问题,如果参数是数字或者英文,那肯定不会 ...

  2. java字符串去掉中文_Java——去除字符串中的中文

    import java.util.regex.Matcher; import java.util.regex.Pattern; public class RemoveStrChinese { priv ...

  3. urlencode quote unquote (url 中带中文参数)

    目录: urlencode & quote & unquote (url 中带中文参数) python httplib urllib urllib2区别(一撇) 当url地址含有中文或 ...

  4. python怎么显示汉字_mac在matplotlib中显示中文的操作方法

    Matplotlib 是一个 Python 的 2D绘图库,它以各种硬拷贝格式和跨平台的交互式环境生成出版质量级别的图形 . 通过 Matplotlib,开发者可以仅需要几行代码,便可以生成绘图,直方 ...

  5. python官网如何调中文-django的settings中设置中文支持的实现

    今天创建了个django工程,用的是目前django 1.9.6,创建工程后,settings.py中设置中文显示支持(最简单的,例如把admin界面的默认英文改成中文),定义 TIME_ZONE = ...

  6. ios网址解析中,中文部分如何处理

    在网络解析中,中文出现的时候,在解析数据是中文会显示为 %E7%81%AB%E5%BD%B1%E5%BF%8D%E8%80%85 这样的形式但是如果我们之间用字符串拼接键值对的时候但多数出现的不是错误 ...

  7. 如何解决oracle中文乱码问题,oracle中解决中文乱码问题

    中文乱码问题解决 1.查看服务器端编码 select userenv('language') from dual; 查到结果是: USERENV('LANGUAGE') --------------- ...

  8. oracle字符串只截取中文,Oracle提取字符串中“汉字”串的解决办法

    我们在实际工作中常常要使用去特殊字符的功能,特别是插入到数据库中的数据,我们为了保证数据的质量,往往需要对数据进行清洗, 我们在实际工作中常常要使用去特殊字符的功能,特别是插入到数据库中的数据,我们为 ...

  9. wordpress搜索不了中文linux,WordPress上传带中文汉字名称的图片不显示的解决办法...

    以上是WordPress上传带中文汉字名称的图片不显示的情况,正常上传成功的话,在上图两个地方都会有图片缩略图显示.相信很多WordPress装载linux系统上的朋友都会遇到这样的错误. WordP ...

最新文章

  1. (第一课)Python学习之蟒蛇绘制
  2. java s1_转!!Java 基础面试题的剖析: short s1=1;s1 = s1 +1 报错? s1+=1 呢
  3. HDU 3068 最长回文
  4. linux u32,如何在程序中使用u32这个类型啊。
  5. Subversion(SVN)/TortoiseSVN 的分支合并方法
  6. 系统仿真平台SkyEye可替代国外Matlab/Sumlink等同类软件
  7. 首次公开!华为最前沿的X Labs实验室都在研究什么?5G+CV
  8. linux mysql 端口 查看进程_Linux如何查看端口状态
  9. swift学习_xcode6搭建
  10. .NET数据提供程序
  11. 解决ASP.NET2.0和1.1在同一台电脑上不能并行的问题(转)
  12. python flask_Python Flask框架详解
  13. Oracle EBS R12 电子技术参考手册 - eTRM (电子文档)
  14. linux服务之irqbalance
  15. python外国网站爬虫_10分钟教你用python爬取网站信息:这可能是全网最好用的爬虫代码...
  16. UOS启用wayland
  17. arxiv数据_使用neo4j第1部分分析arxiv数据
  18. 【办公类-16-01-01】“机动班下午代班的排班表”(python 排班表系列)
  19. 【Linux Centos6\7 Oracle11g 修改数据库最大连接数】
  20. 【后端检测-绕过】文件头检测绕过、二次渲染绕过

热门文章

  1. 除了人工智能,霍金还担心“游牧外星人”会摧毁人类
  2. Error running app: Default Activity Not Found
  3. 《机器学习实战》KNN算法实现
  4. 使用Tensorflow进行脸部识别
  5. C++之保护和私有构造函数与析构函数
  6. Vagrant搭建开发环境1--总体介绍
  7. 局域网内搭建Android SDK更新源
  8. URL重写 对于禁用cookie的 方法
  9. Exchange Server2010系列之二:部署三合一角色(CAS+HT+MBX)
  10. 哲理短文一则:揭示最好的成功法则