python 爬取图片_Python实现千图成像：从图片爬取到图片合成

千图成像：用N张图片拼凑成一张图片。

实现原理：先将所要成像的图片转化成马赛克图片，然后从图库中用对应颜色的图片替换相应色块。

图库中的图片处理：标记图库中每张图片的混合颜色，用于替换目标色块，并记录每张图片的特征用于成像，增加成像质量。

起源

德莱文

图片局部

英雄联盟-微博

很久前在刷微博的时候看到了这条，被他给震撼到了，图片是由LOL近千张皮肤图片组合构成的(难道这是用ps做的，还是一张张拼的，应该不可能吧)，就在昨天突然就想起了这个事，就决定也做一个，随即便展开了行动。

搜到了这篇文章，看了下图片的构成，决定先取得所有皮肤的图片再说吧！便又开始了爬虫！

运行环境：

Python3.6.5 ， pycharm-2018-1-2 ， win10

爬虫思路

皮肤图片的来源问题，首先到官网去找了找，想到了道聚城皮肤专卖区，其中正好有所有我们需要的图片。

通过F12锁定图片取得了第一张图片的URL(https://game.gtimg.cn/images/daoju/app/lol/medium/2-122015-9.jpg)

以此类推便可取得多个皮肤的URL，发现只有图中红框处不同

尝试着改变红框内的数字，在改变后三位(122015-->122001)时，获得了另一张诺手的皮肤，基本可以确定后三位为皮肤编号，前面的数字为英雄编号，且皮肤编号必须为三位。

看到这里你可能会有所疑问，为什么不直接正则获取所需图片的URL呢？为什么要大费周章的寻找规律？

因为这个翻页式网站比较特殊，在翻页时URL并不会改变，所以无法通过常用方法获取所有皮肤。

那估计又有人要提出使用selenium库来模拟人使用浏览器获取所有图片，但是这会造成爬取图片的速度大大下降，只能作为下策(在这过程中了解到了八爪鱼，发现其原理类似于selenium，是模拟人操控浏览器，速度也是不容直视，虽然它能爬取近98%的网站)，在博主能力有限的情况下选择了寻找规律之旅！

如果你有好的方法解决这个问题，可以在评论处提出，十分感谢！

接下来在知道了规律的情况下，那么如何获取每个不同英雄的编号呢？在其他博主的引导下，发现LoL资料库中有所有英雄的头像，通过F12的慢慢查找，发现了这个js文件！

查看其preview，便可得到所有英雄编号，并测试发现可用！比如Ashe艾希的第一个皮肤对应编号按规律应该是22001，所以URL就是https://game.gtimg.cn/images/daoju/app/lol/medium/2-22001-9.jpg，

测试发现确实成功了！

好了，到此为止网页分析到此结束了，终于可以编写代码了。

代码框架

1、获取英雄编号及皮肤编号(说明：关于皮肤编号并未找到每个英雄皮肤的数量，所以设置成查找所有001到015的图片，当然也可以更多020也行)

2、将编号导入图片URL(https://game.gtimg.cn/images/daoju/app/lol/medium/2-****-9.jpg )中，生成Url_list。

3，根据URL来下载对应图片，并保存到本地。

4、完整代码

import requestsimport reimport os# # # # # # # # # # # # # ## title:获取LOL英雄皮肤图像  ## author:简书 Wayne_Dream  ## date:2018-7-5           ## # # # # # # # # # # # # #defgetHero_data():    try:        headers = {            'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'        }        url = 'http://lol.qq.com/biz/hero/champion.js'        r = requests.get(url, headers=headers)        r.raise_for_status()        r.encoding = r.apparent_encoding        text = r.text        hero_id = re.findall(r'"id":"(.*?)","key"', text)        hero_num = re.findall(r'"key":"(.*?)"', text)        return hero_id, hero_num    except:        return '卧槽，获取英雄编码失败！'defgetUrl(hero_num):    part1 = 'https://game.gtimg.cn/images/daoju/app/lol/medium/2-'    part3 = '-9.jpg'    skin_num = []    Url_list = []    for i in range(1, 21):        i = str(i)        if len(i) == 1:            i = '00'+i        elif len(i) == 2:            i = '0'+i        else:            continue        skin_num.append(i)    for hn in hero_num:        for sn in skin_num:            part2 = hn + sn            url = part1 + part2 + part3            Url_list.append(url)    print('图片URL获取成功')    return Url_listdefPicName(hero_id, path):    pic_name_list = []    for id in hero_id:        for i in range(1, 21):            pic_name = path + id + str(i) + '.jpg'            pic_name_list.append(pic_name)    return pic_name_listdefDownloadPic(pic_name_list, Url_list):    count = 0    n = len(Url_list)    try:        for i in range(n):            headers = {                'user-agent':'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/67.0.3396.99 Safari/537.36'            }            res = requests.get(Url_list[i], headers=headers).content            if len(res) < 100:                count += 1                print('\r当前进度：{:.2f}%'.format(100*(count/n)), end='')            else:                with open(pic_name_list[i], "wb") as f:                    f.write(res)                    count += 1                    print('\r当前进度：{:.2f}%'.format(100*(count/n)), end='')    except:        return '卧槽，获取图片失败！'if __name__ == '__main__':    print('author:简书 Wayne_Dream:')    print('https://www.jianshu.com/u/6dd4484b4741')    input('请输入任意字符开始爬虫:')    if os.path.exists('D:\LOLimg_wayne\\') == False:        path = r'D:\LOLimg_wayne\\'        os.mkdir(path)        hero_id, hero_num = getHero_data()        Url_list = getUrl(hero_num)        pic_name_list = PicName(hero_id, path)        print('正在下载图片，请稍等。。。')        print('在' + path + '下查看...')        DownloadPic(pic_name_list, Url_list)        print('图片下载完毕')    else:        path = r'D:\LOLimg_wayne\\'        hero_id, hero_num = getHero_data()        Url_list = getUrl(hero_num)        pic_name_list = PicName(hero_id, path)        print('正在下载图片，请稍等。。。')        print('在' + path + '下查看...')        DownloadPic(pic_name_list, Url_list)        print('图片下载完毕')

好了，到这里我们已经完成了LOL全皮肤的获取，接下来进行最有意思的一步，千图成像！

千图成像

初级阶段我们先使用一款国外的合成软件。

软件下载地址：

https://fmedda.com/en/download

如果打不开，那就搜索“foto-mosaik-edda”下载即可！

打开后界面是这样的。

先选第一步

再选第二步create photo mosaic

效果图：

局部：

如果想直接尝试一下千图成像的，可到百度网盘下载我爬取到的皮肤图集：https://pan.baidu.com/s/19PywbOV1dBwr7r7bzsMhmw 密码：5arb

- END -

原文链接：

https://www.jianshu.com/p/c963370cd8df

文源网络，仅供学习之用。如有侵权，联系删除。

往期精彩

◆ 50款开源工具你都用过吗？

◆ python+C、C++混合编程的应用

◆ python网络爬虫的基本原理详解

◆ Python自动操控excel，一小时解决你一天的工作

◆ 如何用Python增强Excel，减少处理复杂数据的痛苦？