给你个文章参考一下https://www.cnblogs.com/helloxia/p/6374099.html

先来例程:

正则表达式法:(不推荐)

[python] view plain copy# -- coding: utf-8 -- """ Created on Thu Jun 1 16:22:10 2017

@author: qiu """ import urllib import re

下载网页

def get_content(url):

'''''

@url:需要下载的网址

下载网址

'''

html = urllib.request.urlopen(url)

content = html.read().decode('utf-8')#转码

html.close()#记得要将打开的网页关闭,否则会出现意想不到的问题

print (type(content))

return content

print (get_content(url))

def get_image(info):

'''''

@info:网页信息

查看下载内容的编码格式

width="560" height="315" changedsize="true">

利用正则表达式学习样式规则

下载图片

'''

#正则表达式写法是重点

regx = r'pic_type="0" class="BDE_Image" src="(.+?\.jpg)"'

pat = re.compile(regx)

image_code = re.findall(pat,info)

print(type(image_code))

#一个一个保存

i=1

for image_url in image_code:

print(image_url)

urllib.request.urlretrieve(image_url,"C:\\Users\\qiu\\Desktop\\python源\\桌面图片\\%s.jpg"%(i))

i+=1

url = "https://tieba.baidu.com/p/2218566379" info = get_content(url) get_image(info)

BeautifulSoup法:[python] view plain copy# -- coding: utf-8 -- """ Created on Thu Jun 1 19:38:11 2017

@author: qiu """ import urllib from bs4 import BeautifulSoup

beautifulsoup方法,第三方库的方法,爬找网页

下载网页

def get_content(url):

'''''

@url:需要下载的网址

下载网址

'''

html = urllib.request.urlopen(url)

content = html.read().decode('utf-8')#转码

html.close()#记得要将打开的网页关闭,否则会出现意想不到的问题

print (type(content))

return content

def get_image(info):

'''''

利用Soup第三方库实现抓取

'''

soup = BeautifulSoup(info,"lxml")#设置解析器为“lxml”

all_image = soup.find_all('img',class_ = "BDE_Image")

x=1

for image in all_image:

print(all_image)

urllib.request.urlretrieve(image['src'],"C:\\Users\\qiu\\Desktop\\python源\\桌面图片\\%s.jpg"%(x))

x+=1

url = "https://tieba.baidu.com/p/2218566379" info = get_content(url) print (info) get_image(info)

总结:1、首先熟悉网页编程,至少能知道图片对应程序中的位置,将所需要的图片的程序内容单独拿出来,并比较和其他噪声图片的区别,包括class,pic_type等,能够保证所需下载内容程序书写上的唯一性。

2、利用"re"正则表达式或者all_image = soup.find_all('img',class_ = "") 方法实现唯一化表达

3、一些技巧总结:print (type( ))利用查看返回值类型,列表?字典?对象?等,如果是class,一定有方法,利用print (dir( )) 查看对象的方法。或者直接看官网文档。

问题:

1、一些动态网页需要另外技巧了,例如百度图片(康复机械臂)上的图片如何下载,是另外一个需要解决的问题。

更好的方法:scrapy(爬虫框架)

不过安装有点麻烦,当然我还是pip法:库

python机械臂仿真_机械臂 python相关推荐

  1. python 机械臂控制_机械臂正运动学-DH参数-Python快速实现

    机械臂正运动学-DH参数-Python快速实现 前言: 最近在玩一个非常弱智的机械臂,好多功能都没有,连个配套的仿真环境都没, 虚拟边界和碰撞检测的功能都非常难用. 没办法,我只能自己实现一个简陋的虚 ...

  2. python 机器人运动仿真_使用RoboDK对工业机器人与传送带进行动态仿真

    在工业机器人应用中,使用机器人代替人力取放物件是最常见的任务类型之一,这类型的自动化任务经常需要使用到传送带.而给机器人编程时,传送带的动态变量给编程与仿真带来复杂性,因此机器人传送带的仿真往往很有挑 ...

  3. python变量定义大全_详解python变量与数据类型

    这篇文章我们学习 Python 变量与数据类型 变量 变量来源于数学,是计算机语言中能储存计算结果或能表示值抽象概念,变量可以通过变量名访问.在 Python 中 变量命名规定,必须是大小写英文,数字 ...

  4. python自学到大牛_开始学习Python+一位大牛整理的Python资源

    Python基本安装: * http://www.python.org/ 官方标准Python开发包和支持环境,同时也是Python的官方网站: * http://www.activestate.co ...

  5. python积木式编程_实例讲解python函数式编程

    函数式编程是使用一系列函数去解决问题,按照一般编程思维,面对问题时我们的思考方式是"怎么干",而函数函数式编程的思考方式是我要"干什么". 至于函数式编程的特点 ...

  6. python怎么求指数_求指数 python

    softmax用于多分类过程中最后一层,将多个神经元的输出,映射到(0, 1)区间内,可以看成概率来理解,从而来进行多分类! softmax函数如下: 更形象的如下图表示: softmax 直白来说就 ...

  7. python实现数据可视化_使用Matplotib python实现数据可视化

    python实现数据可视化 I Feel: 我觉得: In today's digital world data has become as important as air. Machines &a ...

  8. python画动物代码_如何用python画简单的动物_后端开发

    python3.x完全兼容python2.x吗?_后端开发 可以说是完全不兼容.相对于Python的早期版本,Python3是一个较大的升级,为了不带入过多的累赘,Python 3.0在设计的时候没有 ...

  9. python绝技 pdf 中文_虫术Python绝技 PDF 完整版

    给大家带来的一篇关于Python爬虫相关的电子书资源,介绍了关于Python.Python爬虫方面的内容,本书是由电子工业出版社出版,格式为PDF,资源大小230.8 MB,梁睿坤编写,目前豆瓣.亚马 ...

  10. python适用于哪些芯片_五年Python三大秘诀!日常生活不可或缺的秘密武器

    EDA365欢迎您登录! 您需要 登录 才可以下载或查看,没有帐号?注册 x 本帖最后由 Ber_thaw99 于 2020-12-28 14:07 编辑' P& t5 n# [5 J) Y& ...

最新文章

  1. 中科院自动化所余山:对大脑的未知,并不阻碍借鉴大脑,成就智能
  2. [Vim 使用]vim 自动括号补全配置
  3. memcached基本操作和语法
  4. (一)git简介及安装
  5. 新品发布、降价普惠、拥抱开源、出海全球化 | 杭州云栖企业数字化转型峰会上的那些关键词
  6. 计算机专业教师演讲稿,计算机部教师会议发言稿范文
  7. html巡检脚本,WEB服务器巡检脚本
  8. Windows Phone SDK 7.1 RTM 发布
  9. Java | Java模拟实现扑克牌洗牌、发牌过程
  10. python基于requests库实现12306火车票余票信息以及票价信息查询
  11. 键盘一直自动按/问题的解决。。。
  12. 基于 Ng-zorro-antd 的企业后台模板 ng-alain
  13. 最陡梯度下降算法和LMS算法原理介绍及MATLAB实现
  14. 台式win7f1到f12热键取消_Windows 7旗舰版系统中键盘F1到F12快捷键的作用详解
  15. Django_Django组成_基本响应与部署
  16. ipad2越狱完成!
  17. 51nod2657二进制数字
  18. 接口的多实现和多继承
  19. JSP 酒店管理系统 软件工程设计 网络编程 myeclipse 编辑 mysql数据库
  20. Android - 游戏中的声音

热门文章

  1. SAP中会计凭证红蓝冲相关分析测试笔记
  2. 天猫精灵通过AliOS网桥控制Zigbee设备
  3. 【视频检测】Flow-Guided Feature Aggregation for Video Object Detection
  4. JavaSwing也惊艳之一:水晶之恋
  5. 苹果开放降级_苹果官方为什么不开放 iOS 降级验证通道?
  6. LowB三人组--插入排序原理和java实现
  7. linux cp omitting 复制,linux 系统 cp: omitting directory 问题解决
  8. CReFF缓解长尾数据联邦学习(IJCAI 2022)
  9. Windows修改本地域名解析文件hosts
  10. 统计学cv值是什么意思_什么是CV值