Python常用内建模块——学习笔记
import datetime
,则必须引用全名datetime.datetime
。
- 获取当前日期和时间:
datetime.now()
加减当前时间:now + timedelta(days=2, hours=12)
>>> from datetime import datetime
>>> dt = datetime(2015, 4, 19, 12, 20) # 用指定日期时间创建datetime
>>> dt.timestamp() # 把timestamp转换为datetime1429417200.0
# Python的timestamp是一个浮点数。如果有小数位,小数位表示毫秒数。 某些编程语言(如Java和JavaScript)的timestamp使用整数表示毫秒数,这种情况下只需要把timestamp除以1000就得到Python的浮点表示方法。
|
datetime
,最佳方法是将其转换为timestamp再存储,因为timestamp的值与时区完全无关。
- namedtuple: 创建一个自定义的
tuple
对象
>>> from collections import namedtuple
1
|
- deque: 为了高效实现插入和删除操作的双向列表,适合用于队列和栈
>>> from collections import deque
deque(['y', 'a', 'b', 'c', 'x'])
>>> q.pop()
>>> q
deque(['y', 'a', 'b', 'c'])
>>> q.
popleft ()
>>> q
deque([ 'a', 'b', 'c'])
|
- defaultdict: 使用
dict
时,如果引用的Key不存在,就会抛出KeyError
。如果希望key不存在时,返回一个默认值,就可以用defaultdict
>>> from collections import defaultdict
>>> dd['key1'] = 'abc'
>>> dd['key1'] # key1存在'abc'
>>> dd['key2'] # key2不存在,返回默认值'N/A'
|
- OrderedDict: 保持Key的顺序,可以用
OrderedDict(按插入序)。
OrderedDict
可以实现一个FIFO(先进先出)的dict,当容量超出限制时,先删除最早添加的Key
>>> from collections import OrderedDict
OrderedDict([('a', 1), ('b', 2), ('c', 3)])
|
- Counter:计数器,也是dict的子类,如统计字母出现的次数,类似于Wordcount
>>> from collections import Counter
>>> c=Counter
|
bytes
和其他二进制数据类型的转换。
struct
分析出其文件头结构。
'BM'
表示Windows位图,'BA'
表示OS/2位图;
>>> struct.unpack('<ccIIIIIIHH', s)
(b'B', b'M', 691256, 0, 54, 40, 640, 360, 1, 24)
|
f(data)
很容易,但通过digest
反推data
却非常困难。而且,对原始数据做一个bit的修改,都会导致计算出的摘要完全不同。也可以看成加密算法。
import hashlib
print(md5.hexdigest())
|
count()
会创建一个无限的迭代器,count(1)从1开始的迭代器
for n in itertools.count(1):
print(n) if n==10: break |
cycle()
会把传入的一个序列无限重复下去
for c in itertools.cycle('abc'):
print(c) i+=1 if i==10: break |
repeat()
负责把一个元素无限重复下去,不过如果提供第二个参数就可以限定重复次数
for n in itertools.repeat('a',3):
print(n) |
chain()
可以把一组迭代对象串联起来,形成一个更大的迭代器:
for c in itertools.chain('ABC', 'XYZ'):
print(c)
# 迭代效果:'A' 'B' 'C' 'X' 'Y' 'Z'
|
groupby()
把迭代器中相邻的重复元素挑出来放在一起:
>>> for key, group in itertools.groupby('AAABBBCCAAA'):
|
itertools
模块提供的全部是处理迭代功能的函数,它们的返回值不是list,而是Iterator
,只有用for
循环迭代的时候才真正计算。
(DOM和SAX)
DOM会把整个XML读入内存,解析为树,因此占用内存大,解析慢,优点是可以任意遍历树的节点。SAX是流模式,边读边解析,占用内存小,解析快,缺点是我们需要自己处理事件。正常情况下,优先考虑SAX,因为DOM实在太占内存。
|
- Python利用SAX解析XML(关心的事件:
start_element
,end_element
和char_data
):
from xml.parsers.expat import ParserCreate
|
- 生成XML:拼接字符串、JSON
L = [] #list
L.append(r'<?xml version="1.0"?>')
return ''.join(L) #str
|
- 用爬虫吧目标网站页面抓下来
- 解析该HTML页面
from html.parser import HTMLParser
def handle_entityref(self, name): #特殊字符
print('&%s;' % name)
</body></html>''')
|
- Get(下载)
#模拟iPhone 6去请求豆瓣首页
from urllib import request
req = request.Request('http://www.douban.com/')
req.add_header('User-Agent', 'Mozilla/6.0 (iPhone; CPU iPhone OS 8_0 like Mac OS X) AppleWebKit/536.26 (KHTML, like Gecko) Version/8.0 Mobile/10A5376e Safari/8536.25') #不添加该header时,表示对以上页面进行抓取(查看该页面打开时返回的值),添加了该header,表示 模拟iPhone 6去请求豆瓣首页
with request.urlopen(req) as f: #用request方式打开URL,将返回值标记为f
|
- Post(上传): 如果要以POST发送一个请求,只需要把参数
data
以bytes形式传入。
#模拟微博登录
from urllib import request, parse
print('%s: %s' % (k, v))
print('Data:', f.read().decode('utf-8')) #en加de解
|
- Handler: 通过一个Proxy去访问网站,我们需要利用
ProxyHandler
来处理
User-Agent
头就是用来标识浏览器的。
Python常用内建模块——学习笔记相关推荐
- Python常用内建模块(内含实例)
文章目录 datetime 获取当前日期和时间 获取指定日期和时间 datetime转化为timestamp timestamp转化为datetime str转化为datetime datetime转 ...
- Python学习笔记:常用内建模块7XML
前言 最近在学习深度学习,已经跑出了几个模型,但Pyhton的基础不够扎实,因此,开始补习Python了,大家都推荐廖雪峰的课程,因此,开始了学习,但光学有没有用,还要和大家讨论一下,因此,写下这些帖 ...
- Python学习笔记:常用内建模块6 (urllib)
前言 最近在学习深度学习,已经跑出了几个模型,但Pyhton的基础不够扎实,因此,开始补习Python了,大家都推荐廖雪峰的课程,因此,开始了学习,但光学有没有用,还要和大家讨论一下,因此,写下这些帖 ...
- Python学习笔记:常用内建模块5
前言 最近在学习深度学习,已经跑出了几个模型,但Pyhton的基础不够扎实,因此,开始补习Python了,大家都推荐廖雪峰的课程,因此,开始了学习,但光学有没有用,还要和大家讨论一下,因此,写下这些帖 ...
- Python学习笔记:常用内建模块4:hmac
前言 最近在学习深度学习,已经跑出了几个模型,但Pyhton的基础不够扎实,因此,开始补习Python了,大家都推荐廖雪峰的课程,因此,开始了学习,但光学有没有用,还要和大家讨论一下,因此,写下这些帖 ...
- Python学习笔记:常用内建模块3:struct
前言 最近在学习深度学习,已经跑出了几个模型,但Pyhton的基础不够扎实,因此,开始补习Python了,大家都推荐廖雪峰的课程,因此,开始了学习,但光学有没有用,还要和大家讨论一下,因此,写下这些帖 ...
- Python学习笔记:常用内建模块2:collections
前言 最近在学习深度学习,已经跑出了几个模型,但Pyhton的基础不够扎实,因此,开始补习Python了,大家都推荐廖雪峰的课程,因此,开始了学习,但光学有没有用,还要和大家讨论一下,因此,写下这些帖 ...
- Python学习笔记:常用内建模块1
前言 最近在学习深度学习,已经跑出了几个模型,但Pyhton的基础不够扎实,因此,开始补习Python了,大家都推荐廖雪峰的课程,因此,开始了学习,但光学有没有用,还要和大家讨论一下,因此,写下这些帖 ...
- python的标准类型内建模块有_python的常用内建模块与常用第三方模块
本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理 一.常用内置模块 1.datetime Python 提供了一个 time 和 calendar 模 ...
最新文章
- ping 一会通一会不通
- centos下 keepalived1.2.8配置文件
- python定位文件位置_python使用相对定位,绝对定位,选取同级别文件下的指定文件(csv,excel)...
- 白嫖我常用的 11 个超火的前端必备在线工具,终于有时间上班摸鱼了
- phpStorm重构快捷键(mac系统、持续更新)
- 三星S10背板设计已确定:画面甚是感人
- thinkphp-page
- iOS核心动画Core Animation(一)
- SQLSERVER误删除了Windows登录用户验证方式使用Windows身份验证的解决方法
- FFmpeg总结(五)AV系列结构体之AVCodec、AVCodecParameters、AVCodecParser、AVCodecParserContext、AVCodecDescriptor
- Anaconda 在线安装第三方库jieba
- MacOS Ventura 13.0 Beta6 (22A5331f) 带 OC 0.8.4 三分区原版黑苹果镜像
- rockchip的pwm驱动框架
- VMware ESXi 6.5之前 缺少驱动处理方式
- 英语语法 - the + 形容词 的意义
- CFree 5使用方法
- Mars3d开发:飞行漫游
- Pyinstaller打包eel和pygame需要注意的坑
- 微信公众号开发中分享功能 分享微信朋友圈/微信好友
- Chrome中devtools安装
热门文章
- pandas 数据类型之 Series
- 牛顿法matlab多元方程,fslove - Matlab求解多元多次方程组
- 我开发了《联机桌游合集: UNO+斗地主+五子棋》,让你享受纯粹的游戏
- gtest调试_gtest命令行测试案例
- linux 僵死日志,关于僵死进程
- 2023年京东618红包领取活动时间几月几号什么时候开始在哪里找到京东618红包口令如何领取京东2023年618红包?
- 今日头条“科技”,“娱乐”类文章的抓取
- 企业如何运用社会化媒体进行营销?
- Google开始研究Web中的结构化数据
- 漫画 | 什么智商的人才能当程序员?