1. 过程概述

Python先把代码(.py文件)编译成字节码,交给字节码虚拟机,然后虚拟机一条一条执行字节码指令,从而完成程序的执行。

2. 字节码

字节码在Python虚拟机程序里对应的是PyCodeObject对象。

.pyc文件是字节码在磁盘上的表现形式。

3. pyc文件

PyCodeObject对象的创建时机是模块加载的时候,即import。

Python test.py会对test.py进行编译成字节码并解释执行,但是不会生成test.pyc。

如果test.py加载了其他模块,如import util,Python会对util.py进行编译成字节码,生成util.pyc,然后对字节码解释执行。

如果想生成test.pyc,我们可以使用Python内置模块py_compile来编译。

加载模块时,如果同时存在.py和.pyc,Python会尝试使用.pyc,如果.pyc的编译时间早于.py的修改时间,则重新编译.py并更新.pyc。

4. PyCodeObject

Python代码的编译结果就是PyCodeObject对象。

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

typedefstruct{

PyObject_HEAD

intco_argcount;/* 位置参数个数 */

intco_nlocals;/* 局部变量个数 */

intco_stacksize;/* 栈大小 */

intco_flags;

PyObject*co_code;/* 字节码指令序列 */

PyObject*co_consts;/* 所有常量集合 */

PyObject*co_names;/* 所有符号名称集合 */

PyObject*co_varnames;/* 局部变量名称集合 */

PyObject*co_freevars;/* 闭包用的的变量名集合 */

PyObject*co_cellvars;/* 内部嵌套函数引用的变量名集合 */

/* The rest doesn’t count for hash/cmp */

PyObject*co_filename;/* 代码所在文件名 */

PyObject*co_name;/* 模块名|函数名|类名 */

intco_firstlineno;/* 代码块在文件中的起始行号 */

PyObject*co_lnotab;/* 字节码指令和行号的对应关系 */

void*co_zombieframe;/* for optimization only (see frameobject.c) */

}PyCodeObject;

5. pyc文件格式

加载模块时,模块对应的PyCodeObject对象被写入.pyc文件,格式如下:

6. 分析字节码

6.1 解析PyCodeObject

Python提供了内置函数compile可以编译Python代码和查看PyCodeObject对象,如下:

Python代码[test.py]

1

2

3

4

5

6

7

s=”hello”

def func():

prints

func()

在Python交互式shell里编译代码得到PyCodeObject对象:

dir(co)已经列出co的各个域,想查看某个域直接在终端输出即可:

test.py的PyCodeObject

1

2

3

4

5

6

7

co.co_argcount0

co.co_nlocals0

co.co_names(‘s’,’func’)

co.co_varnames(‘s’,’func’)

co.co_consts(‘hello’,,None)

co.co_code’d\x00\x00Z\x00\x00d\x01\x00\x84\x00\x00Z\x01\x00e\x01\x00\x83\x00\x00\x01d\x02\x00S’

Python解释器会为函数也生成的字节码PyCodeObject对象,见上面的co_consts[1]

func的PyCodeObject

1

2

3

4

5

6

7

func.co_argcount0

func.co_nlocals0

func.co_names(‘s’,)

func.co_varnames()

func.co_consts(None,)

func.co_code‘t\x00\x00GHd\x00\x00S’

co_code是指令序列,是一串二进制流,它的格式和解析方法见6.2。

6.2 解析指令序列

指令序列co_code的格式

opcodeopargopcodeopcodeoparg…

1 byte

2 bytes

1 byte

1 byte

2 bytes

Python内置的dis模块可以解析co_code,如下图:

test.py的指令序列

func函数的指令序列

第一列表示以下几个指令在py文件中的行号;

第二列是该指令在指令序列co_code里的偏移量;

第三列是指令opcode的名称,分为有操作数和无操作数两种,opcode在指令序列中是一个字节的整数;

第四列是操作数oparg,在指令序列中占两个字节,基本都是co_consts或者co_names的下标;

第五列带括号的是操作数说明。

7. 执行字节码

Python虚拟机的原理就是模拟可执行程序再X86机器上的运行,X86的运行时栈帧如下图:

假如test.py用C语言来实现,会是下面这个样子:

1

2

3

4

5

6

7

8

9

10

11

constchar*s=“hello”;

voidfunc(){

printf(“%s\n”,s);

}

intmain(){

func();

return0;

}

Python虚拟机的原理就是模拟上述行为。当发生函数调用时,创建新的栈帧,对应Python的实现就是PyFrameObject对象。

7.1 PyFrameObject

1

2

3

4

5

6

7

8

9

10

11

12

typedefstruct_frame{

PyObject_VAR_HEAD

struct_frame*f_back;/* 调用者的帧 */

PyCodeObject*f_code;/* 帧对应的字节码对象 */

PyObject*f_builtins;/* 内置名字空间 */

PyObject*f_globals;/* 全局名字空间 */

PyObject*f_locals;/* 本地名字空间 */

PyObject**f_valuestack;/* 运行时栈底 */

PyObject**f_stacktop;/* 运行时栈顶 */

…….

}

那么对应Python的运行时栈就是这样子:

7.2 执行指令

执行test.py的字节码时,会先创建一个栈帧,以下用f表示当前栈帧,执行过程注释如下:

test.py的符号名集合和常量集合

1

2

3

co.co_names(‘s’,’func’)

co.co_consts(‘hello’,,None)

test.py的指令序列

上面的CALL_FUNCTION指令执行时,会创建新的栈帧,并执行func的字节码指令,以下用f表示当前栈帧,func的字节码执行过程如下:

func函数的符号名集合和常量集合

1

2

3

func.co_names(‘s’,)

func.co_consts(None,)

func函数的指令序列

7.3 查看栈帧

如果你想查看当前栈帧,Python提供了sys._getframe()方法可以获取当前栈帧,你只需要在代码里加入代码如下:

1

2

3

4

5

6

7

8

9

def func():

import sys

frame=sys._getframe()

print frame.f_locals

print frame.f_globals

print frame.f_back.f_locals

#你可以打印frame的各个域

prints

python程序的原理_Python程序的执行原理(转)相关推荐

  1. 浏览器原理-v8引擎-js执行原理

    浏览器原理-v8引擎-js执行原理 js简介 js应用: js的应用很广泛 可以应用于web,移动端,小程序,桌面应用,后端开发等 web开发包括(原生js,react,vue,angular等) 移 ...

  2. 简述python执行原理_Python程序的执行原理(1)(2)

    Python程序的执行原理(1)(2) 1. 过程概述 Python先把代码(.py文件)编译成字节码,交给字节码虚拟机,然后虚拟机一条一条执行字节码指令,从而完成程序的执行. 2. 字节码 字节码在 ...

  3. python语言不用编译_python程序不需要编译吗

    python编译过程和执行原理 (1)python执行原理 这里的解释执行是相对于编译执行而言的.我们都知道,使用C/C++之类的编译性语言编写的程序,是需要从源文件转换成计算机使用的 机器语言,经过 ...

  4. python的类程序的结构_Python程序员学习路径之数据结构篇

    原标题:Python程序员学习路径之数据结构篇 点击标题下「异步图书」可快速关注 在计算机科学中,数据结构是一门进阶性课程,概念抽象,难度较大.Python语言的语法简单,交互性强.用Python来讲 ...

  5. plc与python哪个前景好_Python程序猿哪种就业方向前景最好?

    python简介: Python是一个高层次的结合了解释性.编译性.互动性和面向对象的脚本语言. Python 的设计具有很强的可读性,相比其他语言经常使用英文关键字,其他语言的一些标点符号,它具有比 ...

  6. python的内存泄露_Python 程序的内存泄露,教你一招来解决?

    如果大家在 Linux 或者 macOS 下面运行一段可能导致内存泄露的程序,那么你可能会看到下面这样的情况: 而如果你用的系统是 Windows,那么可能电脑直接就卡死了. 但是,调试这种 OOM( ...

  7. python程序员培训_Python程序员学习路线图

    Python程序员学习路线图,由黄哥python培训授课老师黄哥所写. 参加黄哥python远程视频培训, 帮你完成从不会写代码到会写代码解决问题的过渡. 咨询qq:1465376564 Python ...

  8. python和java段子_python程序员幽默段子_谁说码农不懂幽默?只有程序员才看得懂的段子...

    程序员干的工作很枯燥,他们需要段子来消遣,其实他们也很幽默,很风趣的.程序员作为高智商.高收入.高压力群体,经常会有各种自嘲,而且还天生携带段子手基因.不信看看下面这些段子,一般人哪能懂!谁说程序员无 ...

  9. python运行原理_Python线程池及其原理和使用(超级详细)

    系统启动一个新线程的成本是比较高的,因为它涉及与操作系统的交互.在这种情形下,使用线程池可以很好地提升性能,尤其是当程序中需要创建大量生存期很短暂的线程时,更应该考虑使用线程池. 线程池在系统启动时即 ...

  10. JavaScript高级 浏览器的渲染原理与JavaScript代码执行原理

    浏览器的渲染原理 1. 网页的解析过程 2. 浏览器内核 1. V8引擎 3. 浏览器渲染过程 1. HTML解析 2. 生成CSS规则 3. 构建Render Tree 4. 布局(layout) ...

最新文章

  1. LSTM训练手写数字识别
  2. 满足人工智能日益增长的要求
  3. [PHP] - 性能加速 - 开启opcache
  4. ajax请求后台报没有body_前端常见面试 - 请求篇
  5. SAP 开发陷阱一箩筐(02)——无法创建客户增强的包含程序
  6. Android 系统(73)---Android判断你的应用在前台还是在后台
  7. 车油表灯亮了,还能开多久?
  8. 使用Enide Studio 2014 IDE进行Express JS路由
  9. android的adb命令总结
  10. 2012春季ACM内部测试赛3
  11. 设置Session超时的三种方法
  12. 形容java工作者的句子_关于形容工作态度的句子
  13. 解决:香橙派orangepi3lts网口用不了 网口灯不亮 没反应
  14. pc端js根据图片url进行下载单张图片以及批量下载到本地
  15. 图像增强算法(持续更新中)
  16. excel 6位数字 转日期列
  17. c#使用Aspose实现Word域套打
  18. 当代年轻人熬夜晚睡的原因找到了!
  19. 【mysql】gh-ost使用说明
  20. 易语言 PDF 制作支持库

热门文章

  1. PSS:更简单有效的End-to-End检测
  2. 全面解析YOLO V4网络结构
  3. 卷积神经网络必读的100篇经典论文,包含检测/识别/分类/分割多个领域
  4. 华为提出DyNet:动态卷积
  5. 客户花钱雇黑客,竟是为Zoom找bug:风口浪尖的视频会议No.1,安全问题如此魔幻...
  6. 干货 | 深度学习检测小目标常用方法
  7. PyCharm 2019.3发布,增加了哪些新功能呢?
  8. PyTorch常用代码段整理合集,建议收藏!
  9. 爬取一万条b站评论看《工作细胞》
  10. 打印从1到最大的n位数