一直以来,横观国内的PHP现状,很少有专门介绍PHP内部机制的书。呵呵,我会随时记录下研究的心得,有机会的时候,汇总成书。:)

今天这篇,我内心是想打算做为一个导论:

PHP是一个被广泛应用的脚本语言,因为它的成功,所以很多时候,我们应用PHP的时候是更不不需要考虑底层到底是怎么实现的。我相信大多数的 PHP程序 员是不会去考虑这一点的。从我接触PHP开始,到今天也就是3年,这三年里,前俩年我一直都是在”用”PHP,每次写出来一段脚本,我就会想“恩,不用担 心,PHP解释器会知道我想做什么的”,直到去年来到雅虎,接受了一个工作,是做一个PHP的Extension,从这个时候开始,我就好奇于新接触的一 大堆的新鲜事物,zend, TSRM, zval, hashtable, op_array…

于是我到处查阅资料,每次获得一篇好的文章,或者一段好的文字我就会如获珍宝,打印保存起来,细细研读。我发现,国内关于PHP内部的资料真是少的 可怜, 不知道是因为懂得的人多但是不愿意分享,还是懂得的人本来就少,所以,这条路,我走的很辛苦。于是,就会有了这篇文章。

在这篇文章中,我会从整个PHP的执行期入手,大致的介绍下各个阶段,词法分析,语法分析,op code等等,以后的文章我会再详细介绍每个阶(当然,如果你急不可耐的想知道详细,呵呵,那么可以直接联系我)。

从最初我们编写的PHP脚本->到最后脚本被执行->得到执行结果,这个过程,其实可以分为如下几个阶段(鄙视:CSDN不能上图):

首先,Zend Engine(ZE),调用词法分析器(Lex生成的,源文件在 Zend/zend_language_sanner.l), 将我们要执行的PHP源文件,去掉空格 ,注释,分割成一个一个的token。

然后,ZE会将得到的token forward给语法分析器(yacc生成, 源文件在 Zend/zend_language_parser.y),生成一个一个的op code,opcode一般会以op array的形式存在,它是PHP执行的中间语言。

最后,ZE调用zend_executor来执行op array,输出结果。

ZE是一个虚拟机,正是由于它的存在,所以才能使得我们写PHP脚本,完全不需要考虑所在的操作系统类型是什么。ZE是一个CISC(复杂指令处理器), 它支持150条指令(具体指令在 Zend/zend_vm_opcodes.h),包括从最简单的ZEND_ECHO(echo)到复杂的 ZEND_INCLUDE_OR_EVAL(include,require),所有我们编写的PHP都会最终被处理为这150条指令(op code)的序列,从而最终被执行。

那有什么办法可以看到我们的PHP脚本,最终被“翻译”成什么样的呢? 也就是说,op code张的什么样子呢? 呵呵,达到这个,我们需要重新编译PHP,修改它的compile_file和zend_execute函数。不过,在PECL中已经有这样的模块,可以 让我们直接使用了,那就是由 Derick Rethans开发的VLD (Vulcan Logic Dissassembler)模块。你只要下载这个模块,并把他载入PHP中,就可以通过简单的设置,来得到脚本翻译的结果了。具体关于这个模块的使用说 明-雅虎一下,你就知道^_^。

接下来,让我们尝试用VLD来查看一段简单的PHP脚本的中间语言。

原始代码:

<?php $i = “This is a string“; //I am comments echo $i.‘ that has been echoed to screen‘; ?>

采用VLD得到的op codes:

filename:/home/Desktop/vldOutOne.php function name: (null) number of ops: 7 line #  op                 fetch       ext  operands

——————————————————————————————————————————-

2 0 FETCH_W local $0, ‘i‘ 1 ASSIGN $0, ‘This+is+a+string‘ 4 2 FETCH_R local $2, ‘i‘ 3 CONCAT ~3, $2,‘+that+has+been+echoed+to+screen‘ 4 ECHO ~3 6 5 RETURN 1 6 ZEND_HANDLE_EXCEPTION

我们可以看到,源文件中的注释,在op code中,已经没有了,所以不用担心注释太多会影响你的脚本执行时间(实际上,它是会影响ZE的词法处理阶段的用时而已)。

现在我们来一条一条的分析这段op codes,每一条op code 又叫做一条op_line,都由如下7个部分,在zend_compile.h中,我们可以看到如下定义:

struct _zend_op { opcode_handler_t handler; znode result; znode op1; znode op2; ulong extended_value; uint lineno; zend_uchar opcode; };

其中,opcode字段指明了这操作类型,handler指明了处理器,然后有俩个操作数,和一个操作结果。

  1. FETCH_W, 是以写的方式获取一个变量,此处是获取变量名”i”的变量于$0(*zval)。
  2. 将字符串”this+is+a+string”赋值(ASSIGN)给$0
  3. 字符串连接
  4. 显示

可以看出,这个很类似于很多同学大学学习编译原理时候的三元式,不同的是,这些中间代码会被Zend VM(Zend虚拟机)直接执行。

真正负责执行的函数是,zend_execute, 查看zend_execute.h:

  1. ZEND_API extern void (*zend_execute)(zend_op_array *op_array TSRMLS_DC);

可以看出, zend_execute接受zend_op_array*作为参数。

  1.  struct _zend_op_array {
  2.     /* Common elements */
  3.     zend_uchar type;
  4.     char *function_name;
  5.     zend_class_entry *scope;
  6.     zend_uint fn_flags;
  7.     union _zend_function *prototype;
  8.     zend_uint num_args;
  9.     zend_uint required_num_args;
  10.     zend_arg_info *arg_info;
  11.     zend_bool pass_rest_by_reference;
  12.     unsigned char return_reference;
  13.     /* END of common elements */
  14.  
  15.     zend_uint *refcount;
  16.  
  17.     zend_op *opcodes;
  18.     zend_uint last, size;
  19.  
  20.     zend_compiled_variable *vars;
  21.     int last_var, size_var;
  22.  
  23.     zend_uint T;
  24.  
  25.     zend_brk_cont_element *brk_cont_array;
  26.     zend_uint last_brk_cont;
  27.     zend_uint current_brk_cont;
  28.  
  29.     zend_try_catch_element *try_catch_array;
  30.     int last_try_catch;
  31.  
  32.     /* static variables support */
  33.     HashTable *static_variables;
  34.  
  35.     zend_op *start_op;
  36.     int backpatch_count;
  37.  
  38.     zend_bool done_pass_two;
  39.     zend_bool uses_this;
  40.  
  41.     char *filename;
  42.     zend_uint line_start;
  43.     zend_uint line_end;
  44.     char *doc_comment;
  45.     zend_uint doc_comment_len;
  46.  
  47.     void *reserved[ZEND_MAX_RESERVED_RESOURCES];
  48. };

可以看到,zend_op_array的结构和zend_function的结构很像(参看我的其他文章), 对于在全局作用域的代码,就是不包含在任何function内的op_array,它的function_name为NULL。结构中的opcodes保 存了属于这个op_array的op code数组,zend_execute会从start_op开始,逐条解释执行传入的每条op code, 从而实现我们PHP脚本想要的结果。

下一次,我将介绍PHP变量的灵魂 – zval, 你将会看到PHP是如何实现它的变量传递,类型戏法,等等。

深入浅出PHP(Exploring PHP)相关推荐

  1. Python --深入浅出Apriori关联分析算法(二) Apriori关联规则实战

    上一篇我们讲了关联分析的几个概念,支持度,置信度,提升度.以及如何利用Apriori算法高效地根据物品的支持度找出所有物品的频繁项集. Python --深入浅出Apriori关联分析算法(一) 这次 ...

  2. MSDN Webcast“深入浅出ASP.NET AJAX系列”

    课程: ASP.NET AJAX深入浅出系列课程(1):ASP.NET AJAX 概述(3月13日):对于ASP.NET AJAX的大致功能进行概述和演示,通过简单的演示让听众了解到ASP.NET A ...

  3. 5.3Role和Claims授权「深入浅出ASP.NET Core系列」

    5.3Role和Claims授权「深入浅出ASP.NET Core系列」 原文:5.3Role和Claims授权「深入浅出ASP.NET Core系列」 希望给你3-5分钟的碎片化学习,可能是坐地铁. ...

  4. 深入浅出开源性能测试工具 Locust (使用篇 1)

    在<[LocustPlus序]漫谈服务端性能测试>中,我对服务端性能测试的基础概念和性能测试工具的基本原理进行了介绍,并且重点推荐了Locust这一款开源性能测试工具.然而,当前在网络上针 ...

  5. 《深入浅出iPhone/iPad开发(第2版)》——在Xcode中建立你的界面

    本节书摘来自异步社区<深入浅出iPhone/iPad开发(第2版)>一书中的在Xcode中建立你的界面,作者 [美]Dan Pilone , Tracey Pilone,更多章节内容可以访 ...

  6. 【组队学习】【35期】深入浅出Pytorch

    深入浅出Pytorch 航路开辟者:李嘉骐.牛志康.刘洋.陈安东 领航员:朱松青 航海士:管柯琴.宋泽山.林旭升 基本信息 开源内容:https://github.com/datawhalechina ...

  7. 深入浅出Pytorch:02 PyTorch基础知识

    深入浅出Pytorch 02 PyTorch基础知识 内容属性:深度学习(实践)专题 航路开辟者:李嘉骐.牛志康.刘洋.陈安东 领航员:叶志雄 航海士:李嘉骐.牛志康.刘洋.陈安东 开源内容:http ...

  8. 深入浅出Pytorch:01 课程大纲与PyTorch简介

    深入浅出Pytorch 01 课程大纲与PyTorch简介 内容属性:深度学习(实践)专题 航路开辟者:李嘉骐.牛志康.刘洋.陈安东 领航员:叶志雄 航海士:李嘉骐.牛志康.刘洋.陈安东 开源内容:h ...

  9. 今晚8点直播 | 深入浅出理解A3C强化学习

    强化学习是一种比较传统的人工智能手段,在近年来随着深度学习的发展,强化学习和深度学习逐渐结合在了一起.这种结合使得很多原来无法想象的工作有了可能,最令我们瞩目的莫过于AlphaGo战胜李世石,以及Op ...

最新文章

  1. 除了缺点创意,GPT-3写出了及格大学毕业论文,只需20分钟
  2. 搞懂OpenLDAP
  3. 再谈移动端Web屏幕适配
  4. JDK8对并发的新支持
  5. Android中的JSONObject和JSONArray的使用
  6. Dubbo使用Zooker注册服务
  7. 本地启动 Hybris 服务器调试模式后,监听在 8000 端口
  8. 深度学习模型提升模型效果的常见方法
  9. 汇编语言(王爽老师)
  10. Laravel 使用百度地图实现地理位置转经纬度
  11. java开发聚合支付系统源码可支撑百万级并发
  12. 中国中老年服装市场投资前景分析及供需格局研究预测报告
  13. 【互补松弛定理】12.7.16省队集训
  14. 用Xlsx xlsx-style 导出excel表格,附带合并单元格,文字居中,文字颜色字体大小等样式 (复制即可实现)
  15. C中Ascii码对照
  16. 聚丙烯酸(PAA)修饰纳米Fe3O4四氧化三铁粒子|CNTs/Fe3O4/TiO2纳米复合材料(齐岳)
  17. PPT制作三大技巧:图标 、图片背景透明和自动函数
  18. 什么是通信原理?原来这么简单
  19. 手机二维码扫码登录(Java源码及思路)
  20. 中英互译词典(二叉搜索树)

热门文章

  1. android 定义集合长度,Android Dex文件结构解析
  2. oracle11g开启1158,1、Oracle11g中浏览器访问不了http://localhost:1158/em的问题
  3. ftl模板导出excel_freemarker导出复杂Excel
  4. 引入外部样式失败的可能原因
  5. Python基础学习笔记--字符串、列表
  6. 记录Mask RCNN调整预测网格 font大小
  7. autoware定位:gnss定位与lidar定位(四)
  8. VS+MFC+Opencv显示视频和图像。
  9. POJ - 3694 Network tanjar割边+lca
  10. 初中计算机指导教师意见,初中信息技术教学计划(推荐3篇)