导读:一切都始于1989年的那个圣诞节,Python的诞生并不算恰逢其时,它崛起充满了机遇巧合,也有其必然性。三十年间,Python技术不断更迭,生态逐渐完善,加上互联网、大数据、以及人工智能这一波波浪潮的推波助澜,Python渐渐从小众最终站上了现在的高度。

从历史发展的角度出发,我们才能看清Python崛起的偶然性和必然性。本文将结合技术和产业的发展,全面透析Python的演进之路,帮助读者理解是什么造就了如今的Python。

作者:宋天龙

来源:AI科技大本营(ID:rgznai100)

01 Python 1.0时代:起源与诞生

Guido van Rossum(下面简称Guido)是Python语言之父,他于1982年从阿姆斯特丹大学获得了数学和计算机硕士双学位,期间他接触了很多的语言,包括Pascal,C,Fortran等。

在那个计算机资源贫乏的年代,像计算机一样思考并编程是每个程序员必须面对的事情,这让他非常苦恼;同时他又非常欣赏shell,shell简单易编程的特性让程序员更加专注于设计和逻辑本身,但shell本质上是一个功能的调用,它没有自己的数据类型,更无法全面调用计算机功能,因此shell也不算是一门“语言”。

因此,他希望找到一种语言既可以像使用shell一样简单,又可以和C语言的功能相媲美。不过这种语言在那个年代并不存在。

▲Guido van Rossum,图片作者:Doc Searls,来源:Wikipedia

1989年的圣诞节,Guido开始编写Python语言的编译器。Python这个名字来源于他喜欢的电视剧Monty Python’s Flying Circus,而不是表面意义上的“蟒蛇”。他希望这个新的语言,能符合他的理想:介于C和shell之间,功能全面、易学、易用又可拓展。

1991年,第一个Python编译器诞生,这标志着Python的第一个版本正式诞生。它基于C语言,并具备了基础的类、函数、异常处理等功能特性,同时具备可扩展性。

Python语法很多来自C,但又受到ABC语言的强烈影响。例如来源于ABC语言强制缩进的规定本身可以让Python容易读,但如果缩进出错却会影响编译和执行。Python本身不以性能为重,但当确实需要考虑性能时,Python程序员却可以深入底层来编写C程序,并编译为.so文件引入到Python中使用。

Python语言的魅力在于让程序员可以花更多的时间用于思考程序的逻辑,而不是具体的实现细节,这一特性也得到Guido同事的欢迎。他们在反馈使用意见的同时也参与到Python的改进中来,因此最初Guido和一些同事构成了Python的核心团队,当然,核心决策者还是Guido本人。随后,Python的使用拓展到研究所之外,并吸引了越来越多的程序员。

但是,最初Python的使用非常小众,因为在那个计算机资源非常有限的年代,大家都倾向于最大化榨取计算机资源并提升运算效率,而Python显然不是为此而生。

02 Python 2.0时代:崛起

最初发布时,Python在设计层面存在一些缺陷,例如以满足跨语言、跨平台进行文本转换、处理的要求的Unicode字符编码标准在1994年才正式公布,所以一直以来Python 2及之前的版本对Unicode的支持并不完全。相信大家在使用Python 2版本处理中文时都遇到过各种问题。

2000年发布的Python 2.0标志着Python的框架基本确定。重要框架方向包括:

  • 简单明确。在设计Python语言时,开发者倾向于选择没有或者很少有歧义的语法。由于这种设计观念的差异,Python源代码通常被认为比Perl具备更好的可读性,并且能够支撑大规模的软件开发。

  • 面向对象。任何Python的元素都可以视为对象,包括数据类型、类、函数、实例化元素等,完全支持继承、重载关系,这有益于增强代码的复用性。

  • 动态类型。任何对象的数据类型都无需提前定义,拿来即用。即使在之前已经预先定义,后期也可随时修改。

  • 胶水特性。Python本身被设计为可扩充的,并非所有的特性和功能都集成到语言核心。Python提供了丰富的API和工具,以便程序员能够轻松地使用C、C++、Cython来编写扩充模块。例如在Google对于Google Engine使用C++编写性能要求极高的部分,然后用Python或Java/Go调用相应的模块。

  • 可嵌入。你可以把Python的功能嵌入到C/C++程序中,从而实现Python功能在其他语言中的功能实现。

  • 生态系统。Python有强大的标准库,同时支持第三方库和包的扩展应用,甚至可以自定义任何库和包。Pypi(https://pypi.org/)是其第三方库的仓库,在这里你几乎可以找到任何领域内的功能库。

  • 解释器机制。Python支持多种解释器,例如CPython(官方版本,基于C语言开发,也是使用最广的Python解释器)、IPython(基于CPython之上的一个交互式解释器)、PyPy(一个追求执行速度的Python解释器,采用JIT技术对Python代码进行动态编译)、Jython(运行在Java平台上的Python解释器,可以直接把Python代码编译成Java字节码执行)、IronPython(和Jython类似,只不过运行在微软.Net平台上)。

1965年,戈登·摩尔提出了著名的摩尔定律,其内容为:当价格不变时,集成电路上可容纳的元器件的数目,约每隔18-24个月便会增加一倍,性能也将提升一倍。在随后超过半个世纪的时间里,个人计算机的发展日新月异,已经由资源不足向资源过剩转变。这客观上为Python的应用提供了基础条件——只有在资源过剩的条件下,程序员才不会过度关注榨取性能。

随着Python自身功能的完善以及生态系统的扩展,Python在Web开发、网络爬虫、数据分析与数据挖掘、人工智能等应用方面逐渐崭露头角。

1. Django和Flask引领的WEB开发模式

2004年,目前最流行的WEB框架Django诞生。2010年,另一个流行的轻量级WEB框架Flask诞生。

Django是一个WEB解决方案“全家桶”,其功能大而全,包含了几乎所有WEB开发相关的组件和功能,它可以大大节省开发者在基础组件、选型、适配等方面的时间和精力;而Flask只包含基本的配置,默认依赖于两个外部库也可以自由替换,给开发者提供最大的自主空间。

这两类完全相反方向上的WEB开发模式,几乎可以为所有开发者提供了很好的选型参照物:无论开发者想要一站式还是最大化自主解决方案,Python都能满足。

此后,以豆瓣、春雨医生、知乎、Dropbox、YouTube、CIA(美国中情局)等为代表的企业和机构都基于Python做网站开发,预示着Python应用到WEB开发领域逐渐成为一种新兴趋势。

2. 人人都能胜任的网络爬虫

Python自带的标准库中,urllib、urllib2、requests库对于简单网页的抓取实现非常简单,即使在面对海量数据抓取需求时,第三方库Scrapy也能应对自如;再配合正则表达式库re、网页代码解析BeautifulSoup、html和xml解析库lxml、多线程库threading等特性,使得Python在应用到网络爬虫任务上时,只需要很少的开发量便能迅速完成任务。基于Python简单易学的特性,几乎人人都能开发网络爬虫。

3. 比shell更好用的自动化运维工具

Python是跨语言和平台的,几乎所有Linux系统和MAC系统都自带Python库,Windows系统也可以自定义安装。Python默认的os、sys等库可实现与操作系统的交互和执行功能,更重要的是Python还能直接执行系统终端命令。

因此,使用Python编写的系统运维和管理脚本在可读性、性能、代码重用度、扩展性几方面都优于普通的shell脚本,在自动化运维方面应用广泛。

4. 数据分析与科学计算三剑客

2008年发布的Numpy、scipy和2009年发布的pandas是数据分析与科学计算的三剑客。

  • NumPy(Numeric Python的简称)是Python科学计算的基础工具包,也是Python做数据计算的关键库之一,同时又是很多第三方库的依赖库。

  • Scipy(Scientific Computing Tools for Python的简称)是一组专门解决科学和工程计算不同场景的主题工具包,它提供的主要功能侧重于数学、函数等,例如积分和微分方程求解。Pandas(Python Data Analysis Library的简称)是一个用于Python数据分析的库,它的主要作用是进行数据分析和预处理。

  • Pandas提供用于进行结构化数据分析的二维表格型数据结构DataFrame,类似于R中的数据框,能提供类似于数据库中的切片、切块、聚合、选择子集等精细化操作,为数据分析提供便捷。另外,Pandas还提供了时间序列的功能,用于金融行业的数据分析。

除此之外,很多大型公司也都在使用Python完成不同类型的其他工作,其中不乏世界知名公司,如国外的Google、Facebook、NASA 、雅虎、YouTube等,国内的网易、腾讯、搜狐、金山等。

例如谷歌在Google Groups、Gmail、Google Maps等项目中将Python用作网络应用的后端;在Google Cloud Platform中的Google Cloud Storage本地部署环境中,gsutil也在Python 2基础上开发和应用。

03 后Python2与Python3时代,AI让Python大放异彩

2008年12月,Python 3发布。Python 3相对于Python 2的早期版本(主要是Python2.6之前)是一个较大的升级,它在设计的时候没有考虑向下兼容,所以很多早期版本的Python程序无法在Python 3上运行。

为了照顾早期的版本,推出过渡版本2.6——基本使用了Python 2.x的语法和库,同时考虑了向Python 3.0的迁移,允许使用部分Python 3.0的语法与函数。同时,Python还提供了Python 2到Python 3的Python文件转换功能,以帮助开发者升级。

2010年7月发布了Python 2.x系列的最后一个版本,主版本号为2.7。大量Python 3的特性被反向迁移到了Python 2.7,2.7版本比2.6版本进步非常多,同时拥有大量Python 3中的特性和库,并且照顾了原有的Python开发人群。Python2.7也是当前绝大多数Linux操作系统最新版本的默认Python版本。

从2008年开始,Python 2与Python 3是并存发展的。但在2018年3月,Guido在邮件列表上宣布Python 2.7将于2020年1月1日终止支持,这意味着之后Python 2将不再被统一维护,与之对应的是主流第三方库也不会再提供针对Python 2版本的开发支持。Python 2的时代即将过去。

这一时期,Python继续以其独特魅力吸引更多的开发者加入,但真正让Python大放异彩的却是AI(人工智能)的爆发。

AI并不是一个新生事物,而是从20世纪50年代就开始出现,随后经过了大概20年的黄金时期,又分别在20世纪70年代和90年代两次进入寒冬期。从2006年开始,神经网络、深度学习的出现,让AI进入爆发期。

在AI领域,Python拥有很多相关库和框架。其中最著名的是:

  • sklearn:一个老牌机器学习库,其neural_network库可用来做神经网络训练。

  • PyTorch:由Facebook于2016年发布,它基于曾经非常流行的Torch框架而来,为深度学习的普及迈出了重要一步,到目前为止它已经是人们用来做学术研究的首选方案。

  • TensorFlow:谷歌于2015年研发的第二代人工智能学习系统。借助谷歌的强大号召力以及在人工智能领域的技术实力,它已经成为目前企业真实生产环境中最流行的开源AI框架。更重要的是,它也是第一个(应该也是唯一一个)经过真实大规模生产环境(Google)检验过的框架。

在互联网领域,Facebook和Google都是全球IT企业的标杆,具备行业领导力和风向指示意义。他们基于Python开发的AI库(PyTorch和TensorFlow)已经成为目前最流行的AI库,而且“到底选择PyTorch还是Tensorflow”仍然是一个具有争议性的话题。

在AI时代,主要应用场景包括:

  • 计算机视觉:通过特定的图片模式训练,让计算机理解图像中的物体甚至内容。在这一领域我们熟悉的场景包括图像识别、目标识别和跟踪。例如人脸识别便是图像识别的典型领域,广泛应用到企业员工考勤、门店客户识别、机场等公共领域反恐识别等。2011年,吴恩达创立的谷歌大脑项目,能够在没有任何先验知识的情况下,仅仅通过观看无标注视频学习到识别高级别的概念就能知道哪个是猫。

  • 语音识别:该过程是计算机将人类的自然语言识别并转换为文字的过程,广泛应用工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品等各个领域。身边熟悉的场景例如通过语言对导航、APP、车载设备等做指令输入,以及电信客服系统中的语音业务查询和办理。

  • 自然语言理解:自然语言理解是一类任务的总称,而并非是单一任务。它旨在让计算机理解人类的语言所表达的表层和深层含义。目前场见的应用场景包括自动问答系统、机器翻译、信息检索和过滤、信息抽取等。

  • 个性化推荐:个性化推荐是一个相对成熟的领域,但基于深度学习和神经网络,可以将大量的复杂、抽象特征的数据预处理工作最大程度的简化,甚至可以将海量特征经过简单处理后便直接丢到模型中便能获得比例理想的效果。

  • 游戏和竞技:在该领域,很多科技公司用经过训练后的AI与人类进行对弈。早在20世纪90年代,由IBM开发的“深蓝”与卡斯帕罗夫的世纪之战已经引起了世界的轰动;在2017年AlphaGo又击败排名世界围棋冠军柯洁,再一次让世人感受到AI的强大威力。

在不同的领域,Python都能扮演非常重要的角色,因此,在国外的各大榜单中,Python都已经成为最受欢迎的语言(或至少是之一)。不只在商业领域流行,国内很多地区和教育机构正将Python纳入教材之中。

比如Python进入山东小学六年级的教材,浙江信息技术教材将放弃VB,改用Python 语言,Python列入全国计算机二级等级考试大纲等。

04 Python的未来发展

在Python发展过程中,Guido一直是核心人物,甚至被称为“终身仁慈独裁者”,但在2018年经历了退出管理层风波之后,他又在2019年以五大指导委员之一的身份重回决策层。这为Python迎来了新的治理方案:指导委员会模式。

这种模式意味着Python的未来将从Guido一人决定变为5人决定,虽然比很多开源语言仍然有民主化空间(例如PHP的改进由社区投票决定),但也算是一种从专制到民主的进步。

有关Python的每个提升计划,都是在PEP(Python Enhancement Proposal)列表中——每个版本新特性和变化都通过PEP提案经过社区决策层讨论、投票决议,最终才有我们看到的功能。

目前,Python的最新稳定的主版本是3.7,Python 3.8也已经有了预览版,大概在2023年左右Python 4便会问世。在之后的时间里,Python会如何发展?我们可以从Python软件基金会的董事会成员、CPython的核心开发人员Nick Coghlan的信息中略知一二:

  • 首先,Python的PEP流程和制度没有任何变化,通过增加新模块和功能来增强的基础能力。随着Python 2在2020年不再维护,社区在Python 3的资源和投入会相应增加。

  • 其次,不同解释器的实现和功能扩展还将继续增强,方向包括PyPy关于JIT编译器生成和软件事务内存的尝试,以及科学和数据分析社区,对面向数组编程的探索等。

  • 再次,嵌入式应用的增强,核心是与其他虚拟机运行时(如JVM和CLR)的集成和改进,尤其是在教育领域取得的进展,可能会让Python作为更受欢迎的嵌入式脚本语言,在更大的应用程序中运行。

  • 最后,对于为了兼容和维持Python 2的部分功能而存在于Python 3中的原有代码,在后续版本中应该会逐步优化甚至去掉。而对于其他更改,则会根据情况弃用、提出警告、逐步替代以及保留。

关于作者:宋天龙,深大数据技术专家,触脉咨询合伙人兼副总裁,前Webtrekk中国区技术和咨询负责人(德国最大在线数据分析服务提供商)。擅长数据挖掘、建模、分析与运营,精通端到端数据价值场景设计、业务需求转换、数据结构梳理、数据建模与学习以及数据工程交付。在电子商务、零售、银行、保险等多个行业拥有丰富的数据项目工作经验。

延伸阅读《Python数据分析与数据化运营》

(第2版)

点击上图了解及购买

转载请联系微信:DoctorData

推荐语:这是一本将数据分析技术与数据使用场景深度结合的著作,从实战角度讲解了如何利用Python进行数据分析和数据化运营。本书与同类书大的不同在于,并不只有纯粹的关于数据分析技术和工具的讲解,而且还与数据使用场景深度结合,在业务上真正可指导落地。此外,本书作者提供微信、邮箱等,可通过实时和离线两种方式及时为读者在线传道、受业、解惑。

有话要说?

Q: 你是从什么时候开始学Python的?

欢迎留言与大家分享

猜你想看?

  • AI魔幻行为大赏:细数机器视觉的9大应用场景

  • 搞定这个月薪50K的AI热门领域,看这9本书就够了

  • 吐血整理!140种Python标准库、第三方库和外部工具都有了

  • 最近都在谈的「私域流量」,究竟有没有前途?

更多精彩?

在公众号对话框输入以下关键词

查看更多优质内容!

PPT | 报告 | 读书 | 书单 | 干货 

大数据 | 揭秘 | Python | 可视化

AI | 人工智能 | 5G | 区块链

机器学习 | 深度学习 | 神经网络

合伙人 1024 | 段子 | 数学 | 高考

据统计,99%的大咖都完成了这个神操作

?

觉得不错,请把这篇文章分享给你的朋友

转载 / 投稿请联系:baiyu@hzbook.com

更多精彩,请在后台点击“历史文章”查看

Python传奇:30年崛起之路相关推荐

  1. Python 传奇:30 年崛起之路 。

    来源:AI科技大本营 作者 | 宋天龙,大数据技术专家,触脉咨询合伙人兼副总裁,前 Webtrekk 中国区技术和咨询负责人(Webtrekk,德国的在线数据分析服务提供商).擅长数据挖掘.建模.分析 ...

  2. Python 传奇:30 年崛起之路

    一切都始于 1989 年的那个圣诞节,Python 的诞生并不算恰逢其时,它崛起充满了机遇巧合,也有其必然性.三十年间,Python 技术不断更迭,生态逐渐完善,加上互联网.大数据.以及人工智能这一波 ...

  3. Python诞生30年,《流畅的Python》作者要来中国了

    说到 Python,相信很多 Python 开发者都读过<流畅的Python>这本书,此书为 PSF 研究员.知名 PyCon 演讲者 Luciano Ramalho 的心血之作,兼顾了 ...

  4. 反走崛起之路1:创新之西部——西雅图

    反走崛起之路 | 初探美国精神力量的来源(连载) 反走崛起之路0:科技之高地--硅谷 开始觉得硅谷挺好的,直到遇到西雅图,才发现硅谷(不含旧金山)是真没文化,或者说太单调了-- 4月30号,在西雅图, ...

  5. “巴巴罗莎计划---我的崛起之路

    "巴巴罗莎计划"周期(四个月) 巴巴罗莎计划周期四个月 要达到的目标 首要的目标 时间分配 铁三角作息 没有迟疑,没有抱怨,没有畏惧,没有悲观,只有一个身影,咬紧牙关不断前进的灵魂 ...

  6. 探寻智能网联趋势下“中国模式”创新崛起之路

    (一)文章素材摘录于 单位信息|智能网联汽车网 数据来源|智能网联汽车网微信公众号 (二)正文 2020年是我国智能汽车相关标准建设的收官之年,也是下一阶段工作谋篇布局之年.随着智能化与网联化发展趋势 ...

  7. 华为云能否复制华为手机崛起之路?

    华为云:重走华为手机崛起之路? 华为手机在中国乃至全球都已经是家喻户晓,但是也许很多人不知道的是,如果我们把时光倒回几年前,当时的华为手机还没有成长为今天的参天大树. "我在欧洲工作了6年, ...

  8. 奇瑞汽车鸿蒙系统,华为鸿蒙OS系统汽车来了!国产汽车巨头奇瑞全球首发:开启崛起之路...

    众所周知,自从华为鸿蒙OS系统发布以来,华为鸿蒙OS系统究竟会被应用到那些设备之中,也是成为了大家最为关注的焦点,而根据华为在2020年所制定的战略目标,华为鸿蒙OS系统将会全面启用,应用到华为所有终 ...

  9. pythonencoding etf-8_etf iopv python 代码30个Python常用小技巧

    1.原地交换两个数字x, y =10, 20 print(x, y) y, x = x, y print(x, y) 10 20 20 10 2.链状比较操作符n = 10 print(1 print ...

最新文章

  1. PCL显示法线no override found vtkactor
  2. mysql 存储 结构,mysql目录与存储结构(一)
  3. java中Map的用法(HaspMap用法)
  4. centos7安装face_recognition踩各种坑
  5. 递归调用、高阶函数、装饰器
  6. 英特尔为苹果代工基带芯片 是为X86逆袭移动市场铺路?
  7. sharepoint 使用命令行注册dll文件到gac的方法
  8. Centos Nginx+PHP Install 史上最完美
  9. [UE4]Size Box
  10. w ndows平板,Win8.1千元芯平板 昂达V975w四核评测
  11. 高性能MySQL系统思维导图
  12. 系统编程__2__父子进程的创建和回收
  13. 书单:交互设计书籍推荐
  14. 安卓Termux包下载
  15. html语言 图片大小,html如何设置图片大小
  16. 如何检查有哪些尝试入侵服务器IP?有哪些命令?
  17. 计算机桌面壁纸在哪个文件夹,系统桌面背景在哪个文件夹
  18. 未来十年最吃香专业大盘点,有你的吗?
  19. 【资源总结】前端资源收集
  20. 盛迈坤电商:关键词的优化方法

热门文章

  1. Qt文档阅读笔记-Object Model
  2. WEB安全基础-HTML相关知识
  3. android 360旋转动画,ANDROID——仿360手机卫士的旋转打分控件
  4. html调用xfplugin,使用多设备执行脚本的时候,html report功能无法正常使用
  5. 高温保护_【美的空调维修案例】P2压缩机高温保护 不定时出现P1过欠压保护...
  6. python设置label的位置_Python3 tkinter基础 Label pack 设置控件在窗体中的位置
  7. 密码编码学之AES及其工作模式详解
  8. opengl es 实现旋转的三角形
  9. andriod 自写的view 获得屏幕大小和 获得自写view大小的不同写法
  10. 计算机网络之数据链路层:12、CSMA/CA协议-随机访问介质访问控制