君子生非异也,善假于物也。

“物”能够延展英雄的能力。它是吕布的赤兔马,杨过的玄铁重剑,CS中的沙漠之鹰,曹操传中的凤凰羽衣。“物”也可用以治愈英雄,例如张无忌的黑玉断续膏,李逍遥的天香续命露,还有深夜里TVB的一碗面。

对于不同的位面,有着不同的宝物定义。对古时文人来讲,笔墨纸砚,是当时具有生产力输出的四大工具。对程序员来讲,当代的“文房四宝”不外乎是:笔 记本,大屏幕,机械键盘,人体工学椅,Google,Github这几种。特别是机械键盘和人体工学椅,它们是极为重要的“人机接口”。前者可以用来延展 英雄的输出能力,后者可以用来治愈英雄的腰椎。

在数据领域也有类似的情况。一个数据项目,最重要的是定义问题,其次是拿到好的数据,再次是找到合适的方法,最不重要的可能就是选择一个工具了。但是看起来最形而下的工具,却是最具体而真实的“人数接口”。用一种顺手的工具来玩数据,我们会觉得比较舒服,输出效率更高。

市面上的分析工具大致分为两大类,菜单式的工具和命令行式的工具。前者适合于初学入门,类似于跟团旅游,提供了固定的路线。分析套路比较固定化,点 几下鼠标就可以搞定也很省事。后者适合于老手玩家,类似于自由行,需要自己规划数据工作流,适用于自定义的灵活分析。大多数用户害怕命令行,然而使用命令 行才能掌握真正的力量。命令行是Jedi的原力。

在命令行工具类别中,最耀眼的是R和Python这对双星。他们有非常多的相似之处,第一个相似之处是“快”。这种快不是纯计算速度快,而是从想法 到结果的快。因为不论是探索数据还是建模,都需要各种尝试各种试错各种踩坑,如果要花2小时写代码,跑1分钟,不如花1分钟写程序,跑1小时。因为人的时 间总是更为宝贵。第二个相似之处是扩展丰富。即有大量现成的函数模块。从想法到结果的快速实现,不能等待重新造轮子,另一方面,试错也要做很多复杂的自定 义任务,将各种模块进行组合,调用各种外部交互接口,这两种开源工具都非常擅长。

二者的差异点在于Python是一种通用型编程工具,R专注于数据领域;R有更为丰富的专业统计函数,Python则长于机器学习;R有更好的可视 化包,Python正在快速追赶;Python和R的核心语法非常简洁,一些R包的语法则兼收并蓄,错综复杂。当你有时间的时候,双修是最好的选择。因为 这两种工具类似于筷子和勺子的区别,在不同场景下使用某种工具更为有效。

R语言这个工具与其生态系统,在统计之都上已经介绍得非常多了。下文简单介绍一下python的七个最为重要的数据分析模块,或者称之为七种武器。

长生剑:Numpy

Numpy是Python提供数值计算的基础模块,也是Python生态中历史最为悠久的模块,可称得上“长生”二字。如果没有这柄长生剑,就没有 办法做快速高效的向量化计算。它还提供了线性代数等高级矩阵运算功能,另外还能集成C的代码,让你出剑更加的快。Python的许多扩展模块都是基于 Numpy开发的,所以学好Numpy就算是奠定好了根基。

碧玉刀:SciPy

SciPy是基于Numpy开发的高级模块,它用于解决科学计算中的一些标准问题。例如数值积分和微分方程求解,扩展的矩阵计算,最优化,概率分布和统计函数,甚至包括信号处理。练习好碧玉刀和长生剑,就足以解决常见的计算问题,并不需要自己哼哧哼哧造轮子写函数了。

孔雀翎:Matplotlib

孔雀的尾羽聚合了世间所有的色彩,做数据研究同样需要漂亮的可视化工具。Matplotlib是python下最著名的绘图库,提供了一整套和 Matlab相似的API,十分适合交互式绘图。也可将它作为绘图控件,嵌入各种应用程序中。在其基础之上,还有更为有趣的绘图工具Seaborn和 Bokeh。

多情环:Pandas

在数据整理阶段,我们经常需要连接读定不同类型的数据源,处理不同格式的数据对象,如果只使用Numpy会很麻烦。Pandas使Python具备 了类似R的数据框对象。这样方便用于真实江湖的数据处理和分析,它提供大量易用、高效的数据操作函数库,能执行join以及其他SQL类似的功能来重塑数 据,支持各种格式的输入输出数据。它与Python生态中的其它模块也有很好的整合,多情环名不虚传。

离别钩:Statsmodels

Statsmodels是python中专门用于统计分析的模块,提供各种回归模型函数,包括广义回归和稳健回归,还提供大量时间序列分析函数,例如ARIMA/VAR,各种经典假设检验和非参数方法一个都不少。有了离别钩,你可以随时和R说离别。

霸王枪:Scikit-learn

Scikit-learn是非常著名的机器学习库,它提供一个统一的接口来使用不同模型,有助于迅速地在数据集上应用流行的算法。它包含了许多用于 标准机器学习任务的工具,例如聚类、分类和回归等。不仅是各种算法,机器学习中重要的特征选择和模型评估均在模块中包含了。值得一提的另一个模块 gensim:提供了词向量、主题模型等函数。有了这两种模块,天下就绝没有不能解决的事。

一口箱子:TensorFlow

古龙并未写完最后的第七种武器,通常会将《英雄无泪》中的一口箱子作为最为神秘最为强悍的终级武器。在Python生态中,一口箱子只能属于 TensorFlow。它作为名门大派出品的深度学习框架,一出世就备受瞩目。TensorFlow提供了C++和python两种接口,让你能高效的设 计各种机器学习算法,并且能运行在各类硬件架构之上。此外还有各种强力组件搭配,TensorBoard用于监控学习过程中的各项参 数,TensorServer可用于生产环境的模型部署,甚至传说还有TPU这种专门用于深度学习的芯片。

在数据江湖中,没有顺手的武器,英雄亦束手加班中。七种武器虽强,但器物总是死的,更重要的是从器物的把玩中,能领悟到运用之妙,数据之道。一件武 器是否能令读者觉得神奇有价值,主要还是得看使用它的是什么人。有赤兔的吕布没有看到明天,没有玄铁重剑的杨过却有更进一步的修炼。

江湖路远,少侠们一路走好。

python枪械_Python的七种武器相关推荐

  1. 让 Python 代码更易维护的七种武器——代码风格(pylint、Flake8、Isort、Autopep8、Yapf、Black)测试覆盖率(Coverage)CI(JK)...

    让 Python 代码更易维护的七种武器 2018/09/29 · 基础知识 · 武器 原文出处: Jeff Triplett   译文出处:linux中国-Hank Chow    检查你的代码的质 ...

  2. 百度云世界里的“七种武器”:PCS、BAE、Site App、ScreenX等

    如果说去年百度世界的关键词是"百度新首页"的话,那么今年在研发者人群中,对百度世界最深的印象就是"七种武器",即在云的世界里,百度为开发者所提供的包括个人云存储 ...

  3. abaqus dat文件 matlab_提升Abaqus求解效率的七种武器

    作者简介 作者:江丙云 本文首发于iCAETube公众号,技术邻CAE学院授权转载. 江丙云,上海交通大学博士,CAEMC-国际注册CAE工程管理咨询工程师,<汽车实用技术>编委会副秘书长 ...

  4. 转载》互联网中七种武器维护移动安全

    2019独角兽企业重金招聘Python工程师标准>>> 人在网上飘,最怕被黑客惦记,个人上网记录.私密信息.银行卡帐号.密码,都是黑客窃取的目标,让人实在没有安全感可言.下面,爱加密 ...

  5. 报童问题求解最大利润_提升Abaqus求解效率的七种武器

    作者简介 作者:江丙云 本文首发于iCAETube公众号,技术邻CAE学院授权转载. 江丙云,上海交通大学博士,CAEMC-国际注册CAE工程管理咨询工程师,<汽车实用技术>编委会副秘书长 ...

  6. GIS就业参考系列之技术篇——七种武器

    题记 从2007--2017,职场中第一个十年即将完成.十年足以摧毁一个人的样貌:十年可以见证一个时代的发展:十年你从匆匆那年转变为而立之年:不知道从毕业一直还在从事本专业的人有多少,不知道这是一种幸 ...

  7. ansible(七种武器)

    ansible七种武器 第一种武器 Ansible命令,用于执行临时性的工作,也是我们之前主要学习的功能,必须掌握 第二种武器 Ansible-doc是Ansible模块文档说明,针对每个模块都有详细 ...

  8. Linux操作系统中的七种武器

    Linux是一套免费使用和自由传播的类UNIX操作系统,主要用于基于Intel x86系列CPU的计算机上.Linux系统是由全世界各地的成千上万的程序员设计和实现的,其目的是建立不受任何商品化软件的 ...

  9. MogDB企业应用 之 七种武器

    MogDB企业应用 之 七种武器 如今江湖上最卷的门派,非国产数据库莫属.各位大侠们往往把精力放在拼内功(内核/架构).拼身法(性能).拼拳脚(功能/兼容性).拼江湖地位(生态/社区).然而好像并不怎 ...

最新文章

  1. 吴恩达 coursera AI 专项四第三课总结+作业答案
  2. 暑假集训考试反思+其它乱写
  3. Linux命令大总结(早期学习时的笔记)
  4. 京东开普勒php接口,IOS菜鸟初学第十五篇:接入京东开普勒sdk,呼起京东app打开任意京东的链接-Go语言中文社区...
  5. Elementui input不能再循环数据中每次自动聚焦的问题
  6. 国产Model 3高性能版规格公布:充电15分钟续航250公里
  7. java 富文本 xss_Jsoup 防止富文本 XSS 攻击
  8. 为什么我们公司强制弃坑Fastjson了?主推...
  9. FANUC机器人_KAREL编程入门学习(1)
  10. 【HAVENT原创】Spring Boot 跨命名空间调用外部依赖包
  11. 常用八大数据结构总结及应用场景-附示例截图
  12. 1553B 协议详解
  13. 渠道商用假流量冒充真实用户
  14. 营业执照识别,三证合一
  15. dubbo 监控中心配置
  16. leetcode59.螺旋矩阵II
  17. [Android] 如何制作手电筒程序
  18. 异构数据源之间交换数据的工具
  19. 计算机中丢失Smtpemail,SMTP和ESMTP错误代码列表
  20. ubuntu更新源修改更新源

热门文章

  1. unity3D 初学者的个人总结
  2. Robinson Crusoe chapter 8 A ship arrives at the island
  3. 今天面完了聚成网络的php研发,面经一枚,为自己攒人品。
  4. 中科院院士!南京大学,迎来新校长
  5. 雅可比矩阵:“Jacobian“矩阵
  6. 个人日记系统,记录点滴小事,记录生活点点滴滴
  7. 经典练习项目门级的三个案列
  8. 80后的互联网北漂:你的未来在哪?
  9. android 特殊网络类型说明
  10. 《推背图》存在着什么样的秘密呢?