如果你想学Python,或者你刚开始学习Python,那么你可能会问:“我能用Python做什么?”

这个问题不好回答,因为Python有很多用途。

大家都知道,当下全栈工程师的概念很火,而Python是一种全栈的开发语言,所以你如果能学好Python,那么前端,后端,测试,大数据分析,爬虫等这些工作你都能胜任。

从事Python开发这么久,也了解了不少,我发现Python主要有以下四大主要应用:

网络爬虫

web开发

人工智能

自动化运维

接下来的文章将和大家详解聊聊这几个方面

已经是在学Python的朋友也请继续看下去,或许能对你将来的学习之路有所帮助呢。

一、网络爬虫

首先,什么叫网络爬虫?

网络爬虫又称网络蜘蛛,是指按照某种规则在网络上爬取所需内容的脚本程序。众所周知,每个网页通常包含其他网页的入口,网络爬虫则通过一个网址依次进入其他网址获取所需内容。

爬虫有什么用?

做为通用搜索引擎网页收集器。(google,baidu)

做垂直搜索引擎.

科学研究:在线人类行为,在线社群演化,人类动力学研究,计量社会学,复杂网络,数据挖掘,等领域的实证研究都需要大量数据,网络爬虫是收集相关数据的利器。

偷窥,hacking,发垃圾邮件……

爬虫是搜索引擎的第一步也是最容易的一步。

用什么语言写爬虫?

C,C++。高效率,快速,适合通用搜索引擎做全网爬取。缺点,开发慢,写起来又臭又长,例如:天网搜索源代码。

脚本语言:Perl, Python, Java, Ruby。简单,易学,良好的文本处理能方便网页内容的细致提取,但效率往往不高,适合对少量网站的聚焦爬取

C#?(貌似信息管理的人比较喜欢的语言)

为什么最终选择Python?

我用c#,java都写过爬虫。区别不大,原理就是利用好正则表达式。只不过是平台问题。后来了解到很多爬虫都是用python写的,于是便一发不可收拾。Python优势很多,总结两个要点:

1)抓取网页本身的接口

相比与其他静态编程语言,如java,c#,C++,python抓取网页文档的接口更简洁;相比其他动态脚本语言,如perl,shell,python的urllib2包提供了较为完整的访问网页文档的API。(当然ruby也是很好的选择)

此外,抓取网页有时候需要模拟浏览器的行为,很多网站对于生硬的爬虫抓取都是封杀的。这是我们需要模拟user agent的行为构造合适的请求,譬如模拟用户登陆、模拟session/cookie的存储和设置。在python里都有非常优秀的第三方包帮你搞定,如Requests,mechanize

2)网页抓取后的处理

抓取的网页通常需要处理,比如过滤html标签,提取文本等。python的beautifulsoap提供了简洁的文档处理功能,能用极短的代码完成大部分文档的处理。

其实以上功能很多语言和工具都能做,但是用python能够干得最快,最干净。Life is short, u need python.

关于爬虫的学习规划,给大家小小的安排了一下,希望对大家有帮助。

因为前面说爬虫时话太多了,我下边就说法精简一点

什么是web开发呢?

其实就是开发一个网站了。

那开发网站需要用到哪些知识呢?

1、python基础,因为用python开发的,所以python指定要会,最起码你也得会条件判断,循环,函数,类这些知识;

2、html、css的基础知识,因为要开发网站,网页都html和css写的,最起码这些知识你得会,就算不会写前端,开发不出来特别漂亮的页面,网站,最起码要能看懂html标签是;

3、数据库基础知识,因为开发一个网站的话,数据存在哪里,就是在数据库里,那你最起码要会数据库的增删改查吧,要不然怎么存数据,取数据呢

上面这些知识会的话,就基本上可以了,可以开发一个简单的小站就没有问题了,如果想开发比较大型的网站,业务逻辑比较复杂的,那就得用到其他的知识了,比如说redis、MQ等等。

补充一点,Django和Flask等基于Python的Web框架最近在Web开发中非常流行。

这些Web框架可以帮助你用Python编写服务器端代码(后端代码)。这是在你的额服务器上运行的代码,而不是运行在用户设备和浏览器的代码(前端代码)。

继续安排

人工智能(Artificial Intelligence),英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。 人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器,该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能从诞生以来,理论和技术日益成熟,应用领域也不断扩大,可以设想,未来人工智能带来的科技产品,将会是人类智慧的“容器”,也可能超过人的智能。

对于希望加入到 AI 和大数据行业的开发人员来说,把鸡蛋放在 Python 这个篮子里不但是安全的,而且是必须的。

或者换个方式说,如果你将来想在这个行业混,什么都不用想,先闭着眼睛把 Python 学会了。

当然,Python不是没有它的问题和短处,你可以也应该有另外一种甚至几种语言与 Python 形成搭配,但是Python 将坐稳数据分析和 AI 第一语言的位置,这一点毫无疑问。

我甚至认为,由于 Python 坐稳了这个位置,由于这个行业未来需要大批的从业者,更由于Python正在迅速成为全球大中小学编程入门课程的首选教学语言,这种开源动态脚本语言非常有机会在不久的将来成为第一种真正意义上的编程世界语。

安排

随着技术的进步、业务需求的快速增长,一个运维人员通常要管理上百、上千台服务器,运维工作也变的重复、繁杂。把运维工作自动化,能够把运维人员从服务器的管理中解放出来,让运维工作变得简单、快速、准确。

如何一起学习,有没有免费资料?

关注我,看我主页哟~有惊喜

python大神能干什么_Python这么火,能干什么?这四大主要用途是你必须得知道的!...相关推荐

  1. python大神能干什么_Python 能干什么

    二.Python 只适合测试? 关于Python是一种什么样的语言,这里不打算说对象.类之类的术语.我们可以先来看一看,时至今日 Python 都在哪些领域里得以应用: 电信基础设施 (Twilio) ...

  2. python大神能干什么_python怎么成为高手 知乎

    python怎么成为高手 知乎以下文字资料是由(历史新知网www.lishixinzhi.com)小编为大家搜集整理后发布的内容,让我们赶快一起来看一下吧! python怎么成为高手 知乎 我个人比较 ...

  3. Python这么火,能干什么?这四大主要用途是你必须得知道的!

    [此文章转自乐字节] 如果你想学Python,或者你刚开始学习Python,那么你可能会问:"我能用Python做什么?" 这个问题不好回答,因为Python有很多用途. 大家都知 ...

  4. python大文件排序_Python如何实现大文件排序?Python大文件排序的实现方法

    Python如何实现大文件排序?Python大文件排序的实现方法 本文实例讲述了Python实现大文件排序的方法.分享给大家供大家参考.具体实现方法如下: import gzip import os ...

  5. python可以用来写什么_python这么火,到底可以用来做什么?

    原标题:python这么火,到底可以用来做什么? python学习交流君羊:245648132 你用 Python 做什么,你选 Python 3 还是 Python 2? 如果你正在考虑学习 Pyt ...

  6. python大数据搜索_python语言-用 Python 实现一个大数据搜索引擎

    搜索是大数据领域里常见的需求.Splunk和ELK分别是该领域在非开源和开源领域里的领导者.本文利用很少的Python代码实现了一个基本的数据搜索功能,试图让大家理解大数据搜索的基本原理. 布隆过滤器 ...

  7. python大作业爬虫_Python大作业---微博爬虫及简单数据分析

    刚开始学python,选了这个题目,把代码放上来留念,没有用到很流行的框架,所以代码量挺大 GUI用wxpython写的 # _*_ coding: UTF-8 _*_ import os impor ...

  8. python大文件排序_python实现按创建时间对文件排序

    测试中,测试log是经常需要保存一段时间以便于后续查询,但是如果一段时间不删除,会导致硬盘空间变小而影响自动化测试,通常空间太小,自动化测试case就不能调用了,或者即使调用,可能会引起新测试的log ...

  9. python大文件去重_python大ip文件排重

    1 需求: 整理个IP列表,需要将IP去重下,统计一共多少来源 本来想直接shell命令解决,简单的 sort 管道 uniq  然后wc下 无奈文件太大,条数多,处理效率不堪 文件大概5G,几亿条数 ...

最新文章

  1. SpringBoot (七) :SpringBoot 整合dubbo
  2. Ext.Net学习笔记18:Ext.Net 可编辑的GridPanel
  3. 发布支持多线程的PowerShell模块 —— MultiThreadTaskRunner
  4. php 正则 回溯,php 正则表达式效率 贪婪、非贪婪与回溯分析
  5. 电脑如何测网速_物联网卡的网速到底怎么样呢
  6. Java面试题:List一边遍历,一边删除
  7. svn安装使用subversion
  8. JQuery------jQuery.parseHTML()的使用方法
  9. 超简单的ubuntu18.04安装teamview
  10. 光线CMS系统,如何显示幻灯片
  11. ibm java虚拟机_IBM J9 Java虚拟机正式开源,贡献给Eclipse基金会管理
  12. 推荐几个阿里,百度大佬的订阅号给大家
  13. 微软Google等互联网公司经典面试智力题和解答
  14. BLAS 1级例程(向量-向量操作)
  15. 在 github 建立blg
  16. [立此存照][转载]昆明小区道路改公用道路新闻两篇
  17. 第 1 行出现错误: ORA-00604: 递归 SQL 级别 1 出现错误 ORA-38301: 无法对回收站中的对象执行 DDL/DML
  18. SpringBoot对接微信小程序支付功能开发(一,下单功能)
  19. 电机及电气技术实验装置QY-503
  20. java计算机毕业设计高等数学试卷系统MyBatis+系统+LW文档+源码+调试部署

热门文章

  1. 【前端单元测试入门03】Sinon
  2. PWM(脉冲宽度调制)的工作原理、分类及其应用
  3. UltraISO使用和U盘安装原版系统指南
  4. 模式识别 | PRML概览
  5. Gerrit升级和升级后的check(包括gerrit mirror 服务器上的升级)
  6. C#chart绘折线图动态添加数据
  7. 如何建立网站登录系统?
  8. PDPS软件:机器人行走轴虚拟仿真操作方法,即外部轴添加与配置
  9. 利用EXCEL函数LINEST进行统计学中的回归分析
  10. 基于屏幕空间渲染的液体模拟