本文主要向大家介绍了Python语言数据挖掘01-环境搭建,通过具体的内容向大家展示,希望对大家学习Python语言有所帮助。

Python是数据挖掘的利器,这里自己边学习边记录下过程。以下操作在Windows或Mac系统下均可进行,Linux下暂未测试。

1、PyCharm安装

Python开发的IDE有很多,这里比较推荐PyCharm。PyCharm有专业版和社区版,两者均可。安装后新建test.py测试运行

print 'Hello Python!'

2、MySQL安装

官网下载系统对应的版本安装,安装完成后在命令提示行输入"mysql",如果返回欢迎信息,则成功运行。如果命令不被识别,在Windows系统下需要把MySQL路径加入系统环境变量。Mac也一样,或者输入 /usr/local/mysql/bin/mysql -uroot -p 然后输入密码,进入MySQL。

测试是否安装成功:

show databases;

运行结果:

+--------------------+

| Database           |

+--------------------+

| information_schema |

| mysql              |

| performance_schema |

| sys                |

+--------------------+

4 rows in set (0.01 sec)

3、MySQLdb安装

为了在Python中操作MySQL,需要安装MySQLdb。Windows系统下直接下载安装包,或者在PyCharm中添加即可。Mac系统在PyCharm中添加可能会提示错误,这时可以在终端中安装:

sudo -H pip install MySQL-python

如果提示EnvironmentError: mysql_config not found,则运行一下以下命令

export PATH=$PATH:/usr/local/mysql/bin

安装完成后,在PyCharm中测试是否运行正常:

import MySQLdb

try:

conn=MySQLdb.connect(host='localhost',user='root',passwd='mypassword',db='mysql')

cur=conn.cursor()

cur.execute('select Host from user')

print cur.fetchall()

cur.close()

conn.close()

except MySQLdb.Error,e:

print "Mysql Error %d: %s" % (e.args[0], e.args[1])

运行结果:

(('localhost',), ('localhost',))

这是一个Tuple类型的数据

4、常用Python库

urllib2  #自带网络请求库

re  #正则表达式

requests  #第三方网络请求库,需手动添加

BeautifulSoup  #网页解析库,需手动添加

5、初步试验

功能:从智联招聘网站上抓取部分数据信息

#encoding=utf-8

import requests

from bs4 import BeautifulSoup

headers={'User-Agent':'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_0) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.75 Safari/537.36 QQBrowser/4.1.4132.400'}

payload={'jl':'深圳','kw':'python','isadv':'0','sg':'0dfd2337bd8a43168ee25385938feda9','p':'1'}

r=requests.get('http://sou.zhaopin.com/jobs/searchresult.ashx',params=payload,headers=headers)

soup=BeautifulSoup(r.text)

list1=soup.find_all('table')

for li in list1:

jobname=li.find('td',class_='gsmc')

jobsalary=li.find('td',class_='zwyx')

joblocation=li.find('td',class_='gzdd')

if jobname:

print jobname.a.string

if jobsalary:

print jobsalary.string

if joblocation:

print joblocation.string

运行结果:

创游时空网络科技(深圳)有限公司

8001-10000

深圳

深圳市程序猿教育科技有限公司

4001-6000

深圳 - 龙华新区

深圳市友联创科技有限公司

6001-8000

深圳 - 龙华新区

本文由职坐标整理并发布,希望对同学们学习Python有所帮助,更多内容请关注职坐标编程语言Python频道!

python语言数据挖掘python语言数据_Python语言数据挖掘01-环境搭建相关推荐

  1. Python + 大数据-Hadoop生态-Linux(一)-环境搭建和Vi

    Python + 大数据-Hadoop生态-Linux(一)-环境搭建和Vi 今日课程学习目标 1.了解Linux操作系统发展介绍.安装配置 2.掌握SSH原理机制.Linux文件上传下载 3.掌握L ...

  2. 《Python从小白到大牛》第2篇 开发环境搭建

    <Python从小白到大牛>已经上市! 开发环境搭建 <论语•魏灵公>曰:"工欲善其事,必先利其器",做好一件事,准备工作非常重要.在开始学习Python技 ...

  3. 大数据介绍、集群环境搭建、Hadoop介绍、HDFS入门介绍

    大数据介绍.集群环境搭建.Hadoop介绍.HDFS入门介绍 文章目录 大数据介绍.集群环境搭建.Hadoop介绍.HDFS入门介绍 1.课前资料 2.课程整体介绍 3.大数据介绍 3.1 什么是大数 ...

  4. python语言程序设计及医学应用_Python语言程序设计(高等学校计算机专业规划教材)...

    第1章Python语言概述/1 1.1Python语言的发展1 1.1.1Python的起源1 1.1.2Python的发展2 1.2Python语言的特点2 1.2.1Python的特性2 1.2. ...

  5. python纳入小学课本了吗_Python语言为什么被推荐纳入高考和小学教材

    python语言最近两天传出将加入高考,此消息一处IT届的新闻火起来了. python语言本来就是近年来最火的语言,也是所有程序语言中搜索热词. 当前,已经确定出台消息来看: 第一条,从2018年起浙 ...

  6. python娃娃在地上摆积木_Python语言要从娃娃抓起

    原标题:Python语言要从娃娃抓起 在未来,对于一些高中生,甚至是小学生来说,除了英语,他们还有另外一门计算机编程"语言"需要学习--Python. 全国计算机等级考试调整 在2 ...

  7. python语言程序设计刘卫国答案_Python语言程序设计

    章Python语言基础1 1.1Python语言概述1 1.1.1Python语言的发展历史1 1.1.2Python语言的特点2 1.1.3Python语言的应用领域3 1.2Python语言的开发 ...

  8. python语言最适合的领域_Python语言被广泛用在哪些领域了?

    我们为什么要学 Python?地产大佬潘石屹曾在微博回答过:在这信息时代想要让机器为人工作,就必须学习机器的语言,而Python就是进化后比较好的计算机语言.总的来讲,Python绝对是近年最火的编程 ...

  9. python比c语言开发速度快多少倍_Python语言其实很慢,为什么机器学习这种快速算法步骤通常还是用呢?...

    原标题:Python语言其实很慢,为什么机器学习这种快速算法步骤通常还是用呢? 作为python的忠实粉丝,看见这个题目就情不自禁想怼回去.鉴于和谐社会,我决定慢慢讲道理. 首先,相对于c语言,pyt ...

  10. python语言的主要网站是_python语言主要是做什么的

    python是一款应用非常广泛的脚本程序语言,谷歌公司的网页就是用python编写.python在生物信息.统计.网页制作.计算等多个领域都体现出了强大的功能.python和其他脚本语言如java.R ...

最新文章

  1. python机器学习可视化工具Yellowbrick介绍及平行坐标图实战示例
  2. 人脸识别必读的N篇文章
  3. 设置 HTTP HEADER 字段来提高 Web 安全性
  4. Axure原型尺寸笔记
  5. 3D演示帮你一眼看懂线性规划问题,这篇可视化教程火了
  6. ceph编译_Ceph编译:L版本及其之后的版本
  7. 解决GeoTools中CQL解析中文字段名的问题
  8. CGTN专访第四范式裴沵思 阐释数字化转型背后的驱动力
  9. 关于inet_ntop、inet_pton中的n和p分别代表的意义
  10. JavaSE基础知识(5)—面向对象(Object类)
  11. Leetcode算法题(C语言)5--存在重复
  12. cassendra数据模型
  13. HDU1870 愚人节的礼物【堆栈+输入输出+水题】
  14. 数据科学包4-pandas核心数据结构
  15. GetFileAttributes
  16. MATLAB 棋类小游戏合集(围棋,六子棋,走四棋,九子棋,含禁手五子棋等等)
  17. linux网络配置方法
  18. 《老路用得上的商学课1—5》成本
  19. 【云原生】—— 学习云计算应用开发你需要掌握的五大技能
  20. 第一届全国大学生GIS应用技能大赛试题答案及数据下载(下午)

热门文章

  1. java lambda sorted_Java8:Lambda表达式增强版Comparator和排序
  2. 【Python】pandas模块中更改Series的数据类型
  3. 【测试工具】在linux测试环境访问禅道数据库
  4. 软件测试管理工具禅道开源版下载安装
  5. GIT和GitHub的使用总结
  6. wordcount C
  7. mongodb 教程一
  8. sublime写网页代码,里面的中文字符会出现乱码
  9. Chart.js学习
  10. JAVA读取本地图片并展示