数据处理到人工智能

  • 数据表示 采用合适方式程序表达数据
  • 数据清洗 数据归一化,数据转换,异常值处理
  • 数据统计 数据概要理解,数量,分布,中位数
  • 数据可视化 直观展示数据内涵
  • 数据挖掘 从数据分析获得知识 产生数据外的价值
  • 人工智能 数据、语言、图像、视觉等方面深度分析与决策
Python库数据分析
  • Numpy:表达N维数组最基础库,python接口使用,C语言实现,计算速度优异
    将n维数据看做数据对象直接操作
  • Pandas:Python数据分析高层次应用库 基于Numpy 数据类型与索引
    Series = 索引 + 一维数据
    DataFrame = 行列索引 + 二维数据
  • SciPy:数学、科学和工程计算功能库 类似Matlab 基于Numpy
    傅里叶变换,信号处理,线性代数,图像处理,稀疏图压缩,优化算法类

Python库数据可视化

Matplotlib!!!:高质量二维数据可视化功能库 基于Numpy
通过matplotlib.pyplot子库调用各可视化效果

Seaborn : 统计类数据可视化功能库 主要展示 数据间分布分类线性关系,基于Matplotlib支持Numpy和pandas http://seaborn.pydata.org/

  • Mayavi:三维科学数据可视化功能库 立体
Python文本处理
  • PyPDF2 处理pdf文件
  • NLTK 自然语言文本处理第三方库
    语言文本分类,标记,语法句法,语义分析
  • Python-docx 创建或更新Microsoft Word文件
    创建或更新.doc .docx文件,增加并配置段落,图片,表格,文字
    http://python-docx.readthedocs.io/en/latest/index.html
Python库之机器学习
  • Scikit-learn:机器学习方法工具集 http://scikit-learn.org/
    统一化的机器学习方法功能接口,聚类,回归,分类,强化学习等
  • TensorFlow:AlphaGo 背后的机器学习计算框架 https://www.tensorflow.org/
    将数据流图作为基础,图节点代表运算,边代表张量

MXNet:基于神经网络的深度学习计算框架 https://mxnet.incubator.apache.org/
用于自动驾驶,机器翻译,语言识别等众多领域

实例 霍兰德人格分析雷达图

通用雷达图绘制:matplotlib库
专业的多维数据表示:numpy库

Web解析到网络空间

  • Python库之 网络爬虫
    Requests最友好最主要的页面级网络爬虫功能库,提供简单易用的类HTTP协议网络爬虫功能,支持连接池、SSL、Cookies、HTTP(s)代理 http://www.python-requests.org/
import requests
r = requests.get('https://api.github.com/user',auther=('user','pass'))#一行语句访问网页链接
r.status_code#网络的状态效果
r.headers('content-type')#
r.encoding#
r.text#获取文本信息

Scripy:最主要最专业的优秀的网络爬虫框架 https://scrapy.org
提供构建网络爬虫系统的框架功能,框架即功能半成品。支持批量和定时网页爬取,提供数据处理流程
pyspider强大的Web页面爬取系统,提供完整的网页爬取系统构建功能
支持数据库后端,消息队列,优先级,分布式架构等

  • Python库之Web信息提取
    Beautiful Soup:HTML和XML的解析库
    可加载多种解析引擎,常与网络爬虫库搭配使用,如Scrapy,requests等
    对HTML标签的树形结构进行下行遍历,上行遍历,平行遍历等
    http://www.crummy.com/software/BeautifulSoup/bs4
    Re:正则表达式解析和功能处理库 python最主要标准库之一 无需安装
    定义和解析正则表达式的通用功能,用于各类场景包括定点的Web信息提取
    re.search() re.match() re.findall() re.split() re.finditer() re.sub()
    Python-Goose:提取文章类型Web页面的功能库 https://github.com/grangier/python-goose
    提供对Web页面中文章信息/视频等元素数据的提取功能,正对特定类型Web页面
from goose import Goose
url = 'http://www.elmundo.es/elmundo/2012/10/28/espana/1351388909.html'
g = Goose({'use_meta_language':False,'target_language':'es'})
article = g.extract(url=url)
article.cleaned_text[:150]
  • Python库之Web网站开发
    Django:最流行最基本的的Web应用框架 https://www.djangoproject.com
    MTV模式:模型(model),模板(Template),视图(Views)
    Pyramid规模适中 的Web应用框架 https://trypyramid.com/
    Flask:Web应用开发微框架 简单规模小快速 http://flask.pocoo.org
  • Python库之网络应用开发
    WeRoBot:微信公众号开发框架
    aip:百度AI开放平台接口,提供访问百度AI服务的Py功能接口,语音,人脸,OCR,NLP,知识图谱,图像搜索
    MyQR:二维码生成第三方库,基本/艺术/动态二维

人机交互到艺术设计

  • Python库之图形用户界面
    PyQt5:Qt开发框架的Python接口,Qt成熟的跨平台桌面应用开发系统,完备GUI
    推荐的Python GUI(图形化界面) 开发第三方库
    wxPython:跨平台GUI开发框架
    基于Numpy,操作索引即操作数据
    PyGObject:使用GTK+开发GUI的功能库
    提供整合GTK+,WebKitGTK+等库的功能,GTK+跨平台用户图形界面GUI框架
    Anaconda采用该库构建GUI
  • Python库之游戏开发
    PyGame,Panda3D,cocos2d
  • Python库之虚拟现实 Vizard----VR开发引擎
  • Python库之图形艺术
    Quads库 迭代的艺术,对图像四分迭代形成像素风,生成动静态图像
    ascii_art 将普通图片转为ASCII艺术风格
    turtle 绘制Random Art

玫瑰花制

#RoseDraw.py
import turtle as t
# 定义一个曲线绘制函数
def DegreeCurve(n , r , d=1):for i in range(n):t.left(d)t.circle(r,abs(d))
# 初始位置设定
s=0.2# size
t.setup(450*5*s, 750*5*s)
t.pencolor("black")
t.fillcolor("red")
t.speed(100)
t.penup()
t.goto(0, 900*s)
t.pendown()# 绘制花朵形状
t.begin_fill()
t.circle(200*s,30)
DegreeCurve(60, 50*s)
t.circle(200*s,30)
DegreeCurve(4, 100*s)
t.circle(200*s,50)
DegreeCurve(50, 50*s)
t.circle(350*s,65)
DegreeCurve(40, 70*s)
t.circle(150*s,50)
DegreeCurve(20, 50*s, -1)
t.circle(400*s,60)
DegreeCurve(18, 50*s)
t.fd(250*s)
t.right(150)
t.circle(-500*s,12)
t.left(140)
t.circle(550*s,110)
t.left(27)
t.circle(650*s,100)
t.left(130)
t.circle(-300*s,20)
t.right(123)
t.circle(220*s,57)
t.end_fill()# 绘制花枝形状
t.left(120)
t.fd(280*s)
t.left(115)
t.circle(300*s,33)
t.left(180)
t.circle(-300*s,33)
DegreeCurve(70, 225*s, -1)
t.circle(350*s,104)
t.left(90)
t.circle(200*s,105)
t.circle(-500*s,63)
t.penup()
t.goto(170*s,-30*s)
t.pendown()
t.left(160)
DegreeCurve(20, 2500*s)
DegreeCurve(220, 250*s, -1)# 绘制一个绿色叶子
t.fillcolor('green')
t.penup()
t.goto(670*s,-180*s)
t.pendown()
t.right(140)
t.begin_fill()
t.circle(300*s,120)
t.left(60)
t.circle(300*s,120)
t.end_fill()
t.penup()
t.goto(180*s,-550*s)
t.pendown()
t.right(85)
t.circle(600*s,40)# 绘制另一个绿色叶子
t.penup() t.goto(-150*s,-1000*s)
t.pendown()
t.begin_fill()
t.rt(120)
t.circle(300*s,115)
t.left(75)
t.circle(300*s,100)
t.end_fill()
t.penup()
t.goto(430*s,-1070*s)
t.pendown()
t.right(30)
t.circle(-600*s,35)
t.done()

Python_note9 Matplotlib画图 Seaborn画图相关推荐

  1. matplotlib.pyplot常用画图方式函数封装(一)——.plot绘制折线图及设置坐标轴箭头完美解决

    matplotlib.pyplot常用画图方式函数封装(一)--.plot绘制折线图及设置坐标轴箭头完美解决 py.plot常见绘图设置函数封装 绘制函数图像(完美解决坐标轴添加箭头) 绘制折线图 p ...

  2. python seaborn 画图

    python seaborn 画图 59888745@qq.com 2017.08.02 distplot( )  kdeplot( ) distplot( )为hist加强版, kdeplot( ) ...

  3. seaborn+画图+EDA

    seaborn+画图+EDA 本文介绍了一些用于查看categorical变量与其他变量(一般是label)之间关系的一些可视化技巧,其中主要涉及的包有: 查看categorical变量与一些其他变量 ...

  4. Matplotlib交互模式画图动态刷新延迟等问题

    Matplotlib交互模式画图动态刷新延迟等问题 一.引子 二.问题 三.测试分析 四.解决方案 一.引子   最近在实验室优化基于 EPICS 协议的 Python 控制程序,其中,硅漂移探测器设 ...

  5. matplotlib中文文档_python绘图库——Matplotlib及Seaborn使用(入门篇1)

    在数据分析过程中,数据及模型可视化是无可避免的,同时这也是展示我们数据分析成果的最佳方式.因此,熟悉掌握绘图库的使用,对精进我们的数据分析技能起着不可替代的作用. 今天,我们就来了解一下python强 ...

  6. python绘图库seaborn_python绘图库——Matplotlib及Seaborn使用(入门篇1)

    在数据分析过程中,数据及模型可视化是无可避免的,同时这也是展示我们数据分析成果的最佳方式.因此,熟悉掌握绘图库的使用,对精进我们的数据分析技能起着不可替代的作用. 今天,我们就来了解一下python强 ...

  7. Python使用matplotlib或者Seaborn箱图(boxplot)可视化时汉语(中文)标签显示成了框框□□、什么情况、我们有解决方案。

    Python使用matplotlib或者Seaborn箱图(boxplot)可视化时汉语(中文)标签显示成了框框□□.什么情况.我们有解决方案. #仿真数据 import pandas as pd i ...

  8. python绘图库seaborn_python绘图库——Matplotlib及Seaborn使用(入门篇2)

    在数据分析过程中,数据及模型可视化是无可避免的,同时这也是展示我们数据分析成果的最佳方式.因此,熟悉掌握绘图库的使用,对精进我们的数据分析技能起着不可替代的作用. 在上一篇中,我们掌握了Matplot ...

  9. [转载] python可视化分析(matplotlib、seaborn、ggplot2)

    参考链接: Python Matplotlib数据可视化2 python可视化分析总结(matplotlib.seaborn.ggplot) 一.matplotlib库1.基本绘图命令3.图形参数设置 ...

最新文章

  1. jQuery的自定义动画
  2. Windows下一个curl使用
  3. 静态链接中的那点事儿(1)
  4. T-SQL Recipes之Customized Database Objects
  5. helm3 push/pull安装使用细节及添加国内仓库
  6. linux tips 技巧笔记一
  7. java 文件追加文本_Java追加文件内容的三种方法
  8. 2014图灵技术图书最受欢迎TOP15
  9. UVA10140 Prime Distance
  10. 在mybatis里面设置不同数据库运行环境和适应性问题
  11. 1.1 linux介绍
  12. openresty 前端开发序 1
  13. 问题解决之--无法识别的属性“targetFramework”。请注意属性名称区分大小写。
  14. Java面试题!5年经验Java程序员面试27天,看看这篇文章吧!
  15. 【杂谈分享】如何在中国大学MOOC高效学习?MOOC学习全面指北√
  16. Context-Free Grammar及形状规则集
  17. VSCode前端开发工具插件--LiveServer实时刷新网页
  18. mysql提交数据时会丢失一部分_技术|MYSQL数据丢失讨论
  19. SpringBoot入门系列(二)如何返回统一的数据格式
  20. puzzle(0112)不规则数独、变种数独

热门文章

  1. 用PlanAhead进行RTL代码开发与分析
  2. 690啊690,你不是找骂吗?
  3. 【Python】Python中*args 和**kwargs的用法
  4. Curator-01
  5. 【SQLServer】【恢复挂起的解决方案】附加文件时候的提示“无法重新生成日志,原因是数据库关闭时存在打开的事务/用户,该数据库没有检查点或者该数据库是只读的。 ”【数据库恢复】...
  6. JS学习笔记 - 代码复用
  7. [Design] Strategy Pattern
  8. warnings.filterwarnings(ignore)
  9. 三种复位方式: 同步复位、异步复位、异步复位同步释放
  10. zynq学习02 新建一个Helloworld工程