编程语言只是工具,核心在于你要做什么,很多python的高级方法和语言特性,前期可以全部不管。

作为数据分析和建模,先用python实现基本的需求,更高级的用法慢慢掌握,万事开头难。

一、掌握基本的数据结构和控制流程(1周即可)

基本的数据结构:元组、列表、字典。

基本的控制流程:if判断、for循环、while循环。

剩下的事情就是把数据存在合适的数据结构中,然后使用控制流程操作数据。

其实数据操作和sql很像,就是增删改排序查找,不同数据结构有不同的方法,需要掌握,大致知道就好,用多了就熟了。

可以如下百度(示例如下):python 列表操作

https://www.cnblogs.com/Devilf/p/8039805.html

二、掌握pandas包的数据操作(1-2个月为宜)

python的优势:包。通过导入包,利用别人封装好的方法,可以更加高效的处理数据。

数据处理基本上用pandas就够了(熟悉之后可以逐步使用numpy、scipy等),pandas学习方法:

1、10 minutes to pandas(http://pandas.pydata.org/pandas-docs/stable/getting_started/10min.html),官网的入门教程,虽然是英文,但很好读,花一周坚持读下来,会对pandas有很清晰的了解。

2、pandas的核心在于:

将数据存储为dataframe类型,然后基于此数据类型进行数据操作。

常见的数据操作有:数据输入输出、筛选数据、groupby数据、时间数据操作、数据可视化。阅读官方教程即可:

http://pandas.pydata.org/pandas-docs/stable/getting_started/basics.html

3、阅读Python for Data Analysis,中文版是:利用Python进行数据分析。基本是在更加详细的介绍如何使用pandas操作数据。

三、数据建模(长期,难点在于知道应该做什么,具体实现熟了很简单)

建模常用的包有pytorch、sklearn、tensorflow等,使用sklearn就可以满足常见建模需求。

事实上,利用包建模很简单,基本就是:

1、导入包

2、利用包已实现的算法fit一下训练数据得到model;

3、利用model对测试数据做个predict;

4、利用各种模型性能评价指标评估model性能。

5、调整参数、入模变量等,得到满足性能指标的model。

大量的工作是花费在调参和模型性能指标的验证上的,因为性能指标可以反馈出数据本身的特点以及如何更好的调参得到好的模型。

四、其他

有了基础后,注意提高自己的代码效率或者通过不同的方法得到更好的结果。

可以关注pythonic方面的文章,会提高自己的编程能力。

python数据建模优缺点_Python数据分析\建模入门建议相关推荐

  1. python数据分享人力资源_Python数据分析帮你清晰的了解整理员工们的工作效率和整体满意度...

    前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 项目背景 2018年,被称为互联网的寒冬之年.无论大小公司,纷纷走上了裁员 ...

  2. python数据预测案例_Python数据分析及可视化实例之疾病预测(分类)

    Talk is cheap , show U the code. 该源码注释比较全面,需要对SKlearn有一定的了解, 当然,你也可以把它视作黑箱,做个调包侠也是大侠, 没错,本主用Bokeh进行可 ...

  3. python数据生成可视化_Python数据分析:手把手教你用Pandas生成可视化图表

    大家都知道,Matplotlib 是众多 Python 可视化包的鼻祖,也是Python最常用的标准可视化库,其功能非常强大,同时也非常复杂,想要搞明白并非易事.但自从Python进入3.0时代以后, ...

  4. python数据包分析_python | 数据分析(一)- Numpy数据包

    # 导入numpy包 import numpy as np """ ***************** 一.数组操作 ***************** "&q ...

  5. python便捷数据怎么获取_Python数据分析入门——从数据获取到可视化

    基本信息 作者: 沈祥壮 ISBN:9787121336539 上架时间:2018-3-22 出版日期:2018 年3月 开本:16开 页码:260 版次:1-1 [插图] 编辑推荐 了解基本的Pyt ...

  6. python分析数据的相关性质_理解数据的性质_Python数据分析实战应用_数据挖掘与分析视频-51CTO学院...

    为什么学Python: 重要:数据分析是职业技能必备,Python是大数据分析** 趋势:Python是目前非常火的编程语言,使用人多 好学:学习简单,容易上手,使用灵活,可扩展强 **:会Pytho ...

  7. python做数据可视化视频_Python数据分析系列视频课程--玩转数据可视化

    matplotlib包是基于Python平台的统计绘图利器,是在python平台上完成数据可视化不可或缺的工具,而基于matplotlib进一步开发的seaborn,更是将数据呈现与可视化的可用性推到 ...

  8. python 数据框缺失值_Python:处理数据框中的缺失值

    python 数据框缺失值 介绍 (Introduction) In the last article we went through on how to find the missing value ...

  9. python数据查询教程_Python数据可视化教程之基础篇

    经过学习之后,我总结了利用python实现可视化的三个步骤: 确定问题,选择图形 转换数据,应用函数 参数设置,一目了然 1 首先,要知道我们用哪些库来画图? matplotlib python中最基 ...

  10. python数据科学-单变量数据分析

    总第85篇 01|背景: 我们在做机器学习之前,需要自己先对数据进行深入的了解(这些数据是什么类型,总共有多少数据,有没有缺失值,均值是多少之类的),只有自己对数据足够了解了,才能够更好地利用机器学习 ...

最新文章

  1. 爬虫之观察js的执行过程
  2. NLPIR 分词准确率接近98.23%
  3. Thymeleaf 标准表达式语法详解
  4. STM32输入捕获模式设置并用DMA接收数据
  5. jd-eclipse反编译插件的离线安装和使用
  6. OpenGL blending sort 混合排序(前后)的实例
  7. vCenter Events
  8. Linux修改时区(tzselect) 【例子:修改时区 为 中国 东8区 的时间】
  9. 【Oracle】DG三种保护模式及切换方式
  10. VFS之基本数据结构
  11. .bat脚本基本命令合集
  12. QtDBus快速入门
  13. java如何取出list的最后一个值,如何从Java中的ArrayList获取第一个和最后一个元素?...
  14. 分页 在mybatis执行SQL语句之前进行拦击处理实例
  15. 计算机组装实训写总结,计算机组装维护实训总结.doc
  16. 一张图解决为什么校外访问不了学校购买的中国知网
  17. 《DIY智慧小屋—带你玩转物联网》简述LoRa和NB-IoT的技术特点,他们有哪些共同点和差异点,在生活中LoRa和NB-IoT各有哪些适合的应用场景?
  18. 简单贪心问题-圣诞老人的礼物
  19. 使用PIL将白底黑字图片转为透明底白字
  20. 过年放生真的是积德吗?《别把“放生”变“杀生》

热门文章

  1. 基于javafx+sqlserver的仓库管理系统
  2. g41 计算机主板维修,解决方法:G41主板BIOS设置方法
  3. 地方时太阳时html源码,地方时和标准时(25页)-原创力文档
  4. 数据结构(C++版)- 教学视频+配套资源
  5. QImage、QPainter绘图
  6. ubuntu下好用的TCP/UDP调试工具
  7. 高等数学(第七版)同济大学 习题1-8 个人解答
  8. 麒麟系统linux内核,麒麟Linux操作系统内核简介(14页)-原创力文档
  9. 【Json工具】一个json格式化查看工具——HIJSON
  10. sql插入数据时自动插入时间