最近经常被问到怎么入门数据分析,可能很多同学对怎么开始学习还是比较困惑的。我回想自己学习数据分析的经历,总结了一些建议,希望能给到大家帮助。

打好概率与统计的基础

概率与统计是数据分析的基石,像一些概率分布、抽样、线性回归、时间序列都是数据分析当中经常会用到的,可以说日常碰到的大部分的分析需求都可以用统计分析来解决。

理工科专业的同学大多在本科期间就学过概率与统计这门课,这部分的基础应该还是比较扎实的。对于没有基础的同学,有一本叫《深入浅出统计学》的书非常值得一读,豆瓣上的评分8.5分。

这本书非常通俗易懂,讲理论知识的时候结合了很多案例,把统计学应用到解决实际问题当中,让原本枯燥的统计学原理变得有趣起来,适合非专业人士入门学习。

掌握数据库技能

做数据分析离不开查询数据库,这里主要涉及的是SQL。对于传统的数据库如MySQL,SQL Server,Oracle,或者大数据平台Hadoop,都可以通过SQL查询的方式来获取数据。入门SQL的书推荐一本《MySQL必知必会》,豆瓣评分8.4分。

这本书实践性很强,教你怎么用SQL语句操作MySQL。可以自己在电脑上装一个MySQL,跟着书中的案例操作一遍。

掌握Python或者R

Python和R是数据分析当中最常用的两门语言。R是为数据分析而生的一门语言,但Python在数据分析方面有后来居上的趋势。公司里的数据科学团队在几年前还是用R做的分析,最近一年已经转向Python了,身边的朋友也听到很多R转Python的。性能上来说,Python的速度更快,可以处理上G的数据,而R不行。所以长远来说,我还是看好Python的。

讲Python基础的有一本《A byte of Python》非常推荐,我当初就是看这本书入门的,读起来很轻松,两三天就可以读完。网上已经有人把这本书翻成中文,地址在这儿:介绍 · 简明 Python 教程

数据分析相关的,推荐这本《利用Python进行数据分析》,豆瓣评分8.5分。

作者是广受好评的pandas库的开发者。读完这本书,可以对用Python做数据分析涉及到的一些工具、怎样用pandas、怎样做数据可视化有比较详尽的了解。

机器学习

数据分析如果继续深入的话,可以学习机器学习。机器学习涉及的理论主要是分类、回归、聚类、决策树、贝叶斯定理等。机器学习相关的书强烈推荐一本《机器学习实战》,豆瓣评分8.2分。

这本书介绍了机器学习中最常用的几种算法,对算法背后的数学原理也有介绍,对于理解机器学习的算法非常有帮助。书中的代码和例子都是用Python实现,非常适合有python基础的同学学习。

以上这些是数据分析最基础的技能,有编程基础的同学花两三个月差不多就能入门了,零基础可能要多费点时间。当然看书学习只是掌握理论知识,要真正的掌握还是要在项目中去实践。

查询数据库前十条数据_入门数据分析的一些建议相关推荐

  1. 数据库查询前十条数据_西门子PLC1200组态王-Access数据库-⑨数据库查询

    西门子PLC1200-组态王跟Access数据库--⑨数据库查询 组态王记录不同类型变量到数据库,和数据库数据查询到组态王界面 1.0 从左边栏选择表格模板,level1和level2分别设置整型和布 ...

  2. java显示数据库_java查询数据库中的数据并显示

    java查询数据库中的数据并显示 关注:93  答案:2  mip版 解决时间 2021-01-17 16:29 提问者笑低了眉眼 2021-01-17 04:11 button.addSelecti ...

  3. mssql查询括号前的数据及括号中的数据

    mssql查询括号前的数据及括号中的数据 select CASE WHEN CHARINDEX('-',Name)=0 THEN REVERSE(stuff(reverse(Name), 1, cha ...

  4. mysql source导入_读取MySQL数据库中的数据【Python数据分析百例连载】

    当所需的数据存贮在MySQL数据库中时,那么数据分析首要任务就是要通过Pandas读取MySQL数据.例如,某网站注册用户信息保存在MySQL数据库中,如图所示(部分数据),下面将使用Pandas的r ...

  5. mysql查询数据库创建语句是_查询数据库语句

    一.Select语句:67页 select语句除了可以查看数据库中的表格和视图的信息外,还可以查看SQL Server的系统信息.复制.创建数据表,其查询功能强大,是SQL语言的灵魂语句,也是SQL中 ...

  6. 微信小程序云开发记账本计算总金额,查询突破二十条数据的限制,条件查询、根据时间排序

    //这里用async await 获取一下 集合中记录的总数 ,这样比较方便... chaxunout: async function () {//查询函数this.setData({year1:th ...

  7. Qt实现按照时间查询数据库中的数据

    效果: 原理: 1.在保存数据的时候就需要记录当前数据条目的时戳,我是按照1970-01-01 08:00:00为起始时间点,计算当前时间离这个起始时间一共是多少毫秒,如下: QDateTime or ...

  8. java如何向数据库中插入数据_如何控制Java代码向数据库中插入数据

    慕哥6287543 Java程序向数据库中插入数据,代码如下:123456789101112131415161718192021222324252627282930313233343536373839 ...

  9. Guns根据条件查询数据_入门试炼04

    一.找到Controler,对方法进行修改即可实现 二.修改list方法 修改钱的方法: /*** 获取房屋管理列表**wrapper 条件*/@RequestMapping(value = &quo ...

最新文章

  1. Swift快速入门之getter 和 setter
  2. 分享文章《控制情绪,享受人生》
  3. c:数据结构-线性表
  4. .NET Forms身份验证
  5. c++ _mkdir无法创建文件夹_Python脚本4:根据txt文本,批量创建文件夹
  6. 2013年6月13日星期四
  7. puml绘制思维导图_免费在线思维导图神器 简单又漂亮 比Wodrd好用很多
  8. OpenCV-图像处理(05、图像混合)
  9. DB9接口详解---DB9引脚在 UART,CAN,RS485中的定义
  10. 计算机网络技术发展四个阶段,计算机网络的发展分哪四个阶段,特点?
  11. gitlab: [remote rejected] pre-receive hook declined
  12. C/C++程序设计与算法第十一周:零点定理求方程的根
  13. Excel 18个快捷键
  14. Java随笔记 - TCP通信的基本过程,三次握手,四次挥手
  15. 一.正则表达式转换为有限状态自动机:正则表达式转NFA
  16. GitLab设置受保护的分支
  17. 【趣文】秦始皇与区块链竟然有关系
  18. 【课程笔记】计算机体系结构复习笔记
  19. 2022TikTok行业发展现状
  20. flink ui含义图解

热门文章

  1. 微信小程序实现选项卡
  2. HDU 5919 分块做法
  3. Canny边缘检测及C++实现
  4. [转载]Java并发编程:深入剖析ThreadLocal
  5. jqmobile小技巧
  6. 12-22 挑战留给自己,积极面对
  7. (转)getElementByID getElementsByName getElementsByTagName用法详解
  8. Android 中activity中传递数据的方式
  9. postgresql9.1_gaussdb200_解析表结构
  10. Leetcode-1155 Number of Dice Rolls With Target Sum(掷骰子的N种方法)