数据是现实世界运转留下的痕迹。
这些痕迹如何展示出来,则取决于我们采用什么样的数据收集和样本采集方法。

将具象的数据转化为抽象的数据,过程是绝对主观的。

数据的随机性和不确定性来源:

  • 过程本身
  • 数据采集方法

统计推断

关注的是如何从随机过程产生的数据中提取信息。

关于建模

数据即信息,不需要模型,了解相关性就够了。–Anderson

这是错误的想法。

什么是模型

模型是一个特殊的镜片,透过这个镜片观察和了解现实世界的本质,而这个镜片是什么,不同学科的人,有不同的工具。

如何构建模型

如何知道什么数据用什么模型?

一半是艺术,一半是科学。

这没有统一标准,如何选择模型,选择的理由是什么,都是摸着石头过河,加经验总结。

但是EDA(探索性数据分析)是一个比较好的起步方法。通过EDA绘制图形,从数据中获取直观的感觉。对帮助解决问题有很大帮助。

从简单处着手,先做起来,再做好。

END.

参考:

《数据科学实战》

【数据科学】什么是数据科学?相关推荐

  1. 要想进入顶级数据公司,2020年数据科学10大技能帮你加分

    过年期间,小编努力学习了一些数据科学技能,作为数据领域的人,最终总会阅读并了解很多很多东西. 数据科学对小编来说,是一种力量,能使企业和利益相关者做出明智的决策,并用数据解决问题. 如今,不是每个技术 ...

  2. 数据中心怎么建更科学

    从发达国家经验看,数据中心建设与布局往往与当地优势产业和特色资源相结合.专家建议,一方面,政府要通过制度创新和规则完善,做好顶层设计:另一方面,要以市场需求为导向,催生更广泛的应用场景.此外,政府还应 ...

  3. python数据科学讲解_数据科学的概念-Python数据科学技术详解与商业项目实战精讲 - Python学习网...

    数据科学的概念数据科学的概念 注册路由 最基础的路由定义方法是: Route::rule('路由表达式', '路由地址', '请求类型') 要使用Route类注册路由必须首先在路由定义文件开头添加引用 ...

  4. 大数据数据量估算_如何估算数据科学项目的数据收集成本

    大数据数据量估算 (Notes: All opinions are my own) (注:所有观点均为我自己) 介绍 (Introduction) Data collection is the ini ...

  5. 数据科学与大数据排名思考题_排名前5位的数据科学课程

    数据科学与大数据排名思考题 目录 (Table of Contents) Introduction介绍 Udemy乌迪米 Machine Learning A-Z™: Hands-On Python ...

  6. 数据中台是下一代大数据_全栈数据科学:下一代数据科学家群体

    数据中台是下一代大数据 重点 (Top highlight) Data science has been an eye-catching field for many years now to you ...

  7. 数据科学与大数据技术的案例_主数据科学案例研究,招聘经理的观点

    数据科学与大数据技术的案例 I've been in that situation where I got a bunch of data science case studies from diff ...

  8. 敏捷数据科学pdf_敏捷数据科学数据科学可以并且应该是敏捷的

    敏捷数据科学pdf TL;DR; TL; DR; I have encountered a lot of resistance in the data science community agains ...

  9. web数据交互_通过体育运动使用定制的交互式Web应用程序数据科学探索任何数据...

    web数据交互 Most good data projects start with the analyst doing something to get a feel for the data th ...

  10. 数据科学与大数据技术的案例_作为数据科学家解决问题的案例研究

    数据科学与大数据技术的案例 There are two myths about how data scientists solve problems: one is that the problem ...

最新文章

  1. php简单的log文件
  2. java script console_JS调试之console.log()作用与用法
  3. php循环语句w,php ftpconnectphp for 循环语句使用方法详细说明
  4. docker下MySQL修改配置并重启生效:表名不区分大小写
  5. NB-IOT技术以及物联网安全问题简述
  6. python—range() 函数—步长为正,左闭右开;步长为负,左开右闭
  7. 【论文阅读】Table-to-text Generation by Structure-aware Seq2seq Learning
  8. 【JAVA秒会技术之ActiveMQ】ActiveMQ的快速入门
  9. 大学学计算机考试大一,大学计算机基础大一考试必备题库[1].pdf
  10. 在Azure的云服务器上搭建个人网站
  11. linux Xinetd服务简介
  12. linux重装出现cannot load file 5555h,在安装系统出现error cannot load file code 5555h 的解决办法...
  13. 正点原子STM32 H743完成RT Thread下的LAN8720 网卡驱动 LWIP跑起来
  14. 计算机网络-数据传输
  15. matlab绘图学习(二维曲线)
  16. 使用win10自带的输入法打出带音标的拼音
  17. 微信小程序联盟:微信小程序之获取并解密用户数据(获取openId、unionId)
  18. ubuntu16.04 安装deepin软件商店
  19. 嵌入式软件开发必读的圣经
  20. 大数据建表及相关代码模板

热门文章

  1. 模板匹配之zernike矩
  2. 计算机课程设计评分表,课程设计的评分标准.doc
  3. mysql tb级数据库_4.5万字手把手教你实现MySQL TB级数据存储!!
  4. android开发 修改标题栏背景_Android哆啦A梦调试工具体验
  5. java 申明数组 默认构造函数_没有默认构造函数,如何定义对象的数组
  6. 9模块化学习 java_Java 9模块
  7. java设计模式工厂模式_Java中的复合设计模式
  8. dir函数python_Python dir()函数
  9. 如何在Linux和Mac中清除Bash历史记录
  10. 开课吧课堂:什么是HashSet类