表格结构数据特征&表结构数据特征

表格结构数据特征

数据类别:结构化数据&非结构化数据

结构化数据:交易数据、财务数据、产品信息、库存信息......

非结构化数据:图片信息、社交聊天记录、视频......

表格结构数据层级:对象间的父子级关系

父--->子:一个父级对象包含多个不同子级对象

子--->父:一个子级对象只属于某个特定的父级对象

表格结构数据的数据类型:数值型、文本型、逻辑性(True/False)

单元格的格式属性:数字格式&显示格式

数字格式:决定显示形式

显示格式:决定显示效果

表格结构数据获取方法

后台数据库系统

前端操作平台

企业外部渠道

表格数据结构数据使用方法

单元格值的引用方法:eg:=A1

单元格区域值的引用方法:eg:=A1:A10

表格结构数据查询/替换方法:crl+f/replace函数

表格结构数据的计算方法:直接计算&函数计算

表结构数据特征

(1)以字段或记录作为数据的引用、操作及计算的基本单位数据

(2)所有字段记录行数相同

(3)一个表中有且只有一个主键(主键特点:非空、不重复)

缺失值处理方法

        a、不处理

根据数据类型及生成信息重要程度的不同,使用不同的方法处理缺失值,若该缺失数据对分析影响不大,可保持原本信息不处理原则减少噪声。

       b. 特殊值填充

将空值作为一种特殊的属性值来处理,如将空值用“unknown”填充。

      c. 平均值/众数填充

  1. 如果空值是数值型的,就根据该属性在其他所有对象的取值的平均值来填充该缺失的属性值
  2. 如果空值是非数值型的,就根据统计学中的众数原理,用该属性在其他所有对象的取值次数最多的值(即出现频率最高的值)来补齐该缺失的属性值。

        d. 热卡填充

对于一个包含空值的对象,热卡填充法在完整数据中找到一个与它最相似的对象,然后用这个相似对象的值来进行填充。

       e. 最近邻法

先根据欧式距离或相关分析来确定距离具有缺失数据样本最近的K个样本,将这K个值加权平均来估计该样本的缺失数据。

        f. 模预测

基于完整的数据集,建立预测模型。对于包含空值的对象,将已知属性值代入方程来估计未知属性值,以此估计值来进行填充。

      g. 多重插补

一般对于小数据会使用这个方法,因为多重插补会反复训练模型,然后评价模型的效果。因此需要大量的时。

        h. 人工确认修改

重要数据需要联系相关人员进行核对确认。

表结构数据的获取方法

“应用”&“引用”

应用:适合数据量小的数据分析场景

引用:数据实时更新,适用于数据量大的数据分析场景

数据系统

(1)关系型数据库管理系统:企业业务数据的存储、检测、访问和共享

(2)商业智能化系统-BI:为企业决策者快速提供完整、准确、深入的数据分析结果,帮助企业决策者实现商业洞察

(3)ETL:将数据经过抽取、清洗转换之后加载到数据仓库

(4)数据仓库-DW:储存分析所需要的不同数据源的所有相关数据

(5)OLAP:连接信息孤岛、创建多维信息模型

CDA学习-----数据结构相关推荐

  1. 经典高斯算法,一起学习数据结构和算法吧!

    为什么80%的码农都做不了架构师?>>>    对于想提高编程技巧的人,数据结构和算法是必修的,举一个最经典的故事向新手们说明算法的伟大. 话说很久很久以前...,一次数学课上,老师 ...

  2. 数据结构稀疏矩阵的加法十字链表_学习数据结构和算法的框架思维

    ----------- 通知:如果本站对你学习算法有帮助,请收藏网址,并推荐给你的朋友.由于 labuladong 的算法套路太火,很多人直接拿我的 GitHub 文章去开付费专栏,价格还不便宜.我这 ...

  3. 在Object-C中学习数据结构与算法之排序算法

    笔者在学习数据结构与算法时,尝试着将排序算法以动画的形式呈现出来更加方便理解记忆,本文配合Demo 在Object-C中学习数据结构与算法之排序算法阅读更佳. 目录 选择排序 冒泡排序 插入排序 快速 ...

  4. 学习数据结构和算法前瞻

    我并非计算机科班出身,以前只对C.java.Matlab.Python语言有粗略的了解,以前写代码的时候只会考虑功能能实现就行了,并不考虑性能方面的问题,对数据结构与算法从未学习过,更不了解什么时间复 ...

  5. 02如何抓住重点,系统高效地学习数据结构与算法?

    以下内容总结自极客时间王争大佬的<数据结构与算法之美>课程,本文章仅供个人学习总结. 什么是数据结构?什么是算法? 从广义上讲,数据结构就是指一组数据的存储结构.算法就是操作数据的一组方法 ...

  6. 如何抓住重点,系统高效地学习数据结构与算法?

    你是否曾跟我一样,因为看不懂数据结构和算法,而一度怀疑是自己太笨?实际上,很多人在第一次接触这门课时,都会有这种感觉,觉得数据结构和算法很抽象,晦涩难懂,宛如天书.正是这个原因,让很多初学者对这门课望 ...

  7. 【完整目录】每天5分钟用C#学习数据结构

    [基础知识]| 作者 / Edison Zhou 这是恰童鞋骚年的第250篇原创内容 不知不觉,每天5分钟学习数据结构就更新完了,本篇将该系列所有文章整理起来作为一个目录,方便你的快速阅读. 1线性表 ...

  8. 数据结构与算法深入学习_我最喜欢的免费课程,用于深入学习数据结构和算法...

    数据结构与算法深入学习 by javinpaul 由javinpaul Data structures and algorithms are some of the most essential to ...

  9. c# 插入数据到 uniqueidentifier_每天5分钟用C#学习数据结构(16)二叉树 Part 2

    [基础知识]| 作者 / Edison Zhou这是恰童鞋骚年的第209篇原创文章 上一篇开始了树与二叉树之旅,本篇会介绍二叉树的基本实现.1二叉树的代码实现 二叉树节点的定义实现 /// /// 二 ...

最新文章

  1. Linux DHCP服务搭建
  2. C#中String对象转换为Font对象的方法
  3. WLAN与WIFI的区别
  4. 软件公司与非软件公司区别(纯个人看法)
  5. java中static代码块与非静态代码块
  6. SAP Cloud for Customer(C4C)和微软Outlook的集成
  7. java w732_技术联盟W732系统下载
  8. 遇到 oracle 错误 25153,EXP时,出现3113的错误,不知道怎么解决?
  9. Android混淆从入门到精通
  10. 修改拦截器里的请求头_OkHttp4 源码分析(1) 请求流程分析
  11. docker配置深度学习环境
  12. 解决问题:Appium WebView 跳转页面后无法定位元素
  13. 关于Java观察者模式的一点思考
  14. 解决向日葵远程不能退出腾讯安全管家,点退出时没反应,也不能远程卸载
  15. 用python简易制作晋江城小说下载器(GUI+爬虫+多线程)
  16. 帆软参数设置_报表工具FineReport新版本参数全攻略
  17. ICQ官方中文版 v10.0.12161.0
  18. angular ngRoute
  19. c语言s-next,memset_s - [ C语言中文开发手册 ] - 在线原生手册 - php中文网
  20. Office 365禁用所有宏,且不通知

热门文章

  1. unity游戏,插入聚合广告TopOn,优量汇,穿山甲,groMore,快手等,隐私协议解决方案!(包括传感器的使用目的和方式,还有Sdk使用Mac地址和软件列表的目的)
  2. 百度招财猫新加入区块链游戏,喜欢数字猫咪的你了解一下
  3. 每日一句情话源码php,每日一句情话
  4. Analyze 菜单分析
  5. 锤子android 7,锤子坚果Pro 2工信部入网:TFT显示屏,Android 7.1.1
  6. 做好QA质量管理,4大注意事项和技巧。
  7. 计算机信息学院开学演讲稿,大学开学演讲稿范文(精选16篇)
  8. 现代移动端网络短连接的优化手段总结:请求速度、弱网适应、安全保障
  9. 计算机桌面方向更改,win10电脑屏幕方向颠倒了怎么办?更改win10屏幕显示方向方法...
  10. 以梦为码,最燃的华为开发者大会2020(Cloud)有这些看点