2021-10-08 存储扫盲01
1、结构化数据?
答:是高度组织和整齐格式化的数据,更容易使用的数据类型,计算机可以轻松的搜索它,
也称为定量数据,会被统一的结构加以表示信息。项目中,保存和管理这些数据的一般为关系数据库。
总结:结构化数据,是指由二维表结构来逻辑表达和实现的数据,严格地遵循数据格式与长度规范,主要通过关系型数据库进行存储和管理。
也称作行数据,一般特点是:数据以行为单位,一行数据表示一个实体的信息,每一行数据的属性是相同的。
2、典型的结构化数据包括:信用卡号码、日期、财务金额、电话号码、地址、产品名称等。
3、非结构化数据?
答:本质上是结构化数据之外的一切数据,非结构化数据就是字段可变的的数据。存储在非关系数据库中,并使用NoSQL进行查询。
总结:非结构化数据,是数据结构不规则或不完整,没有预定义的数据模型,不方便用数据库二维逻辑表来表现的数据。包括所有格式的办公文档、文本、图片、HTML、各类报表、图像和音频/视频信息等等。
非结构化数据更难让计算机理解。
4、典型的人为生成的非结构化数据包括:
答:文本文件:文字处理、电子表格、演示文稿、电子邮件、日志。
电子邮件:电子邮件由于其元数据而具有一些内部结构,我们有时将其称为半结构化。但是,消息字段是非结构化的,传统的分析工具无法解析它。
社交媒体:来自新浪微博、微信、QQ、Facebook,Twitter,LinkedIn等平台的数据。
网站: YouTube,Instagram,照片共享网站。
移动数据:短信、位置等。
通讯:聊天、即时消息、电话录音、协作软件等。
媒体:MP3、数码照片、音频文件、视频文件。
业务应用程序:MS Office文档、生产力应用程序。
5、典型的机器生成的非结构化数据包括:
答:卫星图像:天气数据、地形、军事活动。
科学数据:石油和天然气勘探、空间勘探、地震图像、大气数据。
数字监控:监控照片和视频。
传感器数据:交通、天气、海洋传感器。
6、存储的TCO(Total Cost of Ownership)总拥有成本的概念。可以理解为从最开始到结束
总共需要的成本。
7、半结构化数据
答:半结构化数据,是结构化数据的一种形式,虽不符合关系型数据库或其他数据表的形式关联起来的数据模型结构,但包含相关标记,用来分隔语义元素以及对记录和字段进行分层。因此,也被称为自描述的结构。
常见的半结构数据有XML和JSON,比如:
<name>A</name><age>13</age><gender>female</gender>
2021-10-08 存储扫盲01相关推荐
- 2021.04.08 线程和进程的使用
2021.04.08 线程和进程的作用 直接通过Thread创建子线程 Thread(target=需要在子线程中调用的函数,args=(函数的实参列表)) from threading import ...
- 纬创科技面试 2021.10.09 19:00
纬创科技面试 面试时间:2021.10.09 19:00 面试方式:两个面试官 腾讯视频面试 面试总结:总体面试比较简单,但是问题较多,也很全面.总体上还是比较满意的 问题 基本情况: 介绍之前的项目 ...
- 【Flutter】Flutter 开发环境搭建 ( 2021年08月25日 补充最新资料 | 最新安装教程 )
文章目录 前言 一.Android Studio 环境安装 Flutter / Dart 插件 二.Flutter SDK 下载 三.设置 Flutter 环境变量 1.设置 Flutter SDK环 ...
- 2021第一学期学习笔记01
2021第一学期学习笔记01 摘要 一.知识点 1.1 追溯 1.2 区块链 二.项目报告 三.本地服务器 四.环境配置 4.1 JDK 展望 摘要 本周的学习情况主要是进行基础理论的学习,查找有关于 ...
- Python 最近两条好消息:①TIOBE排名超过C和Java②新版本发布3.10.0,还有今天刚发布的《What’s New in Python(2021.10.15)》
来自TIOBE的最新10月份统计数据显示,Python首次超越Java.JavaScript.C语言等,成为最受欢迎的编程语言.TIOBE过去20年一直在追踪编程语言的受欢迎程度,其数据来自于对25个 ...
- Fri Oct 7 10:08:00 UTC 0800 2016日期格式转换为 yyyy-mm-dd hh24:mi:ss (Map实现版)
更新: 枚举实现版本请看点击打开链接 --------------------------------------------------------------------------------- ...
- leetcode刷题记录2:进度64, 2021.10.23
文章目录 数组的度(题目编号697:[link](https://leetcode-cn.com/problems/degree-of-an-array/)) 二叉搜索树(题目编号700:[link] ...
- 58同城笔试(2021/10/23)
58同城笔试(2021/10/23) # 第一道 题目大意:输入"AAABBCCCDD",输出A3B2C3D2:输入ABCDEF,输出ABCDEF```java import ja ...
- 电动力学每日一题 2021/10/23 载流板产生的电磁场
电动力学每日一题 2021/10/23 载流板产生的电磁场 载流板的辐射 载流板的辐射 先验证电荷守恒: ∂ρ∂t=−∇⋅J=−∂∂zJz=0\frac{\partial \rho}{\partial ...
最新文章
- ehcache导致Tomcat重启出错
- itoa函数和atoi函数
- gbdt降低学习率可以实现正则化效果呢
- fake it till you become it
- uvalive4838(凸包+重心)
- python子类初始化父类_Python实现子类调用父类的初始化实例
- 在 Windows 中,当一个应用程序窗口被关闭,该应用程序将会保留在哪里?
- java安装找不到uri,【找不到与请求 URI匹配的 HTTP 资源】(转)
- CDH5 6 7安装包
- 三、Oracle 游标、存储过程、存储函数、触发器
- 一款软件测试脚本生成工具
- 大话数据结构-单链表勘误,计划调整
- 麦语言和python区别_放弃文华财经,自己编程实现期货程序化交易
- 因为没有使用有效的安全证书进行签名,该内容已被屏蔽。
- JSD-2204-Redis缓存-Day17
- 随时标注各种物件,一个小标签机就能搞定,汉印M11体验
- python中lis的意思_Python语言入门(二)
- Python数据分析高薪实战第八天 数据计算统计与分析
- Java算法分析与设计视频教程
- thumb指令和arm指令