大数据计算技术架构解析
大数据计算技术
- 大数据计算体系层次
- 1数据应用系统
- 2数据计算处理系统
- 3数据存储系统
- 3.1功能
- 3.1.1数据清洗、抽取和建模
- 3.1.1.1建模
- 3.1.1.1.1概念模型
- 3.1.1.1.2逻辑模型
- 3.1.1.1.3物理模型(存储)
- 3.1.2数据存储架构
- 3.1.3数据仓库和数据服务
- 3.1.4统一数据接口
- 3.2层次单元
- 3.2.1分布式文件系统:提供物理存储架构
- 3.2.2分布式数据库:not only sql database
大数据计算体系层次
1数据应用系统
2数据计算处理系统
计算模型(计算模式)的概念:
计算模型针对领域问题提出技术解决方案的基础模型、数据结构和算法
其中不同的计算模型的衡量标准:
3数据存储系统
3.1功能
3.1.1数据清洗、抽取和建模
3.1.1.1建模
3.1.1.1.1概念模型
(定义基于业务的实体类)
3.1.1.1.2逻辑模型
(给出实体类的更多表的细节(主键、外键等)在纸上表达的对数据(关系等)的抽象,数据库提供了数据的逻辑存储结构)
3.1.1.1.3物理模型(存储)
( 把实体数据存储到磁盘或者内存中,分布式文件系统提供数据的物理存储结构)
3.1.2数据存储架构
3.1.3数据仓库和数据服务
3.1.4统一数据接口
传统的数据库接口:ODBC、JDBC
问题:如果数据库既需要支持java编写的应用程序,也要支持c++写的程序,所以:
目前的大数据采用的是:统一数据读写接口
3.2层次单元
3.2.1分布式文件系统:提供物理存储架构
(对数据的物理存储架构,如果没有,则无法长期、持久保存数据)
例如:HDFS、GFS都采用主从架构
主节点管理一组从节点
数据划分为小的数据块,又生成备份,都会存储到文件系统中
3.2.2分布式数据库:not only sql database
大数据计算技术架构解析相关推荐
- 大数据平台架构浅析——以讯飞大数据平台Odeon为例
文章目录 大数据平台架构解析--以讯飞大数据平台Odeon为例 定义 功能 数据采集 数据开发 数据分析 数据编程 补充 大数据平台架构解析--以讯飞大数据平台Odeon为例 定义 Odeon大数据平 ...
- 大数据开发架构——调度系统的分类解析
调度系统的分类解析 一.什么是调度系统 二.为什么需要调度系统 三.调度系统的两大种类 1.资源调度系统 2.作业调度系统 四.作业调度系统的两大种类 1.定时分片类作业调度系统 2.DAG工作流类调 ...
- 多图技术贴:深入浅出解析大数据平台架构
目录: 什么是大数据 Hadoop介绍-HDFS.MR.Hbase 大数据平台应用举例-腾讯 公司的大数据平台架构 "就像望远镜让我们能够感受宇宙,显微镜让我们能够观测微生物一样,大数据正在 ...
- 《程序员》11月精彩内容:大数据平台架构与技术实践
本期<程序员>呈现大数据平台架构与技术实践精彩内容,汇聚来自去哪儿.游族网络.链家网.万达金融等公司的技术专家,将带领读者共同探讨热门技术应用和实践优化,深入解析蕴藏的数据价值,展现时下大 ...
- 软件架构设计原则和大数据平台架构层
1.软件架构设计的六大原则: 1)"开-闭"原则(OCP) Software entities should be open forextension, but closed fo ...
- 大数据实验报告总结体会_建设大数据中台架构思考与总结
简介 本文介绍完善的大数据中台架构了解这些架构里每个部分的位置,功能和含义及背后原理及应用场景. 帮助技术与产品经理对大数据技术体系有个全面的了解. 数据中台定义:集成离线数仓与实时数仓,并以多数据源 ...
- 二, 大数据基础架构Hadoop-HDFS入门和基本操作(基本组成, Shell操作, API操作, 读写流程) hf
一, HDFS概述 1.1 HDFS的产生背景和定义 随着数据量越来越大,我们需要把文件分布存储到多台计算机上,分布式文件管理系统作为一种管理多台机器上文件的系统应运而生, HDFS是其中的一种. H ...
- 大数据平台架构的层次划分
1. 数据源层:包括传统的数据库,数据仓库,分布式数据库,NOSQL数据库,半结构化数据,无结构化数据,爬虫,日志系统等,是大数据平台的数据产生机构. 2. 数据整理层:包括数据清洗.数据转换.数据加 ...
- ZUCC_大数据计算技术_大作业
大数据计算技术大作业 课程名称 大数据计算技术 实验项目名称 大作业 项目目的 天气数据分析,通过网络爬虫(自己编写网络爬虫程序),网址:https://www.tianqi.com,点击" ...
- 曙光大数据战略:解析XData一体机产品
曙光大数据战略:解析XData一体机产品 2013-06-15 05:20 [中关村在线 原创] 作者:王迪 评论(14) 如今,在巨大的行业变革驱动下,各大厂商都在不断研发新的产品来应 ...
最新文章
- IDEA自动生成对象所有set方法
- 学计算机一般要off,必须要学的电脑知识
- maven 指定jdk版本和编译版本.
- 生成验证码的流程分析.
- 如何修改pfpj的服务器,如何更改布局?
- fluent design_Fluent Design单选按钮,复选框,选择框,Java菜单
- 【MFC系列-第32天】控件自绘技术
- python调用usb摄像头黑屏_ORB-SLAM2编译安装和USB摄像头例程运行
- python自带的用于解析HTML的库HtmlParser
- python优先队列,队列和栈
- 链路层发现协议LLDP
- Python-openvn的初步理解(1)
- 安川机器人仿真软件MOTOSIM EG
- 翻译: 3.4. Softmax 回归 pytorch
- Vue框架的初识入门
- 2007年生日祝福:宝贝,谢谢您陪伴我走过人生风风雨雨,祝您2007年生日快乐!
- 构建信用卡反欺诈预测模型——机器学习
- 对话汇医慧影联合创始人郭娜:人工智能是分级诊疗的必然抓手
- python爬取知乎热榜了解时事
- SVN: an error occurred and the operation could not be completed
热门文章
- matlab停止运行命令_matlab终止运行命令
- __attribute__ 关键字小结
- Linux(Ubuntu系统)安装yum及源的更新(详细操作+文字描述!!!)
- Pdfarranger:开源的 PDF 分割和合并工具
- tomcat启动过程报the JDBC Driver has been forcibly unregistered问题的修复的一种方法
- i3型3D打印机制作详解——Marlin固件中文介绍
- Separating Skills and Concepts for Novel Visual Question Answering 论文笔记
- Nacos 集群 一致性协议实现之`Distro`协议浅析
- 刀塔传奇战斗系统分析
- Oracle设置自增序列