内存 增量数据持久_内存中数据模型和大数据持久性
内存 增量数据持久
ORM框架在需要与关系数据库进行交互时可以帮助开发人员。 对于关系数据库,有许多出色的ORM框架,例如Hibernate和Apache OpenJPA,其中一些确实很棒。
如今,大数据正在涌现,越来越多的人开发在大数据上运行的应用程序。 已经开发了各种NoSQL数据库来存储这种大小的数据,即列存储和文档存储。
尽管ORM框架解决了许多问题(即使它们也有缺点)并且在关系数据库方面如此普遍,但由于NoSQL数据库没有通用标准,因此NoSQL数据库的情况有所不同。
Apache Gora旨在通过特定于数据存储的映射为用户提供易于使用的内存数据模型和大数据框架的持久性。 Apache Gora的总体目标是成为大数据的标准数据表示和持久性框架。
Gora支持持久存储到列存储,键值存储,文档存储和RDBMS,并通过广泛的Apache Hadoop MapReduce支持来分析数据。
Gora使用Apache Avro,并且依赖于特定于每个数据存储的映射文件。 与其他OTD(对象到数据存储)映射实现不同,在Gora中,数据Bean到数据存储特定的架构映射是显式的。 这样做的好处是,在使用HBase和Cassandra等数据模型时,您始终可以知道如何持久保存这些值。
Apache Gora的路线图
- 数据持久性:将对象持久保存到列存储中,例如HBase,Cassandra,Hypertable; 键值存储,例如Voldermort,Redis等; SQL数据库,例如MySQL,HSQLDB,本地文件系统或Hadoop HDFS中的平面文件。
- 数据访问:一种易于使用的Java友好通用API,用于访问数据,而不管其位置如何。
- 索引:将对象持久化为Lucene和Solr索引,使用Gora API访问/查询数据。
- 分析:通过Apache Pig,Apache Hive和Cascading的适配器访问数据并进行分析
- MapReduce支持:对数据存储中的数据提供现成的和广泛的MapReduce(Apache Hadoop)支持。
Apache Gora和当前解决方案之间有什么区别?
- Gora特别专注于NoSQL数据存储,但对SQL数据库的支持有限。
- Gora的主要用例是使用Hadoop访问/分析大数据。
- Gora使用Avro进行bean定义,而不是字节码增强或注释。
- 对象到数据存储的映射是特定于后端的,因此可以利用完整的数据模型。
- Gora很简单,因为它忽略了复杂SQL映射。
- Gora将使用Pig,Lucene,Hive等支持持久性,数据索引和分析。
Apache Gora支持的数据存储
- Apache Accumulo
- 阿帕奇·卡桑德拉(Apache Cassandra)
- 亚马逊DynamoDB
- Apache HBase
- 阿帕奇·索尔(Apache Solr)
- MongoDB
Apache Spark是大数据开发人员的一个光辉的项目。 Spark提供了更快,更通用的数据处理平台。 使用Spark,您可以在内存上运行程序的速度比Hadoop快100倍,在磁盘上的速度快10倍。 当前Gora不支持Spark,在我的GSoC期间,我正在为Apache Gora实施Spark后端以填补这一空白。
资源资源
- http://gora.apache.org/current/tutorial.html#introduction
- http://gora.apache.org/current/tutorial.html#introduction
- https://github.com/apache/gora
- https://hadoop.apache.org/
- https://avro.apache.org/
- http://spark.apache.org/
- 大数据徽标来自: http : //www.smartdatacollective.com/sites/smartdatacollective.com/files/big-data-big_0.png
翻译自: https://www.javacodegeeks.com/2015/08/in-memory-data-model-and-persistence-for-big-data.html
内存 增量数据持久
内存 增量数据持久_内存中数据模型和大数据持久性相关推荐
- 大数据算法_【中科大】大数据算法(2020年春季)
算法与理论是计算机科学的核心领域之一.随着大数据时代的来临,传统的算法理论已经不能很好地解决人工智能. 物联网.工业制造等领域所遇到的实际问题.本门课程主要介绍基于大数据的新型算法技术,如随机采样.数 ...
- 内存中数据模型和大数据持久性
ORM框架在希望与关系数据库进行交互时可以帮助开发人员. 对于关系数据库,有许多出色的ORM框架,例如Hibernate和Apache OpenJPA,其中一些确实很棒. 如今,大数据正在涌现,越来越 ...
- jquery数据折叠_通过位折叠缩小大数据
jquery数据折叠 Sometimes your dataset is just too large, and you need a way to shrink it down to a reaso ...
- 数据资源丨开放中的行政大数据——国内篇(附链接)
来源:数据Seminar 本文约3000字,建议阅读6分钟 本文我们为你介绍目前国内行政大数据开放情况. 行政大数据是指政府行政部门为实现管理.监督和服务等目的而收集和保存的关于自然人或其他社会实体的 ...
- sqoop数据倾斜_北京卓越讯通大数据岗位面试题分享
北京卓越讯通面试题 学长1 1)笔试 (1)JAVA支持的数据类型有哪些?什么是自动拆装箱? (2)AtomicInteger和Volatile等线程安全操作的关键字的理解个使用 (3)创建线程有几种 ...
- python做数据和大数据区别_不懂Python,不懂大数据的人,和咸鱼有什么区别?
原标题:不懂Python,不懂大数据的人,和咸鱼有什么区别? 在这个处处充斥着大数据影响的时代之下,不懂Python,不懂大数据,你就可能轻易地错过身边的黄金. 我们生活在数据密布的环境中,就像< ...
- informatica数据脱敏_助您首个大数据项目破茧成蝶的实践指南
自从本世纪初软件应用开始在整个业务流程中盛行以来,一个不争的事实就是:数据改变了我们的工作方式.越来越多的企业认识到必须在大数据方面有所作为,但他们却并未切实规划出如何开展这项工作.而调查发现,切实展 ...
- 大数据相加_推动媒体融合与大数据相加发展
深圳特区报讯 7月7日至8日,备受瞩目的第十二届中国传媒年会在贵州贵安新区东盟国际会议中心举行.本次年会以"媒体深度融合与大数据"为主题,近300名与会嘉宾深入思考研讨媒体融合与大 ...
- python大数据平台_基于腾讯位置大数据平台的全球移动定位数据Python爬取与清洗...
前不久投稿了一篇论文是以腾讯位置大数据为基础进行人口空间化研究的,但是还未见刊,见刊后会给大家分享下具体的研究方法. 首先打开腾讯位置大数据星云图链接:https://xingyun.map.qq.c ...
最新文章
- POJ-3687-Labeling Balls
- Cut the Sequence(POJ3017)
- Python常用的模块和简单用法
- tomcat配置一个线程来调试ThreadLocal的代码问题
- socket编程中的异常处理
- a fast way to get list of all BSP application according to different search criteria
- c++歌手大赛系统_计人即讯|第十届程序设计大赛
- USACO Section2.1 Hamming Codes 解题报告 【icedream61】
- VB 字符串续行符最多25行…………
- 用于语音识别的数据增强
- python 实现 画图器_python实现画图工具
- 系统集成项目管理工程师知识点
- C++ 保存txt文本文件
- 无法理解高等数学怎么办?
- 猿题库高中同步微博运营策划
- 修改联通服务器,联通光猫dns设置服务器地址
- Windows学习总结(1)——win10系统最新快捷键汇总
- windows版本解说之长期服务版缺少应用商店的安装
- 死循环之----恐怖游轮
- 游戏App上架iOS被拒各种奇葩问题