物联网、车联网、工业互联网大数据平台,为什么推荐使用TDengine?

大数据有很多处理工具,最流行的当属Hadoop系统。Hadoop生态包括HDFS, HBase, Hive, YARN, Storm, Spark, Zookeeper等系列工具。整个大数据平台中往往还有Kafka, Redis等类似的消息队列、缓存软件。这些软件较好的解决了通用大数据问题,但是物联网、车联网、工业互联网等场景的数据有其独特性,如果充分利用这些独特之处,可以推出一个专有的物联网大数据处理平台,数量级的提升数据处理能力,并减少研发和运维成本。刚刚开源的TDengine就是这样的产品。

TDengine专为物联网、车联网等时序空间大数据设计,其核心功能是时序数据库。但为减少大数据平台的研发和运维的复杂度,更进一步降低计算资源,TDengine还提供大数据处理所需要的消息队列、消息订阅、缓存、流式计算等功能。TDengine的优势十分明显,主要表现在以下几个方面。

1: 大幅提升数据插入和查询性能

物联网的数据是结构化的,因此TDengine采取的是结构化存储,而不是流行的KV存储。物联网场景里,每个数据采集点的数据源是唯一的,数据是时序的,而且用户关心的往往是一个时间段的数据,而不是某个特殊时间点。基于这些特点,TDengine要求对每个采集设备单独建表。如果有1000万个设备,就需要建1000万张表。

基于这样的设计,任何一台设备采集的数据在存储介质里可以是一块一块连续的存放的,而且按照时间排序。因此查询单个设备一个时间段的数据,查询性能就有数量级的提升。另外一方面,虽然不同设备由于网络的原因,到达服务器的时间无法控制,是完全乱序的,但对于同一个设备而言,数据点的时序是保证的。一个设备一张表,就保证了一张表插入的数据是有时序保证的,这样数据插入操作就变成了一个简单的追加操作,插入性也能大幅度提高。

KV存储的好处是不用定义数据库表结构,每条记录都可以变换格式。但物联网、车联网这些场景里,一般数据格式是固定的,改动的频次很低,而且TDengine实现了一种高效的修改表结构的方法,因此TDengine采取格式化存储不会带来太大的不便。

2: 大幅降低硬件或云服务成本:

由于数据插入查询性能大幅度提升,系统所需要的计算资源就大幅减少。另外一方面,物联网采集的物理量的值是随时间改变的,但正常情况下,是渐变的,因此TDengine采取列式存储,将同一个物理量在多个时间点采集的值连续存放,这样能成倍的提高压缩效率。而且TDengine针对不同的数据类型采取不同的压缩方法,比如delta-delta 编码、simple 8B方法、zig-zag等等,这样更进一步的提高压缩率。与通用数据库相比,在已经测试过的物联网场景中,TDengine存储空间不到1/5,大幅节省存储资源。在TDengine公布的对比测试报告里,有如下的结果:

3: 大幅简化大数据系统架构

与互联网应用不一样的是,物联网场景中,只要指定联网设备数量,数据采集频次,系统所需要的流量是可较为准确估算出来的,不像双11,电商的流量可以几十倍的变化,而物联网的流量是较为平稳的。同时,物联网设备都有一定的数据缓存能力,以防止网络连接失败,因此物联网平台对消息队列的需求没有那么强烈。TDengine内部实现了一简单的消息队列,同时提供订阅功能,这样就不需要使用Kafka等类似的消息队列软件。

TDengine对数据库分配了固定的内存区域,新插入的数据,会先写入内存。内存按照先进先出的原则进行管理,内存不足时,老的数据会被持久化存储,而内存里的老数据会被最新的覆盖掉。TDengine还保证了任何一台设备最后一条记录一定在内存中,如果应用要获取每个设备的最新数据或状态,都将从内存里直接获取,这样的设计让系统可以不再需要Redis这类软件。

物联网数据是一个流数据,基于滑动窗口,TDengine后台定时的拉起查询计算,提供了一简化的流式计算,可以做各种实时的统计聚合操作,这样对于一般的物联网场景,不再需要使用Spark等类型的流式计算软件。

因此TDengine提供了大数据处理所需要的数据库、缓存、消息队列、流式计算等系列功能。使用TDengine,在物联网大数据平台中完全可以抛弃掉Kafka, HDFS,HBase,Spark, Redis等软件,大幅简化大数据平台的设计,降低研发成本大,而且系统将更加健壮,数据的一致性更有保证。

4: 强大的历史数据分析能力:

TDengine设计上让用户对历史数据和实时数据的处理完全透明,不区分历史数据和实时数据。用户只需要在SQL语句里指定时间段,TDengine自动决定是否从内存、从本地硬盘,还是从网络存储上获取数据,这样应用的实现变的简单。

每个设备的数据按块存储,而且每个数据块都已经做了预聚合(比如和、最大、最小值等),这样执行一个设备一个时间段的各种统计操作,有可能不用扫描原始数据,就能计算出来,性能大幅提升。即使有的计算需要扫描原始数据,但由于数据是一块一块连续存储的,读取速度远超通用数据库,计算分析速度也是大幅提升。而且由于结构化存储,解压后,不用做任何解析,读进内存就可以直接计算,相对于NoSQL数据库,计算分析速度也是大幅提升。

TDengine定义了一新的概念超级表,用以描述同一类型的设备。给每个设备或表打上静态标签后,就可以用标签值筛出一部分满足过滤条件的设备,然后对这一部分设备的数据进行聚合。TDengine还设计了一特殊的机制,对于多个设备数据聚合,仅仅需要扫描一次数据文件,这样大幅减少IO操作次数,提高聚合计算速度。为提高易用性,用户可以通过TDengine自带的shell, 或者Python, R, Matlab等工具直接进行各种Ad Hoc的查询或分析。TDengine用来做物联网、车联网、工业互联网的数据仓库,会是一理想的选择。

5: 零运维管理,零学习成本

TDengine安装包不到2M,下载、安装几秒钟搞定。对于企业版,把一台机器加入集群一条命令就能完成,而且数据库是实时自动备份,不用手动分库分表,运维极其简单。系统使用标准的SQL,支持C/C++, Java,Python,Go等各种语言开发接口,支持JDBC,支持RESTful接口。使用起来象是在使用MySQL,几乎不需要学习成本。

6: 与第三方工具无缝集成

目前TDengine在数据采集侧,已经支持Telegraf, Kafka,后续还将支持MQTT,OPC等。在应用侧,已经支持Grafana可视化工具,支持Matlab,R以及一些BI工具。因为TDengine支持JDBC接口,很容易实现与第三方工具的接口,可以预见,更多的工具将会被无缝集成。

对于运维监测场景,不用写任何代码,只要将开源的Telegraf, Grafana与TDengine配置好,就可以迅速搭建一个高效的运维监测平台。

7: 开源

TDengine由北京涛思数据技术有限公司自主开发,没有依赖任何第三方软件。研发时间已经超过2年,而且已经有一批付费商业客户,涉及电力、数控机床、智慧城市、车辆网等多个领域,客户的使用反馈都很不错。可喜的是,涛思数据将TDengine的核心存储、计算引擎完全开源。TDengine的社区版完全能满足一定规模的物联网、车联网、工业互联网的应用需求。因为涛思数据核心团队就在北京,相比其他开源软件,应该能够给中国的软件工程师提供更好的本地服务。

结语

TDengine在易用性、功能上、性能上已经远超其他时序数据库。采用TDengine,物联网、工业互联网、运维监测的大数据平台的搭建变得极为简单,具备超强性能,不仅降低硬件成本、运维成本,还能大幅降低对研发和运维人员的需求。

因为是开源免费的,而且安装包不到2M,不妨访问tdengine.com下载一个试试。

物联网、车联网、工业互联网大数据平台,为什么推荐使用TDengine?相关推荐

  1. 物联网、工业互联网大数据的特点

    物联网.工业互联网大数据的特点 随着数据通讯成本的急剧下降,以及各种传感技术和智能设备的出现,从手环.共享出行.智能电表.环境监测设备到电梯.数控机床.挖掘机.工业生产线等都在源源不断的产生海量的实时 ...

  2. 清华大学软件学院院长王建民:以数字基建为契机,加强工业互联网大数据软件建设...

    来源:中国电子报 作者:清华大学软件学院院长王建民 本文约3250字,建议阅读5分钟 工业互联网大数据软件基础设施建设对工业领域激活大数据资产.导入智能化技术具有重大基础支撑作用. 编者按:3月4日, ...

  3. “新基建”提速,工业互联网大数据发展迎新机遇

    云栖号资讯:[点击查看更多行业资讯] 在这里您可以找到不同行业的第一手的上云资讯,还在等什么,快来! 近期,中央政治局密集召开会议研究新冠肺炎疫情防控工作,部署统筹做好疫情防控和经济社会发展工作, 5 ...

  4. 深掘工业互联网大数据五大维度

    我国尚未形成统一的工业互联网大数据管理.服务和安全体系,工业互联网大数据资源存在孤立.分散.封闭等问题,数据价值未能得到有效利用,数据主权和数据安全面临重大威胁.当前,我国正在推进以国家工业互联网大数 ...

  5. CSDN开发者周刊 TDengine:专为物联网订制的大数据平台 YugaByte DB:高性能的分布式ACID事务数据库

    CSDN开发者周刊:   TDengine:专为物联网订制的大数据平台 YugaByte DB:高性能的分布式ACID事务数据库 CSDN开发者周刊:只为传递"有趣/有用"的开发者 ...

  6. 工业互联网大数据中心使用 KubeEdge 实践

    项目背景 2018年,工信部启动了国家创新发展工程,建设工业大数据中心.中国移动在该项目中承担了边缘协同和数据采集相关功能的研发. 要求和挑战 要求 从工厂收集生产和运行数据并将数据发送到云端 云中的 ...

  7. KubeEdge在国家工业互联网大数据中心的架构设计与应用

    摘要:在18年的时候,工信部开展了一个叫国家创新发展工程,这个工程中提出了要建立一个国家工业大数据中心,中国移动在其中承担了边缘协同与数据采集相关功能的研发.本文将从该项目背景下面临的问题与挑战.技术 ...

  8. 典型工业企业大数据平台解决方案(含数据治理)

    一.总体思路 当前,工业企业产生的数据日与俱增,如何利用大数据为企业产生驱动力.竞争力成为工业企业面临的重要问题.工业企业大数据平台建设的总体思路是将现有PLC.MES.ERP.CRM.SRM.SCM ...

  9. 国内跨云端平台应用的大数据平台供应商,基于Hadoop的互联网大数据平台解决方案,武汉数道云...

    跨云端大数据平台是什么?有何实质性的价值呢?如何去实现跨云端大数据平台技术呢?这是耐人深思的话题. 高速发展的信息技术,不断扩张的数据库容量,互联网作为信息传播和再生的平台,"信息泛滥&qu ...

最新文章

  1. 刚子扯谈:微信 今天你打飞机了嘛吗?
  2. C语言——第0次作业(二)
  3. 厦门诺宝机器人_诺宝机器人编程软件
  4. 服务 TCP 断线错误分析
  5. mysql 5.1.73.tgz下载_Linux下安装python,mysql
  6. iOS10 NSURLErrorDomain Code 1200
  7. 网格搜索支持向量机运行结束不了
  8. 20165236 2017-2018-2 《Java程序设计》结对编程练习_四则运算
  9. go ssh 执行多个命令_Gox语言中通过SSH远程执行命令及上传下载文件-GX10
  10. Spark入门(Python版)
  11. 深入浅出聊Unity3D优化:从Draw Calls到GC
  12. Android studio3.2学习开发JNI并且生成so库教程
  13. CS224N笔记——TensorFlow入门
  14. python怎么获取lol皮肤名称_英雄联盟手游免费皮肤获取攻略 LOL免费皮肤怎么得...
  15. 信道估计matlab代码
  16. 用了三星Dex,我已经快一个月回家没开过电脑了
  17. opencv Library QUIRC is not linked解决办法
  18. matlab红外遥感温度反演,热红外遥感地表温度反演研究现状与发展趋势
  19. 【190222】VC++ 社区视频监控系统源代码
  20. 手势识别整体设计流程方案

热门文章

  1. 关于“服务器提交了协议冲突. Section=ResponseStatusLine问题请
  2. asp.net页面回传与js调用服务端事件,Postback的原理
  3. CSS: 解决100% 高度失效 height 100% is not working when scrolling down page
  4. WordPress 默认主题自定义页面模板
  5. 解决kindeditor在线编辑器 过滤dl、dd、dt的两种方法
  6. 梯度下降法、牛顿法和拟牛顿法——机器学习面试
  7. 爬虫入门五(Phantomjs和selenium)
  8. 斗地主AI算法——第六章の牌型判断
  9. Linux中修改环境变量及生效方法
  10. 小记 cin/get/getline