以下是一篇15年的文章的译文:https://dwainegilmer.wordpress.com/2015/01/28/microsoft-trill-for-streaming-analytics-from-microsoft-research/

当今许多大数据应用程序套件的重点是数据存储。它们是围绕狭窄范围的数据集设想和设计的,通常是为了组织内的特定业务功能使用。

对新数据源的不断增加的需求使得许多BI应用程序在短短几年内就过时了。令人遗憾的是,对于许多公司而言,他们的大数据战略是存储数据,直到其实际业务价值可以在未来某个时间解锁。

在这些快节奏的时代,大多数企业迫切需要是实时的处理数据,而不是仅仅存储数据并应用一组工具进行滞后的离线分析。Trill则可以从数据中实时提取可用的知识和分析结果。基于实时的当前信息对决策提供可靠的支持和制定。这最终将改善整个决策过程。

流分析应用程序在数据到达时就可以开始搜索分析数据。而不是通过查询数据库以拉取数据信息流来进行分析,将常设查询应用于在捕获数据时产生事件(推送)的数据流。

与传统关系型数据库比较。SQL Server旨在存储和管理静态数据,Trill则旨在分析动态数据。基于Trill构建的应用程序将流传递给一组查询,这些查询分析数据并在找到匹配项时触发事件完成实时结果推送。

在大数据的新时代,公司正在竞相推出大数据系统。这些系统本质上是用于检查,转换,存储和建模业务数据的第一代紧耦合平台。Microsoft Trill(每天万亿事件)是Data Analytics层的一部分。

可以在Microsoft.com上可以找到介绍Trill的Microsoft Research(MSR)研究论文  。 Microsoft Trill是用于分析的流分析引擎或查询处理器。Trill被设计为大数据的查询处理器,有三个要求:

1) 查询模型:使用早期结果实时处理流式和关系查询,并提供离线查询;

2) 结构和语言集成:提供从高级语言库轻松访问,以便与现有分发结构和应用程序集成;

3) 性能:低延迟和高吞吐量。

与Apache Storm,Microsoft SQL StreamInsight,Vertica Shark和Naiad Spark流相比,Trill具有许多优势。Trill也将取代微软的StreamInsight。下面是Microsoft的图表,说明了差异并比较了功能集。

Trill具有时间语义化查询的能力,允许用户“通过实时或离线数据集的方式进行复杂查询”,并且由于分析引擎“在预期的使用场景中具有高性能”,因此可以比以前更快地获得结果。

Trill使用批量处理事件的新技术和算法。并且,这些批次中的数据以一种促使查询更有效地方式执行与组织。

结论

事实上,我们目前的总存储容量能提供的能力远远落后于存储新的和变化的数据流不断增长的需求。此种情况下很快就会引发以处理数据和流分析为处理方式的转变。

额外的阅读资料:

您可以从以下出版物中了解有关Trill的更多信息,或者从我们的幻灯片中了解更多信息pdf | pptx。

Trill现在是开源的,可以在GitHub上找到!

  • 您可以在此处通过NuGet安装Trill二进制文件。

  • 此处提供了 Trill源

  • 可以在此处下载用于演示Trill使用的示例。

  • 可以在此处浏览Trill API文档。

  • 可以在此处找到阐述Trill的论文。

原文地址:https://www.cnblogs.com/CattaC/p/10143445.html


.NET社区新闻,深度好文,欢迎访问公众号文章汇总 http://www.csharpkit.com

微软开源的Trill是什么?相关推荐

  1. 微软开源数据处理引擎 Trill,每天可分析万亿次事件

    微软近日开源了数据处理引擎 Trill,它每天能够分析万亿次事件. 项目地址:https://github.com/Microsoft/trill 当下每毫秒处理大量数据正成为一种常见的业务需求,此次 ...

  2. 微软开源数据处理引擎 Trill,每天可分析万亿次事件

    微软近日开源了数据处理引擎 Trill,它每天能够分析万亿次事件. 项目地址:https://github.com/Microsoft/trill 当下每毫秒处理大量数据正成为一种常见的业务需求,此次 ...

  3. 基于微软开源深度学习算法,用 Python 实现图像和视频修复

    ‍‍ 作者 | 李秋键 编辑 | 夕颜 出品 | AI科技大本营(ID:rgznai100) 图像修复是计算机视觉领域的一个重要任务,在数字艺术品修复.公安刑侦面部修复等种种实际场景中被广泛应用.图像 ...

  4. PyTorch实现,GitHub 4000星:这是微软开源的计算机视觉库

    视学算法报道 编辑:魔王.陈萍 转载自公众号:机器之心 本文介绍了微软开源的计算机视觉库,它囊括了计算机视觉领域的最佳实践.代码示例和丰富文档. 近年来,计算机视觉领域突飞猛进,在人脸识别.图像理解. ...

  5. PyTorch实现,GitHub star 4k+:这是微软开源的计算机视觉库

    点击上方,选择星标或置顶,不定期资源大放送!阅读大概需要15分钟 Follow小博主,每天更新前沿干货[导读]本文介绍了微软开源的计算机视觉库,它囊括了计算机视觉领域的最佳实践.代码示例和丰富文档. ...

  6. 解读微软开源MMLSpark:统一的大规模机器学习生态系统

    AI前线导读:目前,有很多深度学习框架支持与Spark集成,如Tensorflow on Spark等.然而,微软开源的MMLSpark不仅集成了机器学习框架(CNTK深度学习计算框架.LightGB ...

  7. 【效率】微软开源最强Python自动化神器!不用写一行代码!

    相信玩过爬虫的朋友都知道selenium,一个自动化测试的神器工具.写个Python自动化脚本解放双手基本上是常规的操作了,爬虫爬不了的,就用自动化测试凑一凑. 虽然selenium有完备的文档,但也 ...

  8. 4计算准确率_PyTorch实现,GitHub 4000星:这是微软开源的计算机视觉库

    本文介绍了微软开源的计算机视觉库,它囊括了计算机视觉领域的最佳实践.代码示例和丰富文档. 机器之心报道,编辑:魔王.陈萍. 近年来,计算机视觉领域突飞猛进,在人脸识别.图像理解.搜索.无人机.地图.半 ...

  9. 微软开源的Web测试和自动化神器 Playwright

    Playwright 是微软开源的一个用于 Web 测试和自动化的框架, 提供了可靠的端到端测试, 功能非常强大, 可以在测试, 爬虫,自动化场景中使用. 跨浏览器 Playwright 支持所有现代 ...

最新文章

  1. Win7部署基础知识(7):使用Imagex捕获和安装映像
  2. AI公开课:19.04.17杨松帆—好未来AI Lab负责人《为人工智能时代打造一个AI老师》课堂笔记以及个人感悟
  3. [html] button标签的type默认值是什么呢?
  4. 连接真机开发安卓(Android)移动app MUI框架 添加购物车等——混合式开发(四)
  5. 随机数------选双色球
  6. 计算机基础知识进制的转换,计算机基础之各进制间的相互转换
  7. 苹果内置录屏SDK-ReplayKit库的使用说明
  8. Unity C# 将String字符串转换为16进制Byte数组
  9. 汇编语言中间接寻址(间接操作数)与变址寻址(变址操作数)的区别
  10. 面经:计算机视觉工程师(字节跳动-飞书部门)
  11. YbtOj#20073. 「NOIP2020 模拟赛 B 组 Day6」钻石守卫
  12. Redux以及Flux介绍
  13. c语言程序设计第二版(张磊),C语言程序设计教程(第2版) 教学课件 张磊 第9章 文件程序设计.pdf...
  14. upperbound找不到_关于lower_bound( )和upper_bound( )的常见用法
  15. [SDOI2012]拯救小云公主
  16. 春季出游将至 Bingdata大数据详解春季踏青游趋势
  17. 技术团队,是不是在祸害公司?
  18. 神舟z7m安装Linux,神舟战神Z7M-CT7GS笔记本win10系统下载与安装教程
  19. 使用STM32CubeMX把USB配置成虚拟串口(virtual com port)
  20. 树叶贴画机器人_树叶贴画怎么保存塑封

热门文章

  1. 【C】C语言结构体指针的语法
  2. MySQL5.6二进制软件包编译安装详解(三)
  3. L2-020. 功夫传人
  4. Serv-U服务器的管理3
  5. 【Linux】IPC-消息队列
  6. zabbix2.2升级到zabbix3.0.2
  7. [禅悟人生]尊严非席, 不可卷起
  8. 在web网页中正确使用图片格式
  9. 推荐:Flowchart 一种通过文本方式描述的流程图
  10. OceanBase开源,11张图带你了解分布式数据库的核心知识