近日,Precog宣布了他们的大数据仓储和分析服务,该服务负责处理数据的抓取、变换分析和可视化等过程,以及服务运行所基于的基础架构。不过,这一服务也通过RESTful API预留了各种开放的访问点,支持开发者和数据科学家控制整个过程。

Precog可以从各种数据源抓取输入数据,其中包括SQL数据库、Amazon S3、Hadoop、MongoDB、客户端Web应用和后端服务器等。RESTful API支持开发者从外部源(如Twitter或Facebook)、CSV文件或移动设备抓取数据。抓取的数据保存到一个叫做PrecogDB的定制数据库中,而且我们还可以使用人群统计、态度、位置和其他信息使数据更为丰富。

之后,数据可以通过多种手段加以分析,比如通过一个API,或是利用客户库(JavaScript,PHP),或者使用Labcoat(一种支持使用Quirrel这种声明式查询语言进行数据分析的IDE)。开发者可以创建自己的数据抓取、强化和分析模块,甚至可以将这些模块拿到市场上销售。

Precog能够将整个过程运行在不同的云供应商之上——如Amazon EC2和SoftLayer——以便增加系统的弹性和正常运行时间。

在InfoQ进行的一次采访中,Precog的CEO和创始人John A. De Goes解释到:

“(系统的)架构与数据库分析有些相似,比如都包括面向列的存储;但是其区别在于,前者支持完全异构的、非规范化的数据,通过对Quirrel的支持,相对于使用RDBMS进行分析,使用这种类似于“面向大数据的R”的语言,你能够很方便地执行很多更为高级的计算。”

PrecogDB是该平台的核心,它是一种用Scala编写的、面向列的数据库,运行在JVM上,它也为数据捕获和分析进行了优化。据De Goes介绍,PrecogDB中可以保存“测量数据,如点击、购买、尺寸、Twitter数据,或是收集自其他各种活动的日志信息”。他还补充 道,“Precog尚不能存储大块的非结构化数据,尽管在生物信息学和其他一些领域的应用的确有这种需求。不过这一功能已经在我们的路线图上了。”

至于Quirrel——这种由Precog实现的统计查询语言,De Goes谈到:“Quirrel很多方面都与R编程语言比较相似。像R一样,Quirrel也是为高级的分析与统计而设计的。但与R不同的 是,Quirrel并非图灵完备的语言,它是纯声明式的,利用它更容易高效地在大规模集群的机器中分发Quirrel查询(这也使Quirrel比R更容 易学习)。”

PrecogDB有一些“用于常见的分析与统计计算的内置例程”,它还提供了一个“细粒度的、基于能力的安全模型,支持来自移动设备或Web的应用程序通过RESTAPI直接访问其功能”。

Precog:大数据分析即服务相关推荐

  1. 大数据分析,利用向外扩展技术深入挖掘商业价值

    转载自:http://www.itongji.cn/article/101436252014.html 导语:大数据分析技术的价值在企业领域已经非常明确.充分利用良好信息的能力一直是摆在IT部门面前的 ...

  2. 大数据分析BI工具:帆软、Smartbi与神策数据的对比

    随着大数据技术与物联网.云计算.人工智能等新技术的相互融合渗透,多技术融合的新应用正在不断涌现,大数据已广泛应用于各个领域.我国大数据产业发展快速增长,产业规模不断扩大,产业链条加速完善,企业实力不断 ...

  3. 容器开启数据服务之旅系列(二):Kubernetes如何助力Spark大数据分析

    摘要: 容器开启数据服务之旅系列(二):Kubernetes如何助力Spark大数据分析 (二):Kubernetes如何助力Spark大数据分析 概述 本文为大家介绍一种容器化的数据服务Spark ...

  4. 容器开启数据服务之旅系列(二):Kubernetes如何助力Spark大数据分析 1

    摘要: 容器开启数据服务之旅系列(二):Kubernetes如何助力Spark大数据分析 (二):Kubernetes如何助力Spark大数据分析 概述 本文为大家介绍一种容器化的数据服务Spark ...

  5. 运用大数据分析开展主动服务

    日前,中国电信湖北公司以10000号客户接触数据为基础,通过对客户消费行为.通信使用行为.手机上网行为等特征数据进行挖掘,运用大数据分析找到客户需求与行为的内在关联性,并将关键时刻按场景化应用制定服务 ...

  6. 法国大数据分析服务初创公司 Dataiku 获1400 万美元 A 轮融资

    本周三(10 月 26 日),法国初创公司Dataiku 宣布获得了一笔 1400 万美元的 A 轮融资,领投方是纽约知名风投FirstMark Capital. Dataiku 公司成立于 2013 ...

  7. 面向服务的大数据分析平台解决方案

    近年来, 大数据处理与分析已经成为全球性问题,引起欧美各国政府和产业界高度重视,美国政府于2012年3月率先发布了<大数据研究与发展计划>, Google, Amazon. Faceboo ...

  8. 大数据挖掘企业服务平台-道路运输安全大数据分析解决方案

    1  方案背景 当前运输市场竞争激烈,道路运输企业受传统经营观念影响,企业管理者安全意识淡薄,从业人员规范化.流程化的管理水平较低,导致制度规范在落实过程中未能有效监督与管理,执行过程中出现较严重的偏 ...

  9. 提供大数据分析服务以及机器学习API的公司

    最近看到的几个提供大数据分析服务以及机器学习API的公司 Everstring:http://www.everstring.com/ 团队很强大. ------------ Clarifai: htt ...

最新文章

  1. Sql Server触发器的使用
  2. 最容易看懂的汇编语言书籍:汇编语言 王爽
  3. Android之如何判断设备是平板还是手机
  4. JavaScript中的位置协议属性
  5. SecureCRT突然卡死的问题
  6. bash中的grep函数_如何在Bash中编写函数
  7. 计算机二级考试c语言冲刺,计算机二级C语言考试冲刺练习题
  8. 【Clickhouse】Clickhouse 整合 Prometheus 监控 运行时状态
  9. mysql jsp servlet 中文乱码问题。
  10. Unity 全面理解加载和内存管理
  11. 一个程序员的创业失败教训【转自CSDN】
  12. c语言高精度算法阶乘_学了这么久的C语言,原来可以这样解决算法问题...
  13. Insomni'hack teaser 2019 - Misc - echoechoechoecho
  14. java 二叉树详解 + 实现代码
  15. 【历史上的今天】4 月 23 日:YouTube 上传第一个视频;网易云音乐正式上线;数字音频播放器的发明者出生
  16. Office之word如何把尾注的上标加括号,尾注里的上标改为普通数字
  17. 可视化优化:百度地图内网访问(通过nginx代理)
  18. 由随机数生成器到宿命论
  19. JAVA - 变量作用域
  20. 开源PLM软件Aras详解八 Aras之RelationshipTypes关系类详解

热门文章

  1. C++并发编程之std::async(), std::future, std::promise, std::packaged_task
  2. Alpha 冲刺 (10/10)
  3. iOS启动屏 ➕ 闪屏的方法
  4. FlexViewer入门资料
  5. NHibernate配置引发的异常
  6. [翻译]IE8下VML的变化
  7. 深度linux安装spotify,如何在 Linux 上使用 snap 安装 Spotify(声破天)
  8. 神经网络迭代次数的线性累加现象
  9. Jupyter notebook 运行环境创建和切换 (Win10+Anaconda)
  10. 深度学习常用数据集介绍