1. 概念介绍:

Amazon Athena 是一种交互式查询服务,让您能够轻松使用标准 SQL 直接分析 Amazon S3 中的数据。只需在 AWS 管理控制台中单击几下,客户即可将 Athena 指向自己在 S3 中存储的数据,然后开始使用标准 SQL 执行临时查询并在数秒内获取结果。Athena 没有服务器服,因此没有需要设置或管理的基础设施,客户只需为其执行的查询付费。您可以使用 Athena 处理日志、执行即席分析以及运行交互式查询。Athena 可以自动扩展并执行并行查询,因此可快速获取结果,对于大型数据集和复杂查询也不例外。

2.

无服务器。零基础设施。零管理。

Amazon Athena 没有服务器,因此没有需要管理的基础设施。您无需担心配置、软件更新和故障问题,也无需担心随着数据集和用户量的增长而扩展基础设施的问题。Athena 会自动处理这些问题,因此您可以专注于数据而非基础设施。

轻松入门

要开始使用,请登录 Athena 控制台,使用控制台向导或输入 DDL 语句来定义您的架构,然后立即使用内置查询编辑器进行查询。您还可以使用 AWS Glue 自动抓取数据源以便发现数据,并使用新的和修改过的表与分区定义来填充数据目录。结果会在数秒内显示在控制台中,并会自动写入您在 S3 中选择的位置。您可以将结果下载到您的桌面。使用 Athena,无需执行复杂的 ETL 作业来为数据分析做准备。因此,具备 SQL 技能的任何人都可以轻松快速地分析大规模数据集。

只需使用标准 SQL 即可轻松查询

Amazon Athena 使用的是 Presto,一种针对低延迟临时数据分析进行了优化的分布式开源 SQL 查询引擎。这意味着您可以使用 ANSI SQL 针对 Amazon S3 中的大型数据集执行查询,并且完全支持大型连接、窗口函数和数组。Athena 支持多种数据格式,如 CSV、JSON、ORC、Avro 或 Parquet。您还可以使用 Athena 的 JDBC 驱动程序从多种 BI 工具连接到 Athena。

按查询付费

使用 Amazon Athena,您只需为执行的查询付费。您需要按每次查询所扫描的数据量付费。通过对数据进行压缩、分区或将其转换为分列格式,您可以节省大量资金并提高性能,因为这些操作均可以减少 Athena 执行查询所需扫描的数据量。

快速性能

使用 Amazon Athena,您无需管理或调整集群即可实现快速性能。Athena 针对快速性能通过 Amazon S3 进行了优化。Athena 可以自动执行并行查询,因此您可以在数秒内获取查询结果,即使查询大型数据集不例外。

高度可用且具有持久性

Amazon Athena 具有高可用性,能够利用多个设施上的计算资源执行查询,如果特定设施无法访问,它会正确地自动路由查询。Athena 使用 Amazon S3 作为基础数据存储,可确保您的数据具有高可用性和高持久性。Amazon S3 提供耐久的基础设施存储重要数据,其设计旨在为对象提供 99.999999999% 的耐久性。您的数据以冗余方式存储在多个设施和各个设施内多个设备上。

安全

Amazon Athena 让您能够通过 AWS Identity and Access Management (IAM) 策略、访问控制列表 (ACL) 和 Amazon S3 存储桶策略控制对数据的访问权限。通过 IAM 策略,您可以授予 IAM 用户对 S3 存储桶的精细控制权。通过控制对 S3 中数据的访问,您可以限制用户使用 Athena 对数据进行查询。借助 Athena,您还能够轻松查询存储在 Amazon S3 中的加密数据,还可以将加密后的结果写回 S3 存储桶。Athena 同时支持服务器端加密和客户端加密。

集成

Amazon Athena 与 AWS Glue 集成,开箱即用。借助 Glue 数据目录,您可以跨各种服务创建统一的元数据存储库、抓取数据源以便发现数据、使用新的和修改过的表和分区定义来填充数据目录,还可以保持架构版本控制。您还可以使用 Glue 完全托管的 ETL 功能来转换数据或将其转化为分列格式,以便优化查询性能并降低成本。了解有关 AWS Glue 的更多信息。

搭建事例

1.

参考链接:

https://aws.amazon.com/cn/athena/features/

https://docs.aws.amazon.com/athena/latest/ug/getting-started.html

什么是AWS Athena相关推荐

  1. AWS — AWS 上的 NFV

    目录 文章目录 目录 AWS 上的 NFV AWS 上的 NFV 通过以下 AWS 服务来支持 NFV: VIM/NFVi:虚拟资源由 AWS Virtual Compute.AWS Virtual ...

  2. aws python sns_使用AWS Lambd从AWS SNS读取时修改JSON消息

    我有一个上游应用程序正在向一个SNS主题发送以下JSON消息.我们使用AWS lambda函数将这个JSON对象保存在S3中:{ "processResult": { " ...

  3. athena sql_使用SQL Server查询Amazon Athena外部表

    athena sql This article covers the following topics: 本文涵盖以下主题: Overview of the Amazon Athena 亚马逊雅典娜概 ...

  4. 独家 | 关于数据湖架构、战略和分析的8大错误认知(附链接)

    翻译:张玲 校对:丁楠雅 本文约9200字,建议阅读20分钟. 本文打破有关数据湖的8个错误认知,错误认知包括3方面,还提出了5个小技巧,以构建一个灵活的.可交付业务价值的数据湖. 本文的目的是构建数 ...

  5. 鱼和熊掌可以兼得,云原生开启“数据库大数据一体化”新时代

    允中 发自 凹非寺 量子位 编辑 | 公众号 QbitAI 10月23日数据湖高峰论坛上,阿里巴巴集团副总裁.阿里云智能数据库产品事业部负责人.达摩院数据库与存储实验室负责人李飞飞表示:"云 ...

  6. 的数据湖_一文读懂云原生数据湖体系

    导读:如何基于阿里云 OSS .JindoFS 和数据湖构建(Data Lake Formation,DLF)等基础服务,同时结合阿里云上丰富的计算引擎,打造一个全新云原生数据湖体系? 作者 | 吴威 ...

  7. bigint hive java类型_详解Apache Hudi如何配置各种类型分区

    1. 引入 Apache Hudi支持多种分区方式数据集,如多级分区.单分区.时间日期分区.无分区数据集等,用户可根据实际需求选择合适的分区方式,下面来详细了解Hudi如何配置何种类型分区. 2. 分 ...

  8. 阿里云李飞飞:什么是云原生数据库

    简介: 云原生是一种新型技术体系,是云计算未来的发展方向.今天,阿里云李飞飞将和我们分享何为云原生.云原生如何与分布式有机结合,以及云原生技术如何帮助客户迈入数字原生时代. 作者 | 飞刀 来源 | ...

  9. 数据湖 VS 数据仓库之争?阿里提出大数据架构新概念:湖仓一体

    作者 |关涛.李睿博.孙莉莉.张良模.贾扬清(from 阿里云智能计算平台) 黄波.金玉梅.于茜.刘子正(from 新浪微博机器学习研发部) 编者按 随着近几年数据湖概念的兴起,业界对于数据仓库和数据 ...

最新文章

  1. 51单片机实现对24C02进行页写、顺序读取并显示验证
  2. java hashset应用_三.java集合的应用
  3. 可遇不可求的BUG之采用MYSQL odbc 3.51访问数据库返回值缺失
  4. Java传统的io和nio区别_Java中IO和NIO的本质和区别
  5. 设置程序无label
  6. 基于 Python Matplotlib 模块的高质量图形输出
  7. 2015年《大数据》高被引论文 Top10
  8. 它们翻滚着的飞秋下载
  9. 最短路径——Floyd算法HDU Today(hdu2112)
  10. qcalendarwidget只显示月_万家基金旗下26只产品规模迷你 万家精选重仓地产股年内收益排名靠后丨基金...
  11. uboot copy_from_nand代码详解
  12. mysql数据库中文乱码解决
  13. [日志]挂在树上的茶壶
  14. 面试百题066——颠倒栈
  15. 手机Web 开发中图片img 如何等比例缩放
  16. C++编程 Unicode转换成中文
  17. 黑科技 | 电脑必备黑科技软件
  18. 【matlab学习】用matlab编写简单程序(入门)
  19. C语言程序设计专栏索引
  20. html的版权符号是哪个,HTML版权符号是怎么输入的、代表什么-京标知识产权

热门文章

  1. 数据分析Excel必备技能:数据透视表使用教程
  2. keil软件仿真时如何使用逻辑分析仪查看波形
  3. 镜播无人直播带货教程,手把手教你如何搭建直播间
  4. 植物神经紊乱引起的焦虑、烦躁怎么办?
  5. [计算机毕业设计]元学习方法的小样本图像分类算法
  6. photoshop复制图层快捷键总结
  7. 8句极易踩中买家雷点的口头禅,你中了哪几条?
  8. Unity-黑暗之魂复刻-翻滚、后跳功能
  9. 前端面试题:HTML 语义化的理解
  10. flask中ajax的使用,jquery – 使用ajax时,Flask flash消息不再有效