【Azure Data Platform】ETL工具(21)——Azure Databricks使用(1)——访问Azure Blob
本文属于【Azure Data Platform】系列。
接上文:【Azure Data Platform】ETL工具(20)——创建Azure Databricks
本文演示如何通过Azure Databricks访问Azure存储
环境准备
在前面的ADF章节,我们已经创建过存储账户,所以这里直接使用。但是对于Databricks,则需要使用额外配置,这里用notebook和Scala语言来实现。
创建Scala notebook前,先创建一个集群,使用前一篇的方式创建即可。然后按下图创建notebook:
选择语言和集群:
notebook 界面如下,另外可以看到方框处已经标识出语言。
配置访问
要访问存储账户,可以使用专门的账号,也可以使用【共享访问签名】,在存储账户下选择如下图的配置,并点击【生成SAS和连接字符串】:
我们需要SAS 令牌的值。
回到Databricks的notebook,按以下格式填写信息并在notebook里面执行“shift+回车”,替换前三行的信息:
val containerName = "test"
val storageAccountName = "as4adf"
val sas = "?sv=2020-08-04&ss=bfqt&srt=sco&sp=rwdlacupitfx&se=2022-03-12T19:57:37Z&st=2022-03-12T11:57:37Z&spr=https&sig=qeHK0A8%2FZ1j2bkDOPONO%2FOYrXWOyUwEwDDWyO%2BKc7Zs%3D"
val config = "fs.azure.sas." + containerName+ "." + storageAccountName + ".blob.core.windows.net"
如下图,这是访问Azure Blob的第一层配置:
配置完毕之后,需要装载容器,可以参考官方文档:装载 Azure Blob 存储容器
本例根据格式,得出的Scala脚本如下:
dbutils.fs.mount(source = "wasbs://test@as4adf.blob.core.windows.net/DataflowDemo.txt",mountPoint = "/mnt/demo",extraConfigs = Map(config -> sas))
执行成功:
前面的内容配置好后,可以尝试读取数据内容,因为我的文件是txt文件,所以选择text参考链接。
val mydf = spark.read.text("/mnt/demo")
display(mydf)
同时也可以用其他方式来查询数据:
val selectdf = mydf.select("value")
display(selectdf)
总结
本篇到此为止,主要是集中在对Blob上文件的访问。
【Azure Data Platform】ETL工具(21)——Azure Databricks使用(1)——访问Azure Blob相关推荐
- 【Azure Data Platform】ETL工具(11)——ADF 数据流
本文属于[Azure Data Platform]系列. 接上文:[[Azure Data Platform]ETL工具(10)--ADF 集成运行时(Integration Runtimes,IR) ...
- 【Azure Data Platform】ETL工具(22)——Azure Databricks与ADF整合
本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(21)--Azure Databricks使用(1)--访问Azure Blob ...
- 【Azure Data Platform】ETL工具(20)——创建Azure Databricks
本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(19)--Azure Databricks 本文演示如何创建一个Azure Da ...
- 【Azure Data Platform】ETL工具(19)——Azure Databricks
本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(18)--ADF 迭代和条件活动(2) 这次来聊聊Azure Databrick ...
- 【Azure Data Platform】ETL工具(8)——ADF 数据集和链接服务
本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(7)--ADF copy data 详解 本文介绍ADF 的数据集 和链接服务 ...
- 【Azure Data Platform】ETL工具(13)——ADF并行加载多个文件
本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(12)--ADF 参数 本文介绍ADF 的并行导入多个文件 前言 在一个数据类的 ...
- 【Azure Data Platform】ETL工具(6)——重新认识Azure Data Factory
本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(5)--使用Azure Data Factory数据流转换数据 前面开篇第一章主 ...
- 【Azure Data Platform】Azure SQLDW与ADLS的整合
本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]Azure Data Lake(1)--简介 前言 在Azure上面,已经没有了data w ...
- 【Azure Data Platform】Dedicated SQL Pool——导入性能测试(2)——CTAS
本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]Dedicated SQL Pool--导入性能测试(1)--传统insert 本文介绍SQ ...
最新文章
- 70种芯片细分领域、国产MCU重要代表企业
- 简述Core Location定位功能
- 一些重要的算法The Most Important Algorithms
- 【小练习03】CSS-表格(table)--天气预报
- 扬州工业机器人外壳设计排名_工业交换机的外壳设计重要吗?
- python采用哪种编码方式_Python编码格式的指定方式
- 每日一题(51)—— 大小端判断
- Application对象 简单的聊天室
- WPF--ContextMenu绑定命令的一个问题
- sql语句查询计算机系,SQL查询语句基础
- 微信小程序实现tab切换
- 计算机折线图教程,excel折线图如何添加数字标签? excel折线图添加数字标签的方法...
- java watcher service_GitHub - sinix/watcher: watcher(守望者)提供java应用暴露监控/健康检查的能力。...
- pick out.php,pick_out.php
- Chrome浏览器整个网页截图
- 信用飞疑似信息泄露致用户被骗近4万元,平台借款利率高达75%
- Lua语言编程学习之路01----第五章 函数
- yolov5训练操作步骤
- HDU CCPC网络选拔赛 6441 Find Integer(数学)
- 格密码LLL算法:如何解决最短向量SVP问题(3)(完结篇)