本文属于【Azure Data Platform】系列。
接上文:【Azure Data Platform】ETL工具(20)——创建Azure Databricks
本文演示如何通过Azure Databricks访问Azure存储

环境准备

在前面的ADF章节,我们已经创建过存储账户,所以这里直接使用。但是对于Databricks,则需要使用额外配置,这里用notebook和Scala语言来实现。

创建Scala notebook前,先创建一个集群,使用前一篇的方式创建即可。然后按下图创建notebook:


选择语言和集群:

notebook 界面如下,另外可以看到方框处已经标识出语言。

配置访问

要访问存储账户,可以使用专门的账号,也可以使用【共享访问签名】,在存储账户下选择如下图的配置,并点击【生成SAS和连接字符串】:

我们需要SAS 令牌的值。


回到Databricks的notebook,按以下格式填写信息并在notebook里面执行“shift+回车”,替换前三行的信息:

val containerName = "test"
val storageAccountName = "as4adf"
val sas = "?sv=2020-08-04&ss=bfqt&srt=sco&sp=rwdlacupitfx&se=2022-03-12T19:57:37Z&st=2022-03-12T11:57:37Z&spr=https&sig=qeHK0A8%2FZ1j2bkDOPONO%2FOYrXWOyUwEwDDWyO%2BKc7Zs%3D"
val config = "fs.azure.sas." + containerName+ "." + storageAccountName + ".blob.core.windows.net"

如下图,这是访问Azure Blob的第一层配置:

配置完毕之后,需要装载容器,可以参考官方文档:装载 Azure Blob 存储容器

本例根据格式,得出的Scala脚本如下:

dbutils.fs.mount(source = "wasbs://test@as4adf.blob.core.windows.net/DataflowDemo.txt",mountPoint = "/mnt/demo",extraConfigs = Map(config -> sas))

执行成功:


前面的内容配置好后,可以尝试读取数据内容,因为我的文件是txt文件,所以选择text参考链接。

val mydf = spark.read.text("/mnt/demo")
display(mydf)

同时也可以用其他方式来查询数据:

val selectdf = mydf.select("value")
display(selectdf)

总结

本篇到此为止,主要是集中在对Blob上文件的访问。

【Azure Data Platform】ETL工具(21)——Azure Databricks使用(1)——访问Azure Blob相关推荐

  1. 【Azure Data Platform】ETL工具(11)——ADF 数据流

    本文属于[Azure Data Platform]系列. 接上文:[[Azure Data Platform]ETL工具(10)--ADF 集成运行时(Integration Runtimes,IR) ...

  2. 【Azure Data Platform】ETL工具(22)——Azure Databricks与ADF整合

    本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(21)--Azure Databricks使用(1)--访问Azure Blob ...

  3. 【Azure Data Platform】ETL工具(20)——创建Azure Databricks

    本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(19)--Azure Databricks 本文演示如何创建一个Azure Da ...

  4. 【Azure Data Platform】ETL工具(19)——Azure Databricks

    本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(18)--ADF 迭代和条件活动(2) 这次来聊聊Azure Databrick ...

  5. 【Azure Data Platform】ETL工具(8)——ADF 数据集和链接服务

    本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(7)--ADF copy data 详解 本文介绍ADF 的数据集 和链接服务 ...

  6. 【Azure Data Platform】ETL工具(13)——ADF并行加载多个文件

    本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(12)--ADF 参数 本文介绍ADF 的并行导入多个文件 前言 在一个数据类的 ...

  7. 【Azure Data Platform】ETL工具(6)——重新认识Azure Data Factory

    本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]ETL工具(5)--使用Azure Data Factory数据流转换数据 前面开篇第一章主 ...

  8. 【Azure Data Platform】Azure SQLDW与ADLS的整合

    本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]Azure Data Lake(1)--简介 前言 在Azure上面,已经没有了data w ...

  9. 【Azure Data Platform】Dedicated SQL Pool——导入性能测试(2)——CTAS

    本文属于[Azure Data Platform]系列. 接上文:[Azure Data Platform]Dedicated SQL Pool--导入性能测试(1)--传统insert 本文介绍SQ ...

最新文章

  1. 70种芯片细分领域、国产MCU重要代表企业
  2. 简述Core Location定位功能
  3. 一些重要的算法The Most Important Algorithms
  4. 【小练习03】CSS-表格(table)--天气预报
  5. 扬州工业机器人外壳设计排名_工业交换机的外壳设计重要吗?
  6. python采用哪种编码方式_Python编码格式的指定方式
  7. 每日一题(51)—— 大小端判断
  8. Application对象 简单的聊天室
  9. WPF--ContextMenu绑定命令的一个问题
  10. sql语句查询计算机系,SQL查询语句基础
  11. 微信小程序实现tab切换
  12. 计算机折线图教程,excel折线图如何添加数字标签? excel折线图添加数字标签的方法...
  13. java watcher service_GitHub - sinix/watcher: watcher(守望者)提供java应用暴露监控/健康检查的能力。...
  14. pick out.php,pick_out.php
  15. Chrome浏览器整个网页截图
  16. 信用飞疑似信息泄露致用户被骗近4万元,平台借款利率高达75%
  17. Lua语言编程学习之路01----第五章 函数
  18. yolov5训练操作步骤
  19. HDU CCPC网络选拔赛 6441 Find Integer(数学)
  20. 格密码LLL算法:如何解决最短向量SVP问题(3)(完结篇)

热门文章

  1. 【Python爬虫】之 抓取“微医”上的医生信息
  2. 最优化:一维搜索的Wolfe条件与Goldstein条件
  3. 神经网络中的反向传播
  4. 服务器串口硬盘梅捷主板设置,梅捷主板bios设置ahci
  5. nodejs调用go语言
  6. Ubuntu10下载安装Android 2.2 froyo 源码
  7. Android Qcom USB Driver学习(六)
  8. 网络编程(3)-----------Javaweb
  9. 为什么说大数据一定会从ABC里最先掉队
  10. 深度思考故事2:出租司机的经济学