//使用sparkSql完成wordCount
object wordCount_SQL {def main(args: Array[String]): Unit = {//1.创建sparkSessionval spark: SparkSession = SparkSession.builder().appName("wc").master("local[*]").getOrCreate()val sc: SparkContext = spark.sparkContextsc.setLogLevel("WARN")//2.读取文件val df: DataFrame = spark.read.text("E:\\ideal_workspace\\spark\\day01\\words.txt")val ds: Dataset[String] = spark.read.textFile("E:\\ideal_workspace\\spark\\day01\\words.txt")//3.对每一行按照空格切开并压平//df.flatMap(_.split(" ")),df没有泛型,所以不知道_表示String,只能使用dsimport spark.implicits._val wordDS: Dataset[String] = ds.flatMap(_.split(" "))wordDS.show()//ds有泛型,所以编译器知道_表示String//4.注册表wordDS.createOrReplaceTempView("t_word")//5.wordCount查询val sql:String ="""|select value,count(value) as counts|from t_word|group by value|order by counts desc""".stripMarginspark.sql(sql).show()spark.stop()sc.stop()}}

sparkSQL之SQL风格的wordCount相关推荐

  1. SparkSQL之DSL风格的wordcount

    object WordCount_DSL {def main(args: Array[String]): Unit = {//1.创建sparkSessionval spark: SparkSessi ...

  2. 【大数据开发】SparkSQL——RDD、DataFrame、DataSet相互转换、DSL常用方法、SQL风格语法、Spark读写操作、获取Column对象的方式

    take,takeAsList是Action操作 limit⽅法获取指定DataFrame的前n⾏记录,得到⼀个新的DataFrame对象.和take与head不同的是,limit⽅法不是Action ...

  3. Spark SQL概述,DataFrames,创建DataFrames的案例,DataFrame常用操作(DSL风格语法),sql风格语法

    一. Spark SQL 1. Spark SQL概述 1.1. 什么是Spark SQL Spark SQL是Spark用来处理结构化数据的一个模块,它提供了一个编程抽象叫做DataFrame并且作 ...

  4. 2021年大数据Spark(三十三):SparkSQL分布式SQL引擎

    目录 分布式SQL引擎 Hive的SQL交互方式 ThriftServer JDBC/ODBC Server 开启sparksql的thriftserver 使用beeline 客户端连接 JDBC/ ...

  5. ❤️Spark的关键技术回顾,持续更新!【推荐收藏加关注】❤️

    目录 前言 Spark的关键技术回顾 一.Spark复习题回顾 1.Spark使用的版本 2.Spark几种部署方式? 3.Spark的提交任务的方式? 4.使用Spark-shell的方式也可以交互 ...

  6. 2021年大数据Spark(二十七):SparkSQL案例一花式查询和案例二WordCount

    目录 案例一:花式查询 案例二:WordCount 基于DSL编程 基于SQL编程 具体演示代码如下: 案例一:花式查询 package cn.itcast.sqlimport org.apache. ...

  7. Spark SQL:从入门到精通(一)[SparkSQL初体验]

    入口-SparkSession 在spark2.0版本之前 SQLContext是创建DataFrame和执行SQL的入口 HiveContext通过hive sql语句操作hive表数据,兼容hiv ...

  8. spark sql 上个月_Spark学习之路 (十八)SparkSQL简单使用

    一.SparkSQL的进化之路 1.0以前: Shark 1.1.x开始: SparkSQL(只是测试性的)  SQL 1.3.x: SparkSQL(正式版本)+Dataframe 1.5.x: S ...

  9. PySpark | SparkSQL入门 | DataFrame入门

    文章目录 一.快速入门 1. 什么是SparkSQL 2. 为什么要学习SparkSQL 3. SparkSQL特点 二.SparkSQL概述 1. SparkSQL和Hive的异同 2. Spark ...

最新文章

  1. 【廖雪峰python入门笔记】函数
  2. 史上最详细、最完全的ipython使用教程,Python使用者必备!
  3. java匿名类的用法
  4. 四川一级计算机课程编码,四川省计算机一级考试真题
  5. php的foreach
  6. Shell入门:掌握Linux,OS X,Unix的Shell环境
  7. 怎么才能在百度上看到自己发布的博文?
  8. 计算机网络安全防护教案,计算机网络安全基础教案.DOC
  9. linux服务器查看系统装到哪个盘,查看linux安装了什么服务器地址
  10. ctfmon.exe开机无法自己主动启动
  11. 14.Vue cli脚手架安装
  12. 04 ARM Mali-V VPU硬件视频编解码驱动介绍V61
  13. 常见英文缩写小节-江晚正愁余-iteye技术网站
  14. 记一次完整手机APP项目的开发
  15. Android 应用清单简介1
  16. Hadoop 百度百科
  17. 2021年东方市铁路中学高考成绩查询,东方2021多少分可以上高中 分数线预测
  18. The Winter Is Coming
  19. 魔鬼交易员害了法兴银行却救了全球经济?
  20. java游戏服务器必备

热门文章

  1. Elasticsearch(ES)常用命令整理
  2. CSS浮动、PS切图、学成在线案例前期准备
  3. 亲密接触歼10战斗机--苹果MAC数据恢复记
  4. error: the following arguments are required
  5. 8点1氪晚间版:要是巨头们都去开餐馆,他们会怎么干?
  6. 【转】碳酸氢氨工艺流程
  7. 计算机实习生听课记录,实习生听课记录范文五年级上语文上册
  8. C语言设计函数求最大公约数,C语言程序设计课程设计--编写函数求取两个整数m,n的最大公约数和最小公倍数.doc_在线文库www.lddoc.cn...
  9. 用Python自动化生成胡歌爱豆日历
  10. 《音乐达人秀:Adobe Audition实战200例》——实例13 录制高品质音乐