Spark从本地文件中统计包含某个字母的行数:

import org.apache.spark.SparkConf;
import org.apache.spark.sql.Dataset;
import org.apache.spark.sql.SparkSession;
/*** spark从文件中统计包含某个字段的记录数* @author admin**/
public class SparkWordCount {public static void main(String[] args) {String path = SparkWordCount.class.getClassLoader().getResource("").getPath();String logFile = path+"/file/README.md"; // Should be some file on your systemString appName = "SparkWordCount";String master = "local";// 配置SparkConf conf = new SparkConf().setAppName(appName).setMaster(master);SparkSession spark = SparkSession.builder().config(conf).getOrCreate();//文件的每一行作为一条记录Dataset<String> logData = spark.read().textFile(logFile).cache();// 统计long numAs = logData.filter(s -> s.contains("a")).count();long numBs = logData.filter(s -> s.contains("b")).count();System.out.println("Lines with a: " + numAs + ", lines with b: " + numBs);spark.stop();}}

Spark从本地文件中统计包含某个字母的行数相关推荐

  1. 判断文本的行数c语言,软件工程统计文件中字符串个数,单词个数,词频,行数

    一.前言 在之前写过一个词频统计的C语言课设,别人说你一个大三的怎么写C语言课程,我只想说我是先学习VB,VB是我编程语言的开始,然后接触到C语言及C++:再后来我是学习C++,然后反过来学习C语言, ...

  2. spark 读取本地文件

    1 背景 基于spark 开发程序 数据放在本地文件中,为text格式 本文语言案例为java 2   步骤 2.1 搭建工程 ​​​​​​​ 基于maven搭建spark工程_this is a b ...

  3. java数据从本地文件中取出_java 从数据库取数据并存入本地文本中

    要求如下: 1.连接数据库,取数据,weibo表中取出uid和text 2.判断uid是否相同,如果相同,则把其对应的text存入路径为D:\data1的同一文件中,并且以此uid命... 要求如下: ...

  4. python保存运行结果下次使用_将python运行结果保存至本地文件中的示例讲解

    一.建立文件,保存数据 1.使用python中内置的open函数 打开txt文件 #mode 模式 #w 只能操作写入 r 只能读取 a 向文件追加 #w+ 可读可写 r+可读可写 a+可读可追加 # ...

  5. fontTools库来检测字体文件中是否包含某字符

    在使用字体渲染某些字符时,有可能渲染出空白或者"口"字形,原因在于该字体文件中不包含该字符的字形. 可能的原因包括: 字符不在字体的cmap表中(cmap表是字体文件声明的支持字符 ...

  6. 知其然(3)*.java文件中可以包含多个类,但最多只能有一个类,其修饰符为public

    *.java文件中可以包含多个类,但最多只能有一个类,其修饰符为public. 测试1:文件名Dog.java,文件内容如下:[2个类均为public] public class Dog{Dog(){ ...

  7. 可以使用FontForge查看TTC字体文件中,包含哪些字体

    FontForge Releases · fontforge/fontforge · GitHub 下载安装( 略) 启动FontForge 打开字体文件 这个文件中,包含两个字体:宋体,新宋体.图中 ...

  8. 向HBase中导入数据3:使用MapReduce从HDFS或本地文件中读取数据并写入HBase(增加使用Reduce批量插入)

    前面我们介绍了: 向HBase中导入数据1:查询Hive后写入 向HBase中导入数据2:使用MapReduce从HDFS或本地文件中读取数据并写入HBase(只使用Map逐条查询) 为了提高插入效率 ...

  9. Java main方法_解释Java中的main方法,及其作用_一个java文件中可包含多个main方法

    public static void main(String[] args) {} 或者 public static void main(String args[]) {} main方法是我们学习Ja ...

最新文章

  1. Spring的单元测试
  2. 深度学习入门教程UFLDL学习实验笔记一:稀疏自编码器
  3. javaweb jsp
  4. leetcode 367. Valid Perfect Square
  5. 经验分享 | 二本直博浙大?我只是写了篇论文而已
  6. 2017年10月2日日志
  7. java数字类型_Java数据类型
  8. linux下安装minio
  9. mysql中 for update 使用
  10. AcWing 877. 扩展欧几里得算法(拓展欧几里得模板)
  11. 拓端tecdat|R语言里的非线性模型:多项式回归、局部样条、平滑样条、 广义相加模型GAM分析
  12. 猎豹网校 java_猎豹网校Java 零基础入门 JAVA基础视频教程(精制)
  13. 操作系统——信号量机制(PV操作)
  14. 白山搜索引擎优化收费_白山SEO优化_专业搜索引擎优化、整站优化、快速排名公司...
  15. word2016添加题注|图注文献标号的交叉引用及引用的更新|添加不同类型的页码|文献自动编号|文献编号的自动引用|删除空白页
  16. 用js处理图片加载错误时加载默认图片的方法
  17. 华为python673集_[译] 使用 Python 的 Pandas 和 Seaborn 框架从 Kaggle 数据集中提取信息...
  18. KL-MPLC无人值守系统
  19. 台式计算机用u盘给电脑安装系统,台式机用u盘装系统 电脑店给台式机装系统详细教程...
  20. Android Studio模拟器如何设置中文输入法

热门文章

  1. H5页面嵌套在APP中的坑
  2. CADENAS为BELFUSE创建新的电子元件3DCAD产品目录
  3. 小米 微信:无法连接服务器,微信出现大规模故障 多地无法登录
  4. STM32 KEIL软件设置程序烧写起始地址选择
  5. 关于手机唯一识别码的研究meid和imei
  6. English trip EM2-MP4 Teacher:Taylor voiceless consonant 清辅音 voiced consonant 浊辅音
  7. [转]Web开发者和设计师必须要知道的 iOS 8 十个变化
  8. mysql 加三天_MySQL添加几天到日期?
  9. idea 中ctrl+shift+数字的作用
  10. FIDE 全新编译体验,编译速度大幅提升