Spark 0.8 集群(CentOS6.4)-简单统计测试
$>cd ~/spark-0.8.0
$>bin/start-all.sh
|
$> jps
11055 Jps
2313 SecondaryNameNode
2409 JobTracker
2152 NameNode
4822 Master
|
// set the master node of spark cluster and runspark-shell
$> MASTER=spark://centos01:7077./spark-shell
// read the json data
$>val file = sc.textFile("hdfs://sdc/user/hadoop/In/DATA*.json")
// filter the json data
$>val ips = file.filter(line => line.contains("ip_address"))
// Count all the IP
$>ips.count()
// Count all the“241.*”IP
$>ips.filter(line => line.contains("241.")).count()
$>ips.filter(line => line.contains("241.")).collect()
|
![](http://www.51testing.com/attachments/2014/01/14982672_201401261319251jOSL.jpg)
Spark 0.8 集群(CentOS6.4)-简单统计测试相关推荐
- 分布式存储 CentOS6.5虚拟机环境搭建FastDFS-5.0.5集群
其实这是一篇来自:http://www.open-open.com/lib/view/open1435468300700.html 个人认为很适合新手参考的文章,感谢原创作者的努力. 分布式存储 Ce ...
- 记一次 基于Hadoop 3.3.0 安装部署 Spark 3.0.0 分布式集群
一.基本信息 官网 http://spark.apache.org/ Apache Spark 官方文档中文版(Spark 2.2.0) http://spark.apachecn.org/#/ Sp ...
- elasticsearch7.0.1集群搭建(最后有ES6.7的配置)
** ES集群搭建 **: 说明:首先要讨论搭建几个集群,集群搭建很简单,只需要配置做好就ok; 一 : 在搭建集群之前,我们首先要了解一个es中的相关内容 cluster : 代表一个集群,集群中有 ...
- redis-5.0.4集群部署
redis-5.0.4 集群搭建 redis-cluster介绍 1:redis是一个开源的key value存储系统,受到了广大互联网公司的青睐. 2:redis集群采用P2P模式,是完全去 ...
- Spark On YARN 集群安装部署
2019独角兽企业重金招聘Python工程师标准>>> 最近毕设需要用到 Spark 集群,所以就记录下了部署的过程.我们知道 Spark 官方提供了三种集群部署方案: Standa ...
- 本地Spark连接远程集群Hive(Scala/Python)
精选30+云产品,助力企业轻松上云!>>> 点击蓝色"大数据每日哔哔"关注我 加个"星标",第一时间获取大数据架构,实战经验 摘要:本地Spa ...
- 手动搭建高可用的Redis5.0分片集群,从理论到实践,超详细
前言 前一篇 高可用的Redis主从复制集群,从理论到实践 发布后,反响非常热烈.所以今天继续深入讲解redis集群的搭建和相关理论. 好吧,其实是因为上篇搭建的主从复制集群,还有一个实际问题不能解决 ...
- Spark系列之Spark在不同集群中的架构
title: Spark系列 第十二章 Spark在不同集群中的架构 Spark 注重建立良好的生态系统,它不仅支持多种外部文件存储系统,提供了多种多样的集群运行模式.部署在单台机器上时,既可以用 ...
- 搭建Spark On YARN集群
文章目录 零.本讲学习目标 一.Spark On YARN架构 (一)client提交方式 (二)cluster提交方式 二.搭建Spark On YARN集群 (一)搭建Spark Standalo ...
最新文章
- MySQL共享存储主备模式利用Keepalived实现双机高可用
- 【数据挖掘】数据挖掘算法 组件化思想 ( 模型或模式结构 | 数据挖掘任务 | 评分函数 | 搜索和优化算法 | 数据管理策略 )
- SQL Server 触发器学习总结
- Airtest自动化测试工具介绍
- angular组件-特殊的瀑布流(原创)
- It's highly recommended that you fix the library with 'execstack -c libfile', or link it with '-z
- google +按钮_如何禁用或改善Google的Google+集成
- 熊仔科技Steamduino PIC18F46J50主控板 部分原理图
- 转学到斯坦福大学计算机专业,斯坦福大学转学申请条件有哪些?
- Centos7 重启网卡
- aoi服务器图标删除后怎么找回,Windows10系统桌面图标被误删了如何找回【图文教程】...
- [2018.10.23 T1] 战争
- “绿坝—花季护航”使用全攻略
- App Store审核宝典
- uni-app如何发送请求调用接口
- oracle查询时间段差,关于oracle数据库中进行查询的时候出现效率特别差的一种情况...
- 【破解】PyCharm2018专业版激活(激活到2100年)
- 实现AlphaGo(二):快速构建棋盘和围棋规则
- dedecms安全漏洞之/include/common.inc.php漏洞解决办法
- 海丽宾雅水疗服务App技术支持
热门文章
- FireDAC 下的 Sqlite [4] - 创建数据库
- 【记录一个问题】cuda核函数可能存在栈溢出,导致main()函数退出后程序卡死30秒CUDA...
- hibernate 双向n-n
- hadoop学习之一
- JavaScript创建对象的方法
- Windows Embedded Compact 7网络编程概述(上)
- VS 2010 通过 Architecture创建UML类图设计
- HDOJ-2012 素数判定
- [转]建一个XMLHttpRequest对象池
- js中的DOM对象和jQuery对象的比较