【大数据处理技术】实验11
文章目录
- Hama安装配置
- 下载解压
- 修改文件
- Hama使用案例
- 随机生成 100 个节点、1000 条边的图结构数据,运行 PageRank 算法
Hama安装配置
下载解压
下载网址:http://archive.apache.org/dist/hama/
赋予用户权限
解压配置:
修改hama-env.sh:在Hama中进入conf文件夹,修改hama-env.sh文件,在其中加入Java的home 路径(jdk的路径)
修改hama-site.xml,这是hama配置的核心文件
- 在中加入 以下代码,是本地就配置为local,即将value中的内容分别改为local,local,localhost
<configuration><property><name>bsp.master.address</name><value>local</value><description>The address of the bsp master server. Either theliteral string "local" or a host:port for distributed mode</description></property><property><name>fs.default.name</name><value>local</value><description>The name of the default file system. Either the literal string"local" or a host:port for HDFS.</description></property><property><name>hama.zookeeper.quorum</name><value>localhost</value><description>Comma separated list of servers in the ZooKeeper Quorum.For example, "host1.mydomain.com,host2.mydomain.com,host3.mydomain.com".By default this is set to localhost for local and pseudo-distributed modesof operation. For a fully-distributed setup, this should be set to a fulllist of ZooKeeper quorum servers. If HAMA_MANAGES_ZK is set in hama-env.shthis is the list of servers which we will start/stop zookeeper on.</description></property></configuration>
修改文件
Hama使用案例
随机生成 100 个节点、1000 条边的图结构数据,运行 PageRank 算法
- 在hama的bin/hama/下,进行jar jia 文件名,生成的文件位于hama 下的randomgraph。他表示100个节点,1000条边的数据存储在两个文件中
./bin/hama jar hama-examples-0.7.1.jar gen fastgen -v 100 -e 10 -o randomgraph -t 2
- 执行pagerank,结果保存在pagerankresult文件中
./bin/hama jar hama-examples-0.7.1.jar pagerank -i randomgraph -o pagerankresult -t 4
【参考资料】
hadoop集群下安装及配置hama
Hama图计算模型
【大数据处理技术】实验11相关推荐
- 【大数据处理技术】第三篇 大数据处理与分析(暂停更新)
大数据分析与处理 第7章 MapReduce 7.1 概述 7.1.1 分布式并行编程 7.1.2 MapReduce 模型简介 7.1.3 Map 和 Reduce 函数 7.2 Mapreduce ...
- 《深入理解大数据:大数据处理与编程实践》一一1.2 大数据处理技术简介
本节书摘来自华章计算机<深入理解大数据:大数据处理与编程实践>一书中的第1章,第1.2节,作者 主 编:黄宜华(南京大学)副主编:苗凯翔(英特尔公司),更多章节内容可以访问云栖社区&quo ...
- 大数据处理技术之hadoop概览
上两个图,可以对热到极致的大数据处理技术有一个基本的认识 大数据处理技术之演进 大数据处理技术之hadoop软件族: hadoop 1 hadoop2 相关软件下面简介: 1 Ambari:Hadoo ...
- NLPIR大数据处理技术实现多种类智能挖掘
当今,信息技术为人类步入智能社会开启了大门,带动了互联网.物联网.电子商务.现代物流.网络金融等现代服务业发展,催生了车联网.智能电网.新能源.智能交通.智能城市.高端装备制造等新兴产业发展.现代信息 ...
- 大数据处理技术之数据集成
大数据处理技术是一个十分重要的工作,就好比做菜,我们做菜之前就需要对蔬菜进行清洗,洗过的菜我们才能够吃的放心,同时还有助于我们的身体健康.而大数据处理就好比清洗蔬菜一样,当我们对数据整理以后,我们才能 ...
- 关于大数据技术的演讲_大数据核心技术介绍:大数据处理技术
大数据之所以能够从概念走向落地,说到底还是因为大数据处理技术的成熟,面对海量的数据,在有限的硬件条件下,以低成本满足大数据处理的各种实际需求.那么具体处理大数据需要哪些技术,今天我们来简单介绍一下大数 ...
- 纯前端大数据处理技术:葡萄城纯前端开发工具应用实践
SpreadJS 是一款基于 HTML5 的纯 JavaScript 电子表格和网格功能控件,满足多平台.跨平台的表格数据处理和类 Excel 的表格应用开发. WijmoJS 前端开发工具包由多款纯 ...
- 大数据时代:大数据处理技术及采集方法
在大数据时代,传统的大数据处理技术还管用吗? 大数据处理环节下的需求 大数据环节下的数据来源是非常多,而且类型也很多花样,存储和数据处理的需求量很大,对于数据展现也非常的高,并且很看重数据处理的高效性 ...
- 大数据处理技术导论(8) | Datawhale组队学习46期
文章目录 10. 1 面试题 10.1.1 hive外部表和内部表的区别 10.1.2 简述对Hive桶的理解? 10.1.3 HBase和Hive的区别? 10.1.4 简述Spark宽窄依赖 10 ...
- 大数据处理技术导论(1) | Datawhale组队学习46期
文章目录 前言 1. 大数据概述 1.1 数据量大 Volume 1.2 数据种类多 Variety 1.3 处理速度快 Velocity 1.4 价值密度低 Value 2. hadoop 2.1 ...
最新文章
- Database Connection String
- 由防止表单重复提交引发的一系列问题--servletRequest的复制、body值的获取
- Junit单元测试时提示:Method should have no parameters
- 距离算法在概率统计C语言,基于CBM-TOF探测器无触发数据获取系统的压缩算法-应用概率统计.PDF...
- project日历设置-大小周交替
- python亿级mysql数据库导出_Python之csv文件从MySQL数据库导入导出的方法
- php 操作数组 (合并,拆分,追加,查找,删除等)
- ppi 各代iphone_iphone型号对比
- linux 7 %3e命令,Linux操作系统常用基础命令
- java序列化(Serializable)
- 通过kafka提供的命令来查看offset消费情况
- 8.微服务设计 --- 监控
- 如何从课堂与教学内容两方面提高培训效率
- 错误报告函数:strerror和perror
- 今日头条推广视频教程自媒体推广短视频教程今日头条引流小白入门视频解析下载支持今日头条快手抖音火...
- 4python小项目---# 体脂率计算
- sdn的用处_SDN是什么?SDN的好处有哪些?
- 妇产科护理学复习重点
- 【JAVAWEB开发】带你零基础学JAVA项目(二嗨租车项目篇)
- JavaScript 的常量和变量