Mahout使用入门
1、启动Hadoop
2、下载测试数据
http://archive.ics.uci.edu/ml/databases/synthetic_control/链接中的synthetic_control.data
或者百度一下也很容易找到这个示例数据。
3、上传测试数据
hadoop fs -put synthetic_control.data testdata
4、 使用Mahout中的kmeans聚类算法,执行命令:
mahout -core org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
花费9分钟左右完成聚类 。
5、查看聚类结果
执行hadoop fs -ls /user/root/output,查看聚类结果。
- [jediael@mastermahout-distribution-0.9]$hadoopfs-lsoutput
- Found15items
- -rw-r--r--2jediaelsupergroup1942015-03-0715:07/user/jediael/output/_policy
- drwxr-xr-x-jediaelsupergroup02015-03-0715:07/user/jediael/output/clusteredPoints
- drwxr-xr-x-jediaelsupergroup02015-03-0715:02/user/jediael/output/clusters-0
- drwxr-xr-x-jediaelsupergroup02015-03-0715:02/user/jediael/output/clusters-1
- drwxr-xr-x-jediaelsupergroup02015-03-0715:07/user/jediael/output/clusters-10-final
- drwxr-xr-x-jediaelsupergroup02015-03-0715:03/user/jediael/output/clusters-2
- drwxr-xr-x-jediaelsupergroup02015-03-0715:03/user/jediael/output/clusters-3
- drwxr-xr-x-jediaelsupergroup02015-03-0715:04/user/jediael/output/clusters-4
- drwxr-xr-x-jediaelsupergroup02015-03-0715:04/user/jediael/output/clusters-5
- drwxr-xr-x-jediaelsupergroup02015-03-0715:05/user/jediael/output/clusters-6
- drwxr-xr-x-jediaelsupergroup02015-03-0715:05/user/jediael/output/clusters-7
- drwxr-xr-x-jediaelsupergroup02015-03-0715:06/user/jediael/output/clusters-8
- drwxr-xr-x-jediaelsupergroup02015-03-0715:07/user/jediael/output/clusters-9
- drwxr-xr-x-jediaelsupergroup02015-03-0715:02/user/jediael/output/data
- drwxr-xr-x-jediaelsupergroup02015-03-0715:02/user/jediael/output/random-seeds
Mahout使用入门相关推荐
- apache mahout_Apache Mahout:入门
apache mahout 最近,我有一个有趣的问题要解决:如何使用自动化对不同来源的文本进行分类? 前一段时间,我读到一个有关该项目以及许多其他文本分析工作的项目– Apache Mahout . ...
- Apache Mahout:入门
最近,我有一个有趣的问题要解决:如何使用自动化对不同来源的文本进行分类? 前一段时间,我读到一个有关该项目以及许多其他文本分析工作的项目– Apache Mahout . 尽管它不是一个非常成熟的版本 ...
- Mahout快速入门教程
Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现.分类.聚类等.Mahout最大的优点就是基于hadoop实现,把很多以前运行于单 ...
- java 调用 mahout_(转)Mahout使用入门
一.简介 Mahout 是 Apache Software Foundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序 ...
- Mahout学习之Mahout简介、安装、配置、入门程序测试
一.Mahout简介 查了Mahout的中文意思--驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了... 附logo: (就是他,骑在象头上的那个 ...
- Apache Mahout 简介 通过可伸缩、商业友好的机器学习来构建智能应用程序
在信息时代,公司和个人的成功越来越依赖于迅速有效地将大量数据转化为可操作的信息.无论是每天处理数以千计的个人电子邮件消息,还是从海量博客文章中推测用户的意图,都需要使用一些工具来组织和增强数据. 这其 ...
- Apache Mahout 简介
Apache Mahout 简介 通过可伸缩.商业友好的机器学习来构建智能应用程序 当研究院和企业能获取足够的专项研究预算之后,能从数据和用户输入中学习的智能应用程序将变得更加常见.人们对机器学习技巧 ...
- mahout 0.9 连接mysql_部署安装 Mahout
一.Mahout简介 Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创 ...
- 数据挖掘优秀工具对比
1.数据挖掘工具对比 数据来源:Top 15 Best Free Data Mining Tools: The Most Comprehensive List - Software Testing H ...
最新文章
- 【Chat】实验 -- 实现 C/C++下TCP, 服务器/客户端 多人聊天室
- 数据库归档及热点库_postgresql连续归档及时间点恢复的操作
- 密度聚类OPTICS算法
- java cglib jar包_Java面试题|反射必看的4道面试题
- 同一类的不同对象,在调用相同的成员函数时,入口地址是相同的
- 从零开始学JavaScript三(变量)
- PHP-FPM Fastcgi 未授权访问漏洞(端口9000)
- SpringBoot使用CommandLineRunner和ApplicationRunner执行初始化业务
- javascript;json数据,js转换日期方法。
- npm的一些常用命令
- android token加密_Android使用token维持登陆状态的方法
- 小米笔记本重装系统,提示无启动驱动
- 记忆术: 记数字 (110数字图像编码)
- python爬虫贴吧_Python爬虫——抓取贴吧帖子
- 图解多线程设计模式pdf_图解Java多线程设计模式pdf
- ‘\0‘到底是什么?
- ubuntu WPS 报错系统缺失字体symbol、wingdings、wingdings 2、wingdings 3
- 音频呼叫界面设计_使用网络音频来增强您的用户界面
- python中,__del__方法介绍
- SimpleDateFormat使用详解