1、启动Hadoop
2、下载测试数据
http://archive.ics.uci.edu/ml/databases/synthetic_control/链接中的synthetic_control.data
或者百度一下也很容易找到这个示例数据。
3、上传测试数据
hadoop fs -put synthetic_control.data testdata
4、 使用Mahout中的kmeans聚类算法,执行命令:
mahout -core org.apache.mahout.clustering.syntheticcontrol.kmeans.Job
花费9分钟左右完成聚类 。
5、查看聚类结果
执行hadoop fs -ls /user/root/output,查看聚类结果。

[plain]view plaincopy
  1. [jediael@mastermahout-distribution-0.9]$hadoopfs-lsoutput
  2. Found15items
  3. -rw-r--r--2jediaelsupergroup1942015-03-0715:07/user/jediael/output/_policy
  4. drwxr-xr-x-jediaelsupergroup02015-03-0715:07/user/jediael/output/clusteredPoints
  5. drwxr-xr-x-jediaelsupergroup02015-03-0715:02/user/jediael/output/clusters-0
  6. drwxr-xr-x-jediaelsupergroup02015-03-0715:02/user/jediael/output/clusters-1
  7. drwxr-xr-x-jediaelsupergroup02015-03-0715:07/user/jediael/output/clusters-10-final
  8. drwxr-xr-x-jediaelsupergroup02015-03-0715:03/user/jediael/output/clusters-2
  9. drwxr-xr-x-jediaelsupergroup02015-03-0715:03/user/jediael/output/clusters-3
  10. drwxr-xr-x-jediaelsupergroup02015-03-0715:04/user/jediael/output/clusters-4
  11. drwxr-xr-x-jediaelsupergroup02015-03-0715:04/user/jediael/output/clusters-5
  12. drwxr-xr-x-jediaelsupergroup02015-03-0715:05/user/jediael/output/clusters-6
  13. drwxr-xr-x-jediaelsupergroup02015-03-0715:05/user/jediael/output/clusters-7
  14. drwxr-xr-x-jediaelsupergroup02015-03-0715:06/user/jediael/output/clusters-8
  15. drwxr-xr-x-jediaelsupergroup02015-03-0715:07/user/jediael/output/clusters-9
  16. drwxr-xr-x-jediaelsupergroup02015-03-0715:02/user/jediael/output/data
  17. drwxr-xr-x-jediaelsupergroup02015-03-0715:02/user/jediael/output/random-seeds

Mahout使用入门相关推荐

  1. apache mahout_Apache Mahout:入门

    apache mahout 最近,我有一个有趣的问题要解决:如何使用自动化对不同来源的文本进行分类? 前一段时间,我读到一个有关该项目以及许多其他文本分析工作的项目– Apache Mahout . ...

  2. Apache Mahout:入门

    最近,我有一个有趣的问题要解决:如何使用自动化对不同来源的文本进行分类? 前一段时间,我读到一个有关该项目以及许多其他文本分析工作的项目– Apache Mahout . 尽管它不是一个非常成熟的版本 ...

  3. Mahout快速入门教程

    Mahout 是一个很强大的数据挖掘工具,是一个分布式机器学习算法的集合,包括:被称为Taste的分布式协同过滤的实现.分类.聚类等.Mahout最大的优点就是基于hadoop实现,把很多以前运行于单 ...

  4. java 调用 mahout_(转)Mahout使用入门

    一.简介 Mahout 是 Apache Software Foundation(ASF)旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创建智能应用程序 ...

  5. Mahout学习之Mahout简介、安装、配置、入门程序测试

    一.Mahout简介 查了Mahout的中文意思--驭象的人,再看看Mahout的logo,好吧,想和小黄象happy地玩耍,得顺便陪陪这位驭象人耍耍了... 附logo: (就是他,骑在象头上的那个 ...

  6. Apache Mahout 简介 通过可伸缩、商业友好的机器学习来构建智能应用程序

    在信息时代,公司和个人的成功越来越依赖于迅速有效地将大量数据转化为可操作的信息.无论是每天处理数以千计的个人电子邮件消息,还是从海量博客文章中推测用户的意图,都需要使用一些工具来组织和增强数据. 这其 ...

  7. Apache Mahout 简介

    Apache Mahout 简介 通过可伸缩.商业友好的机器学习来构建智能应用程序 当研究院和企业能获取足够的专项研究预算之后,能从数据和用户输入中学习的智能应用程序将变得更加常见.人们对机器学习技巧 ...

  8. mahout 0.9 连接mysql_部署安装 Mahout

    一.Mahout简介 Mahout 是 Apache Software Foundation(ASF) 旗下的一个开源项目,提供一些可扩展的机器学习领域经典算法的实现,旨在帮助开发人员更加方便快捷地创 ...

  9. 数据挖掘优秀工具对比

    1.数据挖掘工具对比 数据来源:Top 15 Best Free Data Mining Tools: The Most Comprehensive List - Software Testing H ...

最新文章

  1. 【Chat】实验 -- 实现 C/C++下TCP, 服务器/客户端 多人聊天室
  2. 数据库归档及热点库_postgresql连续归档及时间点恢复的操作
  3. 密度聚类OPTICS算法
  4. java cglib jar包_Java面试题|反射必看的4道面试题
  5. 同一类的不同对象,在调用相同的成员函数时,入口地址是相同的
  6. 从零开始学JavaScript三(变量)
  7. PHP-FPM Fastcgi 未授权访问漏洞(端口9000)
  8. SpringBoot使用CommandLineRunner和ApplicationRunner执行初始化业务
  9. javascript;json数据,js转换日期方法。
  10. npm的一些常用命令
  11. android token加密_Android使用token维持登陆状态的方法
  12. 小米笔记本重装系统,提示无启动驱动
  13. 记忆术: 记数字 (110数字图像编码)
  14. python爬虫贴吧_Python爬虫——抓取贴吧帖子
  15. 图解多线程设计模式pdf_图解Java多线程设计模式pdf
  16. ‘\0‘到底是什么?
  17. ubuntu WPS 报错系统缺失字体symbol、wingdings、wingdings 2、wingdings 3
  18. 音频呼叫界面设计_使用网络音频来增强您的用户界面
  19. python中,__del__方法介绍
  20. SimpleDateFormat使用详解

热门文章

  1. jq onclick
  2. 芒果TV的2020:在长视频界放下野心
  3. 为网页承载页面添加更多功能
  4. 数字化开采|AIRIOT智慧矿山自动化生产解决方案
  5. 小程序前端Vue里使用u-upload进行多图片上传
  6. 半导体行业如何有效测量无尘净化车间内尘埃粒子数
  7. 2020-09-27
  8. POJ3255 Roadblocks ——次短路
  9. Java Reflection (JAVA反射) 选择自 leek2000 的 Blog
  10. .NET异步和多线程系列(四)- 多线程异常处理、线程取消、多线程的临时变量问题、线程安全和锁lock