2019独角兽企业重金招聘Python工程师标准>>>

一、pom.xml

<!-- 机器学习包 --><dependency><groupId>org.apache.spark</groupId><artifactId>spark-mllib_2.10</artifactId><version>${spark.version}</version></dependency>

二、api使用

package cn.hhb.spark.mllibimport org.apache.spark.SparkConf
/***向用户推荐商品*/
import org.apache.spark.mllib.recommendation.{ALS, Rating}
import org.apache.spark.{SparkConf, SparkContext}
// $example off$object RecommendationExample2 {def main(args: Array[String]) {var conf = new SparkConf().setAppName("RecommendationExample2").setMaster("local[4]").set("spark.testing.memory", "2147480000")val sc = new SparkContext(conf)val data = sc.textFile("c://test.data")//变换成rationg(评分)对象val ratings = data.map(_.split(',') match { case Array(user, item, rate) =>Rating(user.toInt, item.toInt, rate.toDouble)})//发生购买行为(评分)数据val realData = ratings.map( t=>(t.user,t.product) )// Build the recommendation model using ALSval rank = 10val numIterations = 10//模型,举证分解模型val model = ALS.train(ratings, rank, numIterations, 0.01)val usersProducts = sc.makeRDD(Array((1,1), (2,1)))//笛卡尔积
//    val allUsers = sc.makeRDD(Array(1,2,3,4))
//    val allProduct = sc.makeRDD(Array(1,2,3,4))
//    val userProducts = allUsers.cartesian(allProduct)
//    val unbuy = userProducts.subtract(realData)
//    unbuy.collect().foreach(println)//预测评分.
//    val predictions = model.predict(unbuy)val predictions = model.predict(usersProducts)predictions.collect().foreach(println)}}

转载于:https://my.oschina.net/hehongbo/blog/1545039

spark mllib推荐算法使用相关推荐

  1. 大数据Spark MLlib推荐算法

    目录 1 相似度算法 1.1 欧几里德距离算法 1.2 基于夹角余弦相似度算法 2 最近邻域 3 交替最小二乘法 3.1 最小二乘法 3.2 交替最小二乘法 3.3 ALS算法流程 3.4 ALS算法 ...

  2. Spark MLlib回归算法------线性回归、逻辑回归、SVM和ALS

    Spark MLlib回归算法------线性回归.逻辑回归.SVM和ALS 1.线性回归: (1)模型的建立: 回归正则化方法(Lasso,Ridge和ElasticNet)在高维和数据集变量之间多 ...

  3. Spark MLlib机器学习 | 算法综合实战(一)(史上最详细)

    ==========                         ========= 8.1.1 什么是机器学习 机器学习可以看做是一门人工智能的科学,该领域的主要研究对象是人工智能.机器学习利用 ...

  4. spark als推荐算法笔记

    转自: https://www.cnblogs.com/mstk/p/7208674.html --上面的测试集实际用的训练集 参考: https://blog.csdn.net/delltower/ ...

  5. Spark MLlib FPGrowth算法

    1.1 FPGrowth算法 1.1.1 基本概念 关联规则挖掘的一个典型例子是购物篮分析.关联规则研究有助于发现交易数据库中不同商品(项)之间的联系,找出顾客购买行为模式,如购买了某一商品对购买其他 ...

  6. 开源精选 - Spark个性化推荐算法

    源码:https://github.com/wolf-song-ml/RecommendationSystem 实战篇 1 项目技术架构 2 项目涉及关键技术 Redis:存储用户最近评测队列 Mon ...

  7. 基于Spark实现推荐算法-1:推荐算法简介

    个性化推荐系统简介 个性化推荐系统的定义在 1997 年由 Resnick 和 Varian 提出:利用互联网向用户提供信 息和建议,帮助用户选择产品,或模拟售货员帮助用户完成购买行为的系统 .通常推 ...

  8. 从Spark MLlib到美图机器学习框架实践

    MLlib 是 Apache Spark 的可扩展机器学习库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模的数据集. 机器学习简介 在深入介绍 Spark MLlib 之前先了解机器学习,根据 ...

  9. mllib调参 spark_从Spark MLlib到美图机器学习框架实践

    MLlib 是 Apache Spark 的可扩展机器学习库,旨在简化机器学习的工程实践工作,并方便扩展到更大规模的数据集. 机器学习简介 在深入介绍 Spark MLlib 之前先了解机器学习,根据 ...

最新文章

  1. 如何使用React提前三天计划
  2. object.ReferenceEquals(a,b)
  3. Android双向滑动菜单完全解析,教你如何一分钟实现双向滑动特效
  4. 若依微服务版新建业务模块后提示找不到mapper的解决方法
  5. 经典C语言程序100例之二六
  6. Caffe + CUDA8.0 + CuDNNv5.1 + OpenCV3.1 + Ubuntu14.04 配置参考文献 ---- Wang Xiao Anhui University CVP
  7. vue.js+vscode+visual studio在windows下搭建开发环境
  8. 深度学习(三十三)——GAN参考资源
  9. java实验1机动车实验目的_《Java程序设计》实验指导书.doc
  10. oracle 10g db_file,oracle 10g的db_file_multiblock_read_count参数
  11. android+残留软件包名,关于使用pm hide伪卸载系统软件的一些包名
  12. [置顶]千年潜规则一语道破
  13. http2.0和http1.1的区别
  14. python while快速写法_从零开始学Python,带你手把手实战之一
  15. PMP-项目进度管理
  16. JAVA设计模式-11-代理模式(动态)(一)
  17. Node+puppeteer学习笔记 (二)--环境搭建Win、MAC、Linux环境,以及使用Sublime Text3运行
  18. 任何进行推理的系统都必须具有一些基本的智能
  19. 神奇的三门问题,到底换不换门
  20. 在手机端访问pc服务器的方法

热门文章

  1. 08-KNN手写数字识别
  2. Python---利用蒙特.卡罗方法计算圆周率近似值
  3. linux下怎么查kill某个进程,Linux下查询进程PS或者杀死进程kill的小技巧
  4. bs架构 erp 进销存_从依赖经验到用柔性ERP,企业少走了多少弯路?
  5. ffmpeg 解码视频(h264、mpeg2)输出yuv420p文件
  6. c语言程序设计编程解读,【答题】C语言程序设计问题与解释实验
  7. python函数与模块学习_Python函数与模块学习1
  8. linux缓存文件用户权限错误,CVE-2019-11244漏洞到底该如何修复?--关于缓存文件权限设置...
  9. java查看jdk源码_Java-如何查看JDK源码
  10. I/O复用之 epoll