在user-cf的过程中,考虑如下的case:

user-A like item-a item-b item-d

user-B like item-a item-c

user-C like item-b item-c

user-D like item-c item-d item-e

考虑给user-A进行推荐,首先user-cf要确定相邻user的个数K。

书上说,user-cf中K的值过大或者过小都不好。user-A的推荐中,K值最小的极限K=1,即只考虑和user-A最相似的user,会因过于片面而效果不好;K值去最大的极限,即K=user_number,即所有的user都和user-A相邻,那么给user-A的推荐就会过于倾向于热门物品,而不是个性化物品。

个人认为,在user-cf的推荐中,user-A和所有相似度不为0的user进行推荐,K值越大越好。因为这样才能全方位利用相似user的信息,如果K值过大导致推荐倾向热门物品,是因为相似度计算公式不够好,不能够对和A最相似的物品给予足够的权重。

在此处只考虑K=user_number进行计算。

user-cf算法思考-K值的确定相关推荐

  1. k近邻算法之 k值的选择

    k近邻算法之 k值的选择 举例说明: K值过小:  [过拟合] ​ 容易受到异常点的影响   [如:美人鱼本身就是喜剧片,假如统计的时候记为动作片,则对预测值的影响太大] k值过大:  [欠拟合] ​ ...

  2. 机器学习里如何确定K-Means算法的K值?

    [问题] Kmeans算法中,K值所决定的是在该聚类算法中,所要分配聚类的簇的多少.Kmeans算法对初始值是比较敏感的,对于同样的k值,选取的点不同,会影响算法的聚类效果和迭代的次数. [解决方案] ...

  3. Kmeans算法肘部法则--Kmeans算法确定K值

    肘部法则对于K-means算法的K值确定起到指导作用,很多人在用K-means算法的时候可能不知道如何确定K取多少比较好,在面试也会遇到K值确定的问题.肘部算法可以有效解决这个问题 简单叙述一下肘部法 ...

  4. KMeans算法的K值以及初始类簇中心点的选取

    KMeans算法是最常用的聚类算法,主要思想是:在给定K值和K个初始类簇中心点的情况下,把每个点(亦即数据记录)分到离其最近的类簇中心点所代表的类簇中,所有点分配完毕之后,根据一个类簇内的所有点重新计 ...

  5. 【机器学习】KNN算法及K值的选取

    KNN算法是有监督学习中的分类算法,它看起来和另一个机器学习算法K-means有点像(K-means是无监督学习算法),但却是有本质区别的. KNN的原理就是:当预测一个新的值x的时候,根据它距离最近 ...

  6. knn算法中k值的理解

    knn算法是指对预测集中的每一个图像与训练集中的所有图像比较,寻找出在训练集中与这一张预测图片最接近的图像,将该图像的标签给这张预测图片.实施的方法为图像矩阵相减并取绝对值,然后将得到的像素矩阵各元素 ...

  7. K-近邻算法之K值的选择(带案例)

    三.K值的选择 K值选择问题,李航博士的一书「统计学习方法」上所说: 选择较小的K值,就相当于用较小的领域中的训练实例进行预测,"学习"近似误差会减小,只有与输入实例较近或相似的训 ...

  8. KNN 最近邻算法(K近邻)

    机器学习教程 正在计划编写中,欢迎大家加微信 sinbam 提供意见.建议.纠错.催更. KNN(K-Nearest Neighbor)是机器学习入门级的分类算法,也是最为简单的算法.它实现将距离近的 ...

  9. kmeans聚类选择最优K值python实现

    Kmeans算法中K值的确定是很重要的. 下面利用python中sklearn模块进行数据聚类的K值选择 数据集自制数据集,格式如下: ①手肘法 手肘法的核心指标是SSE(sum of the squ ...

最新文章

  1. php图片特效,php_imagick实现图片剪切、旋转、锐化、减色或增加特效的方法
  2. celery 运行时 (from . import async, base)SyntaxError: invalid syntax 异常的解决方案
  3. FFmpeg编码扩展之————编码库的扩展(libfdk-aac)
  4. DDoS攻击惯犯图鉴
  5. easyuefi只能在基于uefi启动的_电脑知识:5分钟教你深入了解BIOS+MBR和UEFI+GPT
  6. 编写五子棋的完整python代码_python实现五子棋游戏
  7. mybatis自动生成mapping和实体
  8. SAP License:ERP项目经理需求调研的惨痛经历
  9. linux驱动开发框架
  10. Binutils工具集中的一些比较常用的工具
  11. 85、android handler的警告Handler Class Should be Static or Leaks Occur
  12. 数据结构与算法之-----队列(Queue)
  13. pmp备考资料这些都是必备的
  14. windows 邮件系统收发163邮件
  15. 新路由3 Newifi3 D2 Lede固件
  16. Web前端必备:JavaScript基础知识梳理
  17. ParkingEE智能化停车服务平台
  18. android搜索app下载地址,如何找出APP的URL Scheme
  19. eclipse IDE
  20. Qt之QWidget设置窗口背景图片的几种方法

热门文章

  1. 全链路稳定性背后的数字化支撑:阿里巴巴鹰眼技术解密
  2. Python编程:安装自己编写的包
  3. C语言|职工工资管理系统
  4. linux centos7 解决挖矿病毒kthreaddk 高CPU占用
  5. 公司绝不会告诉你的20大秘密值得一看很受用
  6. SAP与金蝶星瀚:ERP销售业务实现技术方式区别
  7. 【译】「食人的大鹫」的运动方法 程序动画技术
  8. Mac xmind安装与破解版
  9. web端 刷卡器_web工程集成身份证读卡器,高拍仪
  10. 计算机二级C语言的教材、上机考试题库、历年真题等