数据挖掘--非负矩阵分解
交替最小二乘法:
如果同时解下图绿色方程的两个矩阵W和H,属于非线性问题,考虑先初始化一个矩阵W,再在非负矩阵的限制下求出矩阵H,再利用求出矩阵H反过来解矩阵W,…,直到满足误差限为止,这种方法叫交替最小二乘法。
考虑到这样分解出的矩阵W和H是不唯一的,而且有可能会出现负元素,我们还需要对每次迭代出的结果进行标准化。
活跃集方法:
在F范数下,进行矩阵的分解,可以看作是对矩阵A的每一列在二范数意义下进行的最小二乘。
活跃集方法的缺陷在于:对进行非负矩阵分解的速度太慢。
非负矩阵分解可以用来进行分类;
正如前面所言,我们还需要一个初始化的矩阵W,怎么确定这个矩阵呢?
使用
基于SVD的选择运算:
基于SVD的选择运算的MATLAB实验
理论:首先对矩阵A进行SVD分解得到的第一个左奇异向量u1和第一个右奇异向量v1(的转置)分别作为矩阵W的第一列和矩阵H 的第一行。因为矩阵A是非负不可约的,所以可以保证这两个奇异向量的非负性。
A的第二个左奇异向量,和,第二个右奇异向量用来构造一个新矩阵C,将C中的负元素置零,再对C进行SVD分解,取第一个左奇异向量、右奇异向量(的转置)分别作为W的第二列、H的第二行。
A的第三个左奇异向量,和,第三个右奇异向量用来构造…………
试验结果:
可见矩阵H中的前四列(所对应的文档)能够被最初选定的Google关键词很好地表示;
对比之下,
第三列(所对应的文档)可能不能够被最初选定的Google关键词很好地表示,因为(0.5251 0)不仅有一个零元,而且其中非零元所占比重也不大。
数据挖掘--非负矩阵分解相关推荐
- Non-negative Matrix Factorization 非负矩阵分解
Non-negative Matrix Factorization 非负矩阵分解 Introduction 定义 非负矩阵分解(non-negative matrix factorization),或 ...
- 独立成分分析ICA、因子分析、LDA降维、NMF非负矩阵分解
独立成分分析ICA.因子分析.LDA降维.NMF非负矩阵分解 目录 独立成分分析ICA.因子分析.LDA降维.NMF非负矩阵分解 独立成分分析ICA
- SVD(奇异值分解)+NMF(非负矩阵分解)
SVD(奇异值分解)+NMF(非负矩阵分解) NMF==>变为两个矩阵相乘 SVD==>变为三个矩阵相乘
- 文本主题模型之非负矩阵分解(NMF)
1. 非负矩阵分解(NMF)概述 非负矩阵分解(non-negative matrix factorization,以下简称NMF)是一种非常常用的矩阵分解方法,它可以适用于很多领域,比如图像特征识别 ...
- 推荐系统笔记:基于非负矩阵分解的协同过滤
1 非负矩阵分解 非负矩阵分解 (NMF) 可用于非负的评级矩阵. 这种方法的主要优势不一定是准确性,而是它在理解用户-项目交互方面提供的高度可解释性. 与其他形式的矩阵分解的主要区别在于因子 U 和 ...
- 机器学习笔记:非负矩阵分解问题 NMF
1 NMF介绍 NMF(Non-negative matrix factorization),即对于任意给定的一个非负矩阵V,其能够寻找到一个非负矩阵W和一个非负矩阵H,满足条件V=W*H,从而将一个 ...
- 机器学习新论文推荐-(成对关系约束的非负矩阵分解)
徐亦达老师团队新发了一篇论文-Relative Pairwise Relationship Constrained Non-negative Matrix Factorisation(成对关系约束的非 ...
- 【机器学习】NMF(非负矩阵分解)
写在篇前 本篇文章主要介绍NMF算法原理以及使用sklearn中的封装方法实现该算法,最重要的是理解要NMF矩阵分解的实际意义,将其运用到自己的数据分析中! 理论概述 NMF(Non-nega ...
- 文献记录(part55)--基于分布式非负矩阵分解的大规模主题社区挖掘
学习笔记,仅供参考,有错必究 关键词:复杂网络:主题社区挖掘:非负矩阵分解:MapReduce:梯度下降 基于分布式非负矩阵分解的大规模主题社区挖掘 摘要 复杂网络的主题社区挖掘具有重要的应用价值 , ...
- 大数据聚类分析用于预测_多模态数据中的非负矩阵分解用于分割和标签预测
引用 Akata Z, Thurau C, Bauckhage C. Non-negative matrix factorization in multimodality data for segme ...
最新文章
- 当中台遇上DDD,我们该如何设计微服务?
- linux6.2下安装oracle11g,Oracle Linux6.2下安装Oracle11gR2.docx
- Windows2012R2 Hyper-v3.0 高可用群集安装及配置(Live Migration)
- Python实训day05am【正则表达式、网络爬虫】
- Volatile原子性一致性JVM指令重排
- linux 调优系列(续)
- 软考(二):网络中的那些事儿
- 【图像分割】基于matlab贝叶斯算法阙值图像分割【含Matlab源码 1475期】
- C/C++作用域运算符::
- android word缺少字体下载,OfficeSuite字体包
- Quartz数据库存储
- 16种常用的数据分析方法-列联分析
- 物联网安全架构与基础设施
- 论文阅读 [TPAMI-2022] VolterraNet: A Higher Order Convolutional Network With Group Equivariance for Homo
- RabbitMQ实现订单30分钟超时自动关闭
- linux纯文本无法键入密码,Apple Mac OS X FileVault纯文本密码本地安全限制绕过漏洞...
- 服务器中勒索病毒解密恢复 SQL数据库中勒索病毒解密恢复 SQL数据库被加密恢复...
- 相机和雷达外参联合标定
- 工控一体机和常见的平板电脑有什么区别?
- 复习3个月,雅思首考7.0