超高维数据(数据维度远大于样本数)的降维该如何处理?


clear ;clc;
img1 = double(imread('im1.jpg'));
img2 = double(imread('im2.jpg'));
img = cat(3,img1,img2);
img = img / 255;
img_size = size(img);
img = reshape(img, img_size(3), img_size(1) * img_size(2));
X = img;
[V,pcaX] = PCAt(X,2);
gscatter(pcaX(:,1),pcaX(:,2));
function [V,pcaX] = PCAt(X,k)
%输入: X-样本矩阵,每行为一个样本
%输出: V-主成分向量
% pcaX-降维后的k维样本属性向量组成的矩阵,每一行一个样本,列数k为降维后的样本属性列数
[n,m] = size(X);
meanV = mean(X); %样本均值向量
Z = (X-repmat(meanV,n,1));
CovM = Z*Z'; %计算协方差矩阵的转置
[V,D] = eigs(CovM,k); %计算CovM的前k个特征值和特征向量
V = Z'*V; %得到协方差矩阵(CovM)'的特征向量
%特征向量归一化为单位特征向量
for i=1:k
V(:,i) = V(:,i)/norm(V(:,i));
end
pcaX = Z*V; %线性变换(投影)降维至k维
save('PCA.mat','V','meanV'); %保存变换矩阵V和变换原点meanV

超高维数据(数据维度远大于样本数)的降维相关推荐

  1. 关于保存数据时,提取数据特征的数量和样本数不匹配的原因

    关于保存数据时,提取数据特征的数量和样本数不匹配的原因 项目场景: 样本总数354,测试集283,验证集36,测试集35 0个epoch,保存的特征数据是[35,90] 1个epoch,保存的特征数据 ...

  2. Nat. Biotechnol | PHATE:高维生物数据的可视化方法

    高维生物数据的可视化能帮助研究者以直观的方式了解数据.今天介绍2019年12月发表在Nature Biotechnology的可视化工作. 1 研究背景 高维数据需要可视化工具,以直观的方式显示数据结 ...

  3. python数据组织存在维度吗_用Python 爬取蔡徐坤新浪微博 10 万转发数据,从数据的维度看看存在多少假流量...

    315晚会揭露各企业的造假,怎么也没看看流量明星的数据造假呢?作为一名数据猿,我们秉着好奇心点开了NBA新春贺岁形象大使蔡徐坤的微博,发现他的微博转发量除了最新一条之外,其它的基本每条都是转发100万 ...

  4. 【数据可视化】复杂高维多元数据的可视化

    1 高维多元数据 每个数据对象有两个或两个以上独立或者相关属性的数据.高维指数据具有多个独立属性,多元指数据具有多个相关属性.由于研究者在很多情况下不确定数据的属性是否独立,因此通常简单地称之为多元数 ...

  5. 2021超全大数据面试宝典,吐血总结十万字,大数据面试收藏这一篇就够了

    本文最新版已发布至公众号[五分钟学大数据] 获取此套面试题最新pdf版,请搜索公众号[五分钟学大数据],对话框发送 面试宝典 扫码获取最新PDF版: 版本 时间 描述 V1.0 2020-02-18 ...

  6. 利用AI+大数据的方式分析恶意样本(四十)

    文章目录 The Tangled Genealogy of IoT Malware abstract introduction dataset malware lineage graph extrac ...

  7. 主成分分析旋转矩阵MATLAB实现,R语言高维数据的主成分pca、t-SNE算法降维与可视化分析案例报告...

    维度降低有两个主要用例:数据探索和机器学习.它对于数据探索很有用,因为维数减少到几个维度(例如2或3维)允许可视化样本.然后可以使用这种可视化来从数据获得见解(例如,检测聚类并识别异常值).对于机器学 ...

  8. R语言辅导高维数据的主成分pca、 t-SNE算法降维与可视化分析案例报告

    降低维度有两个主要用例:数据探索和机器学习.它对于数据探索很有用,因为维数减少到几个维度(例如2或3维)允许可视化样本.然后可以使用这种可视化来从数据获得见解(例如,检测聚类并识别异常值).对于机器学 ...

  9. Python 数据的维度

    [中国大学MOOC]北京理工大学 python程序与设计课程 数据的维度 一维数据:由对等关系的有序或无序数据构成,采用线性方式组织 列表.数组.集合 二维数据:由多个一维数据构成,是一维数据的组合形 ...

最新文章

  1. 用于RGB-D显著目标检测的自监督表示学习
  2. MPB:基于BIOLOG的微生物群落功能分析
  3. c++ 缓存和缓冲_【嵌入式C】放弃printf,选择了精简snprintf
  4. matlab符号函数绘图法_转载:MATLAB 符号函数作图
  5. GPU Gems1 - 17 环境遮挡
  6. JAVA WEB篇2——Servlet
  7. 信息学奥赛一本通 1397:简单算术表达式求值 | OpenJudge NOI 1.12 01:简单算术表达式求值
  8. python基础装饰器(二十)
  9. NATSserver配置具体解释
  10. Problem 69:Totient maximum
  11. 大前端-全栈-node+easyui+express+vue+es6+webpack+react
  12. python解包裹_python-之基本语法
  13. 操作系统系列(三)——编译和链接
  14. linux离线安装apr-util 报错,Linux 编译 apr-util 时报错
  15. Win10中英文切换 win键+空格
  16. input-group两侧添加额外元素
  17. CAD转图片用什么软件?分享两种途径
  18. 影视后期制作中AEnbsp;抠像技术浅…
  19. 【更新】京东、美团、饿了么获取cookies
  20. 简述中断处理的6个步骤_完整的中断处理过程分为那几个阶段?

热门文章

  1. delivery route配送路线
  2. PHP跨域处理 图片跨域 接口跨域 后端nginx的cors设置
  3. 小学计算机实验考查总结,小学实验考查的工作总结
  4. HEIC图片如何快速转换格式
  5. [附源码]计算机毕业设计JAVA公务员报名
  6. ​​2023年腾讯云轻量应用服务器和云服务器CVM区别
  7. 视频格式转换器哪个好用?万兴优转-好用的视频格式转换器
  8. 抖音养号步骤有哪些?最重要的3步你做到了吗?
  9. 一个1.1~1.6GHz的威尔金森功一分四功分器设计
  10. Android仿微信视频群聊,Android 仿钉钉、微信 群聊组合头像