学习播客_KLDA(推导得很通俗,下面的推导就是源于此篇博客)


第一部分:按照自己的理解,模仿抄!学习播客来完成一下KLDA的推导。
第二部分:对于Kernel的思考


KLDA:顾名思义,就是把Kernel运用到了LDA上,下面直接推导公式。(原始空间数据$x$,映射之后数据$\phi(x)$)


(1)$J(w) = \frac{w^TS_bw}{s^TS_ww}$ ( we will calculate the $w$ to maximum this formula, and then we finished LDA )
(2)$S_b = (\mu_1-\mu_2)(\mu_1-\mu_2)^T$
(3)$S_w = \sum\limits_{i=1}^{2} \sum\limits_{j=1}^{n_i}x_{ij}$ ( $x_{ij}$ means $x$$\in$$X_i$, and it's the jth element )
(4)$\mu_i = \frac{1}{n} \sum\limits_{i=1}^{n} x_i$
(5)$w=\sum\limits_{i=1}^{n} \alpha\phi(x_i)$
Kernel:$K(x,x_i) = (\phi(x)·\phi(x_i))$ ( which has a specific formula )


问题出现了,我们需要的是最大化(1)来完成LDA,那么就涉及到$w$的计算,而在线性的LDA中,我们已经得出了$w$的结果,即:$S_w^{-1}S_b$。现在,我们希望通过核函数来解决,将线性不可分(可以非线性可分)的低维数据,映射到高维空间从而实现线性可分。那么核函数有什么用?我们观察一下核函数:
Kernel:$K(x,x_i) = (\phi(x)·\phi(x_i))$,这个式子的本质不就是计算$\phi(x)$·$\phi(x_i)$么?那么只要求出映射变化$\phi$,就可以轻松解决这个问题。紧接着出现了新的问题,如何求出$\phi$?答案是——很难,或者说没有价值。因为我们是将低维的数据升维,而很多数据的维度本来就远远高于3维,然后再生个维,$\phi$的维度可以说是非常的高,计算将会耗费大量的时间,而我们回顾我们定义的核函数,我们发现它是显示的,你套用哪个,公式就是哪个,而$\phi$是隐式的。那我们是不是可以通过避开求解$\phi$,而只求$K(x,x_i)$的值,来做同样的事情?答案是肯定的。
那么,如何求解?我们知道$K(x,x_i)$求的是内积,观察(1)至(5),想要凑出形如$x·x_i$的项,只有结合(4)(5)了,结合之后:
$$w^T\mu = \sum\limits_{i=1}^{n} \alpha\phi(x_i) * \frac{1}{n} \sum\limits_{i=1}^{n} x_i = \alpha^TM_i$$ ( where $M=K(x,x_i)$, means $M_i$ is a matrix which has the elements of caculation after K )
接下来呢?看看我们的目标)$J(w) = \frac{w^TS_bw}{s^TS_ww}$,再观察$\mu_i = \frac{1}{n} \sum\limits_{i=1}^{n} x_i$,是不是乘进去就有了我们上一步得到的$w^T\mu$?那我们的目标,就可以进一步表示成:分子/分母!
分子部分:$w^TS_bw$ -> $\alpha^TM\alpha$,为什么就剩下一个$\alpha$?因为两个隐式映射$\phi$被我们揉进了核函数K,这里的M和上面的M意思相同。
分母部分:分母就是暴力乘进去,乘开在这里仅看其中一个类
$$ w^T \sum\limits_{i=1}^{n} \phi(x_i)-\mu w $$ $\Longrightarrow$
$$\sum\limits_{i=1}^{n} (w^T\phi(x_i)w-w^T \mu w)$$ $\Longrightarrow$
$$\sum\limits_{i=1}^{n} w^T\phi(x_i)w-w^T \frac{1}{n} \sum\limits_{i=1}^{n} \phi(x_i) w$$ ( where $w = \sum\limits_{i=1}^{n} \alpha\phi(x_i)$)
然后剩下的就可以用核函数的形式表示了,以便看得较为简洁(同理,揉进去),分母即为:$\alpha^TN\alpha$,这里的N就是把除了$\alpha$的部分做一个变量代换,保持美观整洁。
此时,我们发现,映射变化$\phi$,早就不出现在式子中了,取而代之的是有着明确公式的核函数K(M,N中都含有K),这就是为何说求$\phi$其实没有价值的原因,因为它难算还会被替代,如果好算肯定就算它了。那么我们的目标呢?
$$J(w)=\frac{w^TS_bw}{w^TS_ww}$$ $\Longrightarrow$
$$J(\alpha)=\frac{\alpha^T M \alpha}{\alpha^T N \alpha}$$ ( the answer $\alpha=$ the eig_vector of $N^{-1}M$ who has the maximum eig_value )

关于核函数的思考:核函数,我更喜欢它的另一个名字:核技巧,感觉这个更像核做的事情。因为函数的映射其实不是核做的,是隐式的$\phi$做的,而又因为$\phi$的维数可以巨高,导致我们没有办法或者不值得去计算它,从而我们考虑将目标求值变形,构造出$(\phi(x)·\phi(x_i))$项,进而运用核技巧完成操作。现在疑惑在于,核技巧之多,如何选择?将在思考后补上。

转载于:https://www.cnblogs.com/FormerAutumn/p/10946840.html

关于Kernel的思考相关推荐

  1. Kernel Method的理解

    kernel method是针对低维线性不可分而提出的一种解决方法,在PRML中有一章节的介绍,对其理解,也是迭代更进的过程. 简单来说,kernel method是一种低维和高维特征空间映射的方法, ...

  2. 嵌入android模拟器,编译运行Android模拟器

    source buile/envsetup.sh lunch sdk-eng make sdk -j2 编译完之后,sdk安装在了下面的目录里 ANDROIID_DIR/out/host/linux- ...

  3. Linux系统之Uboot、Kernel、Busybox思考之四

    目录 三 内核的运行 9 设备树: 1) 设备树产生缘由 2) 设备树方案的流程 3) 有了上述概念,为了支撑整个设备树的工程实现,内核实现以下内容 4) 内核解析设备树 5) 入口分析 6) 解析处 ...

  4. Linux系统之Uboot、Kernel、Busybox思考之三

    目录 三 内核的运行 5-中断子系统 6 锁.延迟与原子上下文 7 内存管理子系统 8 驱动的两类框架 三 内核的运行 5-中断子系统 中断子系统的数据结构及设计思想. 中断子系统需要解决中断管理的问 ...

  5. 思考:Linux Kernel的中断处理函数中是否会被其它程序(中断/异常)打断?

    快速链接: .

  6. 解密Kernel:为什么适用任何机器学习算法?

    作者 | Marin Vlastelica Pogančić 译者 | 陆离 编辑 | 一一 出品 | AI科技大本营(ID:rgznai100) 机器学习中Kernel的秘密(一) 本文探讨的不是关 ...

  7. 大牛是怎么思考设计SQL优化方案的?

    作者:惨绿少年 https://www.cnblogs.com/clsn/p/8214048.html 在进行MySQL的优化之前,必须要了解的就是MySQL的查询过程,很多查询优化工作实际上就是遵循 ...

  8. 从安全视角对机器学习的部分思考

    https://www.toutiao.com/a6645122824279163399/ 2019-01-11 14:30:24 陈立庚 南京大学 研究方向:系统安全与软件安全 摘要 近几年,机器学 ...

  9. [转]HOWTO do Linux kernel development - take 3 (中文版)

    打好linux基础,不断的跟随这篇文章中的建议,适应linux kernel开发的流程.虽然需要很久甚至几年的时间,但我相信坚持就会前进!加油! HOWTO do Linux kernel devel ...

最新文章

  1. 计算机基本组成: 触发器
  2. Android setTag()/getTag()
  3. Python基础知识(第三天)
  4. Linux下的Vsftpd配置篇
  5. 认真聊一下MySQL索引的底层实现!
  6. 任何项目都适用的CMakeLists配置
  7. 这么做科研你也能成功!
  8. 9种高性能可用高并发的技术架构
  9. 《DSP using MATLAB》示例Example4.6
  10. day4(继承、修饰符、方法的重写、super关键词、继承中的构造方法、object类、对象转型)...
  11. sql创建表_SQL创建表
  12. 移动硬盘在Windows和Mac上同时使用的巨坑
  13. 今年过年收大礼,劼哥带你进阿里
  14. 线性代数标准型矩阵化简技巧
  15. html水平导航栏代码连接状态,水平导航栏1.html
  16. bugku rev1(xman) WP
  17. 蝴蝶效应,青蛙现象,鳄鱼法则,鲇鱼效应,羊群效应,刺猬法则,手表定律,破窗理论,二八定律,木桶理论,马太效应,这些你都明白吗?...
  18. 关于html中img src= 的使用!!
  19. 日常无用功之windows把整个D盘改成了桌面还原
  20. Unity再更新AR Foundation套件拥有胜博发渲染工作管线

热门文章

  1. php全局变量的关键字,php的static关键字和全局变量
  2. 学习vim的linux游戏,PacVim:一个学习 vim 命令的命令行游戏 | Linux 中国
  3. oracle创建多个游标,Oracle——游标的创建和使用
  4. 背计算机专业英语词汇,计算机专业英语词汇1500词(五)
  5. html表头的标签,HTML 表头单元格标签
  6. jsp中java代码无效_来杯咖啡,教你如何优雅的在java中统计代码块耗时
  7. linux系统ip占用,IP地址被占用的问题,折腾我好几天了 (已解决)
  8. 专栏订阅须知《必读》
  9. 往map里的vector添加_面试官问我同步容器(如Vector)的所有操作一定是线程安全的吗?我懵了!...
  10. java 获得站点地址_JavaWeb项目里面的路径获取方法总结