在统计学习中,转导推理(Transductive Inference)是一种通过观察特定的训练样本,进而预测特定的测试样本的方法。另一方面,归纳推理(Induction Inference)先从训练样本中学习得到通过的规则,再利用规则判断测试样本。然而有些转导推理的预测无法由归纳推理获得,这是因为转导推理在不同的测试集上会产生相互不一致的预测,这也是最令转导推理的学者感兴趣的地方。


  归纳推理中的一个经典方法是贝叶斯决策,通过求解P(Y|X)=P(X|Y)P(Y)/P(X)得到从样本X到类别Y的概率分布P(Y|X),进而使用P(Y|X)预测测试样本的类别。这一过程的缺点在于,在预测某一测试样本的类别之前,先要建立一个更通用的判别模型。那么是否能够更直接判别测试样本的类别呢?一个办法就是通过转导推理。转导推理由Vladimir Naumovich Vapnik(弗拉基米尔·万普尼克)于20世纪90年代最先提出,其目的就在于建立一个更适用于问题域的模型,而非一个更通用的模型。这方面的经典算法有最近邻(K Nearest Neighbour)和支持向量机(Support Vector Machine)等。

  特别是当训练样本非常少,而测试样本非常多时,使用归纳推理得到的类别判别模型的性能很差,转导推理能利用无标注的测试样本的信息发现聚簇,进而更有效地分类。而这正是只使用训练样本推导模型的归纳推理所无法做到的。一些学者将这些方法归类于半监督模型(Semi-Supervised Learning),但Vapnik认为是转导推理3。这方面的经典算法有转导支持向量机(Transductive Support Vector Machine)等。

  转导推理的产生的第三个动机在于模型近似。在某些工程应用中,严格的推导所产生的计算量可能是非常巨大的,工程人员希望找到某些近似模型能适应他们所面临的特定问题,不需要适用于所有情况。

  如下图所示。判别模型的任务是预测未标注数据点的类别。归纳推理方法通过训练一个监督学习模型来预测所有未标注点的类别。这样,训练样本中就只有5个点供以训练监督学习模型。对于图中较靠中心的某点(红色圆圈),利用最近邻算法就会将其标记为A或C,但从所有数据组成的类簇来看,此点应标为B。

图1:少量标注样本时,使用KNN算法预测样本类别。训练样本是少量已经标注(A、B、C)的点,而其它大部分的点都是未标注的(记为?)。

转导推理会利用所有点的信息进行预测,也就是说转导推理会根据数据所从属的类簇进行类别标注。这样中间红色圈的点由于非常接近标为B的点所从属的类簇,就会标注为B。可以看出转导推理的优势就在于其能通过少量的标注样本进行预测。而其不足之处就在于其没有预测模型。当新未知点加入数据集时,转导推理可能需要与数据量成正比的计算来预测类别,特别是当新数据不断地被获取和加入时,这种计算量的增长显得犹为突出,而且新数据的添加可能会造成旧数据类别的改变(根据实际应用的不同,可能是好的,也可能是坏的)。相反地,归纳推理由于有模型存在,在计算量上可能会优于转导推理(模型的更新可能增加计算量)。

文章的后面部分将以二分类为例,先从较简单的情况开始,即给定大量的标注样本,判断测试样本的类别,讨论最近邻(k Nearest Neighbours,KNN)和支持向量机(Support Vector Machine,SVM)。接着就讨论在给定少量标注样本和大量测试样本的情况下,判断测试样本的方法,主要是转导支持向量机(Transductive Support Vector Machine,TSVM)。

推理计算过程_转导推理—Transductive Learning相关推荐

  1. 推理计算过程_初中物理电学计算题第六讲:极值问题推理和限制条件

    初中物理电学计算题第六讲:极值问题推理和限制条件 前面已经讲过:初中物理电学计算题第三讲:串联电路电流电阻极值推理实例,本讲是这一问题的进一步深入讨论. 题型分析 极值问题是电学计算题中一类较难的题目 ...

  2. 转导学习 transductive learning

    转导推理(也称为直推式学习(Transductive Learning) 区别于归纳推理(Inductive Inference)从特殊到一般,再从一般到特殊的学习方式,转导推理(Tranductiv ...

  3. 图像sobel梯度详细计算过程_数字图像处理(第十章)

    点.线.边缘检测 背景知识.书中主要介绍了图像的一阶导数与二阶导数,这个之前的文章中有过介绍这里在复习一遍.对于函数 ,对于点 在x方向的一阶偏导为: ,二阶偏导为: 之后书中总结了一阶导与二阶导对于 ...

  4. 图像sobel梯度详细计算过程_视频处理之Sobel【附源码】

    边缘检测是检测图像中的一些像素点,它们周围的像素点的灰度发生了急剧的变化,我们认为在这过程中,图像中的物体不同导致了这一变化,因此可以将这些像素点作为一个集合,可以用来标注图像中不同物体的边界.边缘区 ...

  5. 直线插补计算过程_【计鹏视角】风速数据插补对发电量的影响

    测风数据在插补时通常通过相关函数实现,相关函数一般采用线性方程函数,线性函数根据不同通道的风速相关性散点图来得到. 不同高度层的相关性散点图是成"带"状分布,相关系数越大,&quo ...

  6. 弹性均质圆环法计算过程_蚝油的加工工艺,蚝油总固形物(水分含量)计算公式,检测方法...

    蚝油是用蚝(牡蛎)熬制而成的调味料.蚝油是由豉(牡蛎干)熬制成的汤,经过滤浓缩后即为蚝油.它是一种营养丰富.味道鲜美的调味佐料.蚝油做法程序繁多,最重要的步骤是用水将鲜蚝煮至理想黏度,做出优质的蚝油应 ...

  7. 熵权法excel计算过程_翅片式蒸发器如何最简单的进行计算和仿真?

    前言: 翅片式换热器是制冷系统中最最常用的换热器之一,换热方式是强制式风冷换热器,尤其是家用空调中的蒸发器和冷凝器采用的都是翅片式换热器,而换热器其实又是制冷系统设计中最难的一部分,因为压缩机的匹配和 ...

  8. 弹性均质圆环法计算过程_同济大学地下建筑结构复习要点

    同济大学地下建筑结构复习 1 绪论 1.1简述地下建筑结构的概念及形式 地下建筑结构即埋置于地层内部的结构.包括衬砌结构和内部结构两部分.要考虑地下结构与周围岩土体的共同作用.地下建筑结构的形式主要由 ...

  9. 弹性均质圆环法计算过程_第十章盾构隧道衬砌计算方法综述.ppt

    第十章 盾构隧道衬砌计算方法 10.1 国内外的发展动态-常用模型 盾构隧道的设计模型,多用荷载一结构模型.但由于其断面为圆形,地层结构法对均一地层中单孔圆形隧道也取得了精确的解析解,但其他情况仍须借 ...

最新文章

  1. NVIDIA 认证系统
  2. python安装了运行不了_python详细安装教程
  3. 「仅凭照片就能判断一个人是否犯罪」?这样的研究能发表,LeCun、MIT谷歌等机构的1700名研究者怒了...
  4. boost::make_biconnected_planar用法的测试程序
  5. MySQL Sharding DB (基于Fabric)
  6. IOS开发之----常用加密方法
  7. kali BEEF-XSS启动报错解决
  8. 笔试的图形推理题怎么做?
  9. iOS简单人脸检测的实现
  10. 一张“黑洞”照片需半吨重硬盘?更逆天的操作还有这些……
  11. 利用神经网络预测股票价格走势
  12. RN:App版本更新提示方案
  13. xHiveAI Jetson NX盒子:jpeg图片编码
  14. Android中TextView中的.setText和.append的区别
  15. Spring MVC 拦截器执行流程
  16. java代码实现排序二叉树
  17. JUC第六讲:ThreadLocal/InheritableThreadLocal详解/TTL-MDC日志上下文实践
  18. FinalShell找回服务器密码
  19. 人工智能AI、机器学习模型理解
  20. mysql分片备份不一致问题_光大银行分布式实战:国内最大缴费平台的数据库架构转型...

热门文章

  1. 激光雷达Lidar Architecture and Lidar Design(上)
  2. TensorRT IRNNv2Layer
  3. H.265视频编码与技术全析(下)
  4. 目标检测coco数据集点滴介绍
  5. php将图片链接转换为base64编码文件流
  6. Python:XPath与lxml类库
  7. Android 一个activity 加载一个Fragment
  8. C#日期格式精确到毫秒 !!
  9. Debugging Ruby in VS Code
  10. chrome使用技巧(看了定不让你失望)