Preference Learning——Object Ranking
Basics About Orders
- Object Ranking应用:
- 量化的受訪者的感觉或印象(quantification of respondents’ sensations or impressions)
- 信息检索(information retrieval)
- 理性决策(decision making)
- 定义基本符号
- X:object集合
- xj:索引號为j的object
- xj = [xj1,xj2,…xjk]:xj由一个长度为k的特征向量表示。当中k是特征个数
- O = xa>xb>…xc:O是一个排名
- X(Oi)= Xi:X中Oi的object
- Li = |X(Oi)| = |Xi|:Xi的长度
- 假设某个Oi的个数等于X。那么这个Oi排名就是一个全排名。
- r(Oi , xj)= rij:Oi排名中的第j名是哪个object
- 举例:Oi = x1>x3>x2, r(Oi,x2) = ri2表示Oi的第二名:3
- 对于两个排名O1,O2,存在两个不等的xa,xb,假设(r1a-r1b)(r2a-r2b)>= 0说明这两个object(xa,xb)在两个排名(O1,O2)的排名前后是一致的。
- 假设O1,O2中全部的object的排名前后都一致。则说明O1,O2这两个排名是一致的。
斯皮尔曼距离(Spearman distance)
- 当两个排名中的元素同样时(仅仅有元素同样才有可比性)能够计算这两个排名的距离。计算公式例如以下:
将其规范化到[-1,1]得到 Spearman’s rank correlation p,(当中L =|X|)
- 这得到的是两个全排名的相关性系数。
- 当两个排名中的元素同样时(仅仅有元素同样才有可比性)能够计算这两个排名的距离。计算公式例如以下:
肯德尔距离(Kendall distance)是还有一个被广泛应用的距离
- 当x>0时,sgn(x)=0,当x<0时。 sgn(x)= -1.
- M= (L-1)L/2等于全部的object pairs.
- 将其规范化到[-1,1]得到Kendall’s rank correlation τ:
计算p和τ的代价各自是O(LlogL)和O(L^2),这这两个值本身也有非常高的相关性。他们之间的差距能够通过Daniels’ inequality来界定:
- 还有一个描写叙述ds和dk之间的关系的不等式是Durbin–Stuart’s inequality:
An Object Ranking Task
- 输入:若干个object pair之间的相对关系{O1,O2,…On}
- 给定:模型的误差函数ε()
目的:找到一个排名函数(ranking function)ord(),使得ε(ord(Xi)).sum()最小。ord(Xi)表示了预測排名和输入排名Oi之间的差。
看一个样例:
当中O1,O2,O3是能够观測到的object排名,通过一个回归函数。进行排名得到的是O,当中对于每一个Oi都会产生一个误差ε,通过最小化这个误差和来求得最优的回归模型。*这个概念在机器学习中叫aggregated ranking,在统计学中叫center of orders。
当中的x4在输入模型中并没有观測数据,那么处理这类数据的原则是:若两个object在特征空间上是邻居,那么其排名上也会非常接近。
- 绝对排名(absolute):描写叙述的是回归函数对x1,x2的排名不论是否存在x3,都是一致的
- 相对排名(relative):当存在其它object时。x1,x2的排名可能不一致。可能会出现x1 >x2 > x3 and x2 >x4 > x1
绝对排名在过滤或者推荐系统中更受欢迎。在总结多文档时。当提取了重要句子后又出现新的句子时。那么原有的排序将会受到影响,採用相对排名比較合适。
Object Ranking Methods
Cohen’s method (Cohen)
Cohen的目标是找到一个Ou使得以下这个式子最大化:
当X非常大时,这个问题是NP难的。
因此Cohen提出了一个贪心的算法(Xu表示全部的objects):
- 第一个for循环是计算每一个节点的排名在前面的个数(遍历每对object。对在前面的object的score加1)
- 第二个while循环里面,首先将score的分最大的那个object排在Ou的后面,然后在Xu中删除该元素。
- 内循环for的任务是改动score,此处掉了求和符号。应该与第一个一样。仅仅是这里的Xu改动了
- P[xa>xb|xa,xb]是通过Cohen的Hedge algorithm计算出来的。该算法是一个在线算法(online algorithm)。是Winnow算法的变体。
- Hedge algorithm是一种专家建议预測算法。它仅仅考虑了顺序信息而忽略了数值信息,因此,对于属性值是数值型数据的问题不适合用这个算法。
RankBoost (RB)
Freund提出了RankBoost。
- Input:
- feedback function ∅(xa,xb),假设∅(xa,xb) >0那么xb>xa。
- a set of ranking features fl(xi),包括了目标排名(target ording)的部分信息。
Output:
- final ranking H(xi),是一个计分函数(score function)
算法描写叙述
- 首先:计算初始分布D1(xa,xb)=max(∅(xa,xb),0)/Z1(Z1是规范化系数)
然后:迭代T次。反复选择权值αt以及弱化学习器ht(x)。更新公式例如以下:
h(x)是弱学习器(Weak learners),从特征值中捕捉了真实排名的若干信息。比方说h(xb)>h(xa)表示xb>xa. 一旦αt和ht被确定了,那么排名从大到下的顺序也就确定了,通过以下这个公式能够获取排名信息:
SVM-Based Methods: Order SVM (OSVM) and Herbrich’s Method (SVOR)
OSVM是用来判别给定的对象排名是否高于第j名。 SVOR是用来判别给定的两个object哪个排在前面。
- Order SVM:通过不同的阈值来构建多个SVM分类器,然后对于新的object,利用全部SVM的平均来给予一个固定的名次。SVM算法能够描写叙述为这样一个优化问题:
Preference Learning——Object Ranking相关推荐
- Preference Learning
Introduction 在维基百科中对Preference Learning的解释是这样的:通过已知的可观测的偏好信息构建一个偏好预测模型.偏好学习是机器学习的一个子领域,并且它的主要任务是学会进行 ...
- 语义分割--Learning Object Interactions and Descriptions for Semantic Image Segmentation
Learning Object Interactions and Descriptions for Semantic Image Segmentation CVPR2017 本文主要是从训练数据的角度 ...
- Learning to ranking简介
Learning to ranking简介 目录 1前言... 1 2 LTR基本流程... 2 3 模型训练... 3 3.1排序类型... 3 3.1.1 Pointwise. 3 3.1.2 P ...
- WWW22: CAUSPref_Causal Preference Learning for Out-of-Distribution Recommendation
CAUSPref_Causal Preference Learning for Out-of-Distribution Recommendation Introduction 常见的推荐方法有协同过滤 ...
- 视觉导航(一)Learning Object Relation Graph and Tentative Policy for Visual Navigation
Learning Object Relation Graph and Tentative Policy for Visual Navigation Abstract 视觉导航中最重要的是学习有用的视觉 ...
- (NeurIPS 2019) Learning Object Bounding Boxes for 3D Instance Segmentation on Point Clouds
Abstract 我们提出了一种新颖的.概念上简单的通用框架,用于在3D点云上进行实例分割.我们的方法称为3D-BoNet,遵循每点多层感知器(MLP)的简单设计理念.该框架直接回归点云中所有实例的3 ...
- Deep Learning - Object Dectection 时间简史
转载于https://blog.csdn.net/u010986080/article/details/86534838 相较于文章中所写,目前原github已更新到2020 补充阅读 - 计算机视觉 ...
- 机器人学习之ReorientBot: Learning Object Reorientation for Specific-Posed Placement(ICRA 2022)
1 简介 Object reorientation 面向的问题是:物体初始化的位姿,无法使机器人立刻抓取并以特定的位姿放置物体. 本文提出基于视觉的操作系统ReorientBot,包含以下步骤: 视觉 ...
- 【论文翻译】(ECCV2020)Learning Object Permanence from Video 从视频中学习客体永久性
目录 摘要 1 介绍 2 相关工作 2.1 合成视频数据集中的关系推理 2.2 视频推理架构 3 学习的设置:关于不可见物体的推理 4 我们的方法 5 LA-CATER数据集 6 实验 6.1 基准和 ...
- GeneGAN: Learning Object Transfiguration and Attribute Subspace from Unpaired Data
本文的工作属于图像到图像间的翻译.类似于 DiscoGAN.CycleGAN 和 DualGAN,作者通过对偶学习,加上弱监督信息(weak 0/1 label),成功实现图像属性的迁移.G 采用 a ...
最新文章
- 区块链学堂:区块链引子
- 图像通道、Scalar、分离、合成通道
- android activityManager
- 2021已去,2022未来
- 关于错误Resource interpreted as Script but transferred with MIME type text_html
- c++生成光栅条纹程序_共享屋:一文让你认识光栅尺和编码器
- Java笔记(二)抽象类,接口,完全解耦,多重继承,内部类,静态类,匿名内部类
- matepad适配鸿蒙,消息称华为 MatePad2 搭载骁龙888 4G 华为鸿蒙OS计划适配高通平台...
- sparksql 操作hive_Spark SQL 物化视图原理与实践
- 如何使用final阻止重载?如何使用final阻止继承?
- M1 Mac 档案的临时暂存区工具: Yoink
- 英文翻译西班牙语-批量英文翻译西班牙工具免费
- 批处理渲染Fbx到Avi视频 BatchRenderFbxToAvi Maxscript插件
- wshop微信商城数据库结构简要解析
- 什么是排序算法的稳定性
- Android 11---WMS之横竖屏切换流程详解之一
- 面试——Java字节面经(已获Offer)
- MDD 建模驱动设计
- 微信ipad协议 code 授权信息 hook
- CA认证实现https访问
热门文章
- 欺骗神经网络_可以欺骗神经网络吗?
- java自动填充_java-自动使用随机数据填充原始属性?
- Ubuntu中mkdir失败,显示不存在此目录(mkdir: cannot create directory : No such file or directory)
- DSP实验二c语言程序,实验1.2:编写一个以C语言为基础的DSP程序
- oracle如何修改字段为空的为0,Oracle中字段为空处理成0
- linux服务器用的多的命令,linux服务器常用命令
- iqoo支持typec耳机吗_JEET ONE蓝牙耳机:颜值在线的实力派
- java事件轮询_用scala实现的nio事件轮询
- 用scikit-learn和pandas学习线性回归,XGboost算法实例,用MSE评估模型
- 学习Linux的决心书