用户意图——《Constructing plausible innocuous pseudo queries to protect user query intention》
《Constructing plausible innocuous pseudo queries to protect user query intention》
Information Sciences 325 (2015) 215–226
《构建合理的无害的伪查询来保护用户的查询意图》
摘要:
本文提出了一个基于客户机的方法来保护用户查询意图。主要思想是构建一些合理无害的伪查询放在用户的查询词中,来达到掩盖用户意图的目的。
1. Introduction
本文的方法有两个基本点:
1).不改变原有的收索引擎;
2)此方法的返回结果是查询意图的真实结果的一个超集[注释2],所以不影响性能(准确率和召回率)
未查询词必须具有:合理性、无害性(和真是查询词不相干)
2. Methodology
1)隐私模型(7个定义)Q代表查询空间,P代表话题空间
①Re(q,pi):查询-话题相关度函数,返回值:语义相关性的度量
②P(q)={pi|pi∈P∧Re(q,pi)>λu}:用户意图的组成,其中λu是一个阈值
③Re(p1,p2):话题-话题相关度函数,返回值:语义相关性的度量
④Inn(pi,q):无害性(需要多的话题和查询词无语义相关性)
⑤F(q)= [F(t1),F(t2),...,F(tn) ],where n=|T(q)|and t1,t2,...,tn∈T(q). :q的特征分布
⑥Pla(q1,q2):两个查询词的合理性,由两个词的特征向量分布的相识度来计算
⑦G⊆Q:和查询q有关的一组未查询词
2)方法:
①识别用户意图:Re ( q, p i ) ;为用户查询识别相关意图
②查询无害话题:
③生成伪查询词:
3. Experiment
4. Conclusion
改进:1)根据用户一系列查询词而不是单个词来进行保护用户意图
2)使用其它资源库,不只是使用维基百科
注释:
1.a client-based approach:构建一些合理的无害的伪查询和用户的一个查询结合在一起,达到掩盖用户查询意图。
2.Superset(超集):如果一个集合S2中的每一个元素都在集合S1中,且集合S1中可能包含S2中没有的元素,则集合S1就是S2的一个超集。 S1是S2的超集,若S1中一定有S2中没有的元素,则S1是S2的真超集,S2是S1的真子集。
用户意图——《Constructing plausible innocuous pseudo queries to protect user query intention》相关推荐
- 比 GPT-3 更擅长理解用户意图,OpenAI发布 InstructGPT
作者 | 青苹果 来源 | 数据实战派 近日,OpenAI 发布了一项令人瞩目的研究-- InstructGPT. 在这项研究中,相比 GPT-3 而言,OpenAI 采用对齐研究(alignment ...
- 最新进展概述:澄清式提问辅助理解信息检索中的用户意图
©PaperWeekly 原创 · 作者|金金 单位|阿里巴巴研究实习生 研究方向|推荐系统 用户使用搜索引擎的过程中,通常很难用单一的查询表达复杂的信息需求.在真实应用的过程中,用户需要根据当前搜索 ...
- 这是 Google 工程师 Amit Singhal 发表在 Google 官方博客的一篇文章,讲述了 Google 搜索排名背后的一些技术,涉及到 Google 对网页,对语义,对用户意图的理解。
XEIM这是 Google 工程师 Amit Singhal 发表在 Google 官方博客的一篇文章,讲述了 Google 搜索排名背后的一些技术,涉及到 Google 对网页,对语义,对用户意图的 ...
- 《SEO的艺术(原书第2版)》——3.3 理解搜索引擎流量和用户意图
3.3 理解搜索引擎流量和用户意图 正如1.1节所讨论的,搜索者会输入许多不同种类的查询.这些查询通常可以分为3个大类. 导航型查询 这种查询的意图是访问一个特定的网站或者网页(例如,有人输入你的公司 ...
- 智能语音识别系统_语音识别技术原理_智能语音识别系统如何识别用户意图_企业服务汇...
编者按:智能语音识别系统目前已经实现商业化应用,广泛应用于客服行业,包括智能语音客服和智能客服呼叫中心.那么智能语音识别系统如何识别客户意图,如何判断智能客服系统的语音识别能力呢?本文我们将结合语音识 ...
- 如何来做用户意图识别
什么是用户意图识别?就是让搜索引擎能够识别出与用户输入的查询最相关的信息,例如用户输入查询"仙剑奇侠传"时,我们知道"仙剑奇侠传"既有游戏又有电视剧还有新闻.图 ...
- 基于维基百科的用户意图分类
关于"用户查询意图分类(识别)",在很久以前就开始关注了,最近开始阅读一些文章.前期得文章中,多半在特征抽取中,提到的都是用其他得资源比如查询日志比较多.今天偶然读了一篇文章,以一 ...
- 对话系统-“问答型”单轮对话:FAQ检索式对话系统【步骤:①用户意图判断、②文本检索召回、③文本匹配计算排序】【搜索引擎的最终形态】
一.基本概念 文本匹配:计算文本之间的相似度,主要分为两大类: 1)基于句子向量表示的相似度模型(适合初始召回): 2)基于词级别匹配的相似度模型(适合对召回结果重排) 问答系统:信息检索的一种高级形 ...
- 掌握新技能的义肢-只需通过用户意图就可以移动单个手指
神经系统与机器对接依靠人体主要有三个部分:大脑.肌肉和周围神经.埃隆-马斯克的Neuralink大脑植入是BCI系统的一个例子,在所有接口系统方法中,侵入性接口尽管提供了最全面的人机交互,但存在较大的 ...
最新文章
- 杂记2:VS2013创建Windows服务实现自动发送邮件
- python中文编码-python中文编码json中文输出问题
- 外观模式(Facade)
- MFC多线程各种线程用法 .
- TCP/IP(一):数据链路层
- 看透这个世界--数据封装与解封装过程
- 邮政管理部门发话:未获用户同意投放快递柜属违法行为
- HTML+CSS之iframe
- (*(void(*)())0)();
- java后端使用freemarker生成echarts图表word
- coturn NAT穿透服务器搭建
- 《数据库原理与应用》复习总结
- 智能名片小程序创建名片页功能实现关键代码
- A股数据日级前复权数据补全
- Android设置TabLayout及下划线宽度
- 微信做音乐相册html5,如何制作微信音乐相册 微信音乐相册制作软件的精品教程...
- [Objective-C] 010_Foundation框架之NSSet与NSMutableSet
- OpenCV开发笔记(六十二):红胖子8分钟带你深入了解亚像素角点检测(图文并茂+浅显易懂+程序源码)
- php GD库做水印功能,合并图片
- 华大单片机HC32L130 / HC32L136 / HC32F030 系列硬件开发指南
热门文章
- 基于AidLux+Yolov8,实现安卓手机检测纺织物瑕疵
- 传苹果向三星购买5G基带芯片遭拒;ofo否认破产;阿里大股东宣布清算,抛售全部股份|雷锋早报...
- 我的世界java版合成表_《我的世界》基础攻略 JAVA版合成系统详解
- mysql中phpmyadmin安装教程_安装phpMyAdmin图文教程
- [入门]树(treeview)控件制作导航的做法(三)
- Maya的建模小技巧(二)
- 网站推广的100个实用方法
- 猿人学题库十九题——css加密-雪碧图/数据干扰等——地毯式采坑学习
- 杭州职业技术学院:“企业人才智选库”助力恩施职院毕业生就业
- 电脑文件夹需要权限才能删除怎么处理?(已解决)