搜索引擎定向广告策略--以百度为例
百度的定向广告可以粗分为两种:一种是目前比较搜索界通用的页面右侧广告;另外一种则是百度被人诟病最多的一种所谓“推广”方式,就是在用户搜索的结果前面(按照百度的企业习惯,则是第一页的搜索结果)象用户推送跟用户的输入查询词汇相关的广告链接;
花开两朵,各表一枝,我们先看看“推广”方式,也就是百度常说的竞价排名,是如何实现的。其实,这个“推广”的方式百度采取的技术手段是相当相当的直接的。百度的做法是:把用户的查询拼成一个完整的字符串,然后进行HASH计算,当然后台有一个广告词数据库,直接用HASH值作为数据库的入口,如果发现数据库有这个关键词,就按照购买关键词的企业出价高低输出“推广”结果,如果没有发现这个关键词就按照正常顺序输出用户查询结果。下面用例子来佐证一下:输入查询“手机”,可以看到排列在第一页的都是“推广”广告,输入查询”手 机“,广告依旧,改变查询为“手机 机型”,没有再看到广告,“输入”手机彩铃“,看到很多推广广告,
输入”手机的彩铃“,可以看到广告不见了。这基本已经能够说明问题了。
从这个机制我们可以很容易推导出一个如何绕开百度烦人的小广告的机制,其实很简单,你在输入查询的时候在后面加一个常用词”的“就可以,比如以前你输入”彩铃“,OK,查询结果满目疮痍,到处是膏药广告,改变查询为”彩铃 的“,你可以看到“彩铃 的”第一页搜索结果和“彩铃”的第二页搜索结果是完全一致的,说明成功地绕开了百度的广告词推荐系统而且不影响搜索的效果。
接下来我们看看页面右侧广告的实现机制,这个机制比"竞价排名"明显复杂多了。
首先,我用一些例子得出的第一个结论是:百度右侧排名有两种购买方式,一种是精确匹配关键词方式;一种是模糊匹配关键词方式;所谓"精确匹配”,就是说只有用户输入的查询词和企业购买的是完全相同的才算,比如
企业甲购买“手机”这个关键词,那么只有用户输入“手机”,才能匹配,用户输入“手机价格”是匹配不上的;所谓“模糊匹配”,就是只要用户提交的查询里面包含企业购买的关键词就算匹配上了,比如企业乙购买“手机”这个关键词的模糊匹配,那么用户输入“手机价格”,在右侧排名也会出现企业乙的广告;下面给个例子:
输入“彩铃”,右侧广告匹配成功,列出一些企业广告;输入“彩铃彩铃”,右侧匹配成功,但是企业广告和“彩铃”有所不同;类似的例子还很多,基本说明有“精确”与“模糊”的分别。
如果是精确匹配广告,那么实现起来的机制也很简单和直接,一样直接HASH查找数据库就行了,速度应该够快;麻烦的是模糊匹配策略,一种很容易想到的策略是:对用户查询首先分词,然后在广告关键词数据库里面查找是否有这个关键词。但是百度是这样做的么?
很明显不是这样做的,百度并未对用户查询进行分词,我想可能是先分词再查广告速度比较慢?为什么说没有分词呢,我们看一个例子,输入查询“海鲜花”,可以看到百度右侧广告是有关“鲜花”的广告,而我们都知道百度的分词是正向最大匹配,如果是先分词,那么“海鲜花”必然是分为“海鲜 花”,那么右侧广告应该是海鲜(可以保证“海鲜”是有企业买了这个广告词的),而不是鲜花,这说明百度并非采取先分词,然后去匹配这种策略,
那么采取的是何种策略呢?
很可能采取的是字符串的多模式匹配策略,字符串的多模式匹配问题是要在给定的文本T 中找出输入模式集合P(1)……P(N)中所有出现了的模式。在百度的应用场景下,就是给定用户查询“海鲜花”,在这里找出后台保存的广告词集合“海鲜、鲜花”,关于多模式匹配策略有很多文章讲述,感兴趣的可以去研究一下,目前比较好的方法速度还是相当快的。所以百度处理模糊关键词匹配的方法是:分析用户查询,比如用户输入“海鲜花 彩铃”,先根据空格信息分成两个子成分“海鲜花”和“彩铃",然后两个字符串序列和广告词数据库执行多模式匹配策略,得到如下的匹配结果:”海鲜“,"鲜花”,“彩铃”四个匹配结果,然后按照一定标准输出到右侧广告栏,这个输出策略可能跟企业购买关键词的出价有关,比如出价高的排列在前面,同时输出结果不超过比如10个等等。
/*版权声明:可以任意转载,转载时请务必标明文章原始出处和作者信息 .*/
搜索引擎定向广告策略--以百度为例
中科院软件所 张俊林
timestamp:2006年7月3日
搜索引擎定向广告策略--以百度为例相关推荐
- 搜索引擎设计实用教程(1)-以百度为例
搜索引擎设计实用教程-以百度为例 之一:查询处理以及分词技术 中科院软件所 张俊林 ...
- 搜索引擎设计实用教程(5)-以百度为例
/*版权声明:可以任意转载,转载时请务必标明文章原始出处和作者信息 .*/ 搜索引擎设计实用教程(5)-以百度为例 之五:CACHE结构 中科院软件所 张俊林 2006年1月4日 Cache是目前实 ...
- 搜索引擎设计实用教程(4)-以百度为例
/*版权声明:可以任意转载,转载时请务必标明文章原始出处和作者信息 .*/ 搜索引擎设计实用教程(4)-以百度为例 之四:相关提示功能 中科院 ...
- 搜索引擎设计实用教程(3)-以百度为例
/*版权声明:可以任意转载,转载时请务必标明文章原始出处和作者信息 .*/ 搜索引擎设计实用教程(3)-以百度为例 之三:对百度分词算法的进一步分析 ...
- 搜索引擎设计实用教程(2)-以百度为例
/*版权声明:可以任意转载,转载时请务必标明文章原始出处和作者信息 .*/ 搜索引擎设计实用教程(2)-以百度为例 之二:Spelling Checker拼写检查错误提示(以及拼音提示功能) 中科院软 ...
- 【BI学习心得13-淘宝定向广告演化与天猫用户复购预测】
目录 1.电商定向广告 VS 搜索广告 1.1电商定向广告 1.2搜索广告 2.淘宝定向广告演化 3.阿里深度兴趣网络DIN 3.1attention机制 3.2评价指标 3.2.1改进AUC 3.2 ...
- 手机端展现table_百度信息流广告外包丨百度信息流广告的展现样式和收费方式?...
虽说信息流与竞价同属"广告"模式,但二者或多或少都存在一定的区别和联系.下面看企程信息流托管详细说说,百度首页信息流广告是展示类广告,百度信息流广告是在百度首页,百度贴吧.百度手机 ...
- 网站搜索引擎优化SEO策略及相关工具资源
网站搜索引擎优化SEO策略及相关工具资源 网站优化的十大奇招妙技 1. 选择有效的关键字: 关键字是描述你的产品及服务的词语,选择适当的关键字是建立一个高排名网站的第一步.选择关键字的一个重要的技巧是 ...
- “我们必须禁止互联网定向广告!”
作者 | Paul Jarvis 译者 | 香槟超新星,责编 | 郭芮 头图 | CSDN 下载自视觉中国 出品 | CSDN(ID:CSDNnews) 以下为译文: 剑桥分析公司(Cambridge ...
最新文章
- java部署工具下载_Walle部署工具-Walle(开源部署工具)下载 v2.0.1官方版--pc6下载站...
- nmt模型源文本词项序列_「自然语言处理(NLP)」阿里团队--文本匹配模型(含源码)...
- jquery源码解析:pushStack,end,ready,eq详解
- 2019年春季学期第三周作业
- ZooKeeper快速搭建
- 【推荐系统】一文梳理联邦学习推荐系统研究进展
- AngularJs 基础教程 —— 控制器
- oracle宣传视频下载,1300首 Audiomachine 背景音乐电影宣传预告片配乐合辑(23集)...
- ubuntu 软件包管理工具 dpkg,apt-get,aptitude 区别
- LeetCode(283)——移动零(JavaScript)
- 【手册】jc-cookies 中文文档
- WiFi 转DMX512模块 支持Art-Net sACN RDM DMX
- 利用平面投影坐标与经纬度粗略自动计算高斯投影坐标系参数
- python 柱状图 内部颜色_matplotlib画柱状图,设置同一幅图上的柱子呈现不同颜色...
- 编辑为什么建议转投_为何投文章总被拒?听听期刊编辑的干货建议
- 发布jar包至maven本地库及私服
- AutoCAD关于选择的一些技巧(如何高效地框选)
- python实用大全pdf_超级实用干货|九大技巧,带你用Python玩转PDF
- python 打开电脑摄像头
- java gif转jpg_Java gif图片转换为jpg格式|chu