谷歌搜索:几乎所有的英文搜索都用上BERT了
点击上方“视学算法”,选择“星标”公众号
第一时间获取价值内容
来自:机器之心
在前段时间举办的「Search On」活动中,谷歌宣布,BERT 现在几乎为谷歌搜索引擎上的每一个基于英文的查询提供支持。而在去年,这一比例仅为 10%。
BERT 是谷歌开源的一款自然语言处理预训练模型,一经推出就刷新了 11 项 NLP 任务的 SOTA 记录,登顶 GLUE 基准排行榜。
具体到搜索引擎来说,BERT 可以帮助搜索引擎更好地理解 web 页面上的内容,从而提高搜索结果的相关性。BERT 模型中创新性的 Transformer 架构是一大亮点。Transformer 处理一个句子中与所有其他单词相关的单词,而不是按顺序逐个处理。基于此,BERT 模型就可以借助某个单词前后的词来考虑其所处的完整语境,这对于理解查询语句背后的意图非常有用。
2019 年 9 月,谷歌宣布将 BERT 用到搜索引擎中,但仅有 10% 的英文搜索结果得到改善;2019 年 12 月,谷歌将 BERT 在搜索引擎中的使用扩展到 70 多种语言。如今,这家搜索巨头终于宣布:几乎所有英文搜索都能用上 BERT 了。
BERT 对于搜索引擎意味着什么?
作为自然语言处理领域里程碑式的进展,BERT 为该领域带来了以下创新:
利用无标签文本进行预训练;
双向上下文模型;
transformer 架构的应用;
masked 语言建模;
注意力机制;
文本蕴涵(下一句预测);
……
这些特性使得 BERT 对于搜索引擎的优化非常有帮助,尤其是在消除歧义方面。用上 BERT 之后,对于比较长、会话性比较强的查询,或者在「for」、「to」等介词比较重要的语句中,谷歌搜索引擎将能够理解查询语句中词的上下文。用户可以用更加自然的方式进行搜索。
此外,BERT 对于搜索中的指代消解、一词多义、同形异义、命名实体确定、本文蕴涵等任务也有很大的帮助。其中,指代消解指的是追踪一个句子或短语在某个语境或广泛的会话查询中指代的是谁或什么东西;一词多义指同一个词有多个义项,几个义项之间有联系,搜索引擎需要处理模棱两可的细微差别;同形异义是指形式相同但意义毫不相同的词;命名实体确定是指从许多命名实体中了解文本与哪些相关;文本蕴含是指下一句预测。这些问题构成了搜索引擎面临的常见挑战。
在过去的一年,谷歌扩展了 BERT 在搜索引擎中的应用范围,「搜索引擎营销之父」Danny Sullivan 和 G-Squared Interactive 的 SEO 顾问 Glenn Gabe 等人在推特中介绍了谷歌搜索的最近亮点。
在谷歌搜索中,有十分之一的搜索查询拼写错误。很快,一项新的变革将帮助我们在检测和处理拼写错误方面取得比过去五年更大的进步。
另一个即将到来的变化是,谷歌搜索将能够识别网页中的单个段落,并将它们处理为与搜索最相关的段落。我们预计这会改善 7%的 Google 搜索查询。
Search On 2020:谷歌可以索引一个网页的段落,而不仅仅是整个网页。新算法可以放大一段回答问题的段落,而忽略页面的其余部分。从下个月开始。
使用人工智能,我们可以更好地检测视频的关键部分,并帮助人们直接跳到感兴趣的内容,而不需要创作者手动标记。到今年年底,10% 的谷歌搜索将使用这项技术。
此外,谷歌还表示,他们还应用神经网络来理解搜索相关的子主题,当你搜索宽泛的内容时,这有助于提供更多样化的内容。这项服务预计年底推出。
参考链接:
https://searchengineland.com/google-bert-used-on-almost-every-english-query-342193
https://searchengineland.com/a-deep-dive-into-bert-how-bert-launched-a-rocket-into-natural-language-understanding-324522
https://blog.google/products/search/search-on/
-结束-
???? 长按识别,即可关注
好文章,我 在看
谷歌搜索:几乎所有的英文搜索都用上BERT了相关推荐
- 谷歌、雅虎支持中文域名搜索 有助提升SEO
中文域名也随着这些层出不穷的消息火热升温,其迅猛发展可谓势不可挡.如今,谷歌.雅虎也已开始支持中文域名搜索.只要人们在搜索引擎中输入目标网站已注册的中文域名,便可较为精确的锁定所需站点.此举的实行,对 ...
- 谷歌、百度、必应的搜索技巧
Google高级搜索语法指令 1.allinanchor anchor是一处说明性的文字,它标注说明了这个链接可能跳转到其它的网页或跳转到当前网页的不同地方.当我们用allinanchor提交查询的时 ...
- 谷歌新技术:神经优化器搜索,自动找到可解释的优化方法
文章来源:ATYUN AI平台 如今,深度学习模型已经部署在众多谷歌产品中,如搜索.翻译和照片等.而在训练深度学习模型时,优化方法的选择至关重要.例如,随机梯度下降在大多情况下都很有效,但更先进的优化 ...
- 谷歌、百度、必应高级搜索指令整理
Google高级搜索语法指令1.allinanchor anchor是一处说明性的文字,它标注说明了这个链接可能跳转到其它的网页或跳转到当前网页的不同地方.当我们用allinanchor提交查询的时候 ...
- Nat Methods|一个快速搜索工具能让所有人都能进行蛋白质结构预测
2022年5月30日,来自韩国首尔国立大学生物科学学院的Martin Steinegger和哈佛大学FAS科学部的Sergey Ovchinnikov等人在Nat Methods杂志发表文章,介绍了一 ...
- 国外优秀搜索引擎介绍(英文搜索四当家)
在互联网上,中文内容只占约4%,绝大多数是英文内容,所以只有掌握英文搜索才能真正的深入互联网.但是,英文搜索引擎很多,变化也很快,应该用哪个搜索,和怎么搜索呢?今天,我就来介绍几个最有代表性的英文搜索 ...
- 上传应用程序到谷歌商店_将Google图书搜索集成到PHP应用程序中
上传应用程序到谷歌商店 常用缩略语 API:应用程序编程接口 DOM:文档对象模型 HTTP:超文本传输协议 HTML:超文本标记语言 ISBN:国际标准书号 REST:代表性状态转移 URL:统 ...
- 谷歌 Google Custom Search 站内搜索功能
谷歌 Google Custom Search 站内搜索功能 一. 进入设置网址 https://cse.google.com 二. 登入谷歌账号,没有的需申请 三. 新增搜索引擎,添加网址 点击创建 ...
- 雅虎、百度、谷歌三大巨头比拼社区化搜索
[标题]雅虎.百度.谷歌三大巨头比拼社区化搜索 [内容] 昨天(10日),雅虎打造社区化搜索的关键产品---雅虎空间和雅虎群组同时上线.此举标志着雅虎完成社区化搜索布局,与百度.谷歌开打新一代搜索战役 ...
最新文章
- 《卫生信息基本数据集编制规范》等23项行业标准的通告
- python hex 补0_Python保留前导零的二进制到十六进制转换
- Tomcat乱码解决
- 【HDU - 5050 】Divided Land (Java大数,大数进制转换,大数gcd)
- 逻辑运算符,位运算符
- 聚类算法 距离矩阵_谱聚类
- 大数据技术之kafka (第 3 章 Kafka 架构深入 ) offset讲解
- 实践案例丨云连接CC实现跨区域多VPC与线下IDC Server互联
- 从源代码安装PostgreSQL10.1
- java输出华氏摄氏温度转换表_输出华氏-摄氏温度转换表
- html在线随机出题系统,出题系统/考试模拟考试系统-在线系统
- lisp实心圆点怎么画_实心圆点_实心小圆圈符号怎么打出来?
- Layim 自定义聊天界面
- 读后感:八部众---走出软件作坊:三五个人十来条枪 如何成为开发正规军(二十三)
- Ansible Inventory内置参数
- J9数字科普:Web3.0世界中的J9NFT:仍在发展但未来可期
- html绘制坐标曲线,Word2010中怎么绘制曲线坐标图?
- title啥意思?网址title题目书写
- JAVA计算机毕业设计乐居租房网的设计与实现Mybatis+系统+数据库+调试部署
- [Ansible系列]如何初始化普通用户来操作ansible?
热门文章
- 中国电子学会青少年编程能力等级测试图形化四级编程题:抽奖
- 【怎样写代码】参数化类型 -- 泛型(八):泛型委托
- 探索“小数”在计算机中的存储
- java+script+当前日期_如何在JavaScript中获取当前日期?
- 这是一个好问题:既然机器可以学习,它们能忘掉吗?
- 英特尔北京2022年冬奥会体验中心落成
- SDN 网络技术创新探索 | 移动云 TeaTalk 线上直播 倒计时启动中
- 普诺飞思获创新工场新一轮投资,加速神经拟态视觉传感技术商业化
- 数字人民币实现可控匿名交易?产业升级离不开安全可信的“数字底座”
- 再见 VBA!神器工具统一 Excel 和 Python