谷歌可以在一小时内识别并翻译所有的法国街景中的道路号码,这得益于他们开发的神经网络系统。 现在,让谷歌的工程师来告诉你,他们是如何做到的。

谷歌街景已经成为在线地图体验中很重要的一部分。它允许用户定位到街道,看到当地的实景照片。

当然这些也是谷歌拥有的非常有用的资源。可以从这些照片中读取门牌号,并把它们和所在的地理位置进行比对。这样就可以在数据库中记录下每栋建筑物的地理位置。

类似日本、韩国等国家,他们的街道号一般都不是按照地理位置来排列的,街道常常是按照铺设时间先后等方式来排列,这就给人们定位、找路带来了很多的麻烦。在这些场景下,谷歌的路牌,门牌识别就特别有用了。

但是,要标记并识别这些号码是相当耗时的。谷歌的街景照相机已经记录了数以亿计的全景图像,其中包含了上千万的门牌号码。检索这些图片、识别号码,任务繁重,不是凭人力能轻松完成的。

因此,很自然的,谷歌会用自动化的方式来解决问题。今天,公司的 Ian Goodfellow 和 pals 向我们揭示了他们是如何做的。他们的方法就是,使用11层神经元的神经网络,神经元被训练负责从图片中读取号码。

为了容易上手,Goodfellow和他的小伙伴们为这项任务设置了一些限制,让任务尽量简化。 例如,他们假设图片上建筑的编号已经被圈出并剪裁好,号码图像至少占了图片上的三分之一宽度。他们也假设号码不会超过5位,这对世界上大部分的地区来说都是合理的假设。

但是,和其他的团队做的不同,他们并没有把这些门牌号分割成单个的数字。 他们的做法是在裁剪图像中定位整个号码,并一气呵成地唯一确定它,这些都是通过一个神经网络来完成。

他们用被称为街景门牌号数据集的开放的号码图片数据集的图片来训练神经网络的神经元。集合包含了大约 200,000 张谷歌街景照相机拍摄的照片,已被公之于众。他们说,这个训练花了6天时间才完成。

Goodfellow的队员说,如果一个自动化系统的效果不能匹敌或超过人工处理(通常,人有 98% 的概率能精确的圈出号码),哪使用它就毫无意义了。因此,这才是他们团队的目标。

然而,这并不意味着是正确的在所有的图片中圈出98%的号码。而是说,在所有图片的子集中圈出 98% 的号码也是可以接受的,这个子集覆盖到了总集合的 95% 。

即便这样,已经比其他团队的效果好很多了。他说,“世界范围内,我们可以自动检测并解码接近一亿的街道门牌号,并且可以达到人类检测的精度” ,并认为,这是一个“空前的成功”。

并且他们能在合理的时间内完成这项任务。 “我们可以在一小时内,用谷歌的基础设施,解码所有法国的带街道号的街景” ,是的,你没有看错,确实只需要一小时。

有一个有趣的问题,这项技术,有没有可能用于抽取其他的号码,例如名片上的电话号码,甚至车票号码。

然而开发人员对这项技术却并不乐观。他们说,该技术的成功非常依赖于号码不超过5位长的假设。“对更长的号码,我们的方法的扩展性不好” 。

虽然系统现在还需完善,其中2%的未辨识号码仍然是团队们的眼中钉。但是,谷歌可以放心的说,他们已经在文字抽取和识别上迈出了重要的一步:用单一神经网络来定位和识别数字。

其实,我们最想知道的是,下一步谷歌要做什么。Goodfellow 的团队透露了一点信息: “使用单一神经网络作为完整的端到端的系统的这种方法可以适用于解决其它的问题,如一般的文本解码或语音识别。” 什么意思?你懂的。

原文链接: technologyreview 翻译: 极客范 - SarahCla

译文链接: http://www.geekfan.net/5254/

[ 转载请保留原文出处、译者和译文链接。]

谷歌如何捕获街景中的门牌号码相关推荐

  1. 门牌号码编辑器_用于门牌号码检测的深度学习

    门牌号码编辑器 深度学习 (Deep Learning) Stuck behind the paywall? Click here to read the full story with my fri ...

  2. java 正则 捕获_Java通过正则表达式捕获组中的文本

    1.简介 Java 正则表达式如何捕获组中的文本 ?--请看下文. 2.代码 /** * 版权所有 编程十万个怎么办(www.tah1986.com) */ public class Capturin ...

  3. 谷歌的android下拉刷新页面,Android SwipeRefreshLayout:谷歌官方SDK包中的下拉刷新

     <Android SwipeRefreshLayout:谷歌官方SDK包中的下拉刷新> 下拉刷新在如今移动开发中应用如此广泛和普遍,以至于谷歌干脆在SDK中给予支持.在android ...

  4. Nutch 使用metadata plugin捕获页面中的meta标签数据

    Nutch 使用metadata plugin捕获页面中的meta标签数据 添加index-metadata和parse-metatags 要使用Nutch的插件,就需要在conf/nutch-sit ...

  5. java取邮箱前缀_java抓取网页或文件中的邮箱号码

    java抓取网页或文件中的邮箱号码 发布时间:2020-10-18 08:58:32 来源:脚本之家 阅读:69 作者:java大渣渣 本文实例为大家分享了java抓取邮箱号码的具体代码,供大家参考, ...

  6. android 7.0 漏洞利用,谷歌 Android 移动操作系统中的零日漏洞被攻击者利用

    导读 谷歌 ProjectZero 研究小组一名成员周四晚表示,攻击者正在利用谷歌 Android 移动操作系统中的零日漏洞,使他们完全控制至少 18 种不同手机,包括 4 种不同型号的谷歌 Pixe ...

  7. 【HR必看】Excel中对身份证号码的处理技巧

    [HR必看]Excel中对×××号码的处理技巧 ×××号码的处理是HR部门经常遇到的问题,我给几个地方的企业培训时发现,相当一部分人员基本还是手动对×××号码进行处理,效率可想而知啦!下面,刘老师为大 ...

  8. php经常致命错误怎么办,如何捕获PHP中的致命错误(Fatal Errors)

    在这篇文章中,我们将会看到如何捕获PHP中的致命错误(Fatal Errors).在通常情况下这些错误是能不被捕获的,因为他们是"致命"的. 当你想要查看详细的.格式化后的错误页面 ...

  9. 谷歌 zx 脚手架模块中文文档

    谷歌 zx 脚手架模块中文文档 zx 是 2021 gibhub上的一个新的明星项目,它让我们可以便捷的使用 JavaScript / TypeScript(该项目包含TypeScript类型声明)替 ...

  10. mysql提取手机号_如何使用mysql查询语句从用户手机号中提取纯号码

    大家好,我是Dodo团队的shimii 今天和大家分享一下如何使用mysql语句从用户手机号中提取纯号码. 最近工作中需要查询一些用户的手机号,但是数据库中的手机号存在不太规范的情况,数据大概有以下几 ...

最新文章

  1. 青少年蓝桥杯_2020_steam考试_中级组_第三题
  2. 2684亿!阿里CTO张建锋:不是任何一朵云都撑得住双11
  3. boost::error_info的用法测试程序
  4. linux网络编程之网络字节序、主机字节序、大端、小端
  5. bigdecimal 小于等于0_半场0-0比分的比赛,你需要注意这些
  6. 小学数学N合一(洛谷P2433题题解,Java语言描述)
  7. 怎么调节手机的刷新率_二分钟科普:手机上的“高刷新率”
  8. 一个用php抓取网页中电子邮箱的实例
  9. python安装成功的图标_安装Python
  10. 丢手帕程序C语言,语言丢手绢教案中班
  11. 从“谈芯”走向“用芯” RISC-V 未来前景光明?
  12. 计算机html基础试题与答案,2019年大学计算机基础试题题库及答案.docx
  13. android ndk串口触屏,Aandroid NDK开发之串口控制
  14. 2022美团CTF个人决赛WP
  15. MATLAB泰勒级数展开
  16. 计算机组成原理实验报告 算术逻辑单元ALU实验(源代码全)
  17. kafka报错The request included a message larger than the max message size the server will accept
  18. 大功率的用电电器为什么要用三孔插座?
  19. vim如何提高效率:使用jk绑定Esc
  20. 微信公众平台开发教程第2篇-----微信开发者接入

热门文章

  1. 软件工程复习笔记 用例图
  2. java技术与jsp技术简介_什么叫JSP技术
  3. 内容太干准备好水:项目进度管理S曲线制作方法新探
  4. 大数据实战之路-数据仓库-项目运维交接文档
  5. CSDN首页 云计算 孙玄:解析58同城典型技术架构及演变
  6. 本特利振动探头177230-01-01-CN
  7. LED的基本操作(138译码器 573锁存器)
  8. 攻防世界misc——flag_universe
  9. 蓝桥杯led流水灯实现(38译码器和锁存器的使用)
  10. 电子海图制作中坐标转换的应用与实现