翻译 | AI科技科技大本营

参与 | 刘畅

编辑 | Donna

和很多人一样,我们会通过一个人的外表和穿着来判断其经济能力,也会通过字迹来判断其品性。但这篇文章中,斯坦福大学研究人员会通过你所开的车辆类型来判断你可能会在下届总统选举中将票投给川普还是希拉里。

从根本上说,这个研究或者这个结果并不是最近才出现的,市场研究人员和政治分析家已经研究这个问题几十年了,而斯坦福大学更多是借助人工智能在研究方法上进行了创新。

研究介绍

该项研究由李飞飞博士斯坦福AI Lab的学生Timnit Gebru主持。该研究通过算法分析了来自谷歌街景(Google Street View)中的5000万个图像和位置数据,从图像中提取车辆的品牌,型号和年限。经过训练后,算法可以识别给定社区的车辆,判断社区居民的政治倾向。

得益于人工智能方面的最新进展,研究人员第一次能够分析大量的图像,提取可以分类和挖掘的数据,来进行预测收入,政治倾向和购买习惯等事情。

这项研究用到了谷歌街景收集的5000万幅街景图,一共识别了2200万辆汽车,然后被分类到超过2,600个类别,如制造商和型号,位于3000多个邮政编码和39000个投票区。

研究人员招募了数百人对数百万张照片中的汽车进行挑选和分类。一些在线承包商做了一些简单的任务,例如识别图像中的汽车。而其他人则是汽车专家,他们知道一些很细微的差别,比如2007年和2008年“本田雅阁”尾灯的细微差别。

一旦汽车图像工程建成,其速度和预测准确性是非常令人震惊的。它在两周内成功的将五千万张图像中的汽车图像进行分类。如果是一个人类专家进行分类,即使每个图像花费10秒,也需要超过15年。

贝勒医学院基因组研究中心的计算机科学家埃雷兹·利伯曼·艾登(Erez Lieberman Aiden)说:“突然之间,我们可以用对文字分析的那套方法对图像进行同样的分析”。

Lieberman Aiden先生说,对于计算机而言,同人一样,阅读和观察是理解世界的两种截然不同的方式。 从这个意义上说,“计算机就没有理解世界的短板了”。

社会意义

识别如此多汽车图像中的细节是一项非常难的技术,更可贵的在于它将新的数据集与社会经济和环境信息的公共集合连接在了一起,然后调节软件的参数以发现其中信息的模式和相关性。因此,这个项目成为了计算机科学家将图像数据更广泛应用的一个经典案例。

康奈尔科技公司的计算机科学家Serge Belongie曾质疑计算机视觉的快速发展,认为其并不能给社会造成影响:“能够识别照片中的内容并不是能促进我们对世界更科学地理解”。

但是,斯坦福的汽车项目让我们看到了计算机视觉和社会之间的有趣联系,但其实并没有那么多惊人的启示。在最近的一篇论文中,也有关于预测中的相关性的:

  • 该系统能够准确预测全国各城市的邮政编码和选区级别的收入,种族,教育和投票模式。

  • 汽车属性(包括每加仑里程评级)发现,美国最环保的城市是伯灵顿,而卡斯帕是人均碳足迹最大。

  • 芝加哥是收入分配水平最高的城市,在不同地区有大量的昂贵和廉价的汽车。佛罗里达州杰克逊维尔市的收入最少。

  • 纽约是汽车价格最贵的城市。埃尔帕索的悍马比例最高。旧金山的外国汽车比例最高。

其他研究人员已经使用谷歌街景数据为影响城市发展,当地社区的民族变化和公共健康的因素提供了视觉线索。但迄今为止,斯坦福大学的项目似乎在最详细的分析中使用了最多的街景图像。

对这项研究的新应用,Gebru持有很高的期望。除了用于人口统计,视觉图像分析技术还可以用于改进对偏远地区的调查以及用于其他用途,例如:监测二氧化碳水平和缓和交通拥挤。

能否取代传统的统计调查方法?

就像我们说的通过衣着和字迹来判断一个人并不总是凑效,这项研究目前还不能百分百自证完美。目前来说,这项研究仍是传统调研方法的补充方法。

论文的第一作者、前斯坦福大学视觉实验室成员Timnit Gebru称:“我并不认为这样的技术可以取代“美国社区调查”,但是可以作为该调查的补充和对数据进行更新。” Gebru现在在微软研究院的人工智能公平、责任、透明性和伦理(Fairness Accountability Transparency and Ethics in AI,FATE))小组担任博士后研究员。

无法逃避的隐私问题

这项研究只是通过车型预测特定区域的政治倾向,但如果这项研究继续扩展,将会引发数据访问和隐私问题。

斯坦福大学的项目只是预测了社区,而不是个人。 但是在德国和其他地方已经提出了关于街景图片的隐私问题。 对此,谷歌表示,它将根据具体情况来处理关于大量图像数据的研究请求。

随着无人驾驶技术的发展,汽车车载摄像头才刚刚起步。那么,他们收集的大量图像数据是否可用于研究或保留专有权?

如何看待图像识别技术的进步对研究的影响

新生事物总是正反面相伴。一方面我们在质疑研究的可靠性和隐私问题,但另一方面,我们又期待能从中获益。

加州大学伯克利分校人口学教授Kenneth Wachter说,现在基于图像的研究可以帮助公众对抽样调查的回应率下降。 他说,人工智能辅助的视觉人口普查可以填补目前数据中的空白,而且比每十年进行一次的传统人口普查提供更及时的观点,因为这些普查涉及公共政策的热点话题,例如“劣势和机遇的地理和演变。”

哈佛大学计算机科学家兼研究员尼克尔•奈克(Nikhil Naik)在研究城市环境时使用了街景图像,斯坦福大学的这个项目指向了以图像为基础的研究的未来。

Naik先生说:“这是历史上第一次有技术是从大量的视觉数据中提取观点。然而,虽然这项技术令人兴奋,但是计算机科学家需要与社会科学家和其他人密切合作,以确保它是有用的。”

作者 | Steve Lohr

原文

https://www.nytimes.com/2017/12/31/technology/google-images-voters.html

热文精选

2018 年了,该不该下定决心转型AI呢?

不用数学也能讲清贝叶斯理论的马尔可夫链蒙特卡洛方法?这篇文章做到了

盘点深度学习一年来在文本、语音和视觉等方向的进展,看强化学习如何无往而不利

先搞懂这八大基础概念,再谈机器学习入门!

这三个普通程序员,几个月就成功转型AI,他们的经验是...

干货 | AI 工程师必读,从实践的角度解析一名合格的AI工程师是怎样炼成的

AI校招程序员最高薪酬曝光!腾讯80万年薪领跑,还送北京户口

详解 | 如何用Python实现机器学习算法

经验 | 如何高效学Python?

Twitter大牛写给你的机器学习进阶手册

李飞飞高徒新项目,一眼看穿你下届总统会选谁!相关推荐

  1. ECCV 2020最佳论文讲了啥?作者为ImageNet一作、李飞飞高徒邓嘉

    萧箫 发自 凹非寺 量子位 报道 | 公众号 QbitAI 作为计算机视觉三大顶会之一,备受瞩目的ECCV 2020(欧洲计算机视觉国际会议)最近公布了所有奖项. 其中,最佳论文奖被ImageNet一 ...

  2. ECCV 2020最佳论文讲了什么?作者为ImageNet一作、李飞飞高徒

    点上方蓝字计算机视觉联盟获取更多干货 在右上方 ··· 设为星标 ★,与你不见不散 仅作学术分享,不代表本公众号立场,侵权联系删除 转载于:量子位 AI博士笔记系列推荐 周志华<机器学习> ...

  3. 李飞飞高徒盘点年度十大AI亮点:核聚变、ChatGPT、AlphaFold上榜

    来源:新智元 人工智能的爆炸正在扭曲我们的时间感. 你能相信Stable Diffusion只有4个月大,而ChatGPT的出现还不到一个月吗? 打个形象的比喻,只要眨一下眼,你就会错过一个全新的行业 ...

  4. 【强化学习炼金术】李飞飞高徒范麟熙解析强化学习在游戏和现实中的应用

    在新智元上一篇文章中,Jim Fan(范麟熙)介绍了强化学习的概念和目的.今天是<强化学习炼金术>Introduction第三讲. 在这一课里,Jim Fan会跟各位炼金术师们聊一聊游戏中 ...

  5. 李飞飞高徒Andrej Karpathy为大家答疑解惑

    编者按:李飞飞高徒Andrej Karpathy2015年在斯坦福大学获得计算机科学专业博士,2016进入OpenAI工作,主要研究兴趣为:深度学习,生成模型和强化学习.2011至2015年先后在Go ...

  6. ​“从0到1手搓GPT”教程来了!李飞飞高徒出品,马斯克点赞!

    来源:量子位 "从0到1手搓GPT"教程来了! 视频1个多小时,从原理到代码都一一呈现,训练微调也涵盖在内,手把手带着你搞定. 该内容刚发出来,在Twitter已吸引400万关注量 ...

  7. 【强化学习炼金术】李飞飞高徒带你一文读懂RL来龙去脉

    强化学习炼金术 · 背景介绍(上) 欢迎来到<强化学习炼金术>第一讲.手摇芭蕉扇,支起八仙炉,再点上三昧真火.各位炼金术师,你们都准备好了吗? 在这一课里,我会跟大家说说强化学习的概念和目 ...

  8. 李飞飞高徒 Andrej Karpathy:计算机科学博士的生存指南

    李飞飞高徒 Andrej Karpathy:计算机科学博士的生存指南 英文版:A Survival Guide to a PhD

  9. ECCV 2020 五项大奖出炉!李飞飞高徒、徒孙共摘最佳论文奖

    作者 | 陈大鑫 今日,ECCV 2020五项大奖出炉,分别是最佳论文奖.最佳论文提名奖.Koenderink奖.Mark Everingham奖.Demo奖. 在每年大奖中都最受期待的最佳论文奖这一 ...

最新文章

  1. 图灵奖获得者Yann LeCun:未来几十年AI研究的最大挑战是「预测世界模型」
  2. DOM渲染的详细过程 1
  3. mx:button加skin光晕点击时,大小不一样
  4. 成功打开华三模拟器后,创建设备完成却启动设备失败
  5. 一条数据的漫游奇遇记
  6. java勇者大冒险_勇者大冒险 第一集 开车时英文歌 什么名
  7. 【Tools】Tools博客汇总
  8. 【ffmpeg】视频解码器
  9. 真正的免费云时代来临,免费1T全能空间提供1T免费全能空间申请,
  10. excel导出时报错 “文件格式和扩展名不匹配,文件可能已损坏或不安全”解决办法
  11. 用delete带where条件删除特定行部分列(属性)的数据,可能活在梦里
  12. 庄曜计算机应用作曲电子书阅读,庄曜计算机应用作曲的意义
  13. Using 1.7 requires compiling with Android 4.4 (KitKat); currently using API 10
  14. C++11 多线程之 packaged_task
  15. [训练9] 创建猫类
  16. 一篇运维老司机的大数据平台监控宝典(1)-联通大数据集群平台监控体系进程详解
  17. 安卓中动态生成界面布局
  18. 威力曲面sw2020_威力曲面Power Surfacing
  19. 离线强化学习(Offline RL)系列3: (算法篇) AWAC算法详解与实现
  20. 人大金仓(kingbase8)安装与初始化超详细教程

热门文章

  1. 我的第一个vb实例--红楼梦测试小程序
  2. java lamdba表达式效率_java8新特性Lambda表达式为什么运行效率低
  3. php从数据库读取中文显示问号??的解决办法
  4. mail 发送email
  5. Spring MVC环境中的文件上传功能实现
  6. php中类和对象的操作
  7. 《转》java设计模式--工厂方法模式(Factory Method)
  8. 有关于诚信:唐骏学历门
  9. SharePoint 2007 系列(4) -Site Settings
  10. 线性代数:04 特征值与特征向量 -- 矩阵的相似对角化