正在谷歌实习的慕尼黑工业大学博士在读生 Philip Haeusser 的研究领域是计算机视觉。在这篇访谈中,他谈到了自己在谷歌的实习项目、经历、收获以及如何处理实习和自己博士研究课题的关系。

给我们介绍一下你自己,还有你的博士研究课题吧。

我是 Philip,慕尼黑工业大学博士研究生三年级在读,师从 Daniel Cremers。我的研究领域为计算机视觉,即教计算机理解图像及视频的学科。对于计算机而言,图像及视频只不过是巨大数量的无意义数字的组合。如果把它们以色彩表现出来,人类则很容易分辨图片中的内容。


Philip Haeusser

为了教会计算机做同样的事情,我训练神经网络,即一组可以被理解为是“迷你视觉皮层”的模型。目的是为了将组成图像的数字赋予某种意义,如“猫”这样的标签。神经网络在这方面表现惊人。我研究的问题包括光流(从视频的一帧是如何切换到下一帧的)以及域适配(如何使用将一种域的标签,如手写体的图像,运用到另一种域,如谷歌街景里的门牌号)等。

研究以外的时间,我会在我自己的 YouTube 频道“Phil’s Physics”上演示一些实验和分享一些科学知识。

你是如何进入这个领域的呢?

我于2014年在加州大学圣克鲁兹分校获得物理专业硕士学位。当时我在一个跨学科研究小组里参与盲人视网膜移植的项目。我们所做的实验之一需要处理大量的数据,这些数据都非常昂贵,但还无法全部被我们所使用,因为我们的数据处理程序不够复杂。我就是在那时起开始涉猎机器学习和神经网络。我立即被深深吸引并开始联系相关领域的教授。我非常荣幸向 Daniel Cremers 展示了我的工作,并在之后开始读他的博士。

你为什么要来谷歌实习,你的导师是否支持?

深度学习领域发展速度迅猛。几乎每周都有一篇有关神经网络或训练技巧的突破性的新论文发表,而论文作者多来自谷歌,这就使得我对于谷歌在这一领域所做的工作充满了兴趣。在一次夏校的课程里我遇到了 Oliver Bousquet,他对谷歌大脑团队的描述令人惊叹。他也提到了谷歌的实习项目,我立即就申请了。我的导师对此非常支持,能够获取不同的见解,认识更多的人,进行更多的交流总是好的,尤其是在深度学习这样一个全新的领域。此外,在许多大学里计算力无法达到的实验在谷歌都可以获得相关资源并得以完成。

你的实习项目是什么?

我有幸与 DeepDream 创始人之一 Alexander Mordvintsev一起工作。所做的项目涉及用未标记数据和半监督学习训练神经网络的新方法。

我们开发了一种我们称之为“关联学习”的新方法。这有点儿类似“关联游戏”,你听到一个词并马上说出你想到的第一个与之有关联的词。几次“迭代”之后得到的“关联链条”通常出人意料。

我们做的事情非常类似:我们训练一个神经网络来产生允许关联的表征(神经激活模式),关联指标记数据及未标记数据之间的关联。想象从标记数据组中的一个样本到未标记数据组中的另一个样本之间建立一条关联链条;之后,从未标记组到标记组中再建立一条关联,这就形成了一个关联循环。我们就可以将最后得到的样本标签与循环开始时的样本标签做对比。我们的目标在于建立连续一致的关联循环,意指标签是一致的。我们将其表达为成本函数,并证明了该技术对于使用少量标签数据来练分类网络非常有效。

你在谷歌实习期间有发表论文吗?

有的,我完成了一篇论文并提交了 CVPR,在2017年 CVPR 大会上还发表了这篇论文。谷歌资助了我参会的费用。所以在谷歌的实习不仅大幅增长了我在产业里的阅历,还帮助我产出了一篇我自己引以为傲的论文。

你的实习经历与你的博士研究课题相关性如何?

实习之初我们探寻了很多课题,后来从事的这一个与我的博士研究课题非常契合。事实上,我认为即便是参与一个与博士课题并非直接相关的实习项目也会受益良多,例如在编程及项目管理等方面得到的能力训练。

你自己写代码吗?

多亏代码复查,我得以提高了编码水平以及对代码风格及可拓展性有更多考量。谷歌也支持我将自己的代码开源,这也是研究领域惯常的做法。我因此得以继续我的工作,以及同时与全球的研究者分享代码。我还完成了一篇后续论文,关于“关联域适应”,这篇论文也刚被 ICCV 所接受。

这是你第二次在谷歌实习。为什么又回到谷歌苏黎世办公室?

谷歌有太多吸引人的研究项目了,一次实习完全不够,哈哈!说正经的,Sylvain Gelly 的小组邀我参与一个非常有趣的项目。我在去年见过他本人及他的团队,他们都是非常牛的人,我一定不会错过与他们共事的机会。

你在谷歌实习期间获取的最重要的技能是什么?

我认为我的编码能力提高了很多。在谷歌,你有机会向很多超一流的程序员学习,他们的编码质量高,速度快,他们还会帮你提高。与此同时,我还得以与很多不同背景的不同研究小组的成员交流。我遇到的一个产品经理在如何设计成功的产品方面给我很大启发。我还与他们一起参与了 YouTube 新特性的工作。我还在谷歌的健身中心里与 Tough Mudder 的成员一起锻炼了耐力。

实习经历对你的博士研究有何影响?

回顾过去的实习经历,这是我读博经历中重要的里程碑。我当初申请实习也并不是想获得学业的巨大转折或者怎样,不过我返回学校时确实已经收获了非常多的想法和灵感。

回顾过去的经历:博士在读生为什么要申请谷歌的实习?有任何建言吗?

攻读博士期间,有时你会感到困在原地,想要接触不同的东西;有时你想做的实验需要 1000 个GPU;有时你觉得自己已经无所不知,想要挑战自己;有时你想象自己读完博士后的生活,非常想体会狂写代码和对别人产生巨大影响是种什么感觉。理由太多了。谷歌是个允许自我尝试的地方,也许等你回家时,你已经完成了一篇很棒的论文,结交了一群好友,带着一大堆新点子,甚至获得了宝贵的工作机会。

原文发布时间为:2017-08-31
作者:Philip Haeusser
编译:熊笑
本文来自云栖社区合作伙伴“新智元”,了解相关信息可以关注“新智元”微信公众号
原文链接

实习博士访谈:我终于拥有了在大学实验室梦寐以求的算力相关推荐

  1. 作者:周涛(1979-),男,博士,启明星辰教授级高级工程师、大数据实验室副主任。...

    周涛(1979-),男,博士,启明星辰教授级高级工程师.大数据实验室副主任,主要研究方向为大数据安全分析.事件关联分析.入侵检测等.

  2. 作者:钱宇华(1976-),男,博士,山西大学计算智能与中文信息处理教育部重点实验室教授...

    钱宇华(1976-),男,博士,山西大学计算智能与中文信息处理教育部重点实验室教授,主要研究方向为人工智能.数据挖掘与机器学习.

  3. 博士访谈计算机科学研究,【计算机学院】国奖访谈 | 2019级博士研究生熊宇轩:一流的研究,从热爱科学开始...

    原标题:[计算机学院]国奖访谈 | 2019级博士研究生熊宇轩:一流的研究,从热爱科学开始 他是武汉大学计算机学院2019级博士研究生熊宇轩.2017年,他从吉林大学软件学院卓越工程师班保研至武大计算 ...

  4. 配置路由器端口映射,我的eMule终于拥有了HighID

    虽然家里安装ADSL有3年多了,带宽也到了2MB/S,但是我使用eMule下载时总是只有50KB/S左右,终于下定决心,要让我的电骡子拥有HighID,让它跑得快起来. 配置:大亚科技ADSL DB1 ...

  5. 流程自动化开放标准的优势:Eugene Tung 博士访谈

    The Open Group Open Process Automation™ 论坛吸引了各行各业的企业积极参与,包括技术行业.石油与天然气.化工制造商.餐饮业.采矿业及造纸业.在数字化方面,上述许多 ...

  6. java const关键字_const关键字:终于拥有真正的常量声明语句

    你好,今天大叔想和你唠扯唠扯 ES6 新增的关键字 -- const.在说 const 关键字之前,大叔先和你唠唠大叔自己对 const 的感受 -- JavaScript 尼玛终于可以声明真正的常量 ...

  7. GAMES Webinar 222期CAD工业软件——梅敬成博士访谈:三维CAD的发展历程、未来趋势及共性关键技术

    以CAD/CAE/CAM为代表的计算机辅助技术 (CAx) 及其软件研发在现代工业中发挥着极为巨大的作用.3月24日至4月12日,GAMES 执委会CAD/CAE/CAM专题组邀请了八位相关领域的知名 ...

  8. java关闭窗口函数_2016年将是Java终于拥有窗口函数的那一年!

    java关闭窗口函数 你没听错. 到目前为止,出色的窗口功能是SQL独有的功能. 甚至复杂的函数式编程语言似乎仍然缺少这种漂亮的功能(如果我错了,请纠正我,Haskell伙计们). 我们撰写了许多有关 ...

  9. 2016年将是Java终于拥有窗口函数的那一年!

    你没听错. 到目前为止,出色的窗口功能是SQL独有的功能. 即使是复杂的函数式编程语言似乎也缺少这种漂亮的功能(如果我记错了,请纠正我,Haskell伙计们). 我们撰写了许多有关窗口函数的博客文章, ...

最新文章

  1. R语言ggplot2可视化:使用热力图可视化dataframe数据、自定义设置热力图的颜色、自定添加标题、轴标签、热力图线框等
  2. redis(3)redis的基础入门(java)
  3. plc通讯的握手信号_MES与PLC握手的几种方式-控制器/处理器-与非网
  4. 半波对称振子方向图_移动天线的概念 | 天线方向性
  5. Android基础——项目的文件结构(三)
  6. 如果给你机会,阿里巴巴的中层职位和马云的专属司机,你怎么选?
  7. head rush ajax chapter4 DOM
  8. sql server 2008表中计算机,电脑删除SQLsever2008表格数据出现“不能删除”怎么办
  9. 【python教程入门学习】Python 正则表达式
  10. sass报 error (Line XX: Invalid GBK character \xE4) 的解决办法
  11. 无线传感器网络 | 期末复习知识点1
  12. mysql key value_【mysql】大量的 key = value 值用什么方式存储?
  13. flask-mail扩展基本使用
  14. 阶段1 语言基础+高级_1-3-Java语言高级_06-File类与IO流_01 File类_4_File类的构造方法...
  15. Vs2010 上的配置Opencv2.2
  16. android 应用后台 闪退,关于安卓应用后台运行后,重新进入,应用闪退问题
  17. 改名叫Benson...
  18. 推荐一个支付系统技术大全的博主--凤凰牌老熊
  19. ONES 解码:为何数字化是“超级工程”
  20. Apache Ranger and AWS EMR Automated Installation Series (3): Windows AD + EMR-Native Ranger

热门文章

  1. querySelector querySelectorAll
  2. XPath实例教程十四、following-sibling轴
  3. MySQL8.0 - 新特性 - 临时表改进
  4. Java控制语句——for循环
  5. 设计模式(十五):Iterator迭代器模式 -- 行为型模式
  6. Excel随机选取指定数据
  7. 解决方法:ORA-24324 未初始化服务句柄
  8. 互联网天生本质与产业大局的开始
  9. Base64编码原理与实现
  10. 从模板方法模式到JDBCTemplate