文/刘江
2012 年 10 月 25 日,坐在富丽堂皇的天津大礼堂里,与天津各高校的两千多师生一起聆听 “ 21 世纪的计算大会 ” 的报告,不由得感慨如今的年轻人在求学阶段就能与包括图灵奖得主在内的世界顶尖学者零距离接触,实在令人羡慕。
[caption id="attachment_14435" align="aligncenter" width="454" caption="大会期间,刘江(中)与Michael Jordan教授(左)和Eric Horvitz(右)合影"]
[/caption]

“ 21 世纪的计算大会 ” 由微软亚洲研究院主办,始自 1999 年,到 2012 年已经是第十四届,是微软亚洲研究院自成立之初便开始举办的学术盛会,主要面向来自亚太地区各大科研机构和高等院校的计算机科研人员及相关院系师生,集中展示计算科学领域的最前沿技术及未来的发展趋势。正如本次大会的主办方之一,南开大学的校长龚克所说,微软亚洲研究院所主办的“ 21 世纪的计算大会”能够激励青年人更加前瞻、深入地思考 " 二十一世纪的计算 " 所面临的种种挑战,同时帮助人们更好地理解 " 二十一世纪的计算 " 和经济、社会、文化等方方面面之间日益密切的联系。 今年是我连续第三年参加“21 世纪的计算大会”。大会主题从 2010 年上海的  “ 人 · 计算 · 现实世界 ” 、 2011 年北京的 “ 计算之本,创新之源 ” 演进为今年的 “ 计算,自然而然 ” 。顾名思义,自然用户界面( NUI , Natural User Interface )是中心议题。 果不其然, Rick Rashid 博士演讲中有几个演示都与更自然的用户界面有关。其中包括在今年 UIST 大会上引起广泛注意的手腕穿戴式 3D 交互原型项目 Digits ,用不太复杂的硬件实现人手运动的捕捉和模拟,已经达到较高精度。而反响最强烈的是实时语音机器翻译,系统不仅将他实时说出的英文语音识别出来,翻译为质量很高的中文,还能匹配他的语音语调用中文说出来,实在是技惊四座。演讲视频在微博里也引起了轰动和广泛传播,更成为国内外很多媒体热议的话题。 Rashid 之后也专门撰文指出,这个演示其实包括语音识别、机器翻译和语音合成三个领域的研究成果。仅仅语音识别方面,这个系统因为采用了深度神经网络( Deep Neural Networks ),错误率降低了 30% ,是 1979 年隐式马尔可夫模型出现以来精确度的最大提升。 但是仅有人机界面层面的突破,仍然是无法实现自然而然的,自然界面离不开大数据的支撑。图灵奖得主、康奈尔大学教授 John Hopcroft 的演讲 “ 计算机科学的新方向 ” 一如既往的高瞻远瞩,而其主题正是近一两年非专业人士也喜欢议论几句的大数据。他认为计算机科学正在经历根本性的变革,将改变社会生活的方方面面,意识到这种变化并未雨绸缪的人会获得巨大优势。过去 30 年编程语言、编译器、操作系统、算法、数据库等领域关注的主要是怎样更好地发挥计算机的作用;而未来将转为应用导向,如何将计算机应用于各个其他领域,比如某些理念在科技文献中是怎样传播的,社交网络中社区怎样演变,如何从非结构数据源中提取信息,处理各个应用领域产生的海量数据等等。计算机科学理论和教育都需要改变,以适应这样的变化。他指出,支持新方向的基础理论有:大规模图,谱分析,高维和降维,聚类,协同过滤,从噪声中提取信号,稀疏矩阵等。其中很多方面以前都没有很好的研究,需要学术界和工业界的共同努力。 依据数据决策有多重要?在会议间歇我采访微软雷德蒙研究院的副院长 Eric Horvitz 时,他兴致很高地回忆起自己曾经救过导师 George Dantzig (线性规划之父)命的轶事。 1980 年代 Dantzig 被诊断有心脏病,医生建议他尽快手术,但搞优化的 Dantzig 岂能随便答应。他找来 Horvitz ,让他把自己的心脏病手术时间当成一个研究课题来做。 Horvitz 查阅了大量医学文献资料和数据,结合老师的个人情况,画出一个优化曲线,推算出 Dantzig 的手术应该一年后做,结果决策大师研究一番后居然照做了。 Dantzig 此后逢人便夸 Horvitz 的功劳,他又活了 20 多年, 90 岁高龄时才去世。 那么,大数据是否意味着数据越多越好呢?去年大会上斯坦福大学教授 Emmanuel Candes在演讲中就给出了一个反例。他 2004 年 偶然发现,一幅采样不足的图片,利用数据的稀疏性和不连续性,通过巧妙的数学处理,可以得到比采样更多的对比图片更清晰的结果。他与陶哲轩在此方面的合作开创了现在非常热门的压缩感知( Compressed Sensing )研究领域,并因此获得 SIAM Polya 奖和 NSF Waterman 奖。现实生活中,由于处理和通信能力的限制,加上传感器和采样系统设计不佳,大量采样数据是冗余的,很快会被压缩而丢弃,造成了大量浪费。压缩感知为我们提供了一种新的思考问题的角度。 本次大会的演讲嘉宾,来自加州大学伯克利分校的 Michael Jordan教授有心理、统计和认知科学学位,同时是电气工程与计算机系和统计系的教授,他对大数据本质的认识非常独到。 “ 计算机研究的是对资源的管理。资源指的是时间、空间和能量,传统上数据并不认为是资源,而是工作负荷。但现在数据也成为资源了。 ” Jordan 教授强调,时间、空间和能量等其他资源基本上是多多益善的,越多处理越快,而数据作为资源却很不一样,数据越多,计算处理不快反慢,而且数据越多越复杂,麻烦也就越大。数据多了,不仅查询起来复杂得多,而且在给定时间里应用复杂算法也越来越不可能了。这正是大数据的本质困难。 对此, Jordan 提出两种解决途径。一是自底向上,化整为零,将算法里的分治原则更全面地运用到统计推断里去,将大数据化为许多小数据来处理,即大数据的 Bootstrap 法。普通的 Bootstrap 算法非常简单,而且看上去与分布式计算 / 云计算非常匹配,但因为重抽样的数据量也会很大,并不实用。 Subsampling (子抽样)法又有无法保证正确性的问题。最后行之有效的是结合了前两者的 BLB方法( Bag of Little Bootstraps ),实践证明非常高效,而理论上又能证明高阶正确性。 二是自顶向下,通过 凸松弛法(Convex Relaxation)实现计算效率和统计效率的权衡。在计算机学家看来,数据多意味着计算多;而在统计学家看来,数据多意味着风险(错误率)越低,随着数据增长,统计推断反而可能简化。 Jordan 在演讲前进行的专访中特别向我指出,计算机科学只有几十年,遇到的很多问题统计学、数学都思考了几百年了。大数据实际上做的正是将计算机科学和统计两个领域联系到一起。他建议计算机专业人士要多看本学科外的相关论文,并半开玩笑地说这是他的授徒秘诀(他门下弟子如 Andrew Ng 、 David Blei 等多成就斐然)。这让我联想起 2010 年与会的图灵奖得主 Chuck Thacker 介绍自己屡屡能在多个方面创新的秘诀,是经常读各领域的原始论文尤其是比较老的论文,看人们最初怎么思考,又在哪里摔倒。 关于创新,大会专门有一个名为 “ 颠覆性创新 ” 的主题论坛。北京大学的迟惠生教授认为创新就要包容异见、但不要轻易受他人影响。中国科学技术大学李卫平教授则提醒大家不应为了颠覆性创新而创新,颠覆性创新必须满足人们现实需求并且影响广泛,颠覆性往往出现在交叉学科点。微软亚洲研究院的研究经理张虹更强调创新的困难,但是不要因此而泄气;另外,软技能很重要,不要当书呆子,要善于激励别人加入,建立社区。这些都是我最近听到的最好的创新箴言。 大会最后,洪小文院长的演讲很有启发性。我印象最深刻的是,他举了一个有意思的例子,今天大家都已经习以为常、非常自然的用牙膏刷牙这一全人类的共同习惯,其实是在 20 世纪初因为广告大师 Claude C. Hopkins的巧妙推销才很快成为一种社会风气的。也就是说,人们很多感觉自然的事情其实并不是天生的,而是久而久之的习惯和学习使然,本身就是人为创造的。不仅是刷牙,说话、写字亦然。因此,技术不应该仅仅适应已有的习惯,更应该从数据中获取真知灼见,创造新的习惯和自然,并勇于促成人们的改变与社会的变革,这才是真正的创新。 博观而约取,温故以知新,自然、大数据、创新,在这里融会贯通了。 本文选自《程序员》杂志2013年1期,未经允许不得转载。如需转载请联系 market@csdn.net 《程序员》2013年杂志订阅送好礼活动火热进行中

博观而约取 温故以知新——“21世纪的计算大会”报道相关推荐

  1. 稼说送张琥 ---博观而约取

    宋 苏轼 曷尝观于富人之稼乎?其田美而多,其食足而有余.其田美而多,则可以更休,而地力得全:其食足而有余,则种之常不后时,而敛之常及其熟.故富人之稼常美,少秕而多实,久藏而不腐. 今吾十口之家,而共百 ...

  2. 第12期 《博观而约取,厚积而薄发》6月刊

    1.[Java]Garbage Collection-垃圾回收-- 任杰 推荐理由:垃圾回收(Garbage Collection)是一种自动的存储器管理机制,可以减轻程序员管理内存的负担,减少程序员 ...

  3. JVM 启动参数详解:博观而约取、厚积而薄发

    JVM 作为一个通用的虚拟机,我们可以通过启动 Java 命令时指定不同的 JVM 参数,让 JVM 调整自己的运行状态和行为,内存管理和垃圾回收的 GC 算法,添加和处理调试和诊断信息等等.本节概括 ...

  4. 博观约取 和实生物----张铜彦先生的魏碑情结

    孟云飞/文 张铜彦,1958年10月出生,河北高阳人.中国书法家协会第五.六届理事,中国金融书法家协会第一.二届主席,中国文艺志愿者协会第一.二届理事,中国宋庆龄基金会第六.七届理事,中央数字电视书画 ...

  5. 实时数据融合之道:博观约取,价值驱动

    陈雷 | DataPipeline 合伙人 & CPO 曾任 IBM 大中华区认知物联网实验室服务部首席数据科学家.资深顾问经理.十年管理经验,十五年数据科学领域与金融领域经验.综合交通大数据 ...

  6. 博观人脸算法工作记录

    工作也算完成了九成,示例代码改动的是可以运行并识别人脸的,就是效率差了点. 如果有问题,欢迎留言! 前言: 8月17拿到博观的人脸识别SDK,一直到现在11月1日还未完成,我自己都觉得太久了,好在领导 ...

  7. java冰箱评测开题报告范文_冰箱冰箱门论文,关于为极致设计而倾心——海尔博观冰箱BCD-800WBCOU1体验相关参考文献资料-免费论文范文...

    导读:为您写冰箱冰箱门毕业论文范文和职称论文提供相关参考文献. 文/ 同辉 "看见了吗?透明的!离远些,等会儿,再看看,是不是不一样了等"这是我最近一段时间常常念叨的话.只要有亲戚 ...

  8. Unix的轻巧“约取而实得”(上篇)

    在经过上机操作实践以及掌握Unix系统相关的基础知识之后,可以说已跨进了迈向成功的门槛.接着要登堂入室,继续专进,就必须更加深入的了解Unix基本命令的功能.使用并掌握一些必备的技巧.这一轮学习会有一 ...

  9. 天梭携合作款计时器亮相进博会;乐高集团连续第四年于进博会发布中国文化元素玩具新品 | 知消...

    天梭携合作款计时器亮相第四届中国国际进口博览会.第四届中国国际进口博览会(进博会)于上海成功开幕,瑞士知名制表品牌TISSOT天梭表携精美时计新品再度惊艳亮相.本届进博会是天梭连续第三年参展,也是品牌 ...

最新文章

  1. 乘法器之五(混和式乘法器(Hybrid multiplication))
  2. spring-security问题记录
  3. java合并整形_Java:合并InputStreams(Java: merging InputStreams)
  4. 【Boost】boost库中thread多线程详解4——谈谈recursive_mutex
  5. python下载微信公众号文章_python如何导出微信公众号文章
  6. Swift傻傻分不清楚系列(三)元组与可选类型
  7. 云图说 | 3分钟创建一个游戏类工作负载
  8. shell--4、Shell 数组
  9. 微信支付开发:当前URL未注册
  10. Worthington 蛋白质组学/蛋白酶方案
  11. HTTP技术快速提升网页的访问速度
  12. mysql发送邮件例子_发送邮件(示例代码)
  13. HTML和CSS (前端)
  14. python将图片生成视频,和空白视频
  15. 申请 NVIDIA vGPU 90天试用 LICENSE
  16. TCP粘包以及粘包处理
  17. ESP32学习入门:WiFi连接网络
  18. 无人驾驶面临的伦理问题
  19. 微信小程序(一)基础知识
  20. 【Ajax】简单入门 - 不深究

热门文章

  1. 数据中心建筑设计的好帮手——BIM
  2. 能在水上“散步”的动物
  3. 如何计算结构体的大小(四步轻松解决)
  4. 初中生学计算机应用有什么好方面,初中毕业学计算机应用技术怎样
  5. 八路抢答器c语言程序,八路抢答器-51单片机(附Proteus仿真、C代码、原理图及PCB、论文和元器件清单)...
  6. 用flashCS6写的制作画板的代码
  7. 互联网后浪盘点:“无敌破坏王”们是怎么打破行业格局的?
  8. SEO赚不到钱是病 得治
  9. python快速输入括号_pycharm 实现光标快速移动到括号外或行尾的操作
  10. 使用Xftp进行远程文件传输