尽管现实中的人工智能研究遭遇过“寒冬”,曾被科学家打入冷宫,甚至一度“门前冷落车马稀”(详见《中国青年报》7月29日报道《人工智能是真热还是虚火》),但在人类的艺术想象中,追寻人工智能的脚步却从未停歇。

无论是《星际穿越》中那个能看懂周围世界、听懂人类语言的可爱智能机器人Tars,还是今年风靡全球的“大白”,以及电影《她》塑造的能听懂人说话并与人交流,甚至与人恋爱的人工智能操作系统“萨曼莎”,艺术家们发挥他们的想象力,展望未来的人工智能。

那么,现实中的人工智能研究究竟到了什么地步?中国又当如何应对?近期在北京举办的2015中国人工智能大会给出了一个说法。

新松机器人中央研究院院长徐方的看法是:工业机器人已经走进现实,未来5~10年,智能型工业机器人便会大行其道,先是在汽车等行业应用,然后扩大其使用范围,再将来,机器人可以代替人在不适合人类的场合工作。

人工智能与机器人是另一个科技创新的风口

就在这次大会举办的前一周,第19届RoboCup机器人世界杯在中国开幕。一个智能机器人以准确的中英文翻译,震撼了这个国际上规模最大、水平最高、影响最广的机器人大赛。

科大讯飞的机器翻译技术被用在这个机器人身上。在科大讯飞高级副总裁胡郁看来,5年前,没有人敢真正地在大庭广众之下,演示语音识别,“那时的技术还远不成熟,一演示就出错”。

5年来,人工智能有了快速发展,迎来了学界所说的“春天”。胡郁认为这得益于一些基础性研究的突破。比如,Google第一个利用云计算、大数据以及近几年发展起来的深度神经网络组合方法,使用户迭代的方式有所突破。这个标志性的技术,给整个人工智能发展提供了一个重大思路。

人工智能大会上,一个问题出现在了讨论环节——人工智能与机器人在下一个5年或10年之内,是否会成为另一个科技创新的风口?不少与会专家给出了积极的态度,这其中就包括科大讯飞董事长刘庆峰。

不过,在刘庆峰看来,真正意义上的创新,关键在于掌握创新方向的主导权,如果掌握不了主导权,产业规模越大,将来的风险越大。

在他看来,源头核心技术突破是人工智能浪潮中的“大波浪”,而这样的“大波浪”,目前却鲜有中国企业去做。他以苹果手机为例,该手机上的不少关键应用,并不向中国企业开放。这就意味着:如果中国企业只做“手机上面的应用创新”,未来整个产业的价值和主导权还是由别人控制。

换言之,在今天的移动互联网时代,3G、4G的通信技术、芯片技术以及安卓ios是引领潮流的创新“大波浪”,相应的,在这些平台上做的App就是“跟着走”的“小波浪”。“现在我们谈互联网思维当然很对,谈快速应用创新到风口也对,但那些都是小波浪,一个产业如果都这样相对急功近利,整个中国产业可能失去未来。”刘庆峰说。

他并不是唯一的思考者。在为期两天的大会上,不少人工智能领域的专家有一个共同的感受:如果研究人工智能的浪潮没有把对脉,就很可能是逆流而行。

视觉、听觉和触觉是未来的“大波浪”

在徐方看来,视觉、听觉和触觉将是人工智能研究的重点。正如中国工程院院士、中国人工智能学会理事长李德毅在大会上所说的,脑认知的主要外在表现是语言认知和图像认知。这同时说明,要赋予机器感知,就应当让计算机具有视觉、听觉和说话等能力,进而才能使机器具有适应环境和自主作出决策的能力。换句话说,让计算机学会如何像人一样听说看,才是计算机视觉和听觉研究领域的任务。

然而,这种对于人类而言与生俱来再自然不过的能力,对计算机来说却难上加难。如果说,人工智能发展到当今的成果是:计算机无论在计算能力还是记忆能力上,都能轻而易举秒杀人类中像爱因斯坦这样的高智商个体,但是在眼睛看和耳朵听的能力上,最厉害的计算机可能也比不上小婴儿或者邻居家的二傻子。

胡郁也提到《从0到1》这本书中一句经典的表述,美国近些年投入很多资金研发能飞的汽车,最后却得到了140字符(指的是Twitter):真实世界需要的是物理、综合的东西,但虚拟化和信息化反而发展更快。他认为这句话同样适用于人工智能与机器人。

在视觉方面,微软全球执行副总裁沈向洋持积极态度:人类的感知有九成之多来自视觉,研发这部分“将大有可为”。

比如,今年微软在社交网络上意外走红的“how-old”——用户可以通过上传自己的照片,来测试自己的年龄——就是利用脸部API,基于云的脸部识别算法来检测和识别图片中的人脸。

他还提到了微软小冰的最新研究成果,智能聊天机器人“小冰”具有辨识猫狗品种的能力,甚至在面对猫的图片时能够发出“小眼神儿太犀利了”的“吐槽”。而在“小冰”的开发过程中,深层神经网络为计算机提供了不少的帮助。

沈向洋也承认,发展计算机视觉是有难度的。比如在人脸识别过程中,由于拍照光线、发型、角度、妆容等因素影响,得出的结果往往大相径庭,照片上的林志颖和郭德纲现实中基本同岁,计算机却给出一个36岁、一个51岁的错误答案。正因为“A picture is worth a thousand words(一图胜千言)”,计算机在图像识别的路上还有很长的距离要走。

这在沈向洋看来,似乎更具有“目标”的含义,“对于在做计算机的人来说,如果把通过图灵测试做目标,目标就不够远大。”对计算机视觉,他预测接下来的研究方向是“两大一精”,即大数据、大计算、精准计算。这些也值得中国人工智能领域的专家所注意。

期待脑科学和人工智能研究的“杂交优势”

在听觉方面,刘庆峰也给出了他的预测:“我认为下一个产业趋势是万物互联,在这个过程中,绝大部分设备将没有屏幕,人在移动状态下不方便去看去操作。那样,语音时代就真正到来了。”

中国在这方面已经取得了不俗的成绩:语音合成、语音识别和自然语言理解领域都曾连续多次斩获国际大奖。刘庆峰说,科大讯飞从2006年起至今参加英文合成国际评测,取得了八连冠。甚至在2014年该比赛更改了比赛方式,改比印度式英语,中国依旧取得了第一。

据他透露,人工智能的语音发展,已经不仅仅意味着地图导航软件中能够合成林志玲的声音,它还可以用在教育领域的口语测评、主观题自动扫描评分,乃至在医疗领域根据语音自主判断病症等,“这些运用的前景不只是一个目标,更是件非常靠谱的事”。

不过,要真正打通“智能”这道关卡,在李德毅看来,还需打破学科壁垒的生殖隔离。

他说,悠久强大的学科,如生命科学和物理学,一定都是很有个性的学科,学科壁垒森严,存在“生殖隔离”现象,长期以来脑科学研究和人工智能研究犹如两条平行线,没有实质性的交集就是一个佐证。

智搜(Giiso)公司成立于2013年是国内领先的“人工智能+资讯”领域技术服务商,在大数据挖掘、智能语义、知识图谱等领域都拥有国内顶尖技术。同时Giiso旗下研发产品包括编辑机器人、写作机器人等人工智能产品!凭借雄厚的技术实力,公司成立之初,就获得了天使轮投资,并在2015年8月获得了金沙江创投500万美元pre-A轮投资。

也因此,李德毅将目光放在了认知神经学和认知物理学的融合,企图寻找“场外求助”——也就是一种组合的力量。“一旦碳基生物脑和硅基电子脑形成‘杂交优势’,其势将会猛不可挡。”

他认为,用人工智能技术构建千千万万特定机器认知脑,并通过移动互联网、云计算和大数据,或许就可以“倒逼并逼近一个人造生物脑”。

转载于:https://my.oschina.net/u/3878436/blog/1837484

人工智能研究 还需打破学科壁垒的"生殖隔离"相关推荐

  1. 盘点丨毕业年薪34万,高校人工智能研究哪家强?

    来源:亿欧网 摘要:人才短缺已经成为了制约人工智能技术发展和应用落地的一大短板,为了弥补这一短板,加强人才培养,近日教育部发布了<高等学校人工智能创新行动计划> 此前有报道显示,2017年 ...

  2. 爱思唯尔云论坛:疫情挑战下的大数据与人工智能研究

    2020注定是不寻常的一年,新冠肺炎疫情在全球多点暴发并迅速蔓延,给社会带来巨大影响的同时,也为大数据与人工智能研究者带来新的挑战.值此疫情之际,由爱思唯尔旗下大数据期刊Big Data Resear ...

  3. Michael Jordan:人工智能研究的目标变了,不再是构建单个智能

    [专栏:研究思路]我们认为,人工智能进入了新的拐点.在一个后深度学习时代,不同的学者对未来智能发展道路的理解逐渐清晰,当然也逐渐开始分化,由此导致了开展布局完全不同的研究工作.智源社区将系统分析全球范 ...

  4. 谷歌李飞飞:我们依旧站在人工智能研究的起点

    来源:机器人大讲堂 摘要:8 年来,在 ImageNet 数据集的训练下,人工智能对于图像识别的准确度整整提高了 10 倍,甚至超越了人类视觉本身.但李飞飞认为,我们对于人工智能的研究仍在起点上. 说 ...

  5. 李飞飞最新演讲全文:机器已能“看懂”图像和视频,但我们仍站在人工智能研究的起点

    来源: 科研圈 摘要:AI 不仅仅能够精准辨认物体,还能够理解图片内容.甚至能根据一张图片写一小段文章,还能"看懂"视频...... 所以无论我们在讨论动物智能还是机器智能,视觉是 ...

  6. 打破学科边界!柏拉图与技术呆子

    点击上方"机器学习与生成对抗网络",关注"星标" 获取有趣.好玩的前沿干货! 各位读者们好! 相信大家大多都是做技术/工程的,所读的书也大都技术性很强,今天推荐 ...

  7. 蔡自兴:人工智能研究的若干进展

    蔡自兴:人工智能研究的若干进展 (2011-08-08 11:55:25) 标签: 校园 分类: 工作篇 1.引言 人类在进入新世纪时对未来充满新的更大的希望.科技进步必将为各国的可持续发展提供根本保 ...

  8. 技术与业务脱节_人工智能研究人员与吓到我的现实脱节

    技术与业务脱节 人工智能 , 意见 (Artificial Intelligence, Opinion) There's no question that AI will redefine human ...

  9. 人工智能——人工智能研究的各种学派及其理论

    人工智能研究的各种学派及其理论 人工智能研究的三大学派 符号主义学派简单介绍 联结主义学派简单介绍 行为主义学派简单介绍 三大学派的综合集成 三大学派 符号主义(Symbolism ) 联结主义(Co ...

最新文章

  1. windows cmd命令行中 查看 修改 删除与添加环境变量
  2. push to origin/master was rejected错误解决方案
  3. rj45接口引脚定义_简单修复数控主机网络接口通讯故障
  4. 在3kbps的带宽下还能清晰地语音聊天?
  5. JavaScript递归算法统计(将整数n分成任意两份不能相同的k份)分法的种数
  6. AcWing321.棋盘分割(区间DP)题解
  7. Linux常用命令(持续更新)
  8. Mac下Vmware Fusion配置虚拟机虚拟网卡并配置CENTOS上网
  9. iOS 监听锁屏/解锁事件
  10. 线性插值和双线性插值
  11. 不良事件总结怎么写_年度不良事件总结
  12. UE编辑器重要快捷键总结
  13. w3c标准语言的是什么,W3C标准及其规范 - Somuns的个人空间 - OSCHINA - 中文开源技术交流社区...
  14. 打车代驾顺风车货车租运系统开发功能(司机端)
  15. sklearn基础篇(三)-- 鸢尾花(iris)数据集分析和分类
  16. not executable: 64-bit ELF file 已解决
  17. 【OpenCV-Python】教程:5-3 光流
  18. 通知栏消息多种提醒方式
  19. 临近毕业,图像类SCI源刊哪本审稿快?
  20. ESD静电二极管|静电保护器件

热门文章

  1. 普迪文集团:八个马来西亚留学的热门专业
  2. 3、速腾16线激光雷达RS-16 ----- 3D建图算法LeGO-LOAM的使用(Ubuntu18.04 + ROS Melodic)
  3. LocalDB的介绍
  4. java 线程回收_JAVA线程池资源回收的问题
  5. 基于Android的驾照(驾校)考试系统的设计与实现
  6. IT创业失败案例解析 - 第四篇 (一家失败的招聘网站)
  7. 「计算几何精度问题」
  8. 【SLAM】SfM论文推荐(ICCV,CVPR,ECCV等)Structure from Motion
  9. python中os.fork()方法
  10. python中kmeans_kmeans与kmeans++的python实现