点击上方“3D视觉工坊”,选择“星标”

干货第一时间送达

文 | 刘冰一、Echo

编辑 | 极市平台

邱锡鹏,复旦大学理学学士和博士。任职复旦大学计算机科学技术学院教授,博导。发表 CCF A/B 类论文 70 余篇,获得 ACL 2017 杰出论文奖(CCF A类)、CCL 2019 最佳论文奖。出版开源专著《神经网络与深度学习》,主持开发了开源自然语言处理工具 FudanNLP 和 FastNLP,获得了学术界和产业界的广泛使用。

前章

PREFACE

邱锡鹏在复旦大学读本科时专业并不是计算机,他上大学之前也没有接触过计算机,得益于复旦的通识教育,所有理科专业都要学编程语言,他由此对计算机编程产生了浓厚的兴趣,于是辅修了计算机作为第二专业。后来,他读了本校计算机学科的博士,并顺利留校任教。

邱锡鹏主要从事自然语言处理、深度学习等方向的研究。他读博所在小组比较尊重个人兴趣,他的博士论文是计算机视觉方向的,但其研究兴趣更多地偏向于机器学习底层算法研究。他的博导吴立德教授也同时在做自然语言处理方向的研究,因此对自然语言处理并不陌生。从机器学习研究的角度来说,自然语言处理中的预测问题通常是更有挑战性的结构化学习问题。邱锡鹏对此很感兴趣,也想要挑战一些更难的问题,留校后研究兴趣开始慢慢聚焦于自然语言处理。

吴立德教授对他产生了深远积极的影响。吴教授是数学专业出身,功底很强,是国内第一个发“模式识别与机器智能”顶刊论文的学者。吴教授治学严谨,授课通俗易懂,这是他一直佩服并在学习的一个技能。

操千曲而后晓声,他平时会广泛涉猎,有两种知识输入方式,一种是在谷歌学术订阅相关论文和资讯;其次是通过他带领的研究组所开发的工具,定期爬送供组内成员阅览,碰到质量高的研究就精读深究。他的研究小组一周举办两次论文分享会,除了组内分享之外,有时还会特邀嘉宾进行线上分享。学海钩沉,新知识“吸附”到既有的知识体系中,让大脑充盈随时进行联想式致知。

一个优秀的教育工作者和学生之间是良性的,他鼓励学生掌握自己的节奏,基本上不会干预学生的研究方式,他希望「学生们都有自己的研究兴趣;培养自己发现问题、解决问题的通用能力;保持对专一领域深入思考,同时一定要多看多听多交流。」

在邱锡鹏看来,知识学习、知识应用和分享是相辅相成的。他长期保持着知识输入习惯,并且勤于总结归纳,也非常乐于分享交流。他认为「要勤于表达交流,发现理解不透彻之处会倒逼自己学得更好。有时候能从一些漫不经心的交流中获得意想不到的启发。计算机领域在知识分享上做得非常好的,很多优秀的技术极客和研究大牛们都在热心地分享经验技能,这种共享文化可以帮助大家迭代更快,发展更好。」

赓续科研初心

RESEARCH

2015 年,复旦大学开设了“神经网络与深度学习”的课程。当时没有相关教材,网上有一些关于深度学习电子版课件都讲得比较简单,资料也非常零散。这门课程开设的目的是为了让学生们系统、全面且深入地了解神经网络和深度学习知识,因此,邱锡鹏决定自己动手写讲义。筚路蓝缕,以开江河,一学期课程结束后,他写了大概五六十页。他觉得应该给这一个学期的授课做一个总结,于是他把讲义总结放在了网络上,收到了有很多有价值的反馈。有十多位忠实的网络读者让他印象深刻,「我写一章他们看一章,会提很多意见,有些是对讲的模糊部分的追问、有些是指出推导上的错误,有些是对整个体系顺序的建议。」他说,「读者们的增砖添瓦让内容变得更好,我很感激他们的支持和关注。」

直到现在,邱锡鹏仍然在为一届又一届的学生们讲授“神经网络与深度学习”这门课。伴随着行业知识更新、个人认知深化,他每次上课前后都会反复修改,每个学期结束进行汇总调整。就这样亲力亲为、一轮一轮地迭代优化持续了 5 年,课程讲义已从最初的薄薄的几张文档到厚厚一打材料。

将这些更新迅速且十分庞杂的知识系统地归纳串联成一本完整又富有逻辑的教材并非易事,他面临过许多障碍,例如写作书面化和体系化,一个理所当然、一说大家都懂的知识点,但在书中却要掰开揉碎、细致详尽,幽隐毕达地写出来,且内容均需要有充分的考据和印证。此外,篇章式写作总归是不够系统连贯的。驭文之首术,谋篇之大端,邱锡鹏深晓其理,为形成写作体系花了很多功夫。他很喜欢《模式识别与机器学习-PRML》这本书,作者将机器学习置于一个新的视角,非常有体系地串联了不同知识点。这种思维让他很受益,经过广泛阅读和积累,博取众长,一遍遍打磨之下,“神经网络与深度学习”的内容变得更加丰盈连贯。

2020 年 4 月,《神经网络与深度学习》付梓,这是国内出版的第一部关于深度学习的专著,面市不到一周即登上了京东和当当的计算机类新书榜第一,豆瓣评分 9.4 分,且截止到目前,它在 Github 累计标星达1.5万。

知识传播就像一棵树摇动一棵树,一朵云推动一朵云,邱锡鹏潜移默化地影响着自己和他人。最初他只是想把课上好,结果出了一本书,成为很多人的深度学习入门必读本,有些学校还拿去当作教材。这本书客观上也给他带来了一些声誉,让他收获了许多意外的认同和褒奖。「自然语言处理的圈子并不大,圈外人能够通过这本书了解到我。在很多会议上都有同学跟我打招呼说,您好,邱老师,我读过您的《神经网络与深度学习》......」,这让他成就感满满,他调侃,明明在科研上投入的精力更多,但写书得到的收获感更多,这也是教书育人的快乐。

敬酒虽好,但他认为蒲公英书进步空间还很大,写书是一个过程,需要根据行业发展不断补充新知识,比如图神经网络,自监督学习,预训练模型等。将来,他希望在自然语言处理领域写一本书,将他在该领域多年的研究经验、知识理解和工作心得等等汇成体系分享给大家。

做人工智能领域的研究,理解并掌握底层的机器学习理论知识是入门,算法模型开发是核心,而高效且实用则是其作为一门应用型学科的衡量基准。为了提升自己的工作效率,同时也为了帮助更多想要进入到这一领域的研究者,自从事自然语言处理研究开始,邱锡鹏便开始着手于开源工具 FudanNLP 的开发。出于对机器学习的兴趣,他独立完成了 FudanNLP 所有底层的机器学习算法。不同于当时其他的自然语言处理工具,FudanNLP 是集成式的,用一套统一的机器学习算法驱动多种自然语言处理任务。FudanNLP 从底层优化了模型的效率,在 2009年开源后,被许多算法公司所应用。

基于传统统计机器学习的 FudanNLP 在 2014 年停止更新。当时,基于深度学习的应用出现在自然语言处理研究的新趋势中,邱锡鹏认为,在未来深度学习将会变成自然语言处理的主流方法,因此他想开发出一个基于深度学习的工具。但那时的应用还非常不成熟,直到 2018 年 Transformer 等各类模型的推出,深度学习在自然语言处理中的技术应用路线终于规范下来,他开始实现自己 14 年时的计划——实现一套基于深度学习的自然语言处理框架,他将这一工具命名为 FastNLP。

在做这件事的时候,已经有许多开源框架都改进并新增了深度学习的内容,但对于部分国内开发者而言,这类工具都存在有语言上的障碍;同时,在与工业界的沟通中,他了解到,很多企业都难以直接应用这些深度学习系统。因此,他希望首先面向国内开发者,FastNLP 所有的注释都是中文,同时在数据预处理方面的表现十分出色,帮助国内的研究者更快地去上手科研,而工业界则可以直接用它来处理数据,大大缩短了模型开发和调试的周期。

不论是 FudanNLP 还是 FastNLP,邱锡鹏所希望实现的目标都是降低自然语言处理的门槛,加快模型开发部署的速度,同时促进中文自然语言处理的普及。他还有一个一直想去达成愿望,就是未来我们人工智能算法开发的底层可以不再依赖于 Pytorch、TensorFlow 这些现有的框架,而是由我们自己来实现。FastNLP 未来也会大力支持国内现有的开源框架,以此为提升国产框架的普及尽一份力。

推进人工智能术语标准化

VISION

中国历史上出现过三次翻译高潮:东汉至唐宋的佛经翻译、明末清初的科技翻译、鸦片战争至“五四”的西学翻译。每次翻译热潮都引发海量知识的交汇融通,外眺可打通中外知识视域,前瞻可优势互补、关注盲点并寻找突破。当下,信息时代降临,在科研圈更是呼唤有效翻译,启迪影响科研人员,降低交流成本。

2015年,邱锡鹏在写书过程中发现国内学术术语混乱,经常遇到不同的教科书中术语使用标准不一致、中英术语夹杂等问题。比如很多人把 recurrent neural network 翻译成“递归神经网络”,但 recursive neural network 也被译为“递归神经网络”,这样就分不清了。当时他推荐翻译成“循环神经网络”。经过这么多年,大家基本认可了“循环神经网络”的叫法。

但是想要推进整个行业术语标准化并不是一件轻松的事情,一是中英文词性的差异,中文词汇存在引申意义,传词达意存在天然鸿沟。另外,很多翻译其实并不好,但已经被广泛发行刊印,成为业内流行甚至是行业共识称法,这些已被沿袭使用的词汇很难修正,成为推进术语标准化的顽固阻挠。

邱锡鹏希望为术语标准化做一些努力。在2021年上半年,他曾和《统计学习方法》作者李航,《机器学习》作者周志华,《动手深度学习》作者李沐和 Aston Zhang 博士等人开了几次会,探讨在丛书中将术语进行统一对齐,把相关术语整理成一个列表,希望逐步做到规范统一。

当然,日常交流中他推荐术语规范,表达更方便清晰,减少让人产生困惑的地方。一些东西很难翻译,像 Transformer 不论怎么翻译,都不能涵盖其意义和除机器翻译外的场景,此时直接使用原文是便捷的。他也一直在知乎等技术社区为大家推荐一些更准确的翻译,例如 Pooling 应译为“汇聚”,而非“池化”,因为“池化”没有正确表达出 CNN 执行这一操作的真正含义;Dropout 应译为“暂退”;Robustness 则推荐译为“稳健性”,原翻译“鲁棒性”缺乏中文的美感。

一个人可以走得很快,但一群人可以走得很远,邱锡鹏呼吁更多的人注重术语标准化使用,但他不强求每个人都使用目前所倡导推行的翻译。比如他不会要求自己的学生如何如何,只管以身作则。在他看来,推行术语标准化是有兼容性的,无论是争议还是随从都是一种积极的信号,这种关注本身就是一种向心力,能促使行业向前。

感恩智识上的先行者,感谢他们托举思考的宝石,缀满某些空白缺失处的漆黑夜幕。感谢邱老师谦逊地垂着他的绿荫,坚持为人工智能研究发展不断地奉献和努力。

本文仅做学术分享,如有侵权,请联系删文。

3D视觉精品课程推荐:

1.面向自动驾驶领域的多传感器数据融合技术

2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码)
3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进
4.国内首个面向工业级实战的点云处理课程
5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解
6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦
7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化
8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)

9.从零搭建一套结构光3D重建系统[理论+源码+实践]

10.单目深度估计方法:算法梳理与代码实现

11.自动驾驶中的深度学习模型部署实战

12.相机模型与标定(单目+双目+鱼眼)

13.重磅!四旋翼飞行器:算法与实战

14.ROS2从入门到精通:理论与实战

重磅!3DCVer-学术论文写作投稿 交流群已成立

扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。

同时也可申请加入我们的细分方向交流群,目前主要有3D视觉CV&深度学习SLAM三维重建点云后处理自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。

一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。

▲长按加微信群或投稿

▲长按关注公众号

3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:

学习3D视觉核心技术,扫描查看介绍,3天内无条件退款

圈里有高质量教程资料、答疑解惑、助你高效解决问题

觉得有用,麻烦给个赞和在看~  

专访邱锡鹏:人工智能开源社区的「先行者」相关推荐

  1. 强烈推荐邱锡鹏人工智能书籍《神经网络与深度学习》

    今天给大家分享的是"蒲公英书"--<神经网络与深度学习> 近年来,以机器学习.知识图谱为代表的人工智能技术逐渐变得普及.从车牌识别.人脸识别.语音识别.智能助手.推荐系 ...

  2. 推荐:复旦邱锡鹏教授开源发布的《神经网络与深度学习》

    本文作者:Datawhale 4月7日下午,邱锡鹏教授在知乎上达文称整本书终于写完了,虽然还有很多不足.但先告一段落,不然就得无限期拖延下去.感谢众多热心网友的意见和建议.全书的内容可以从这里(htt ...

  3. 复旦大学邱锡鹏:若优化顺利,MOSS三月底开源;库克或被踢出苹果董事会;华为云联合CSDN发布智能化编程助手Snap|极客头条

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  4. 复旦大学邱锡鹏:若优化顺利,MOSS三月底开源;库克或被踢出苹果董事会;华为云联合CSDN发布智能化编程助手Snap|极客头条...

    「极客头条」-- 技术人员的新闻圈! CSDN 的读者朋友们早上好哇,「极客头条」来啦,快来看今天都有哪些值得我们技术人关注的重要新闻吧. 整理 | 梦依丹 出品 | CSDN(ID:CSDNnews ...

  5. 重磅!复旦邱锡鹏老师NLP实战code解读开源!

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 今天给大家分享一门很好的NLP入门学习实战仓库,很好,学它!! 一  邱锡鹏老师N ...

  6. 复旦邱锡鹏超全NLP预训练模型综述论文:两张图带你梳理完整脉络

    关注上方"深度学习技术前沿",选择"星标公众号", 资源干货,第一时间送达! 超全预训练语言模型概览,入门学习.搭建知识体系.找文献资料.找资源代码,这里有 N ...

  7. 句法依存分析_复旦大学邱锡鹏教授:词法、句法分析研究进展综述

    本文为第十六届自然语言处理青年学者研讨会 YSSNLP2019 报告<词法.句法分析研究进展综述>的简要文字整理,本报告主要回顾词法.句法领域的最新研究进展. 关于报告人: 邱锡鹏,复旦大 ...

  8. 复旦大学邱锡鹏教授:语言模型即服务,走向大模型的未来

    来源:智源社区 作者:智源社区 整理:周致毅 人类一直期待AI能在处理自然语言方面大放异彩,语言大模型在近些年已逐渐成为NLP领域的标配.随着模型的扩张,当前大模型的调用已变成上游厂商开放API供下游 ...

  9. 天池读书会,邱锡鹏教授等一众大咖和你一起读书

    简介:阿里云天池读书会三月场来啦,这次我们邀请到了<零基础学机器学习>作者黄佳老师.蒲公英书<神经网络与深度学习>作者邱锡鹏教授.<数据分析通识>作者途索老师.&l ...

  10. 复旦邱锡鹏教授公布《神经网络与深度学习》,中文免费下载 | 极客头条

    点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」,购票请扫码咨询 ↑↑↑ 整理 | Jane 出品 | AI科技大本营 优质的人工智能学习资源一直是大家非常关注的,以往我们也推荐过很多 ...

最新文章

  1. 阿里三面让我现场改造Spring框架,明天带他去爬山!
  2. 我是如何自学 Python 的
  3. 无敌了,不需要操作系统就能运行 Python 了!
  4. FreeRTOS(四)——内存管理
  5. 新建学生类,分别计算3个科目的总和
  6. 浅谈数据库设计技巧(上)
  7. 设置广告 php,设置ecshop广告位
  8. 计算机全息图的制作与在线,基于Matlab的计算全息图的制作与数字再现的研究精选.doc...
  9. webstorm破解
  10. javascript数组
  11. 怎样用计算机打出错字,电脑键盘打字错乱的解决方法-电脑打不出字怎么办
  12. Centos6.10系统迁移到新固态硬盘LVM
  13. “开宝五子棋陪练”软件的隐私政策
  14. python后端脚手架_flask-adminlte-scaffold是一个Python环境下的WEB后台管理系统脚手架...
  15. 2020曼彻斯特大学计算机2020,2020年曼彻斯特大学申请要求完整版
  16. OpenBmc开发错误6:gyp ERR! configure error gyp ERR! stack Error: socket hang up
  17. ThinkPHP Lang多语言本地文件包含漏洞(QVD-2022-46174)漏洞复现
  18. Centos75启动盘安装系统无法进入图形安装界面-提示dracut-pre-udev[348]:modprobe:ERROR: could not inset ‘edd‘
  19. java io流详解_一文带你看懂JAVA IO流,史上最全面的IO教学啦
  20. 后端一次性返回10万条数据,使用vue,你该如何渲染?

热门文章

  1. 在termux中利用安卓的vulkan库加速NCNN
  2. ModBus RTU和ModBus ASC
  3. 电商小程序如何实现分账?
  4. 小组学习电子教室等同屏工具调研
  5. 电子系统中的品质因数
  6. raspberry pi 4检查ch340/ch341驱动
  7. centos7 wps安装
  8. 这8款黑科技APP,满足你的所有需求,你想不到的照样帮你实现!
  9. 框架合集:Java框架自学视频教程-动力节点
  10. 量化投资知识,量化交易