↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习,不错过

Datawhale推荐

作者:程明明,南开大学教授、计算机系主任

十多年前我开始读研的时候,开源还不是主流。每做一个工作,都要花费很多时间精力去重现前人的工作。但是,稍微复杂的一个系统,都会受到很多细节因素的影响。我们实现前人工作的时候,最痛苦的还不是这个重复劳动的工作量,而是论文中不可能把所有细节说清楚,导致自己实现的版本往往并不如原始作者的版本(毕竟原作者花了很多精力打磨)。

2011年开始,我慢慢养成了代码开源的习惯,在不违反保密和商业协议的前提下,尽我所能最大化的开放我自己科研成果中的代码和数据。若干年后,我猛然意识到,那些自己没有及时开源的代码和数据,由于这些年工作单位和常用电脑的多次更换,大部分自己都找不到了。为了方便科研共同体,同时也方便自己,我想提出以下开放共享科研记录行动倡议。借用 Word软件的文件名后缀,我将这个倡议总结为DOCX:

  • Demo:在线互动方便教学与科普。尽可能为自己科研论文中涉及的每个问题做一个在线的demo,方便自己随时使用,方便同领域老师的课堂教学实验,方便给公众科普现在的技术水平能做什么。例如我们实验室的Demo程序后续陆续都会在这里更新:https://mmcheng.net/category/demo/

  • Open source: 为了避免大家不必要的反复低水平重复工作,我们尽量开源自己每篇论文的代码。作为大部分科研资助来源于政府资金的事业单位,我们的科研成果也有义务面向公众开源。这里的开源,除了开源代码,也包括开源实验数据 https://mmcheng.net/code-data/。因此,整个倡议的题目是开放共享科研记录(代码+数据)行动倡议。

  • Chinese version:对包括我自己在内的很多国内科研人员来说。阅读同样一篇论文,中文版不论是从阅读速度,理解深度,还是记忆深刻程度上来讲,都明显优于相同的英文版。但是从国际科研影响力,以及评审的公正性、权威性来讲,国外顶级英文学术期刊目前依然是很难绕过去的高山。所以我建议大家在英文顶级会议或者期刊发表论文的同时,可以在自己主页上共享一个中文翻译版,方便国内读者阅读。我们论文主页上的很多论文后面都有中译版 https://mmcheng.net/publications/ ,方便国内读者阅读

  • eXplain:大家在阅读论文时,经常碰到疑惑,希望能够和作者及同行交流。同时,作者也很多时候也希望听到来自同行的反馈。因此,我倡议,大家尽量为自己的每篇论文建立一个项目主页,读者如果有问题可以去主页上留言。论文的co-author们看到这些留言后尽量及时回复。

从我做起,行动示例。上述倡议中开源(Open source)和回答问题(eXplain)我已经执行很多年了,感觉在交流共享给学术共同体服务的同时。自己其实是整个过程中受益最多的。这个过程启发我拓展了思维,促成了很多新的想法的形成。这样的样例可以通过我个人主页 https://mmcheng.net/publications/ 中的每一个论文后面的 source code和project page链接找到。

这些年国内的科研水平进步很快。以计算机视觉为例,顶级会议论文的第一作者中,华人已经超过半数。但是我们还得用英文而非自己的母语去阅读大部分论文。我们依然经常需要去实现别人的工作并纠结于为什么实现的结果不一样。我们看到了论文里面的很多炫酷的结果,但不是很容易方便的尝试这些新的技术。作为华人科研群体里的一份子,我号召大家共同为整个生态更加健康发展贡献一份自己的力量,同时大家也将从这个生态的发展中受益更多。

在开放共享的同时,另一个让我一直很担心的事情是国产生态。开源了这么多人工智能算法的代码,大家基本上用的都是美国的Pytorch,TensorFlow或者Caffe。期待国产生态如华为MindSpore,百度PaddlePaddle,清华Jittor的崛起。大家是否可以考虑稍微放慢论文发表的速度,在开源Pytorch代码的同时,也开源至少一个国产平台的版本。最后,立此文为据,从我做起,并衷心的期待华人科研生态系统越来越强大,国产生态平台越来越强大。

欢迎转发或者按照这个倡议的精神去共享。原贴地址:https://mmcheng.net/docx/

扩展阅读:

  • 开源组织Datawhale:https://github.com/datawhalechina/

  • 代码共享规范:https://github.com/paperswithcode/releasing-research-code

“科研开源之路,为DOCX三连

南开大学教授:科研开源的行动倡议!相关推荐

  1. 南开大学教授“段子手式”简介,网友:笑着笑着突然“破防”了!

    整理 | 朱珂欣 出品 | CSDN程序人生(ID:coder_life) 在你的学生时代,老师是否都以"高大上"的完美人设存在? 近日,南开大学物理科学学院胡金牛教授的一段堪称& ...

  2. 技术动态 | 北京大学计算机所邹磊教授研究组开源面向 RDF 知识图谱的自然语言问答系统 gAnswer...

    项目网站: http://ganswer.gstore-pku.com/ 代码地址: https://github.com/pkumod/gAnswer OpenKG发布地址: http://open ...

  3. python入门教授_南开大学教授强力推荐的5本Python入门书籍,附电子版

    筛选了2年内优秀的python书籍,个别经典的书籍扩展到5年内. python现在的主流版本是3.7(有明显性能提升,强烈推荐) 3.6, 不基于这两个或者更新版本的书,慎重选择.很多库已经不提供py ...

  4. 南开大学提出最新边缘检测与图像分割算法,精度刷新记录(附开源地址)

    作者 | 刘云.程明明.胡晓伟.边佳旺等 译者 | 刘畅 整理 | Jane 出品 | AI科技大本营 近日,南开大学媒体计算实验室提出的最新边缘检测和图像过分割(可用于生成超像素)被 IEEE PA ...

  5. 南开大学开源新图像分割算法,刷新精度记录 | 资源

    铜灵 编译整理 量子位 出品 | 公众号 QbitAI 最近,南开大学提出一种边缘检测和图像分割算法,被称为首个在图像分割数据集BSDS500上F值(F-Feature)超越数据集本身人工标注平均值的 ...

  6. 做程序员要有“疯子精神”,中国开源开放的科创人才要如何培养?

    过去三十年,科技驱动全球经济取得了巨大发展,技术的迭代更推动了全行业的数字化革新,在新数字.新经济的趋势下,我们迎来了开发者最好的时代.当前中国每年工学类普通本科毕业生超过 140 万人,中国开发者规 ...

  7. 开源翻译公告 2020.10.26:新上线了几个文档

    我们已翻译的文档非常多,免得各位眼晕,以后就不直接贴整个列表了,只把新上线的文档公告一下. (1)AILearning 新增"数据分析"和"PyTorch"部分 ...

  8. 复旦邱锡鹏教授公布《神经网络与深度学习》,中文免费下载 | 极客头条

    点击上方↑↑↑蓝字关注我们~ 「2019 Python开发者日」,购票请扫码咨询 ↑↑↑ 整理 | Jane 出品 | AI科技大本营 优质的人工智能学习资源一直是大家非常关注的,以往我们也推荐过很多 ...

  9. 从校园情侣到教授夫妇,520当天他们携手发顶刊!

    点击上方"视学算法",选择加"星标"或"置顶" 重磅干货,第一时间送达 本文来源:湖北大学官网.DeepTech深科技.材料科学前沿.小木虫 ...

最新文章

  1. DreamWeaver文件保存时,提示发生共享违例问题的解决方法
  2. 获得分辨率_直播教程 | 直播画质认知及如何获得最优画质
  3. 使用AspNetpagerGridView添加连续的序号
  4. RedHat 5.4 RHCE DHCP学习笔记
  5. 使用ModelForm上传图片
  6. matlab hashset,MATLAB集合操作
  7. CentOS系统中安装 vmware-tools
  8. react-router 页面离开 提示数据变更
  9. 【AI视野·今日CV 计算机视觉论文速览 第244期】Fri, 15 Apr 2022
  10. python选课系统作业_Python 大作业4:选课系统
  11. git提交远程报错[rejected] master - master (fetch first)
  12. jquery与Ajax() 调用后台方法
  13. 代码制作数字流星雨_JS+CSS实现流星雨的动画效果(代码)
  14. 深入理解Nginx负载均衡和反向代理_学习笔记
  15. ubuntu1604 golang环境
  16. 计算机电源故障维修方法,atx电源维修方法 atx电源常见故障【详细介绍】
  17. 小米系列手机MIUI12系统升级详细教程
  18. TCP可以从我们的视听感知中借鉴些什么
  19. C/C++蓝桥杯三升序列
  20. 利用Pytorch中深度学习网络进行多分类预测(multi-class classification)

热门文章

  1. 8月12笔记-安卓文件扫描
  2. 【面试虐菜】—— Oracle知识整理《收获,不止Oracle》
  3. 简明 Vim 练级攻略(转)
  4. 表情的机器自动识别(有图有真相)
  5. 【青少年编程】黄羽恒:翻译小工具 -- 利用有道翻译
  6. 数据结构与算法:09 栈与递归
  7. Java面向对象三大特征 之 多态性
  8. 编程能力差,学不好Python、AI、Java等技术,90%是输在了这点上!
  9. 这封以数字构写的蓝图,正在实现笔尖所触即世界
  10. 超硬核全套Java视频教程(学习路线+免费视频+配套资料)