陈丹琦主页:https://www.aminer.cn/profile/danqi-chen/562ce7f545cedb3398cfa6d0
文章转载丨叉院学姐
作者:何婉榕、毛嘉怡、何婉榕、王世因
陈丹琦
Danqi Chen
湖南长沙人。高中毕业于雅礼中学。第 20 届国际信息学奥林匹克竞赛(IOI2008)金牌得主。
大学毕业于清华大学,08 级姚班校友。
毕业后前往斯坦福大学攻读博士学位,毕业论文《Neural Reading Comprehension and Beyond》获得了斯坦福 Computer Science 的最佳博士论文奖(Arthur Samuel Best Doctoral Thesis Award)。
目前在普林斯顿大学担任助理教授,共同创立并领导 Princeton NLP Group。
曾在 ACL 和 EMNLP 获得杰出论文奖。
被 MIT Technology Review 列为 2019 年度中国“35 innovators under 35”。
#0学姐最初是如何对计算机、信息学感兴趣的?
我是小学三年级就开始做数学竞赛,我应该说对数学竞赛很感兴趣。一直到了初三的时候,当时我数学竞赛成绩已经非常好了。因为我在雅礼中学,雅礼是一个在全国信息学是非常有竞争力的一个学校。当时信息学竞赛的教练朱全民老师就联系了我,说有没有兴趣去转到信息学。然后那会儿我刚开始学编程,我觉得数学和信息学还是挺相通的,如果数学竞赛能做好的话,信息竞赛也可以做的挺好的。主要是因为当时雅礼的优势和系统训练的原因,所以其实是一个挺客观的原因。
我在初三的时候就保送高中,初中高中是一个学校,然后初三的下学期就开始进入学校的集训。我印象特别深,我当时跟其他同学的差距挺大的,因为才刚开始接触,不过接下来那个暑假做了很多题目,就把差距给缩小了。
(采访同学)所以学姐大概是什么时候在信息学和数学两门竞赛当中做出选择的?
就是在初三到高一转换的时候。在雅礼的时候很少有人一个人做两个竞赛,这也是学校的传统。我们当时叫理科实验班,湖南有四所著名中学,每个中学都有理科实验班。理科实验班进去的时候就直接分成五个组,每个学科竞赛一个组。所以高一进去的时候我就是分到信息组了。
a
#1学姐在高中的时候总结了一类分治算法(CDQ分治)、集训队作业给大家介绍插头 DP,进入清华大学之后也有重新回到冬令营,给大家讲弦图和区间图,这些开创性的内容对之后的整个 OI 圈子产生了非常大的影响。学姐当时是怎么发现这些当时还没有被系统引入竞赛而自己又比较感兴趣的内容的?
我没有一个很准确的答案。我主要是比较好奇,对很多问题想去寻求一些解法,我也不能知道这些东西最后会受欢迎,这是永远无法预期的。但是如果我对那个问题感兴趣,我就会去寻求一些系统的解法,甚至我觉得我也只是把一些东西做了简化和系统的总结了出来,我并不觉得我这个算法是我提出来的,包括 CDQ 分治也不是我叫的,到后来成了一个比较普遍的解法也是别人告诉我的。有位集训队队员写了一篇文章,把算法命名成 CDQ 分治,我后来听说是这样。
至于怎么接触到的这些内容,当时就是大量做题,然后大家也会相互出题,就会想这个问题怎么解。这跟做科研的过程是一样的,我觉得最大的区别是大部分的竞赛题目你是确定有解的,科研是很多东西你不知道有没有解。一个很普遍的思路是,很多问题有没有共同的解法,或者说一个问题的解法能不能应用到另外一个问题上。也没有什么特别的契机,主要还是遇到什么问题就总结下来,都是在做题的过程中。
(采访同学)之前关注到对于知识,学姐喜欢深入地接触,了解清楚其各方面的拓展和变形,并进行系统的整理和总结。而在我们的印象中多数高中生和低年级大学生往往都会将自己的全部精力放在提升自己上,学姐当时在那么早的时候是怎么想到说要去为所在的社区作贡献的呢
首先是我很喜欢写作,包括现在也是。我觉得写作不仅是去帮助别人,更多也是一个帮我自己去把思路整理出来的过程。写 paper 也是一样的道理。然后当时说实话,插头 DP 是集训队作业,是集训队论文,每个人都要求写的,既然要求写我就想把它写好,这就是对自己的一些要求而已,并没有刻意想我要帮助到别人,我觉得我那时候没有这样的一个境界(笑)。另外关于 CDQ 分治,它纯粹就是当时研究了一些问题。当时集训队的时候也可以交更多的这样的文章,我就决定把它写下来了而已,也就两三页很短的。
a
#2我们观察到计算机领域的男女比一直都比较高,无论是在竞赛、学校、还是工作中,学姐作为为数不多的女性,又是 08 年国家队的唯一女选手,有没有遇到过性别带来的烦恼或者喜悦呢?您怎么看待这些特殊待遇?
首先我是真的非常希望有更多的女生参与这些比赛或者科研中,包括我现在也很想招女学生。这个事情没有特别大的提高,是让我一直比较担忧的事情。说到过去的经历,首先我没有太把性别当回事,因为那会比较好强,我的目标就是要比别人都强,所以我不会去想这是男生女生。作为女生有一个优势就是,如果我和一个男生做得同样的好,但是就是会有更多人关注到我,因为这个性别的问题。不过说实话,我也不希望得到这样的关注。
a
#3学姐如何看待中美两国的性别平等现状/政策/整体氛围?在顶尖高校内的氛围又是怎样的?
我觉得在美国,尤其在这些顶尖的学校,很多同事他们对 diversity 的重视程度,以及那种开明程度,还是比国内要强的。我觉得中国学生、或者中国在美国这边的同学的观念还是需要被改变的。比如说在斯坦福这边,我们都会有 diversity 讨论小组,很多男性都会愿意去参加这种女性的讨论,但我很少见到中国男生的身影。
我觉得这是一个教育和文化的意识问题,他们没有觉得这是一个他们需要去重视的问题。现在国内的有些会议请的演讲嘉宾也基本都是男性,他们还没有注意到 diversity 的事情。
Diversity 是一个很重要的问题,我认为像这些机构还是需要更加注意,相信未来会有提高的。我觉得男性和女性会遇到不同的问题,会遇到不同的挑战,但是有一个更加 diverse 的环境,总的来说肯定是更好的。
我觉得在中国还是需要更长的时间,去把这个意识给纠正过来。在美国有更多关于这些问题的公开讨论,我 8 年多前在清华的时候,还是没有感觉到在清华有很多关于这方面的讨论,大家没有觉得这是个事。首先你觉得它是个事,然后才能有办法去讨论它,才能有办法去提高它。在那个时候我也还没觉得这是个事,很多观念是我到了美国以后才会觉得,为什么大家在这里会这么重视性别平等这件事情,会去采取一些行动。

#4过去我们总会听到人们说女孩子不擅长学理工科、学计算机,学姐这些年还有听到过这样的言论吗?是如何看待这样的言论的呢?
我觉得这真的是不应该去刻意强调的事情,但是我希望见到更多的女生去学计算机、学理工科。我希望女生的心目中认为这不是一个问题,你不需要去想这个事情,但如果大家都在想就说明这中间还是有一个 gap 存在。我觉得还是需要更多地鼓励女生去参加,尤其是年龄比较小的女生去参加理工科的活动。包括现在国内有女生数学竞赛,在美国有很多什么 Teach Girls To Code 的这些活动,比如有一个组织叫 AI For ALL,大概就是每年暑假会找很多高中的女生来学 AI 的一些入门知识。我觉得还是需要更多的机会去让她们知道,对于学习理工科,男生女生之间这个gap 是不存在的,逐渐会越来越不存在的。

#5学姐怎样看待学理工科的女生比例比较小这件事?我们了解到在各地可能会有一些政策,比如说对男女生的录取标准可能并不太一样,通过这种方式来鼓励更多的女生去学计算机等理工科,学姐怎么看待这样的政策呢?
女生比例的问题是一直存在的,没有多大的提升。我记得我在斯坦福读书的时候, 当时我们那一届CS PhD只有四个女生,太少了。Admission committee 现在在做一些努力去提高这个比例,但是依然很低。但还是有一些好消息,比如说现在在美国的本科生中,学CS的女生比例越来越高了。
你们有做信息学竞赛的吗?信息学竞赛是省队有一个女生名额,保证每个省能有一个女生,这相对是一个福利项目。不过在中学的时候,我当时会觉得这是一个内心很复杂的感受,从我的角度来说,我并不希望通过这个名额去进入省队。到了全国比赛的时候大家还是要一起比的,这样女生又比得不好,这种感受从我个人来说是不太舒服的。其实当时我两次进省队都没有用那个名额,我都是靠自己进的,因为我小的时候挺好强的,心里憋着一口气。关于你刚才说的这个录取条件,我希望女生能得到更多的机会,但我不想女生得到这个机会会被人家说这是因为被降低了标准才获取的。我觉得应该给她们更多的机会,使她们能够获得更好的资源,再使得这个 gap 变小,你们能理解我的想法吗?
(采访同学):也就是说,学姐不希望是结果导向的抹平差距,而是要从一开始就提供给她们同等的竞争机会?
是的。
a
#6就学姐的观察而言,在CS的一些子领域当中的男女比例会不会有一些统计意义上的差别?
对。打个比方我做自然语言处理的,我们领域的男女比例就很好。原因是因为 NLP 跟 语言学等人文学科关联起来的更多一些。我们领域男女比例真的非常好,非常多 role model 和成功的女性。我觉得做理论的可能女性少一些,做系统的女性也挺少的其实。就 在整体的比例这么低的情况下,我觉得有些领域还是会男女比例好一点,比如说我觉得 NLP 就算一个例子。CV 是不是女性也会少一些?也还可以吧。
(采访同学):这里我就想到一个很有意思的事情,很多时候我们看似已经破除了一些刻板印象,比如说越来越少的人会说女生不擅长学数学、理工科,但是可能这只是一种表象。比如说像当我妈妈她看到学姐以及很多其他女性在 NLP 这种领域很成功的时候,她会去跟我说,你看女生在计算机领域中就比较适合NLP这种相对偏文一点的事情,可以看到实际上还是有无意识中刻板印象的存在。
对,这个观点首先我是不同意的。首先我不觉得 NLP 偏文,这完全是个人兴趣。到最终去解决问题的时候还是要做很多 system building 和数学建模的东西。我想提一点,这是一个意识问题。我非常感谢我的 PhD 导师,因为我觉得在斯坦福的女性的比例相对这么低的情况下,我的导师是在有意识地去多招女学生/会尽量的让他自己组的女性比例偏高,我非常感谢这一点。我很同意 PhD 是个充满压力的过程,然后我觉得他也比其他的一些导师更加有耐心,我认为女性在这个过程中会有更多的挣扎,面临更多的困境。而在这个过程中我的导师他是非常有耐心地去引导这些事情,对此我非常感谢。
(采访同学):一般来说大佬会相对更开明一些吗?
也不一定是大佬,我觉得主要是每个人的个人意识。我觉得你得有意识去做这件事情,有意识地去帮助女生,然后你要知道她们可以做得非常好。当时有一些女性教授作为女性很愿意招女生,对于博士生导师去招学生来说,一个很自然的过程就是他们愿意招跟自己相似的人,这是很自然的。如果你没有意识的话,因为跟你的文化背景、你的教育背景相似的话,你们更容易能够成为一个好的团队,能够一起工作。因为大部分的导师也是男性,所以他如果没有这个意识的话,很有可能会招很多跟他们相似的人。
a
#7还有学姐是否有注意到在美国东西海岸的关于性别平等的一些差异呢?
这个问题我回答不了,我只有两个样本点,我代表不了东西海岸。但是我可以跟你讲一点文化的区别,西海岸,就是在硅谷这个地方有很多人创业。创业里面可能男性更多一点,我猜可能男性更喜欢去make bold decisions 和承担一定的风险。反正硅谷的环境还是很特殊的,斯坦福的环境受硅谷的影响还是挺大的。在东海岸的话,这些学校还是更 academic 一点,学校之间的联系也比较紧,跟工业界的联系会少一些。但这个我不确定跟性别平等相是不是直接有关系。但是哪怕在硅谷公司 Google、Facebook 这些问题都是不停反复地拿来讨论,对吧?

#8学姐可以讲讲选择斯坦福以及普林斯顿的原因吗?可以为我们分享一下这两所学校他们的文化是怎么样的吗?
我选斯坦福的时候其实不太知道自己要做什么,是后来选了 research group 才定的方向。去普林斯顿是因为我认为对我来说这是个机会,因为普林之前没有 NLP,普林斯顿是一个非常理论的学习的地方。然后它在慢慢地在扩张它的 AI,现在普利斯顿计算机系的做机器学习的 faculty 基本都是过去五年的时候招的,所以我觉得这对我来说是个机会,我能在这边能建立一个自己的 group。所以我觉得这是个机会,相比去其他学校,已经有很成熟的一个 NLP group,而我只是成为其中的一员,我觉得去普林斯顿对我来说更是一个成长和一个承担的机会,我也希望有自己的一个 group。这跟文化没有关系,这完全是个人选择的契机的问题。
就像我刚才说的,我还是觉得我在斯坦福读书的时候跟工业界联系更多一些,which is good and also bad。不停地会有人创业的人来跟你联系,说你们做NLP 这么火,有没有兴趣聊一聊、喝杯咖啡,我其实不太感兴趣这些事情。但是在斯坦福,你会跟工业界的关系很紧,你会知道有一些什么样的 real-world problems,所以这是一个双刃剑。
普林斯顿是一个学术氛围非常浓的地方,它很多理工和人文学科都很强。我觉得现在更希望回归到去解决一些更加 fundamental 的问题。还有普林也正在努力地去跟工业界去产生更多联系。它离纽约的距离是一个小时,我们这里也有一个 Google 的 lab。但是总的来说普林它是一个理论气氛非常好的一个地方。还有普林斯顿的 CS 系比较小,是斯坦福的一半的样子。因为小,所以每个人都得独挡一面,所以也更容易跟其他 faculty、甚至跟其他系的人去沟通和合作,这是我的感受。但是学生视角和教授视角是不一样的,所以我不能说这是完全一个公平的比较。

#9学姐可以说一说在未来一段时间(比方说五年内)的职业规划大致是什么样的吗?
我肯定会留在学术界,未来五年最大的目标,我觉得对于大部分在我这个阶段的人来说,最重要的事情就是 establish,做真正有影响力的工作。能让至少我们这个研究领域,甚至相关研究领域的人能更多地认识到我的工作。一个真的好的研究者,最终一定会被你的代表作所定义的。对于我来说,我还有一个转换,就是我自己从一个 student researcher 到成为一个 mentor 和 advisor,所以我现在组建我的团队。我怎么样去帮助我的学生成长,并且在这个过程中能做到我自己最想做的工作,这也是一个需要解决的问题。但是最重要的目的就是我的团队能做出最好的研究,最有影响力的研究,在这个阶段这肯定是我最大的目标。
a
#10我们面向的读者当中有一些可能现在面临着一些选择。比如高中生对理科和非理科的选择,高考完的学生面临院系的选择。再过几年,可能会面临进入怎样的领域的选择。学姐对他们即将做出的这个选择有没有什么建议?以您的经历有没有一些其他想要分享/叮嘱的事情?
还是找到自己最感兴趣的,首先得热爱你的工作,不管你做什么,你得热爱你的工作。我知道有很多尤其是高中生毕业,他们不会太有想法,可能很多时候会受自己的家庭或者父母的决定,这也很正常。我还想说的事情就是一个人热爱的东西不一定只有一个,有很多东西你只有做着做着才知道自己热不热爱。包括我也不觉得 NLP 是我的宿命。这也是很随机、很偶然的机会进入到这个领域,我觉得我也可以做别的领域。但是我觉得你既然选择了,你就要把它尽量做好,如果真的不是你感兴趣的事情,有的时候就赶紧换个方向。
(采访同学)学姐对于其他在 STEM 领域学习、研究、工作的女性有什么建议吗?
首先我还是很喜欢这种女性的组织,大家应该团结起来,去分享自己的经历和感受。因为我认为女性还是会面临一些男性可能不会意识到的挣扎与困境,哪怕情绪波动会大一些,遇事可能会更沮丧、感到更焦虑一些,这些都很正常。所以我认为女性之间要团结起来,包括我们现在在 NLP 有 Women Researcher in NLP 这样的组织,我觉得还是应该大家相互认识,多聊一聊这些事情,不要自己憋着。大家有很多的感受都会谈,都会面临 work life balance 的问题。男性和女性的挑战是不一样的。另外我觉得是挺需要一些 role model 的,我个人是有几个女性 role model 的,我特别崇拜的人,所以我觉得她们能做好的事情,我希望我也能做到。
(采访同学)可以给我们分享一位role model吗?
我特别崇拜的一位女性 role model 是 Regina Barzilay ,MIT 的教授。她现在一部分做 NLP , 一部分做机器学习应用于 oncology(肿瘤学) 上。首先是我觉得她做 NLP 的时候,她做的很多东西都是那种非常新颖,First kind of research,她做研究非常有远见。后来她得乳腺癌了(停顿),到 2016 年的时候,她在 NAACL 上给了一个talk主题为 How Can NLP Help Cure Cancer。她当时身体已经好了。2016 年的时候,她当时觉得我们现在做研究可能只是说能够帮你提供一些技术,但是真正能做些什么事情能够产生更大的影响和贡献。2016 年以后她重心就开始慢慢转向 medical、oncology 这些问题,过去几年做出了很多的成绩。反正我太崇拜她了。她跟我说过说你需要想想你长期真的想做 NLP 吗?怎么样能让你的研究有更大影响?想想你到底要为什么而工作?
你可以看一下她最近的一些视频和演讲。她确实是我们整个 AI 的几个楷模之一。

她力量系列八丨陈丹琦:我希望女生能够得到更多的机会,男生和女生之间的gap会逐渐不存在的相关推荐

  1. 伯克利摘得最佳论文,陈丹琦、杨笛一等华人团队获杰出论文,ACL2022奖项公布...

    视学算法报道 编辑:陈萍.杜伟 刚刚,NLP 领域国际顶会 ACL2022 公布获奖论文信息,其中加州大学伯克利分校的增量句法表示研究被评为最佳论文.此外,最佳主题论文.杰出论文也揭晓. ACL 是计 ...

  2. 清华姚班校友陈丹琦斩获2022斯隆奖!「诺奖风向标」27位华人学者入选

      视学算法报道   编辑:桃子 拉燕 [新智元导读]刚刚,有「诺奖风向标」之称的斯隆研究奖公布了最新获奖名单.今年,共有118名学者当选.值得一提的是,清华姚班毕业的华人科学家陈丹琦位列其中. 刚刚 ...

  3. 清华姚班陈丹琦获斯隆奖!与去年得主马腾宇是同班同学,博士毕业论文是近十年最热之一...

    点击上方"AI遇见机器学习",选择"星标"公众号 重磅干货,第一时间送达 杨净 丰色 发自 凹非寺 量子位 | 公众号 QbitAI 清华姚班大神陈丹琦,刚刚有 ...

  4. 清华姚校友陈丹琦斩获2022斯隆奖!博士论文是近十年最热之一!共计27位华人入选...

    来源:新智元 有「诺奖风向标」之称的斯隆研究奖公布了最新获奖名单. 今年,共有118名学者获斯隆研究奖,华人学者占27席.他们将获得75000美元,这笔款项可在两年的时间内用于支持其研究的任何费用. ...

  5. 斯坦福大学陈丹琦等人解读机器阅读最新进展:超越局部模式匹配

    来源:AI 科技评论 不久前,斯坦福大学的计算机科学博士陈丹琦的一篇长达 156 页的毕业论文<Neural Reading Comprehension and Beyond>成为「爆款文 ...

  6. 清华姚班陈丹琦等27位华人学者获奖,斯隆奖2022年获奖名单颁布!

    整理 | 于轩 出品 | 程序人生 (ID:coder _life) 近日,素有"诺奖风向标"之称的斯隆研究奖颁布了2022年获奖名单.斯隆研究奖于1955年设立,每年颁发一次,旨 ...

  7. 陈丹琦带着清华特奖学弟发布新成果:打破谷歌BERT提出的训练规律!这个庆祝方式太学神了吧...

    萧箫 发自 凹非寺 量子位 | 公众号 QbitAI 新晋斯隆奖得主如何庆祝? 公开最新研究成果算不算? 就在斯隆奖宣布当天,陈丹琦团队展示了最新的研究成果. 团队发现,经典NLP模型BERT提出的预 ...

  8. ACL 2020今日放榜,779篇论文被接收,姚班校友陈丹琦首日演讲

    晓查 发自 凹非寺  量子位 报道 | 公众号 QbitAI ACL 2020,今天终于放榜啦! 今年的ACL总共有3088篇投稿,大会接收了779篇论文,其中长论文571篇.短论文208篇,接受率2 ...

  9. 清华姚班陈丹琦获斯隆奖!博士毕业论文是近十年最热之一

    点击 机器学习算法与Python学习 ,选择加星标 精彩内容不迷路 量子位 | 公众号 QbitAI 清华姚班大神陈丹琦,刚刚有了最新荣誉.斯隆研究奖得主. 获得这个奖项的研究者,将得到为期两年750 ...

  10. 《NEURAL READING COMPREHENSION AND BEYOND》解读(陈丹琦博士论文)

    之前在听standford的cs224n自然语言处理课程的时候,就有一段是请陈丹琦来这边讲她最近的一些工作,我记得还是在embedding上的进展.听的时候,就觉得像是一个中国小姐姐,后面在这篇爆款博 ...

最新文章

  1. TVM apps extension示例扩展库
  2. 图文详解asp.net自带控件
  3. 13.1-13.3 设置更改root密码,连接MySQL,MySQL常用命令
  4. warshall算法求传递闭包c++_【建模小课堂】图论算法
  5. Python_迭代器Iterator
  6. error: L6235E: More than one section matches selector - cannot all be FIRST/LAST.
  7. day01 --环境搭建 注册 表单校验
  8. C语言从入门到精通——初阶6 指针
  9. Magisk如何针对性隐藏Root避免被检测
  10. 嵌入式(二)——Jlink接口定义
  11. 人工智能Logo设计师Brandmark
  12. 一文看懂ARM Cortex-M处理器 ARM Cortex-M 处理器家族介绍和比较
  13. shell中let 命令与Expr命令介绍
  14. py0_二十一天计划书(前言以及本计划书)
  15. CS5216DP转HDMI1080P方案|CS5216:DP++to HDMI(1080P)
  16. C/C++ 如何设计框架
  17. 教你如何关闭“你要打开此文件吗”的安全警告弹窗?
  18. element ui的双层el-dialog样式控制
  19. 时间类型转换——date和String的相互转换
  20. Hadoop操作HDFS命令

热门文章

  1. postman电脑版无法安装_Postman系列一:Postman安装及使用过程中遇到的问题
  2. SQL语句练习—员工表
  3. WD西部数据移动硬盘官方真伪查询
  4. vrep小车寻迹代码
  5. 软件代码数字签名基本原理
  6. 手机卫星定位系统_真的可以通过手机号码,准确定位对方信息吗?
  7. java项目组会议纪要
  8. 软通动力华为项目组Java开发面试总结
  9. Android好用的音乐,安卓手机音乐播放器哪个好用?十大最好音乐播放器介绍
  10. oracle中一个月的最后一天,SQL和Oracle获取每周、每月、每年第一天和最后一天