她力量

近年来,“她”力量正在科学家群体中快速升温。

在一年一度的妇女节到来之际,智源社区选取了五位颇具代表性的女性科学家,进行了深度访谈。在她们中,有人选择食物图像识别,对选择的科研方向热爱到底;有人享受不确定的科研乐趣,在统计+生物学研究上更向前一步;有人也曾在读博和带娃的困难中迷茫,用理想温暖10年科研路;还有人从Facebook大厂回国,做更有温度的AI研究。

从她们的故事里,我们得以一览当代女性科研工作者的独特风采。

“如果给所有女性科研工作者一个建议,是什么?”

“听从自己内心的需求。”

李婧翌,2007年清华生物系毕业生,加州大学洛杉矶分校(UCLA)统计系终身副教授,2018年斯隆奖获得者,入选《麻省理工科技评论》“35 岁以下科技创新35 人”(Innovators Under 35)2020 年中国区榜单。

当这些耀眼的标签在同一个人身上出现时,人们就知道,这一定是位不平凡的女性。

最近,李婧翌刚好在读一本书,是Facebook 首席运营官Sheryl Sandberg写的《Lean in: Women, Work, and the Will to Lead》

“LEAN IN”,即向前一步。李婧翌认为,与其总去想“我应该做什么”,不如去思考“我想做什么”,因为怀疑自己恰恰是最没有意义的。

采访:李梦佳

撰稿:香农

01

从清华到UCLA

一个女性在成长过程中,可能会听到很多种声音,李婧翌似乎很少受到这些声音的干扰。

“潜心科研,终生学习,以及保持充足的好奇心。”她的人生规划无比清晰,且从未动摇过。

一定意义上说,李婧翌之所以会坚定地走科研道路,不能忽视家族中两位女性长辈的影响:李婧翌的外婆是解放前的大学生,毕业后从医,从小就一直鼓励她多读书、多思考。而曾任职高中数学教师的母亲,在李婧翌读中学的时候重新回到学校读研,一路读到完成博士,并留在了大学任教。

或许就在那时,李婧翌的科研梦想已经留存心中。后来,她保送进入清华,再后来又拿到UC伯克利的博士学位,整个过程非常顺畅、自然。

谈到最初为什么选择清华就读生物专业,李婧翌陷入了回忆:清华生物科学与技术系在当时的前沿师资力量是不言而喻的,绝对算得上是中国最适合做生命科学研究的地方之一。

更深一层原因是,在李婧翌看来,生命科学领域还存在很多未知问题,未来会有丰富的探索空间,这让她感受到一种“兴奋”。清华生物科学与技术系很重视分子生物学领域的前沿研究,这种氛围也和自己的梦想不谋而合。

2007年,李婧翌本科毕业于清华大学生物科学与技术系,并获得优秀毕业生荣誉。

毕业后,李婧翌前往UC伯克利攻读生物统计学博士学位。关于这段求学经历,李婧翌提到了一种思想转变:“本科时候感觉更多是需要上课、完成考试和一些基础的科研任务。但博士时期的科研工作需要学会创造,寻找一个目前没有人给出过答案的问题,甚至最终你可能会意识到,这个问题就是没有答案的。经历了这个过程,我才从一个学生变成了真正的研究者,开始把科研当作一种职业。”

本科期间,李婧翌已经发掘出自己对交叉学科的兴趣,她更喜欢用定量方法和数学工具来研究生命科学里的问题。但博士期间的方向相当于一次“换专业”,很多东西还是要从零开始,两位导师对她的信任和潜力的认可,是她当时最大的支持力量。

这段时间,李婧翌还逐渐接受了一个想法:很多事情不是努力就会有结果的,需要克服短期快感的念头,把注意力放在正在做的事情上,不必过分关注回报周期。

02

享受科研,享受不确定性带来的乐趣

“我意识到生命科学领域有很多的问题等待去解决,但解决问题仅仅用实验手段是不够的,做好实验后的数据分析更加重要。”这个当时看来是感性认知的结论,在李婧翌后来的科研生涯中慢慢被证明是完全正确的。

“因为科研是一种创造性工作,所以存在很多的不确定性。从某种意义上来说,科研工作本质比较辛苦,对于男女来说均是如此。”

其实,李婧翌很享受这种“不确定性”

她提到了印象非常深刻的一项成果:在UC伯克利读博期间,李婧翌曾与劳伦斯伯克利国家实验室的 Mark Biggin 博士共同研究中心转录法则的定量工作。他们发现,2011 年发表在《Nature》上的一篇文章首次在小鼠的全基因组的基因中进行了 4 项步骤的测量,得出了这样的结论:一个基因内 mRNA 的高或低并不太能代表它的蛋白质含量的高或低。

长期以来,研究界普遍认可,不同组织之间的差异,例如大脑和肌肉,以及健康和不健康的人体细胞之间的差异,很大程度上取决于细胞中蛋白质丰度的变化。“转录”这一控制遗传信息从DNA 流向RNA 的过程,被认为在确定细胞中蛋白质的数量方面发挥着主导作用。

但在过去十年中,许多研究声称,在动物中,RNA 翻译成蛋白质的速度差异是一个更重要的因素。如果这篇Nature文章的结论是对的,那么之前很多 mRNA 的结果就要被推翻了。

到底什么才是对的结论呢?

来源:李婧翌的论文 Li et al. (2015). Statistics requantitates the central dogma. Science 347(6226):1066-1067.

在后续的深入研究中,李婧翌等研究者发现,这篇Nature文章严重低估了mRNA 和蛋白质含量的相关性,而转录实际上是决定蛋白质丰度最有影响力的步骤。

李婧翌和Mark Biggin指出,此前的研究中,许多被认为是翻译步骤的影响实际上是实验误差的结果。同时还指出,科学家需要更精确的测量和分析方法以精确地模拟基因表达。相关研究成果2015年发表在了《Science》杂志上,并收录于本科教材 Molecular Cell Biology 中。

2013年,李婧翌在加州大学伯克利分校获得了生物统计学博士学位,随后加入了UCLA统计系,目前领导着一个简称为JSB(即统计与生物的交叉路口)的实验室。

李婧翌提到,现阶段的生物数据分析还存在诸多要解决的问题,比如很多新提出的计算方法缺乏统计学意义上的严谨性,可能会阻碍科学发现的可重复性和可靠性。同时,对于同一类型的数据通常存在着多个为了同一个目标而开发的计算方法,从用户的角度而言,如何去选择合适的计算方法也是一个难题。

针对生物数据分析领域现存的难题,李婧翌带领团队已经做出了多项成果:

2020年,李婧翌研究团队提出了一种新的计算框架“Clipper”,使用户能在无需计算高精度p值的情况下直接控制高通量数据分析中的假发现率。目前,团队正致力于将Clipper应用于多种类型的生物数据分析,譬如识别全基因组层面的差异表达基因和蛋白质结合位点。

此外,为了进一步公平化计算方法的评测和优化实验参数(测序的细胞数目和深度)的选择,李婧翌团队先后开发了单细胞仿真数据模拟器scDesign和scDesign2。

除了上述工作之外,李婧翌团队还开发了一系列关于基因测序数据的计算方法,包括AIDE、PseudotimeDE、scPNMF等,这些方法更着重于对数据中噪音的考量以及对分析结果的假阳性的控制,从而使得研究者可以更加准确地对第二代测序数据进行全长mRNA层面的分析(AIDE)或更加可靠地从单细胞RNA测序数据挖掘信号:表达值随着细胞状态变化的基因(PseudotimeDE)和表达值能区分细胞类型的基因(scPNMF)。

可以看到的是,基于高通量生物数据的定量研究会在生物医学中发挥更重要的作用。不断进步的实验技术会产生更多,更精确的生物数据,随之而来的是对更严谨的计算方法的需求。

如果用一句话形容统计学与生命科学的交叉领域最有魅力、最吸引人的地方,李婧翌这样说道:“一旦有新的实验技术、新的数据类型出来,就会有新的问题,你不是在故纸堆里去找问题,而是一直在去做新的问题。对于学习新东西能力比较强的人、好奇心比较强的人,这是一个可以感觉到很兴奋的学科。”

随着近年来人工智能技术的飞速发展,近来AI+生物学的交叉成果也让李婧翌颇感惊喜,比如用AI预测蛋白质结构的AlphaFold2。此外,空间组学数据也是接下来她看好的一个方向。

“我经常会跟我的学生讲,做研究其实像一场马拉松,并不是短跑,所以你不需要暂时跑得比别人快,也不在乎一时有什么成就,而是争取能够一直做下去。”

李婧翌在UC伯克利过中秋节(左四)

03

勇敢“Lean in”

在《Lean in: Women, Work, and the Will to Lead》这本书中,作者这样写道:“通常女性在总会在无意识中妨碍自己的发展、降低对自己的期望值,甚至很容易就放弃工作、放弃获得更大成就的可能性。与男性相比,女性在职场中的态度仍然不够积极、不够进取。

从小到大,由于自身听到的社会偏见也好,由于自身所处的文化教育环境对男性女性的期望值不同也好,这些都多多少少会让女性更加容易怀疑自己:“我是不是就不要做这个了?需要那么辛苦吗?”

其实,对女性而言,拥有一个强大的内心,更多地去想“我想做什么”,比总是去想“我应该做什么”更有意义。

在李婧翌看来,个体差异绝对大于性别差异。“一类群体无法去代表所有女性,重点是每个人都要想一想,我心里是否愿意做这件事情。比如选择科研这条路,和感受到的乐趣和成就感相比,付出的那些辛苦你觉得值不值?”

“举个例子,如果所有人都告诉你,女生就是没有男生适合学数学,如果你听到这个观点也记在心里了,当你学到比较难的内容的时候,可能第一想法就是『确实,因为我是女生,所以我不太适合』,也许就不会推动自己去努力把问题想明白。”这种先入为主的想法,其实会影响到自己的表现。

“LEAN IN”的意思是向前一步。在很多情况下,女性只有向前一步,才能发挥出自己的潜力,拓展出原本以为的“不可能”。

在做研究之外,李婧翌经常会收获一些“有趣”的观察:从生物学的角度出发,自己更多是被科学问题驱动。但一起合作的统计学家和计算机学家则更多从计算机科学和数据科学的角度出发,更加注重发展新方法,以及将工具做完整。

闲暇时光,她也会走出实验室,在爬山、瑜伽等运动中,放松自己的心情。

李婧翌(中)

如果享受过程,回报可能就没有那么重要了,最后也就更容易感到满足;如果只是在等待回报,而认为过程很痛苦,人就会容易觉得失望。世界上的事莫不如此。

04

李婧翌给女性科研工作者的建议

不管是男性还是女性,可能都不存在一种放之四海而皆准的生活方式。面向女性科研工作者,李婧翌也给出了一些关于学术生涯和职业选择的建议。

“我见过很多学生,她们一路走来都很优秀,但是她们对于自己到底想做什么、想要什么,可能没有很强烈的想法,这对于女性成长不是一件有利的事情。”

李婧翌从小也属于“别人家的孩子”,不过她对人生之路问题有一些额外的思考:“我们可能会受到很多约束,从小被灌输什么是对的、什么是错的,但最重要的是内心要经过充分的思考。”

无论是什么职业,最后能够走下去或者做出成就,都是因为对这个职业有热情、有追求。“简而言之,我希望女性能够更多地去想一下自己内心的需求。”李婧翌最后这样说道。


复旦陈静静 | 把握当下,坚持热爱,与食物图像识别结缘的科研之路

UCLA李婧翌:女性最不需要做的就是「怀疑自己」| 妇女节特辑相关推荐

  1. 斯隆奖获得者李婧翌:AI+X并非总是有效,生物数据量小、噪音大,可解释性是关键...

    智源导读:在过去20年中,由于实验技术的发展,生物领域数据出现爆发式增长,同时推动了生物学科的定量化研究.因此,如何从数据中挖掘出有意义的生物学发现,已经成为生物学领域重要问题之一. 加州大学洛杉矶分 ...

  2. Percy Liang、李飞飞等百余位学者联名发布:「基础模型」的机遇与挑战

    撰文:赵言,秦红川,程晨 校对:贾伟 随着BERT.GPT-3.DALL-e等超大模型的兴起,自监督学习+预训练模型微调适配方案,逐渐成为主流.这种范式会先在超大规模海量数据上进行自监督的模型预训练, ...

  3. 兰艳艳:理想温暖10年科研路,女性可以柔和,更要自信、专业 | 妇女节特辑...

    她力量 近年来,"她"力量正在科学家群体中快速升温. 在一年一度的妇女节到来之际,智源社区选取了五位颇具代表性的女性科学家,进行了深度访谈.在她们中,有人选择食物图像识别,对选择的 ...

  4. 专访李飞飞 :从清华附中高材生到阿里飞刀,一口井钻出「云原生」

    如果要用一个关键词来定义中国当下的消费时代,"双11"是再贴切不过了. 从2009年11月起,它只花了十年的时间,就从一个只有27家商户参与的打折日,变成了一个全民狂欢的消费节,2 ...

  5. 李飞飞重返斯坦福后的大动作:开启「以人为中心的AI计划」

    来源:网络大数据 刚刚,李飞飞宣布斯坦福开启「以人为中心的 AI 计划」(Human-Centered AI Initiative,HAI),该项目由李飞飞和斯坦福大学前教务长 John Etchem ...

  6. 他因为泼了李彦宏一瓶水,成功圈粉无数,成为「网红」

    (小号发于昨天) 今天发生了一件很吸引人眼球的事情,在今日的 Baidu Create 2019 百度 AI 开发者大会上发生突发状况,百度董事长.CEO董事长李彦宏在展示完小度最新功能后,突然有观众 ...

  7. 对话出门问问李志飞:GPT-3 是「暴力美学」的一次胜利

    一项在科学家眼中超越 AlphaGo 的技术突破,让人类真切看到了通用语言智能的希望. 今年 6 月,特斯拉创始人 Elon Musk 创立的非盈利性 AI 科研机构 OpenAI 发布了一个名为 G ...

  8. 「好书·推荐」李筱懿《情商是什么》

    今天,你读书了吗? 小编认为读书是所有事物当中尤为重要的.可能这时候会有人说:"生命才是最重要的."你们想想没有文化知识的人,是不是无异于行尸走肉呢?也有人会说:"金钱才 ...

  9. 李嘉诚的个人资料及简介「非常详细」

    李嘉诚的个人资料 李嘉诚,籍贯汉族, 1928年生于广东潮州,性别男,已婚,获得首富.慈善家等众多称号. 个人简介 李嘉诚是比较知名的香港首富,早些年一提起这个名字,大家立刻就会联想到富翁.有钱人,和 ...

最新文章

  1. python使用matplotlib可视化subplots绘制子图、自定义几行几列子图,如果M行N列,那么最终包含M*N个子图、在指定的子图中添加可视化结果
  2. 移动平台的meta标签-----神奇的功效
  3. 数据包发包工具bittwist
  4. 企业网络推广专员浅析如何完善网站维护企业网络推广吸引用户浏览
  5. Spring Boot——SpringMVC带URL前缀的静态资源解决方案
  6. LVM逻辑卷详解及创建
  7. 服务器不知道怎么回事安卓系统很卡,为什么安卓系统很容易变卡?该怎么解决?看完长知识了...
  8. sql server服务器位置,SQL语句实现查询SQL Server服务器名称和IP地址
  9. 通过ping命令查看服务器是linux还是windows系列
  10. android中画弧函数canvas.drawArc()之理解
  11. ZYNQ ZCU102视频编码开发
  12. 中级通信工程师考试之六移动通信
  13. java类加载器有几种_请问这几种类加载器有什么区别?
  14. MyFirefox v2.6.2 - 打造自己的 Firefox 便携版
  15. 一次从ZoomeyeAPI脚本编写到提权的***实践
  16. SpringCloud-25-Gateway:动态路由、过滤器使用
  17. 【实用工具】Gephi下载与安装
  18. 基于Android P版本PKMS详解二
  19. C/C++预处理命令
  20. java的setquality值多少_java使用JPEGEncodeParam类的setQuality方法进行高质量图片缩放类(转)...

热门文章

  1. 磁盘分区形式mbr和gpt哪个好_济南历下区中考美术集训应该选哪个
  2. 粒子追踪 matlab,用粒子滤波器实现的多目标跟踪代码
  3. 用php文件创建表,使用PHP创建单个文件上传表单的最佳方式是什么?
  4. java判断栈空_java中栈的应用-判断分隔符是否合理
  5. CISCO CCNA RIP
  6. Windows server 2008 R2 登录密码恢复
  7. 第一个Python程序
  8. Jenkins+PowerShell持续集成环境搭建(二)控制台项目
  9. QCon上海2015 架构实战热点前瞻
  10. Xamarin.Android使用教程之Android开发所需的模拟器