导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的2657名同学参加大数据能力提升项目,其中445位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据能力提升之路吧!

清华大学自动化系控制工程硕士生王家豪

研究方向:面向端侧设备的深度学习模型优化与应用研究

一、博观约取,厚积薄发铸就坚实基础

从研一上学期开始,我开始接触大数据与人工智能这个方向,刚刚进入这个领域时,由于缺乏相关的背景知识和实践技能,所以当时的我一头雾水。于是,我开始在老师的指导下大量 阅读这个方向的相关论文,了解了机器学习、大数据,同时也了解了这个行业的发展情况。我为之震惊,无法想象以前很多让我束手无策的问题居然大部分都可以用这种方式去解决。同时,我开始学习大数据分析,大数据系统等相关内容。当时记忆犹新的是大数据机器学习这门课,袁春老师布置的 bonus project,自己的任务是 Kaggle 大赛的“Severstal: Steel Defect Detection”,主要做的是使用语义分割技术识别钢铁上的缺陷,我还记得那段时间夜以继日的研究生活,我使用各种算法去做实验,分析结果,最终选择了最优的模型和数据增强方法,圆满完成了整个项目,获得了 Top 2%的银牌成绩。这个成就使我看到了自己在这方面的潜力和能力,也点燃了我的科研热情。之后,我系统地学习了常用的机器学习方法,同时也提高了自己代码实操的能力。比赛结束之后,我深知自己的机器学习知识并不构成体系,于是我开始重新回归书本,一直到现在我还依旧会学习。经过整个学期的不懈努力,在所选的 5 门大数据能力提升项目的课程中,我的成绩以 4 门满绩,一门 B+顺利结束,我对这一结果十分满意,也更加坚定了自己在这个领域耕耘的决心。

二、博物洽闻,妙笔生花传播数据科学

由于学习项目课程知识的不断积累,从研一下学期开始,我注册了自己的个人知乎账号:“(科技猛兽)”,开始以博客的形式记录自己的学习,科研积累过程和心路历程。那时的初衷是:多写点对行业有意义的博客,为大数据的传播和社会普及做一些自己的贡献。结果令我没想到的是,博客蒸蒸日上,时至今日,我已经完成了 200 多篇技术博客,拥有了 12000+的粉丝数量,并且还在高速增长中。其中的十几篇高质量博客已经发表在了“极市平台,CVer,新智元”等这个领域家喻户晓的公众号上面,同时,我也成为了“极市平台”的签约作者。我也收到了国内著名出版社“人民邮电 出版社”的约稿邀请,成为了这家出版社的撰稿人。

三、校企携手,珠联璧合孕育硕果累累

我还参加了项目提供的华为公司和清华大学合办的“新一代信息与媒体技术实践项目”暑期实践项目,我所在的团队属于中央媒体技术院的拍照工程部,团队里面的同事所在的专业领域也不尽相同,但与他们一起工作、学习,共同进步,促进了彼此的工作交流与合作,大家相处的十分融洽。我在华为实践期间,完成了“基于神经架构搜索的生成对抗网络模型压缩”项目, 对于3个不同的模型对应的3个不同的任务,在不影响结果质量的前提下,模型的参数量分别压缩了约4.6倍,13.9倍,36.5倍;计算量分别压缩了10倍,11.4倍,24.3 倍,帮助企业在该业务上取得了突破进展。我与团队深知:华为公司扎根通信,深耕移动端设备,轻量化的模型更能够带来绝佳的用户体验。心有所信,方能行远。实践课我所做的项目为所在行业端侧设备模型的优化带来的深远的影响,也获得了校内评委老师和华为技术专家的一致肯定,最终考核结果为“优秀(Top 20%)”。

四、筑梦科研,守正创新突破技术瓶颈

大数据项目课程不仅点燃了我的科研热情,同时也夯实了我的专业素质。我的课题方向针 对于当今时代在端侧设备(手机,可穿戴设备,物联网等)上部署深度学习模型时的困难,提出创新的解决方案。以 AlphaGo 为例,它进行一局比赛需要 1920 块 CPU 和 280 块 GPU 的支撑,同时花费约3000$的电费和超过5000磅的CO2排放,这样高的算力消耗,如果将模型部署在我们的手机上会很快地耗干手机的电池电力。因此,我们需要对深度学习模型进行优化和压缩。研二上学期,我提出了一种针对生成模型 GAN 的普适的压缩方案,它融合了架构搜索,模型压缩两方面的技术,在多个模型的压缩结果上达到了SOTA。

五、鞭驽策蹇,栉风沐雨却仍任重道远 

大数据能力提升项目使我从一个大数据领域的学术小白成长为领域内的知名博主,优秀实习生和比赛高手。它带给我的不仅是知识和能力的培养,更重要的是眼界和胆识的提升。相信在今后的科研工作中,每天都有进步,每日都有收获;争取在未来,在这个国际形势千变万化的时代里成为一名优秀的华为人和一名合格的清华学子。请乘理想之马,挥鞭从此起程,路上春色正好,天上太阳正晴。

王家豪:求实探索,青春无问西东;脚踏实地,奋斗自成芳华 | 提升之路系列...相关推荐

  1. 站立潮头、无问西东 | 第二届“大数据在清华”高峰论坛成功举办

    2018年4月27日,由清华-青岛数据科学研究院主办.清数大数据产业联盟协办的第二届"大数据在清华"高峰论坛于主楼接待厅拉开帷幕.此次论坛以"站立潮头.无问西东" ...

  2. 愿你在迷茫时,坚信你的珍贵,爱你所爱,行你所行,听从你心,无问西东。...

    看到和听到的,经常会令你们沮丧,世俗是这样强大,强大到生不出改变它们的念头来.可是如果有机会提前了解了你们的人生,知道青春也不过只有这些日子,不知你们是否还会在意那些世俗希望你们在意的事情. 愿你在被 ...

  3. 就凭这些,蕴含清华百年历史的《无问西东》唤起了一片赤子之心

    时隔6年,<无问西东>这部本为清华大学百年校庆而拍摄的电影,终于上映了. 岁月荏苒,很多人说,"这部开年第一大片,我苦苦等了6年."就连豆瓣年度最值得期待的华语电影榜单 ...

  4. 华为云何去何从:《听从你心,无问西东》

    作者@玛尼呸 在2018年 12 月18日在心声社区发帖吐糟华为内部对于云业务的定位.内部管理混乱等问题,阐述了大量事实依据,反馈了很多实际问题,希望公司予以重视并改进.此贴引起公司管理层重视,1月1 ...

  5. 感受自己内心的真实,无问西东

    许久没有在国产院线的电影里收到过如此多的感动,即使青春逝去如<芳华>,也只是会生出一种怅然若失的感觉罢了.倒也不是什么对青春逝去的感伤或是对亲情,友情,爱情有了过多的体悟,其实倒像是因为找 ...

  6. 【书影观后感 九】感受内心的真实 无问西东

    许久没有在国产院线的电影里收到过如此多的感动,即使青春逝去如<芳华>,也只是会生出一种怅然若失的感觉罢了.倒也不是什么对青春逝去的感伤或是对亲情,友情,爱情有了过多的体悟,其实倒像是因为找 ...

  7. 「太魔人说」仅凭心中热爱,我们无问西东,但凭初心

    点击蓝字 关注我们 AI TIME欢迎每一位AI爱好者的加入! 太魔人 他们 因对AI的热爱在这里相逢 因对知识的渴求在这里成长 因对梦想的期盼在这里守望 让我们一起来听听,太魔人们如何讲述他们与AI ...

  8. 《文言文复兴系列 6 无问西东》(江湖一剑客)

    观听之,每当令汝沮,世俗顽强,强至生不出易之意.然若得预知, 汝之生,知青春不过惟此日,不知卿等有意世愿意也. 愿君被击时,忆汝之珍,拒抗恶意:愿君迷时,信子之珍,爱卿所爱,行其所行,听汝之心,无问西 ...

  9. 无问西东,哪怕重头来过

    据说这是一部审了四五年的片子,放在了2018年贺岁当上映,说实话,导演李芳芳以前都没怎么听过. 电影一开始就是一句发人深省的质问,如果你咋知道了你的这一生,你还会来吗?开完全片不同历史时期的主人公的人 ...

最新文章

  1. sql server 2012序列号
  2. 创业公司这三年,Java老本都快吃完了!
  3. 类内的函数共享给对象使用
  4. 特斯拉地图数据服务以后由百度地图提供
  5. ubuntu下Chrome浏览器字体问题 字体发虚解决办法
  6. AtCoder Grand Contest 028题解
  7. [Remoting]在.NET環境實作Flex 3 Remoting - (2) Flex Builder 環境設定
  8. android 标签分页,Android之ActivityGroup实现Tab分页标签
  9. 职场泥潭,这样的IT公司绝对不宜久留
  10. 直方图代码matlab,MATLAB直方图均衡化代码(MATLAB histogram equalization code).doc
  11. 2012年主流U盘启动盘制作工具合集下载
  12. 提高睡眠质量的东西,这几件东西能让你睡得香又好
  13. 按什么键能够迅速锁定计算机,电脑快速锁屏按什么键
  14. 人工智能-自然语言处理(2)
  15. 三维游戏开发实战--狙击僵尸(unity开发)
  16. 稻盛和夫的经营十二条
  17. 开放api接口平台都会有appid、appkey、appsecret
  18. 量子计算(十四):超导量子芯片
  19. 如何用html5实现网页聊天,HTML5 WebSocket实现点对点聊天的示例代码
  20. opencv 手选roi区域_如何用opencv实现感兴趣区域ROI的选取

热门文章

  1. php报500怎么抛出来,PHP将日期爆炸为值并使用if语句抛出500个错误
  2. python扫描端口脚本_Python实现的端口扫描功能示例
  3. 程序员进阶之算法练习:LeetCode专场
  4. (转) 6 ways of mean-centering data in R
  5. 【一通百通】Bash的单双括号建议:多用[[]], 少用[]
  6. linux运维/自动化开发__目录
  7. 一个java的DES加解密类转换成C#
  8. System Center 2012 R2 CM系列之Configuration Manager介绍
  9. pycharm使用anaconda管理环境的设置实践
  10. TSNE 附有codechina代码