导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的3055名同学参加大数据能力提升项目,其中556位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据提升之路吧!

孙琦 核研院

作为传统能源学科背景的我,始终对前沿数据科学保持浓厚的兴趣,而清华大学大数据研究中心给我提供了宝贵的平台,让我有机会能将大数据知识与我的研究领域交叉结合,碰撞出不一样的火花。因此,我报名了大数据能力提升项目(以下简称:项目),对感兴趣的课程进行学习,开启了我的大数据能力提升之路。

为获取更多大数据前沿信息,我加入了大数据学生协会,并在日后成为了骨干成员。期间我作为协会组织者和工作人员举办并参与了多次活动,在这里,我接触到了不同行业大数据技术的领军人物,从他们的分享中受益匪浅。令我印象最深刻的是昆仑智汇数据科技公司首席数据科学家田春华博士分享的使用大数据技术进行风电叶片故障检测的技术方案,无论是在思路上还是在技术上都给了我很大触动与启发。

借助这个平台,我不但获得了与田博士交流讨论的机会,还获得了昆仑智汇数据科技公司实习机会。实习期间,我学会了 Linux 系统开发、开发板程序移植、掌握了 Github 项目的布置,在不断寻找工业匹配方案和模型优化的过程中,巩固了大数据系列课程所学的知识并把理论应用到了实践当中。大数据的课程学习和实践经历使我在执行导师布置的任务时有了更多想法,也在正式开启博士课题时更加游刃有余。

有一次导师希望我能根据积累的颗粒计算数据,建立一个描述颗粒受力的高准确度关联式模型。这对于具有丰富 Python 机器学习库经验的我来说并不困难,因为从大数据的角度来看这是个经典的监督学习问题。于是,我熟练地划分了训练集、测试集和验证集,尝试了多种机器学习和深度学习方案, 最终使用 Xgboost 得到了准确率最高的预测效果,并获得了老师的认可,大数据技能使得我从课题组内脱颖而出。后续随着对大数据 RONG 思想的深入理解,我意识到一个具有工程意义的模型,除了模型预测的准确度,模型的可解释性也是至关重要的。于是,我对颗粒受力数据的特征提取过程进行了改进,在保持模型准确度的情况下,使特征参数具有更明确的物理意义。相关研究发表了 2 篇核能领域 1 区的SCI 论文,实现了大数据与传统学科的结合,发挥了大数据技能的学术价值。

在我的博士课题中,大数据思维也给了我很大帮助。我的博士课题是对反应堆内颗粒动力学行为开展研究,传统意义上来说,这是流体力学与颗粒力学相互作用的问题,但是受大数据 RONG 思维的启发,我想到可以从大数据的角度开展研究, 因为工程上的颗粒问题从另一个角度也必将伴随着大量的数据,这使我考虑从统计学的角度研究颗粒动力学行为。我设计并搭建了一个玻璃密封的风洞实验台,并使用显微镜 CCD 相机对不同时刻的颗粒行为进行毫秒级的拍摄,获得了大量的颗粒图片数据。当其他同学在人工统计颗粒的数量和位置时,我凭借大数据课程中学习到的计算机视觉知识,使用 OpenCV 编写了一套颗粒检测程序,极大的降低了人工成本,首次实现了毫秒级大量颗粒运动的统计分析(图 1),基于该思路设计的实验平台也获得了清华大学学生实验室建设贡献奖和实验技术成果奖,并申请了一项发明专利。

图 1 分享基于计算机视觉的颗粒检测方法

在有了实验数据支撑之后,我开始关注对颗粒动力学理论层面的研究。由于高速气流所伴随的复杂湍流现象,每时每刻流场内的物理量都存在着显著差异,研究其瞬态模型非常复杂,而大数据思维启发了我,可以从统计关键特征的角度进行研究,关注湍流的分布特征而非瞬时特征。于是我成功地将颗粒动力学和湍流特性关联起来,成功建立了颗粒动力学机理模型。该机理模型不仅通过了实验验证,模型表现也远超经典模型,相关成果获得了中国颗粒学会自然科学二等奖,同时,我的学术报告也多次获得相关会议“优秀口头报告”等荣誉(图2)。

图 2 中国颗粒学会学术年会优秀报告颁奖

如今,即将毕业的我已多次获得了国家、学院、院系的奖学金和荣誉,也数次获得学术论坛的优秀论文和口头报告等奖励。这些成果奖项与大数据能力提升项目 是密不可分的,大数据的学习开拓了我的视野,使得传统工科出身的我能在同一批人中更具竞争力,掌握了更多解决问题的方法和技能。同时大数据 RONG 的思想也一直伴随在我的研究中,使我能积极主动接触学习交叉学科知识,并灵活运用在自己的课题和项目中。

非常幸运接触到了大数据前沿技术,使我认识其理,学以致用,在传统工科研究路上绽放出了不一样的光彩。

编辑:文婧

校对:杨学俊

孙琦:大数据思维助力我探究能源颗粒机理 | 提升之路系列(四)相关推荐

  1. 张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  2. ​李明轩:提升大数据素养,辅助电力系统实时决策研究 | 提升之路系列(八)...

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  3. 赵雪轩:数据科学助力我的智能化航天梦 | 提升之路系列

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  4. 大数据平台助力核与辐射安全监管

    大数据平台助力核与辐射安全监管 核能开发利用是大国发展的战略必争之地,也是调整能源结构.应对气候变化和建设生态文明,进而确保国家安全的重要手段.虽然我国核与辐射安全监管能力不断提升,但仍面临诸多挑战. ...

  5. 刘昊天:以数据思维助力工程实践 | 提升之路系列(十一)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  6. 郑可迪 : 培养数据思维,投身电力大数据领域研究 | 提升之路系列(一)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  7. 苏子怡:大数据思维融入建筑节能 | 提升之路系列

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  8. 【大数据】大数据思维的十大核心原理

    感谢博主,转自:https://blog.csdn.net/supermapsupport/article/details/78741774 一.数据核心原理 从"流程"核心转变为 ...

  9. 大数据思维是企业互联网化的思维内核

    文章讲的是大数据思维是企业互联网化的思维内核,"互联网+"给传统产业带来的变革将是一个持续升且不可逆的过程.随着"互联网+"的深入,诸多的新技术.新业态将会显现 ...

最新文章

  1. 一文带你玩转设计模式之「责任链」
  2. faster rcnn第二阶段loss出现nan_利用Faster_Rcnn训练模型时出现的问题
  3. 解决yarn全局安装模块后但仍提示无法找到命令的问题
  4. Centos查看与关闭防火墙
  5. Akka查询设备组《fourteen》译
  6. Java中对象及常量,局部变量,全局变量的存储位置
  7. Java经典编程题50道之三十一
  8. undefined symbol: PyFPE_jbuf
  9. elk日志分析系统_ELK 日志分析系统
  10. 实验室耗材管理系统,医院各科室如何进行耗材管理
  11. 机器视觉知识汇总(持续更新)
  12. 邮件协议POP3/IMAP/SMTP服务的区别 常用邮箱的 IMAP/POP3/SMTP 设置
  13. 新媒体广告投放的知识要点解析
  14. c++实现atoi()和itoa()函数(字符串和整数转化)
  15. 免费UI色彩搭配素材资源|色卡帮你找准搭配技巧
  16. Centos7、Centos Stream8、Centos Stream9无界面下使用yum安装chrome,方便进行Selenium无头模式自动化
  17. IP反查网站,ip反查接口,旁站查询接口大全,通过IP查域名汇总
  18. 月薪三千到三万不是说说而已!知乎大佬们强烈推荐这五大自学网站
  19. 使用python requests+re库+curl.trillworks.com神器 实现淘宝页面信息爬取
  20. 尚硅谷大数据技术Spark教程-笔记02【SparkCore(核心编程,map、mapPartitions、mapPartitionsWithIndex、flatMap、glom、groupBy)】

热门文章

  1. redistemplate 设置永不过期_密码已过期 拒绝访问如何处理?
  2. AOP具体的实现写法
  3. 企业互联网应用高性能解决之道
  4. 基于bs4+requests的豆瓣电影爬虫
  5. Oracle之唯一性约束(UNIQUE Constraint)使用方法具体解释
  6. java中浅层克隆和深层克隆
  7. 好记性不如烂笔杆-android学习笔记十四 EditText 画行,解决光标压线问题
  8. linux apache web服务器
  9. Fedora15使用笔记
  10. 戏说肥哥系列之---买车