导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

至今,已有来自全校45个院系的2657名同学参加大数据能力提升项目,其中445位同学通过课程学习和实践获得由清华大学研究生院颁发的“清华大学大数据能力提升项目证书”。

谈起最大的收获,同学们表示无论是自身的数据思维还是本专业与大数据技术相结合的科研能力以及实践经验等方面均得到了很大的提升。清华的数据科学人才培养究竟有什么特别之处?让我们一起通过他们的故事,揭秘各院系清华学子的大数据能力提升之路吧!

 

清华大学建筑学院博士苏子怡

研究方向:公共交通建筑节能

很高兴有这样一次机会,通过申请 RONG 奖学金,对我在大数据能力提升项目中的成长之路进行一次系统性的梳理。在整理材料的过程中,看到了自己走过的脚印, 更加觉得大数据能力提升项目与我是一种契合:在科研不知道如何下手的时候遇见, 通过实践带我接触到工程领域的大数据应用,让我将大数据方法融入到了博士课题研究中。

一、从数据分析工具到数据科学思维模式 

最初接触到大数据能力提升项目是有些巧合。当时负责的小课题拿到了大量的工程数据,但是不知道该怎么着手处理,怎么分析提取重要的信息、得出有价值的结论。通过大量的文献阅读,了解到了很多的数据分析方法,但是面对实际数据的时候依然不知道采用什么方法才是合适、高效的。

在科研不知道如何下手的时候碰巧看到了大数据能力提升项目,被课程列表中“数据分析”“优化建模”“实践”“应用”等字眼吸引,立即报名了项目。后来的体验证明项目课程的确很有用,不仅系统性地梳理了数据分析的基本原理和方法,结合案例介绍了不同方法的适用场景,而且课程的大作业也让我熟悉了数据分析工具和软件的使用方法。大数据能力提升项目不仅带我入门了多种数据分析工具,更重要的是训练了我的数据科学思维模式,让我知道了面对不同的目标如何去处理数据、怎样去分析结果,这为我的科研项目提供了大量的参考价值和指导意义。

二、项目实践带我接触工程应用领域 

大数据实践课于我而言是一次愉快而意义重大的体验。我们小组 5 个成员来自于不同的专业,因为都对数据分析有需求而结识。在共同完成项目的过程中,我真切感受到了大数据分析在当今各行各业的广泛应用,也看到了这个行业的宏伟前景。这次“工业园能耗分析” 实践项目,我们真正融入到企业潍柴动力的大数据部门,与部门员工一起挖掘数据、讨论业务需求、研究算法代码,了解了大型国企大数据部门的年轻有活力的工作模式和业务内容。我们对园区内的采暖和用电历史数据进行分析,根据业务需求和小组成员各自所长,对比了多种时间序列和回归类的算法,进行模型的训练、寻优和评价,选出最优算法建立了园区采暖和用电预测模型,并与业务部门探讨协助完成系统的可视化界面。实践成果为工业园后期数字化平台搭建提供了算法支持,为园区优惠购电方案提供了参考,也为园区节能潜力的挖掘和优化控制的设计提供了指导。

这次实践让我第一次近距离接触到了实际工程中的大数据分析应用,除了个人数据分析能力提升之外,更重要的是让我深刻认识到“业务需求”和“数据质量”的重要性。实际项目中,需要针对不同的业务需求有不同的重点,才能真正达到技术服务于业务的目的,比如在采暖项目数据可视化阶段,针对业务部门操作人员、管理人员的不同需求,选择不同的参数进行展示,才能起到方便运营和管理的效果。

第二件很深刻的理解在数据质量,科研不能在象牙塔中,尤其是对于工程学科,科研来源于工程,更需要服务于工程。实际工程中,不可避免的存在数据缺乏维护、质量较差的情况,在分析数据之前,首先需要在不同尺度上探索数据,确认数据问题,结合需求和目标找出数据清洗的解决方案,这是耗费很大精力的工作,但是非常重要,是保证技术可用、结果可信的基础。通过这次实践,我认识到了工程数据和业务的密切关系和复杂背景,对于我将来的科研和工作都是一次很有意义的经历。

暑期实习

三、大数据思维与博士课题的融合 

通过大数据能力提升项目的训练,我在博士课题中也加入了一些新的内容。建筑节能领域是一个比较传统的行业,但是近年来越来越多的大型商业综合体、酒店、交通车站等建筑配备了分项计量系统,收集了大量的运营信息和能耗数据,亟需科学的方法来进行分析,指导建筑的能耗评价和节能运行。在海量数据的背景下,需要在对建筑系统运行原理深刻理解的前提下,对数据进行科学的分析,这就需要传统模型与大数据模型相结合,挖掘节能潜力,建立能耗标杆规范。

国际会议汇报

我将大数据能力提升项目中学到的数据分析方法和理论引入建筑能耗研究,成果已经发表了两篇国际会议论文,均被 EI 收录,并且在 Indoor Air(美国)和 IAQVEC(意大利)会议上做了口头汇报展示,介绍了高铁车站的能耗回归分析的研究成果。目前,我的博士课题也在传统的能耗模型基础上,结合工程大数据,进一步研究公共交通建筑能耗的关键影响因素,希望能够提出简化的数据驱动模型以进行大规模工程推广应用。

大数据能力提升项目让我看到了大数据在各行各业的广泛应用,通过课程学习和实习实践锻炼了我的数据分析能力和数据科学思维,对我的科研和工作起到了指导和拓展的作用。最后,感谢大数据能力提升项目,以及项目中各位老师们的指导和帮助!

苏子怡:大数据思维融入建筑节能 | 提升之路系列相关推荐

  1. 孙琦:大数据思维助力我探究能源颗粒机理 | 提升之路系列(四)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  2. 郑可迪 : 培养数据思维,投身电力大数据领域研究 | 提升之路系列(一)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  3. 刘昊天:以数据思维助力工程实践 | 提升之路系列(十一)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  4. 赵胜男:数据思维,让我的科研和志愿服务动力十足 | 提升之路系列(十二)...

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  5. 雍培:电力遇上大数据,使我的科研如鱼得水 | 提升之路系列(九)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  6. 张书源:大数据能力助力我实现化工智能制造 | 提升之路系列(十)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  7. ​李明轩:提升大数据素养,辅助电力系统实时决策研究 | 提升之路系列(八)...

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  8. 张立贤:积跬步至千里,我与地学大数据的探索之旅 | 提升之路系列(五)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  9. 曹长树:江湖小虾米的侠客行——我的大数据能力修炼得道之路 | 提升之路系列...

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

最新文章

  1. 数据如何导入oracle数据库,如何用Oracle导入导出工具来实现Oracle数据库移植?
  2. 剑指offer-week1
  3. UVA 1602 Lattice Animals
  4. git缓冲区查看_git原理学习记录:从基本指令到背后原理,实现一个简单的git
  5. 计算机网络—体系结构相关真题练习(二)
  6. win10系统 专业版 安装教程
  7. 微信小程序确认取消弹窗
  8. cmd命令跳舞代码_Golang语言元编程之代码生成
  9. python3安装失败_python3安装失败如何处理
  10. 到2020年,将有60%的工作会被人工智能取代?
  11. CSS3炫酷模糊发光文字动画js特效
  12. 大数据早报:阿里巴巴收购以色列创业公司 迅雷再次回应玩客云用户维权事件(12.1)
  13. Android 实现自动点击屏幕的方法
  14. 教你如果恢复硬盘直接删除的视频资料
  15. Python最假的库:Faker
  16. 备份数据库、恢复数据库
  17. 关爱码农成长:关于写代码二三事
  18. python怎么使用jenkins_使用Jenkins部署Python项目
  19. redis的主从自动切换
  20. python实现批量的IP地址,或地址段的排序并按照CIDR格式最小化聚合。

热门文章

  1. 应届生想要获取web前端开发岗位?这份技能攻略,面试攻略别错过!
  2. 页面A使用window.open打开页面B,然后取得B的返回值
  3. vue从创建到完整的饿了么(12)miste.vue
  4. Sqlite的多表连接更新
  5. 以上帝模式管理Windows系统
  6. Android Animation学习(五) ApiDemos解析:容器布局动画 LayoutTransition
  7. 网格搜索后返回的就是最佳的模型
  8. AdamW优化算法 笔记
  9. 未能加载指定的模块“\Neo4j-Management.psd1
  10. Adaboost原理与推导