导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

回首即将过去的2020年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自12个院系的16位同学代表一起领略他们的风采吧!

彭鹏

自动化系2017级博士生

就读于工业智能与系统集成所。曾获2019年丰田二等奖学金,2019年清华大学社会实践奖学金, 2020年清华校友李衍达励学基金,2020年社工优秀奖学金。研究方向是工业过程的故障诊断,目前已发表SCI论文3篇,EI论文6篇。平时喜欢打篮球和羽毛球,喜欢看书和刷电影。

成果展示

论文题目

Cost sensitive active learning using bidirectional gated recurrent neural networks for imbalanced fault diagnosis

选题缘起

针对于实际工业过程中故障样本较少以及存在大量的无标签样本的问题,提出了一种以及基于代价敏感的主动学习方法。

论文简介

针对于故障样本较少的问题,设计了一种样本敏感策略。具体来说,在故障发生时刻前后的样本权重应该大于其他时刻的样本。故障刚发生时,往往对过程的影响比较小,其与正常样本也较难区分,因此赋予比较高的权重有利于此类样本的判别。针对于工业过程存在的大量无标签问题,论文在主动学习的基础上考虑了代价敏感函数,并做了探讨和实验验证。

论文节选

滑动查看更多

  2021年祝语

愿所求皆所愿,愿所盼皆可期。

王家豪

自动化系控制工程研二学生

人民邮电出版社撰稿人,CV著名公众号“极市平台”签约作者,清华大学“RONG”奖学金一等奖获得者,华为技术有限公司优秀实习生。目前从事的研究方向是“面向端侧设备的深度学习模型优化与应用研究”。

就读于工业智能与系统集成所。曾获2019年丰田二等奖学金,2019年清华大学社会实践奖学金, 2020年清华校友李衍达励学基金,2020年社工优秀奖学金。研究方向是工业过程的故障诊断,目前已发表SCI论文3篇,EI论文6篇。平时喜欢打篮球和羽毛球,喜欢看书和刷电影。

成果展示

论文题目

GAN Streamlining: Progressive Searching for Versatile One-Shot GAN Compression

选题缘起

华为公司扎根通信,深耕移动端设备,轻量化的模型更能够带来绝佳的用户体验。目前GAN网络具备强大的生成能力,可以部署在大量端侧设备应用中,为用户带来良好的使用体验。但是GAN模型同样存在着参数量大,计算量大,延迟高的缺点,这些问题阻碍了GAN模型直接部署在端侧设备上。

论文简介

这篇论文完成了“基于神经架构搜索的生成对抗网络模型压缩”的任务,我们结合了神经网络架构搜索以及模型压缩的方案,设计了包含路径,操作,通道数这三个维度的搜索空间,以及针对GAN模型的公平的超网络训练手段,对于3个不同的模型对应的3个不同的任务,在不影响结果质量的前提下,模型的参数量分别压缩了约4.6倍,13.9倍,36.5倍。计算量分别压缩了10倍,11.4倍,24.3倍,帮助企业在该业务上取得了突破进展。

论文节选

滑动查看更多

  2021年祝语

大数据课程项目使我从一个学术小白成为了领域内的知名博主,优秀实习生和比赛老鸟。它带给我的不仅是知识和能力的培养,更重要的是眼界和胆识的提升。在今后的科研工作中,我会将这份精神发扬光大,每天都有进步,每日都有收获,争取在未来,在这个国际形势千变万化的时代里为国效力,成为一名优秀的清华学子。我与旧事归于尽,来年依旧迎花开。

赵雪轩

航天航空学院飞行器设计所博士生

研究方向为敏捷遥感卫星智能化技术。曾获第45届日内瓦发明展银奖,2020年“RONG”奖学金一等奖,2019年KDD Cup 比赛Regular ML Track 前5%,2018年中国高校SAS数据分析比赛第五名。

成果展示

论文题目

Two-Phase Neural Combinatorial Optimization with Reinforcement Learning for Agile Satellite Scheduling

选题缘起

由于人工智能和大数据技术的兴起,导师希望我的博士课题能够将传统的遥感卫星课题与新兴的智能技术结合起来,系统性地讨论新技术在敏捷遥感卫星课题上的应用。在敏捷卫星任务规划问题上,目前流行的启发式算法依赖于启发因子的设计,这种设计具有很强的问题导向,基于某数据集的设计不一定能保证在其他数据集上取得良好的任务规划结果。

论文简介

本文提出了一种考虑成像质量的TPNCO-RL算法来求解敏捷卫星任务规划问题。算法的第一阶段采用神经网络组合优化方法,以最大化观测收益为目标,从候选任务集合里选择合适的待观测条带序列。第二阶段针对成像质量优化待观测条带序列中每个条带的观测起始时间。针对传统启发式方法存在的问题,包括需要人工设计启发因子和需要进行基于假设的预计算,TPNCO-RL算法通过学习的机制无需设计启发因子,并可根据在轨计算结果进行任务规划。

论文节选

滑动查看更多

  2021年祝语

希望2021年大数据能力提升项目能越办越好,让更多的同学受益。

宁泽宇

水利系博士生

曾获清华大学2019年研究生社会实践奖学金、清华大学大数据研究中心2020年"RONG"奖学金等荣誉,主要研究方向为混凝土智能温控防裂,博士期间有幸全程参与了金沙江乌东德、白鹤滩水电站建设,生活中喜欢排球、羽毛球等运动。

成果展示

论文题目

混凝土实时温度数据移动平均分析方法及应用

选题缘起

为了获取大体积混凝土内部真实温度的变化过程,通常需要在混凝土内部埋设大量的温度传感器。随着技术的发展和成本的降低,温度监测的密度和频率也在增加,由于受到现场断电、断网、断线、传感器失效等因素干扰,原始监测数据中常包含着间断、缺失、突变等噪声,直接影响混凝土真实温度场的重构、温控策略与措施的精准调控。进行混凝土温度数据的分析处理,以提高数据质量是当前混凝土智能温控学科的热点研究方向之一。

论文简介

开展混凝土实时温度监测数据质量分析对于混凝土智能温控具有重要意义。本文提出了一种混凝土实时温度数据移动平均分析方法,将传统移动平均进行了多维度扩展。通过从时间、空间和质量维度对监测数据进行动态求均值,形成用于表征某一时刻、空间点、监测对象的特征温度数据,显著减小了原始监测数据中的系统误差和偶然误差,降低了数据误差给计算仿真、分析利用的影响,提高了智能温控系统的性能。

论文节选

滑动查看更多

  2021年祝语

大风起于秋毫,春雨润物无声,诚挚感谢大数据能力提升项目在促进学科交叉创新方面做出的默默贡献,也感谢各位老师给自己创造的这一宝贵学习机会和带来的在科创、实践与个人发展等方面的诸多能力提升,值此2021新春来临之际,衷心祝愿项目能越办越好,也祝福所有支持大数据能力提升项目的老师、同学、各界友人新年快乐,平安健康,牛年大吉。

侯灵犀

电机系博士生

研究方向为敏捷遥感卫星智能化技术。曾获第45届日内瓦发明展银奖,2020年“RONG”奖学金一等奖,2019年KDD Cup 比赛Regular ML Track 前5%,2018年中国高校SAS数据分析比赛第五名。

成果展示

论文题目

Integrating flexible demand response toward available transfer capability enhancement

选题缘起

博士生实践课题是“西南区域弃水问题与外送通道问题研究”,实践期间发现当地(四川省)以水力发电为主,水电厂数量多、规模差异大,省内发电、用电受季节影响明显,加上电网数据繁杂,采用大数据技术能极大提高数据收集、整理、分析的效率与准确性,因此将大数据项目所学聚类等相关知识应用到实践项目中,完成了这篇论文,最终论文被一区SCI期刊Applied Energy录用。

论文简介

论文采用聚类方法建立四川省220kV以上电网的实际模型,考虑工厂、写字楼及居民生活用电调节能力,提出计及平移型、可中断型、灵活调节型等多类需求响应的区域电网稳定外送容量优化计算模型方法。年运行实证分析表明可提升水电消纳率8.8%,减少煤耗11.6%,提升清洁能源外送12%。

论文节选

滑动查看更多

  2021年祝语

希望有更多同学了解大数据项目,学习大数据技术,提升科研能力~

李尹硕

自动化系2019级硕士研究生

男,汉族,1997年11月出生,中共党员,清华大学深圳国际研究生院自动化系2019级硕士研究生。三次获得国家奖学金、学习优秀一等奖学金,曾获优秀学生干部、省级优秀毕业生荣誉称号、清华之友-东方电气奖学金。主要研究方向为超分辨率,已发表一篇SCI一区论文、获得两项发明专利。

成果展示

论文题目

Multitask Learning for Super-Resolution of Seismic Velocity Model

选题缘起

全波形反演(FWI)是利用非线性寻优方法估算地下速度模型的有力工具,对地下资源勘探有重要价值。但实际观测到的速度资料有限,全波形反演具有计算量大、耗时久、高频细节不够清晰的缺点。因此,李尹硕在导师的带领下通过超分辨率(SR)方法提高地震速度模型的分辨率,将SR作为FWI的后处理,以提高FWI的精度与效率。地震速度模型超分辨率的主要难点是边缘恢复,因此该SR方法以地震速度模型的边缘图像作为辅助任务。

论文简介

全波形反演得到的地震速度模型可以看作是高分辨率数据经高斯或均值滤波模糊处理后的结果,缺少高频细节,边缘信息缺失明显。该项工作使用Sobel算子得到水平和数直两个方向的边缘信息,然后使用硬参数共享的多任务学习方法,同时提升地震速度模型和两个方向的边缘图像的分辨率。网络采用均方误差与全变差的组合作为损失函数,Adam作为优化器。网络采用了全局残差连接、编解码结构、稠密连接结构以提高超分辨率效果。

论文节选

滑动查看更多

  2021年祝语

在这飘雪的季节里,怀着一颗感恩的心,走进新的一年。让我们一路同行,学最好的别人,做最好的自己!

编辑:黄继彦

大数据能力提升项目| 学生成果展系列之一相关推荐

  1. 《大数据实践课》开创实践教学新模式:清华大数据能力提升项目特色课程系列报道之一

    2014年4月,清华大学顺应时代潮流成为全国第一批成立大数据研究机构的高等学府.四年来,清华-青岛数据科学研究院(以下简称:数据院)与研究生院共同设计组织实施了以大数据能力提升项目为主的大数据人才培养 ...

  2. 大数据能力提升项目| 学生成果展系列之二

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  3. 大数据能力提升项目| 学生成果展系列之三

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  4. 大数据能力提升项目|学生成果展系列之五

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  5. 清华大学大数据能力提升项目三名学生斩获2017年中国高校SAS数据分析大赛亚军

    2017年11月20日,2017中国高校SAS数据分析大赛颁奖典礼在钓鱼台国宾馆举行.清华大学今年首次组队参赛,在与北京大学.人民大学.复旦大学等1036支参赛团队激烈比拼后,清华大学大数据能力提升项 ...

  6. 王一茗: “大数据能力提升项目”与我的成长之路 | 提升之路系列(三)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  7. 清华大学大数据能力提升项目开始报名啦 !(2019年秋季)

    数据院定于2019年8月28日晚19:00-21:00在明理楼112召开"大数据教育在清华"暨清华大学大数据能力提升项目招生宣讲会,欢迎同学们前来参与!  项目定位 在全球大数据浪 ...

  8. 玩转数据、拥抱智能 | 清华大学大数据能力提升项目宣讲会火热来袭

    9月6日晚,由清华大学研究生院和数据科学研究院(以下简称"数据院")共同举办的大数据能力提升项目新生宣讲会在西阶梯教室成功举行. 近年来,"大数据+"的概念越发 ...

  9. 支持实践教学:清华大数据能力提升项目举办CIKM AnalytiCup2017冠军团队经验分享会

    2017年11月29日,清华-青岛数据科学研究院(以下简称:数据院)报告厅举办了一场赛事经验分享讲座.数据院邀请到数据派研究部成员.清华大学工程力学系博士生姚易辰和清华热能系博士生李中杰前来分享他们在 ...

最新文章

  1. 一场由金山词霸引起的车祸 Process finished with exit code -1073741819 (0xC0000005)
  2. java复杂吗_java – 是哈希一个合适的解决方案吗?我过度复杂吗?
  3. 设计模式(八)代理模式(结构型)
  4. 请不要轻易使用 is_numberic 加入存在E字母
  5. 再记AE与AO的区别与联系
  6. java 选择排序入门
  7. 家里两台电脑怎么共享文件_家里两台电脑怎么共享文件
  8. 计算机的剪切快捷键是什么意思,剪切的快捷键是什么【快捷键大全】
  9. python PIL 图像处理库简介(一)
  10. 别人总结归纳很全的三方库
  11. 关于tomcat启动报错Error deploying web application directory [C:\......]出现的其中一种问题解决:
  12. [案例7-2]商城进货交易记录
  13. 计算机图形驱动程序原理,您知道更新计算机图形驱动程序的作用吗?怎么做
  14. python忽略警告错误
  15. 什么是环境变量?环境变量配置,jdk8的path环境变量配置,各个版本下jdk结构的变化以及环境变量配置的阐述,java命令执行三个不同目录下的java.exe说明
  16. 小米平板4能装Linux系统吗,还在考虑小米平板4要不要入手?看完这十个问题你就有答案了...
  17. POI 导出excel cell无边框
  18. 自适共振神经网络算法 ART 算法 代码实现
  19. C#写入模板excel数据
  20. 《计算机科学经典着作》(Computer Science)

热门文章

  1. Runtime编译环境搭建
  2. zabbix trapper方式监控
  3. 解决Jetty Maven Plugin:Please initialize the log4j system properly(转)
  4. backgroundworker控件的使用(线程传值)
  5. 提升用户体验的根本是内容
  6. 强类型DataSet中的DBNull的处理
  7. java将从键盘输入的时间格式化_java 时间格式化中的模式字母
  8. goland/go语言项目--本地包的导入(将项目添加至GOPATH中)(基于macOS)
  9. 交叉熵损失函数的通用性(为什么深度学习DL普遍用它):预测输出与 y 差得越多,L 的值越大,也就是说对当前模型的 “ 惩罚 ” 越大,而且是非线性增大是一种类似指数增长的级别,结论:它对结果有引导性
  10. 贝叶斯厉害在哪里,相当牛的文章