导读

为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的“π”型人才,由清华大学研究生院、清华大学大数据研究中心及相关院系共同设计组织的“清华大学大数据能力提升项目”开始实施并深受校内师生的认可。项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生大数据分析能力和创新应用能力。

回首即将过去的2020年,清华大学大数据能力提升项目取得了丰硕的成果,同学们将课程中学到的数据思维和技能成功地应用在本专业的学习和科研中,在看到数据科学魅力的同时,也将自己打造成为了交叉复合型的创新型人才。下面让我们通过来自12个院系的16位同学代表一起领略他们的风采吧!

丁文泽

生命学院博士研究生

研究方向为生命科学与计算信息科学的交叉方向,主要是蛋白质结构的预测。在博士期间发表多篇科研论文,同时参与一定的社会活动,如前往地方政府挂职锻炼、参与微软亚洲研究院的实习等。爱好是读史和运动。本次获得了清华大学大数据能力提升项目RONG奖学金特等奖。

成果展示

论文题目

DeepConPred2: an improved method for the prediction of protein residue contacts

选题缘起

避免耗时耗力的结构解析实验,从序列直接预测蛋白质的结构,这一构想随着计算机计算能力的提升以及大规模数据处理技术的发展逐渐成为可能。此论文从蛋白质残基接触角度入手,应用深度信念网络、残差网络,提出了分级的、模块化的网络架构方法,对蛋白质残基接触情况进行预测,在严密的评价体系下,该方法的表现足以踏入同领域在当时的世界领先水平。

论文简介

蛋白质结构在诸多领域都十分重要,随着计算机技术的发展,如何避免耗时耗力的结构解析实验,而从蛋白序列直接精确地预测蛋白结构,无论是在蛋白质折叠理论还是蛋白结构应用的角度都十分值得研究;蛋白质残基接触图谱可以在构像空间搜索时提供大量高质量的空间约束,大大降低搜索成本,提高搜索精度。在蛋白质结构预测领域,以残基接触为切入点的研究越来越受到关注,成为主流方法之一。DeepConPred2 应用了分级架构,汲取了经典神经网络架构如深度信念网络,残差网络等的优点,大大降低了以往预测图谱信噪比低的问题,在严格的测试体系下,DeepConPred2的预测精度达到了同时期的国际领先水平。

论文节选

滑动查看更多

  2021年祝语

大数据能力提升项目是切实帮助清华大学的研究生提升自己的好项目,希望项目越办越好,有更多的同学受益!同时,也祝愿丁文泽同学在2021年一切顺利!

赵瀚森

化学系分析化学专业博士生

博士期间主要关注于分析化学检测与数据分析技术的交叉融合,包括显微图像的识别,追踪与分类,质谱谱图分析,质谱数据库及检索方法等相关内容。爱好编程,游戏和美食。

成果展示

论文题目

Estimate Metabolite Taxonomy and Structure with a Fragment- Centered Database and Fragment Network

选题缘起

代谢组学检测在精准医疗和分子生物学研究中具有重要的意义。通常,我们可以使用质谱检测代谢小分子的核质比信息,但如何从核质比信息追溯到具体的生物分子是目前的一个瓶颈问题。我们在整理数据时候的意外发现:本应具有一致性的二级质谱谱图,在不同样本的检测中,呈现出显著的差异性。这表明这些谱图可能是多个分子同时碎裂的结果。现有的数据库的检索算法无法帮助我们查明谱图中具体包含哪些分子。为此,我们发展和建立了一个全新的数据库MSFragDB。

论文简介

质谱图谱的分子溯源是制约基于质谱的代谢组学研究发展的重要瓶颈。尽管目前质谱检测技术持续发展,但是只有将质谱图谱信息转化为具体生物分子,我们才能在分子层次进行科学研究。我们发展了基于分子碎片的质谱图谱比对解析的算法,并重新整理HMDB数据库的数据,构建了MSFragDB。对比实验表明,尽管基于同一组数据,MSFragDB在测试样例中的表现显著的好于HMDB。

论文节选

滑动查看更多

  2021年祝语

2021年我将毕业和走向工作岗位,希望在人生的转折之年能不忘初心,充满信心和希望的走向人生新阶段。

慕海昕

新闻与传播学院2018级硕士研究生

研究兴趣为社交媒体、性别研究。已发表中文论文两篇,英文T类国际会议论文一篇。曾任清华大学新闻与传播学院研究生分会主席,曾获清华大学综合一等奖学金、清华大学优秀学生干部等荣誉。

成果展示

论文题目

Anatomy of a buzzword: Three meanings of “Chinese pastoral feminism” in social media

(解剖流行词汇:“中华田园女权”在社交媒体中的三种含义)

选题缘起

随着社交媒体掀起女性主义思潮,“中华田园女权”成为一个流行词汇,它有强烈的负面意义,常常在对某些观点、主张、甚至是行动进行批评时作为标签,但却始终没有公认的定义。在大数据课程学习中,我掌握的自动文本分析方法为了解社交媒体用户在使用这一词汇时对其进行定义的方式提供了可能。

论文简介

研究爬取了知乎中三个“何为中华田园女权”问题的约1500条回答,并对答案文本进行了主题模型分析。分析显示,社交媒体用户所认为的“中华田园女权”具有三种含义:在无关议题中过度使用性别框架,争取权利但拒绝责任,某种程度上的厌男症;研究采用罗兰·巴特的神话理论对每种含义的外延(denotation)及其相应的内涵(connotation)进行了阐释。文章指出,这一话语是新自由主义为数字女性主义带来风险的一个表征:一方面,作为男性中心主义的指意体系的持久幻想,这是对中国女性主义的扭曲和污名;同时,它宣示了女性主义内部的分野,使用者将自身合法化为真正的女权主义者。

论文节选

滑动查看更多

  2021年祝语

大数据项目的完成对我来说是新的开始,希望未来我能在数据能力提升的道路上探索属于自己的更多可能;也祝愿大数据项目越办越好,为更多同学提供打开新世界大门的钥匙。

王瑜琪

教育研究院2018级博士生

主要研究方向为研究生教育,入学至今,已在多个课题组参与相关研究工作,并发表CSSCI论文多篇。今后,将继续专注于研究生教育,探讨其与经济社会发展的关系,并尝试为其发展提供建议。

成果展示

论文题目

研究生教育规模对经济增长影响的实证研究——基于国别面板数据

选题缘起

人力资本是经济增长的核心要素之一,而教育是形成人力资本的重要途径。研究生教育,是培养高层次人才的主要途径,一直以来都被认为对国家或区域经济增长有着突出的贡献,也获得了世界各国较多的关注与投入。随着研究生教育规模的扩张,其多层次、多类型特征愈发突出,对经济增长的作用也需要更为精确的识别,有必要通过实证研究进行分析。

论文简介

本文基于国别面板数据,实证分析了研究生教育规模对国家经济增长的影响,并与本专科教育规模的经济贡献进行了对比。最终发现,本专科教育、研究生教育规模对经济增长都有显著的正向影响;对于收入较低的国家,本专科教育规模对经济增长的贡献更加显著,对于收入较高的国家,研究生教育规模对经济增长的贡献更加显著;硕士教育与博士教育均显著促进经济增长,且短期内硕士教育的贡献更大,博士教育的促进作用随着时间的推移逐步增大。

论文节选

滑动查看更多

  2021年祝语

艰难方显勇毅,磨砺始得玉成。

尤静媛

2018级临床医学院与航院联合培养硕士生

2014级清华航天航空学院本科生,2018级临床医学院与航院联合培养硕士生在读。研究方向为人工智能助力睡眠医学,成功开发睡眠呼吸暂停uppp疗效预测软件,并多次参加国际学术会议,获得2019年清华大学研究生“清峰”前置式奖学金。

成果展示

发明创造名称

一种高血压风险预测方法及装置

选题缘起

在大数据能力提升项目中,我在“模式识别”和“深度学习”课程中学习到了深度学习的相关知识,掌握了一定的编程能力。因此,我将深度学习应用到研究的课题中并申请了专利。

专利简介

本发明专利为基于深度学习的针对睡眠呼吸暂停(OSA)患者的高血压风险预测方法及装置,该方法是从临床参数、血氧信号和功率谱特征中自动提取出相关特征,无需经过人工提取和处理特征即可得到高血压预测结果,大大减少了人工误差,进一步提高了OSA患者的高血压预测精度和效率。

论文节选

滑动查看更多

  2021年祝语

撕去2020年旧的篇章,翻开2021年新的一页。愿每一份耕耘都有收获,望每一次坚持都有成长。祝愿大数据能力提升项目未来带给同学们更多的惊喜和成长!

编辑:黄继彦

校对:汪雨晴

大数据能力提升项目| 学生成果展系列之三相关推荐

  1. 《大数据实践课》开创实践教学新模式:清华大数据能力提升项目特色课程系列报道之一

    2014年4月,清华大学顺应时代潮流成为全国第一批成立大数据研究机构的高等学府.四年来,清华-青岛数据科学研究院(以下简称:数据院)与研究生院共同设计组织实施了以大数据能力提升项目为主的大数据人才培养 ...

  2. 大数据能力提升项目| 学生成果展系列之二

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  3. 大数据能力提升项目| 学生成果展系列之一

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  4. 大数据能力提升项目|学生成果展系列之五

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  5. 清华大学大数据能力提升项目三名学生斩获2017年中国高校SAS数据分析大赛亚军

    2017年11月20日,2017中国高校SAS数据分析大赛颁奖典礼在钓鱼台国宾馆举行.清华大学今年首次组队参赛,在与北京大学.人民大学.复旦大学等1036支参赛团队激烈比拼后,清华大学大数据能力提升项 ...

  6. 王一茗: “大数据能力提升项目”与我的成长之路 | 提升之路系列(三)

    导读 为了发挥清华大学多学科优势,搭建跨学科交叉融合平台,创新跨学科交叉培养模式,培养具有大数据思维和应用创新的"π"型人才,由清华大学研究生院.清华大学大数据研究中心及相关院系共 ...

  7. 清华大学大数据能力提升项目开始报名啦 !(2019年秋季)

    数据院定于2019年8月28日晚19:00-21:00在明理楼112召开"大数据教育在清华"暨清华大学大数据能力提升项目招生宣讲会,欢迎同学们前来参与!  项目定位 在全球大数据浪 ...

  8. 玩转数据、拥抱智能 | 清华大学大数据能力提升项目宣讲会火热来袭

    9月6日晚,由清华大学研究生院和数据科学研究院(以下简称"数据院")共同举办的大数据能力提升项目新生宣讲会在西阶梯教室成功举行. 近年来,"大数据+"的概念越发 ...

  9. 支持实践教学:清华大数据能力提升项目举办CIKM AnalytiCup2017冠军团队经验分享会

    2017年11月29日,清华-青岛数据科学研究院(以下简称:数据院)报告厅举办了一场赛事经验分享讲座.数据院邀请到数据派研究部成员.清华大学工程力学系博士生姚易辰和清华热能系博士生李中杰前来分享他们在 ...

最新文章

  1. asp.net mvc view中支持多个实体强类型小技巧
  2. java short to byte_java笔记 Java中byte数组与int,long,short,char间的转换
  3. javascript 检测 header下载文件--插件
  4. 图像分析:二值图像连通域标记
  5. 2020-11-6(JDBC)
  6. 黄聪:PHP获取MAC地址(转)
  7. python导出excel文件数字签名_Python使用RSA+MD5实现数字签名
  8. delphi 演示数据路径
  9. Maven Ant 中截取字符串
  10. 七号信令的消息结构(包括SCCP详解)
  11. typescript元组
  12. SSD模型物体检测(水下生物识别)
  13. spring boot 运行提示:Process finished with exit code 1
  14. 基准测试spec cpu2006
  15. ON DUPLICATE KEY UPDATE 用法
  16. DIAGNOSTICS
  17. linux随机输出加减乘除_实现加减乘除计算器
  18. Web端性能测试和安全测试要点
  19. 【颜纠日记】你还不会用百度搜索吗?搜索引擎关键词技巧宝典。
  20. ABAP开发 扫雷小游戏

热门文章

  1. 【c语言】蓝桥杯算法提高 c++_ch02_03
  2. 【未完成】[Spark SQL_2] 在 IDEA 中编写 Spark SQL 程序
  3. 物联网安全:LED灯中存在多个安全漏洞
  4. OSChina 周六乱弹 ——生日快乐 @落落酱
  5. Delphi - 数组 详解
  6. PL/SQL中的数据类型隐式转换规则
  7. 开放产品开发(OPD):Archi 汉化工具下载
  8. 嵌入式C语言进行曲之要诀
  9. Windows 7 RC Build 7100 使用报告
  10. 测试眉形的有哪个软件_心理测试:你的眉形是下面的哪种?测你生来命运如何!超准...