清华大学统计学研究中心助理教授俞声

清华大学统计学研究中心助理教授俞声,主要的研究方向是基于电子病历的数据分析,他与数据科学研究院的合作始于数据院和清华大学临床医学院合作搭建清华临床医学科研数据平台(以下简称:医学数据平台)。“我们自己去跟医院谈合作,不一定能引起人家的兴趣,医学数据平台的搭建促使我们能够更好的使用医疗数据做研究。”和长庚医院深度合作,俞声认为医学数据平台功不可没。

俞声有着丰富的国外医疗数据统计分析经验,即使是回国后,在与数据院合作之前,他的研究对象依然以美国电子病例为主。相较于国外成熟的医疗数据体系,国内医疗数据的收集、开放、处理都面临着诸多困难。“早期我主要研究美国的电子病历,诸如退伍军人系统这类最优质的数据我们都能拿到,数据根据一套严格的管理规范允许我们使用。但是国内相关的环境和规定还不完善,医院大都不敢提供数据,”他为我们分析道。“另外,中文病历的分析难度也比英文更大。美国有非常完备的术语库,类似字典,包括标准术语和各种常见变体、缩写,可以用来辅助识别病历中的各种医学概念,将文字转化为变量。中文没有类似完整的术语库,所以一方面我们需要开发额外的术语自动识别技术,另一方面也希望国家加大医学信息基础设施建设的投入。”

除了医疗数据的使用和规范之外,国外的医疗数据研究团队也有相对成熟的模式。俞声跟我们介绍,美国研究医学问题的团队历来都会配备生物统计学家,医学背景的人提出研究问题,生物统计学家会帮助设计实验、建立模型、排除干扰变量,并对结果的解读提供统计学指导。“但是在国内,医生很少和统计学家合作科研。”俞声说,“所以数据院和临床医学院搭建的医学数据平台是非常有意义的。联合医学专家和数据科学领域专家,大家术业有专攻。像我个人是有统计和计算机交叉的知识背景,与医学专家合作,我们可以发现许多新问题,从新的角度去解决问题,例如自然语言处理、深度学习这些技术都可以帮助有效处理医疗数据。”

通过医学数据平台,俞声团队在肝癌、脑卒中自由文本数据的信息提取、病历文本挖掘等方面都与医院展开了合作。医院提出和临床直接相关的医学问题并提供数据支持,俞声团队则提供技术支持并进行统计分析,得出和临床相关的结论。“为了数据安全,原始病历数据不能离开医院,所以实际上我们要处理什么数据,都要往医院跑,路上会比较辛苦。”提及与医院合作的过程,俞声有不少感慨:“数据院正在建立的医学数据平台,可以实现数据脱敏,并允许清华IP远程读取存储在医院服务器上的数据,远程处理之后传回结果。相当于数据还是留在医院,但是我们远程就可以实现处理和分析,就不用每次都奔波往返于医院和学校之间了。”

平台还在不断搭建和完善,国内医疗与大数据结合的工作还有许多困难需要克服。俞声相信,数据院和长庚医院的合作模式将会给全国带一个好头。在数据院的推动下,“医工结合”这条路已然草木蔓发,春山终可望!

医工结合之路:草木蔓发,春山可望 | 专访清华统计中心俞声相关推荐

  1. 《财富自由之路》——博多.舍费尔(持续更新中)2020-11-05

    <财富自由之路>--博多.舍费尔(持续更新中) 重新定义金钱的概念 自我分析财务状况 创造奇迹 你真正想要的是什么 责任意味着什么 重新定义金钱的概念 人应该热爱财富,同样有义务创造财富. ...

  2. 开源影响发量?这届开源中的巾帼力量

    作者 | 开源圆桌派 出品 | CSDN(ID:CSDNnews) 在 Stack Overflow 2021 年度开发者调查回收的 82,286 份报告里,女性开发者仅占 5.31%,而职业女性开发 ...

  3. 领域驱动设计(DDD)实践之路(四):领域驱动在微服务设计中的应用

    这是"领域驱动设计实践之路"系列的第四篇文章,从单体架构的弊端引入微服务,结合领域驱动的概念介绍了如何做微服务划分.设计领域模型并展示了整体的微服务化的系统架构设计.结合分层架构. ...

  4. 16S+功能预测发Sciences:尸体降解过程中的微生物组

    Metcalf, J. L., et al. (2016). "Microbial community assembly and metabolic function during mamm ...

  5. Android模拟发短信,[转载]Android模拟器中模拟GPS、打电话、发短信

    首先,当然要打开模拟器 然后,连接模拟器 C:UsersBillGates>telnet localhost 5554 Android Console: type 'help' for a li ...

  6. 微信发的图片怎么样在服务器中删除了,朋友圈的图片怎么删除掉

    大家好,我是时间财富网智能客服时间君,上述问题将由我为大家进行解答. 以微信为例,朋友圈删除图片的具体步骤是: 1.打开微信软件,在"我"页面点击"相册"选项. ...

  7. 企业数字化转型高级解决方案专家柳京活:元宇宙背景下的大数据之路 l 华坤道威专访

    近两年,元宇宙成为时下热门话题之一,从概念的形成到观念的传播,从技术的创新再到资本驱动的产业迭代升级,可谓是说风头正劲,而"大数据"也成为推动元宇宙发展的关键部分,越来越多企业把& ...

  8. 16S+功能预测也能发Sciences:尸体降解过程中的微生物组

    Metcalf, J. L., et al. (2016). "Microbial community assembly and metabolic function during mamm ...

  9. python发邮件包含表格,在Python中在电子邮件正文中包含Excel表

    这样做可能会解决您的问题:import openpyxl from openpyxl import load_workbook workbook = load_workbook(f) workshee ...

最新文章

  1. 当有键盘时如何在开始编辑时使UITextField向上移动?
  2. iOS推送:要支持戴口罩解锁了!以为是黑科技,原来是骗我买iWatch...
  3. mpc5774时钟监控寄存器_单片机如何才能不死机之内外部时钟
  4. IFrame标签的两个用法介绍
  5. matlab基本编程实验1,matlab实验4MATLAB基本编程.doc
  6. java 对象和类
  7. 盘点抖音及今日头条的优化推广方法有哪些?
  8. 2017-2018-1 20155222 《信息安全系统设计基础》第7周学习总结
  9. python数据库定时更新脚本——(一)GitPython拉取代码
  10. sqlite3 命令行操作
  11. 用c语言判断计算机是大端模式还是小端模式
  12. linux上传文件夹工具,[转] psftp(linux简易上传上载工具)的用法及常用命令
  13. SIM800L上传数据到OneNET(HTTP)
  14. 实验4、A/D转换实验
  15. shopify抓单按时间总是少一些的解决
  16. Entry name ‘org/apache/commons/codec/language/bm/gen_approx_greeklatin.txt’ collided
  17. 神奇的月食画面 超级血月出现天文迷大兴奋
  18. 软件模拟SPI接口程序代码
  19. 网桥(生成树网桥和源路由网桥)
  20. Python新手入门英文

热门文章

  1. 安装Ubuntu13.10后必做的10件事
  2. Java的类加载机制
  3. 雪碧图工具sprity(20151201更新修复了同时合并多张图的bug)
  4. Varnish3.0中文入门教程-应用篇2
  5. Linux机器建立密钥信任
  6. vs打开php项目路径,如何让vscode右键项目文件夹打开
  7. Linux学习(五)---开机、重启和用户登录注销
  8. Java基础学习三:循环结构的使用
  9. 通俗理解注意力机制中的Q、K和V表示的具体含义
  10. AWS EBS是 Elastic Block Store 的简写