申耀的科技观察

读懂科技,赢取未来!

客观的说,过去十年来在“新医改”政策和数字化技术的双重推动下,国内医疗行业的数字化转型取得了长足的进步,但随着数字化转型的不断深入,同样也对未来智慧医院的建设提出了更多的要求和挑战。

一方面,是随着数字化转型的提速,医院的数据正在不断变“大”。如果将医疗大数据比喻为一座冰山的话,那么露出水面的仅仅只是“冰山一角”,大量隐藏在水面之下的还有众多的非结构化数据,如影像、心电、监护、基因分析、病毒检测等等。因此,如何存储和管理这些数据成为了新的难题。

另一方面,今年突如其来的疫情,更进一步突显了大数据在疫情防控中的重要性。而利用大数据分析技术,进行创新性研究开发利用,服务于疫情防控、临床救治和科研攻关,支撑基于数据的科学决策已是“迫在眉睫”。

那么,在后疫情时代,对于医院而言,未来如何更好的完成医疗大数据的“存、取、管、用”,实现医疗大数据的掘金,并寻找到一条通往智慧医院建设的最佳之路呢?

医疗大数据的新挑战

众所周知,如果按照国际统一医疗系统信息化水平划分,医院的信息化发展普遍经历三个阶段:

即以收费为中心,以人财物资源调配管理等为主的医院管理信息化(HIS)阶段;以患者为中心,以医生临床诊疗行为为导向,借助多种应用整合患者临床数据,并实现全院级别的诊疗信息与管理信息集成的医院临床医疗管理信息化(CIS)阶段;通过运用信息技术把社会医疗资源和服务整合为一体,从而实现区域医疗卫生服务(GMIS)阶段。

而经过十年来“新医改”的推进,目前国内医疗信息化正处在第二和第三阶段相互并存的阶段,即二级和三乙/丙医院的重点是临床系统建设,而三甲医院重点是医疗协同建设。换句话说,目前国内的医疗信息化正在从基础信息化阶段向医疗大数据应用创新,以及数据互联互通快速迈进的关键时期。

在此过程中,医院的数字化建设,特别是医疗大数据的应用方面还存在和面临着诸多挑战,可以从几个维度来做观察:

一是,医院的“数据孤岛”现象依然大量存在。过去几年智慧医院建设中最为明确的目标,就是确定了“以人为本,以患者为核心”,而要实现这个目标的落地其实需要依靠大量的数据作为关键基础。但是在推进过程中,可以发现仍然有不少的医院还存在着“数据孤岛”的现象。

特别是近几年人工智能的应用,不少是各个医院科室和相关服务商一起来展开的,而这些应用数据由于各种原因导致没有进入到医院的统一数据平台之中。因此,建设医院大数据平台,打造全院级的“数据湖”,并在此基础上加速数据转化为资产,转化为生产力的速度,由此推动智慧医院的落地至关重要。

二是,医院上云给数据的管理提出了新要求。今年突如其来的疫情也成为了医院上云的“催化剂”。例如,疫情发生后,各地定点医疗机构线下门诊压力剧增,患者不断增加,需要通过互联网医院的新模式来提供服务;此外,临时增加的数据中心资源扩充,也需要以更加灵活、快捷的方式来提供,这些都让医院上云成为大势所趋。

由此带来的一个新挑战则是,医院上云之后,其应用数据的部署范围也从传统数据中心扩展至混合多云模式,因此应用和数据的复杂性和多样性随之快速上升,这让医院大数据管理变得更加困难。

三是,现有的存储基础设施不能有效支撑起医院的科研攻关。如今,包括人工智能在内的新技术在医疗行业应用已越来越深,特别是那些研究型的医院,往往会有十几个科研团队同时在做基因测序、AI、深度学习相关的项目,而传统的存储基础设施已难以满足这样的需求。

以基因相关的科研项目为例,基因测序仪一天能完成20个人左右的全基因测序,数据量在6TB左右。但医院的科学家用移动硬盘将这些数据拷贝到基因数据分析平台需要2-3天的时间,同时做科研至少需要1000人以上的基因样本,这就意味着光拷贝1000人的基因数据最少也需要100天,而对科学家来说,花超过100天的时间用于数据的准备是完全不可接受的。

而这仅仅是数据的采集阶段,要让基因测序数据产生价值,还需要进一步做好准备、训练和推理的其他环节,可以说每一个环节都存在着大量的挑战,这也让基因测序的数据管理和价值挖掘变得愈加复杂和困难。

更要命的是,如今很多医院的PB级存储需求已成为通常的衡量单位,同时对存储性能的要求也越来越高,且数据还要保存30年以上,如此大的存储需求,数据又需要高度保密,给医院的传统的存储基础设施带来的挑战和压力是可以想象的。

由此可见,随着云计算、大数据、AI等新技术在医院的的快速发展,不仅会产生新的数据形态、新的部署环境、新的应用模式、新的价值需求,更让存储的重要性变得比以往更加明显,变革与创新俨然“刻不容缓”。

轻松实现四两拨千斤

在此背景下,戴尔科技集团近期正式发布了Dell EMC PowerScale,它继承自Isilon的“衣钵”,可以理解为Isilon的全新升级版本。

PowerScale首次把戴尔科技强大的横向扩展文件系统OneFS和卓越的服务器平台PowerEdge有机结合起来,在高效地存储、管理、保护和分析非结构化数据的同时,也为各种应用程序和工作负载提供了强大的支持能力,对于医院的大数据管理乃至智慧医院建设真正起到了“四两拨千斤”的价值和作用。

首先,实现了性能和成本的平衡。PowerScale可以提供从最小7TB到多PB规模的存储能力,支持对数百万个文件进行操作;同时,智能的横向扩展群集可确保在添加节点时不会出现“热点”,这样可显著提升存储的效率,整个集群的存储利用率可超过80%。

不仅如此,PowerScale中的OneFS操作系统,通过单一命名空间、单一文件系统环境和企业级数据服务优势,医院客户可以通过提高效率和新的自动化功能获得易用性、灵活性和高性能,而这种易用性,不仅体现在最终用户使用的客户体验上,同时也体现在管理上的体验上。

例如,客户容量和性能的扩容可以在60秒之内通过简单增加节点而实现,更新换代也可以通过简单地切换下过时的老旧节点完成,而不需要考虑任何的数据迁移。

同时,通过大规模简化能力,PowerScale的成本也更低,一位管理员就可以管理PB级的存储。这种“伸缩自如、简捷如一”的能力实现了性能和成本之间的平衡,无疑可以成为医院大数据平台建设中的首选。

其次,化解了数据管理一致性的难题。PowerScale同时支持高达8种协议的企业级非结构化数据服务,包括NFS、SMB、HDFS、S3、REST、HTTP、NDMP和FTP,同时可向任意客户端提供访问权限,并支持任意用户的需求。

具体来说,这种支持多协议访问同一数据的特性,既解决了不同用户的不同访问方式的需求,更为重要的是解决了数据在存储和使用中的一致性和完整性问题,比如源数据的存储访问,和大数据分析之间数据差异问题。

值得一提的是,全新引入的对S3协议的支持,以及基于PowerEdge的全闪存和NVMe节点的能力,还可以让PowerScale无论是在数据中心、边缘、核心还是云中,都能借助统一的OneFS操作系统,以相同的方式进行存储管理,可以说强大的“任意数据、任意位置”的能力,真正化解了医院在未来混合多云时代面临的数据管理复杂性、一致性的难题。

最后,为新一代应用提供了关键的支撑能力。主要体现在PowerScale是一款可编程的基础架构,支持Kubernetes和OpenShift的集成,由此医院用户可以更好的完成应用现代化的重构,满足当下互联网医院建设的迫切需求。

在此基础上,全新增加的“DataIQ”功能还能够帮助用户发现、理解,并且更好地对已经拥有的数据采取行动和提取价值。通过提供快速搜索功能和统一文件系统视图(无论数据来自Isilon、PowerStore、ECS还是第三方存储和云存储),DataIQ都允许用户通过单一窗口来可视化所有非结构化数据,有效消除数据孤岛。

这种“海量数据、智能洞察”的独特优势,也让医院可以从大量的非结构化数据中获取最大价值,并将数据转化为洞察力,并为医院今后展开基因测序、AI、深度学习等相关的项目提供重要的支撑能力。

不难发现,PowerScale通过技术创新,在每一处细节上做到了突破,又将之融合,解决了医院用户在“云数智”等多个领域的“痛点”,并彻底释放了医疗大数据的价值。

构筑智慧医院基石

毫无疑问,随着疫情防控的“常态化”,无疑会让医院催生出越来越多的新服务和新模式,更会对存储基础设施的可持续发展提出更高的需求,而这也让PowerScale为医疗行业客户创造更多价值提供了全新的机会。

第一,PowerScale的技术源自一线实践验证,实战锤炼证明其具备一流的可靠性、可用性。从全球数据看,目前全球已有超过6000家医疗提供商已部署OneFS;此外,全球还有超过400家生命科学组织已部署OneFS用于下一代测序(NGS)、高性能计算(HPC)等相关工作。

在中国市场,戴尔科技集团也帮助国内超过3000家医院进行了数字化转型,有效化解了来自结构化、半结构化、非结构化数据与流数据带来的挑战,可以说在医院数据湖乃至医疗大数据平台建设过程中发挥了重要的作用。

第二,PowerScale还始终以场景化创新解决方案作为突破点,在全院级PACS应用支持、医疗大数据平台建设、医疗数据湖建设、医疗影像云建设、IoT及视频监控应用、海量小文件存储管理管理方面都具备独特的优势,而这也为智慧医疗的落地打下了坚实的基础。

以全院级PACS应用支持为例,PowerScale单一文件系统可以有效简化海量数据管理;横向扩展架构满足全院级PACS应用性能需求;在线软硬件升级解决海量数据迁移和长期保存负担;数据自动分层满足数据生命周期管理要求,由此带来的好处体现在两个维度:

其一,就是消除了医院的“数据孤岛”,可以将医院不同部门的、分散的数据平台整合到统一的“数据湖”或者全院级别的大数据平台之中,能够减少重复建设,并降低建设成本。

其二,是医院的数据管理和利用率得到极大的提升,医院的数据科学家不需要再从A平台、B平台或C平台“抓取”数据,而是通过统一的大数据平台就能立刻实现大数据和AI分析,挖掘医疗大数据带来的新价值。

除此之外,PowerScale在医疗大数据分析和AI创新应用方面也能“大显身手”,特别是PowerScale能完美配合主流的Hadoop/Spark等大数据分析软件。

由于PowerScale支持原生HDFS,且在POC验证中性能出色,由此就可以让医院在原有数据的集合上就能立即展开AI深度学习这类应用,而无需任何数据的导出和迁移,也不需要额外的数据复制和容量开销,真正打破了AI应用中过去存储面临的种种瓶颈,使得医院也能够更好的释放数据的潜能。

第三,戴尔科技集团在医疗行业的丰富实践经验,又让它打造出了面向新一代医院数据中心基础设施,以及新一代应用交付的完整架构。

例如,在戴尔科技面向智慧医院数据中心的整体架构中,除基于PowerScale构建数据湖的全院级数据中心外,还可以基于分布式架构打造VMware云平台,以及提供数据安全的保护平台(如备份、恢复、归档、迁移与容灾安全),从而实现了针对医疗大数据的全生命周期管理,这对盘活医疗大数据这一最重要的核心资产显然会贡献出更高的价值。

从这个角度来说,全新的PowerScale不仅能够在医疗大数据平台建设中发挥出更加重要的作用,也可以在智慧医院的升级过程中成为关键的基石,在推动医院基础设施架构进化和迭代的同时,也一定可以书写出医院数字化转型的新篇章。

尊敬的读者

随着“Power”产品的不断推出

涵盖从服务器到网络

从存储到数据保护的

戴尔科技“Power Family”

已经逐渐呈现在您的眼前

藉此,我们隆重邀请您参加

2020710

900

新华网直播间重磅发布主题为

“奔涌之势 智造未来”

戴尔科技新一代

信息技术赋能新基建暨

2020新品发布会

届时同步通过多家主流媒体平台转播。戴尔科技集团将面向中国用户发布多款面向新一代信息技术的Power Family新产品家族及方案,并分享在中国市场各个领域的落地应用

欢迎点击下方“阅读原文”

领取发布会入场券▼

申耀的科技观察,由科技与汽车跨界媒体人申斯基(微信号:shenyao)创办,18年企业级媒体工作经验,专注产业互联网、企业数字化、渠道生态以及汽车科技内容的观察和思考。

!!

点击“阅读原文”,获取发布会入场券!

【观察】掘金医疗大数据,如何四两拨千斤?相关推荐

  1. 刘铁岩:如何四两拨千斤,高效地预训练NLP模型?

    智源社区 & AI科技评论 作者 | 熊宇轩 智源导读:2020 年 11 月 1 日,微软亚洲研究院副院长.IEEE会士.ACM杰出科学家刘铁岩博士在第十九届中国计算语言学大会(CCL)上发 ...

  2. 百度“如流”开启智能办公模式,“四两拨千斤”开启差异化模式

    文|有趣的老天师 来源 | 螳螂财经(ID:TanglangFin) 在网络资源不断完善.用户规模日益扩大的背景下,互联网行业的生态拓展变得顺理成章,如在线办公.在线教育等领域都有了长效的发展. 特别 ...

  3. atom系列服务器,这才叫四两拨千斤!Atom将登陆服务器

    这才叫四两拨千斤!Atom将登陆服务器 2011年03月21日 00:08作者:郭攀编辑:郭攀文章出处:泡泡网原创 分享 泡泡网CPU频道3月21日 Intel的Atom处理器给我们的印象就是低功耗. ...

  4. 分享一个四两拨千斤的真实故事

    分享一个四两拨千斤的真实故事. 看懂的人都是当老板的料. 有一家小食品公司,辣椒酱上市前想做宣传,无奈没有太雄厚的经济实力,租不起市区广告牌. 于是,他们突发奇想,租下城门口的一个不值钱的广告牌. 租 ...

  5. 孙溟㠭讲篆刻(二):金石之上的四两拨千斤

    篆刻艺术已流传3700余年,自商朝起,古人就开始治印.汉字之美在方寸之间蕴涵了千姿百态,一方小小的印章之上,刻的是千年古韵,人生百态.不黑文化艺术学社公众号将陆续推出<孙溟㠭讲篆刻>系列. ...

  6. 数据洪流来袭,企业转型势不可挡,如何四两拨千斤?

    来源:机器之心 :作者:Jonathan Hui 本文约14000字,建议阅读10+分钟. 本文将会从第一步开始,告诉你如何解决深度学习项目开发中会遇到的各类问题. 在学习了有关深度学习的理论之后,很 ...

  7. 【asAI创新】华为CloudIVS轻量云:借力打力,四两拨千斤

    2019独角兽企业重金招聘Python工程师标准>>> [摘要] 1.测评表现就目前来说,AI的门槛还是比较高的,业内所熟知的算法企业,为了追求算法的极致,比如人脸识别公司,仍在不断 ...

  8. 虚拟化何以四两拨千斤

    作者::卢旭成    文章来源:中计在线    更新时间:2007-11-5 9:55:39 虚拟化市场已经处于爆发前的临界期,一股类似当年互联网的浪潮随时都可能席卷业界.虚拟化技术会给用户带来哪些价 ...

  9. 四两拨千斤!深度主动学习综述2020

    本文转载自知乎,为最近新出的论文 A Survey of Deep Active Learning 中文版介绍,原文作者调研了189 篇文献综述了深度主动学习的进展.文章较长,建议先收藏再阅读. ht ...

最新文章

  1. 文本和代码文件助手软件
  2. 原生js获取css样式
  3. MYSQL5.7版本sql_mode=only_full_group_by问题
  4. 【Python基础】Pandas批量合并文件脚本,多个同名sheet也适用
  5. 【IDEA】自动导入无歧义的包
  6. 窄带物联网有望结束技术应用“碎片化”
  7. 华为数据库2019年度大盘点
  8. windows环境下32位汇编语言程序设计 90盘_程序设计作业题汇总
  9. 为jquery.AutoComplete添加触发事件
  10. 事业编,突然接到换岗通知,作为个人能怎么办?能拒绝换岗吗?拒绝的后果是什么?
  11. Nexon由Xsolla全球支付服务
  12. 百战java课程_java百战程序员SpringBoot视频教程
  13. pyqt项目——测温仪数据采集软件
  14. 简练网软考知识点整理-易混概念项目绩效评估与团队绩效评价
  15. kafka auto.offset.reset latest earliest 详解
  16. java8使用Comparator.comparing进行排序
  17. 无线路由器和计算机怎么连接网络连接,如果我从无线路由器的LAN端口连接到计算机,但计算机未连接到Internet,该怎么办?...
  18. RL gym 环境(2)—— 自定义环境
  19. “差生”韩寒难以改变的人生戏码
  20. MarkdownPad 2 安装配置及常见问题

热门文章

  1. 苹果xr如何关机_iPhone X强制关机集合
  2. win7无法打开共享文件夹的文件
  3. 算法初探系列4 - 广度优先搜索之图上搜索
  4. Stephen R.Schach《软件工程 面向对象和传统的方法》总结
  5. @Aspect无法使用的问题
  6. 服务器协议密码,确定SSL服务器支持的最差/最佳协议、最弱/最强密码的最快速方法?...
  7. 如何从pastebin粘贴一段代码到putt…
  8. 狠!删库跑路!一行代码蒸发10亿人民币!
  9. leetcode *974. 和可被 K 整除的子数组(2020.5.27)
  10. 怎么营造一个好的开发氛围