加入收藏 | 设为首页 | 会员中心 | 我要投稿 柳州站长网 (https://www.0772zz.cn/)- 基础存储、数据迁移、云安全、数据计算、数据湖!
当前位置: 首页 > 大数据 > 正文

后疫情时代的城市医疗大数据,需要如何的建设“方法论”?

发布时间:2021-09-16 15:25:43 所属栏目:大数据 来源:互联网
导读:一、数据价值理念需要澄清 数据的价值不是数据自身的属性,是数据与应用环境互动的结果。 1.数据价值边界的研究 各地都在成立大数据局加快数据中心的建设,都在谈论数据的价值,值得注意的是,宣传越火热越容易出现概念越界,导致工作的失误,冷静探讨数据价
  一、数据价值理念需要澄清
 
  数据的价值不是数据自身的属性,是数据与应用环境互动的结果。
 
  1.数据价值边界的研究
 
  各地都在成立大数据局加快数据中心的建设,都在谈论数据的价值,值得注意的是,宣传越火热越容易出现概念越界,导致工作的失误,冷静探讨数据价值的理念很有必要。
 
  2.数据的价值是生态环境的产物
 
  经济学认为价值并非是数据的天然属性而是对数据应用有效性的估值,带有很大主观性的成分,价值是有立场的,同样的内容其价值因人而异,抽象的价值是不存在的,数据的价值是特定生态环境的产物,必须从数据与其应用环境的关系上去理解数据的价值。
 
  3.数据的使用价值取决于使用效果
 
  数据的使用价值是数据对用户目标贡献的主观评价,数据有无价值要看其贡献是否大于成本,这种评价标准与用户目标本身的价值相关,数据作为手段其价值是无法超过目标本身的,项目越重要数据价值会越高。数据价值还与用户的利用能力有关,缺乏数据处理手段、缺乏数据理解能力都会制约应用效果。对使用价值研究有助于降低成本,要有清晰的应用目标,目标不清是最大的浪费,要提升使用工具的能力并避免过量使用数据。
 
  4.交换价值强调稳定的应用规模
 
  人们常用石油来比喻数据资源,这是从交换价值视角强调数据资源的重要,数据资源的确很重要,但数据资源与石油资源的价值特点有很大不同,石油交易稳定且频繁能够形成价值共识,而数据资源易过时易复制且供需匹配很困难,难以形成数据价值共识,这是大数据交易中心无法成功的主要原因,数据资源长远价值的不稳定提醒大数据管理者,不是所有数据都有价值都值得保存,应当保存未来真正用得上的数据,避免垃圾数据的堆积。
 
  二、数据价值随环境变化而改变
 
  数据价值最大的制约因素是处理速度,信息技术的使用大幅度提高了数据处理的速度,使很多过去无法利用的数据都变得有用了。
 
  1.数据处理的速度支撑数据价值
 
  数据是作为工具来帮助人们实现目标,任何目标的实现都有时限,时间是数据处理最大的机会成本,时限内完不成的应用均无价值,数据处理的速度直接影响数据的价值。早期的统计数据由于是人工处理,除了汇总结果没有更多的用途,直到计算机出现数据价值才开始被人称道。
 
  2.摩尔定律推动数据价值的提升
 
  计算机的应用提升了数据处理的效率,摩尔定律使计算机的能力提高亿万倍才形成了社会对数据价值的重视。
 
  3.统计数据价值的黄金期
 
  在统计数据处理的黄金期,计算机不仅能够高效处理各种分类报表、排序等操作,还把统计数据带入统计分析阶段,统计分析软件如SPSS、SAS成为计算中心的必配软件,统计数据共享被提上日程,国家统计局对外宣称统计数据是一个巨大金矿。
 
  4.数据库存储了数据间的关系
 
  统计数据处理是一项工程并不是一项服务,用户必须有数据处理的能力才能使用统计数据,这使应用很难推广,数据库的发明解决了这一难题。数据库按照用户使用的方便对数据进行重组,不仅存储数据更存储数据之间的关系,用户关注的信息不仅体现在数值之中还体现在关系之中,数据间关系的存储极大提升了数据库使用的灵活性,使数据库备受欢迎。
 
  三、互联网对数据价值的影响
 
  互联网推动全球的数据共享,降低数据发布与数据服务的成本并把竞争带入到数据服务领域,降低了数据信息服务的价格。
 
  1.管理信息系统与商用数据库
 
  数据库提供的服务比统计数据处理更方便更有针对性,数据库公司把这种新型服务定义为信息服务,提出信息共享口号来推广数据库的应用,数据库最成功的应用有两类:一类是管理信息系统,该系统是利用数据库与局域网技术设计的专用业务管理系统,典型的例子是企业管理ERP系统;另一类是与广域网相结合形成的商用数据库的公开服务并大赚其钱,成为当时的明星产业。
 
  2.互联网终结了商用数据库的辉煌
 
  新技术不断推出新一代明星且终结了老一代明星。九十年代末互联网开始在全球大规模推广,此后再没有商业数据库明星出现了,被互联网企业明星取而代之,通用的互联网模式淘汰了商业数据库的专用网模式,使缺乏专用网壁垒保护的商用数据库深陷廉价信息的竞争之中,商业数据库的数据质量并没有降低,但是互联网竞争环境却使其收益大大降低了。
 
  3.数据共享开创免费信息时代
 
  互联网的最大贡献是推动了全球的数据共享,数据的发布成本几乎降为零,加上信息复制早已接近零成本,必然带来网上数据泛滥,必然带来信息服务价值下降,互联网开创了免费信息时代,越来越多的外部信息服务的竞争使政府内部信息服务的价值也下降了。
 
  四、关于政府大数据应用
 
  按照统计数据应用思路,以获取信息为目标的大规模数据应用才属于大数据应用;政府精细化管理所使用的传统业务数据不属于大数据应用。
 
  1.大数据应用价值的出现
 
  互联网推动网上数据流量大爆发,互联网巨头公司积累了超大规模的数据,开发出能够处理超大规模数据的软件工具,公司可以利用自己的大数据资源向社会提供服务。典型的例子如谷歌流感预测、阿里的市场预测等,大数据成为专有名词被用来推广这种应用及销售相关软件。
 
  2.大数据对统计数据理念的冲击
 
  英国人迈尔-舍恩伯格与库克耶合著的《大数据时代》对大数据的应用特点做了精辟的概括,认为大数据应用带来三大观念转变:
 
  1.以全体数据替代随机样本;
 
  2.强调数据规模允许数据不精确;
 
  3.重视相关关系不追求因果关系。
 
  大数据新观念提升了应用的效果,使之成为发现新规律新知识的重要工具。
 
  3.相关关系对因果关系的挑战
 
  大数据只重视相关关系的理念是对因果关系文化的挑战,原因之一是因果关系超出了大数据分析的范围;原因之二是工作改进依赖的是事实,并非都需要用因果关系来解释。机器翻译主要靠概率推算而不是语法推理,统计质量管理也是依赖数据相关关系改进质量而不依赖因果关系解释。
 
  4.大数据分析决策的局限性
 
  大数据分析有许多成功案例也有先天的弱点,首先是合适的大数据资源非常稀少不容易碰到;其次是大数据资源涉及的领域非常狭窄(大规模数据只能产生于专业化领域),数据量大并不意味所反映的信息就全面,大数据适合狭窄领域的决策而不适合政府的宏观决策。
 
  五、政府精细化管理使用的数据
 
  政府精细化管理目的是提高业务操作的效率,关注的是业务数据精准化与整体化,数据整合的任务就是把分散的管理数据组织成便于统一调用的系统,提升整体的驾驭能力。对政府业务数据的整合是数字政府的基础工作。
 
  1.政府业务管理是数据的精准使用模式
 
  政府使用数据通常有两种模式,一种是信息获取模式,该模式是对数据分析加工提取信息供领导层决策使用;另一种是管理操作型数据使用模式,该模式是系统直接利用数据进行操作,这是数据的精准使用模式,是面向政府业务管理操作应用,这种模式管理的是政府业务部门使用的工作数据,数据是不可替代的,这类数据的精准管理是政府精细化管理的基础。
 
  2.数据整合的目的是实现政府数据整体化
 
  政府数据的收集是分部门完成的,分散收集的数据必须组织成整体才能提升管理能力。这次疫情健康码的整合就是一个成功的例子,当事人的交通信息、进出商场、小区、医院等记录都通过身份证号码集中起来形成个人健康码记录,在疫情防护中发挥出重要作用。数据整合的任务是把分散的数据有效组织起来产生出数据的整体价值,业务数据跨部门调用的流畅性是政府数据整体化的标准。
 
  3.实现数据逻辑统一是各部门的共同任务
 
  数据的整体化效果来自跨部门数据调用的流畅性,影响数据调用流畅性的因素主要是逻辑障碍(数据名称、标准、计量单位、统计时间不一致等),实现各部门数据在逻辑上统一是数据整合的基础工作,它不是信息技术人员能完成的,它是领导层与各级工作人员的共同任务。
 
  4.完善数据的质量维护机制
 
  政府精细化管理依赖的是数据的精准处理,数据必须要准确,完善的数据质量维护机制必不可少,出现数据差错必须能立即追责及时修改,反馈修改机制的流畅是数据质量的保证。为方便数据共享,有些数据机构想把各部门数据集中统一管理,但是要考虑到数据质量维护责任不容易集中,考虑到牺牲数据质量维护的流畅性是否划算。
 
  5.建立支持基层数据应用的数据服务
 
  政府精细化管理主要实施者是基层工作人员,将整合好的数据送到基层是提高工作效率的关键,目前这项工作碰到的障碍还很多,从终端设施数据资源到管理手段都不连贯,必须建立完整的服务链才能达到数据服务向基层倾斜的效果。
 
  六、网络数据服务引领数据价值革命
 
  网络数据服务的重要贡献是把技术、网络、服务资源和用户群组合成大规模的社会服务云,利用动态化、互动化、共建化模式实现数据服务的升级换代。
 
  1.公众最有获得感的数据服务系统
 
  电子商务、手机支付、地理导航、网上查询等是公众最称道的系统,这些最有获得感的应用几乎都是大型网络数据服务系统,很多大数据分析的数据都是这些网络服务的数据副产品,产生大数据资源的主流业务(搜索、电子商务等)都要列入大数据业务,这些主流业务是大数据业务的真正支柱。
 
  2.联网大数据服务构造了强大的服务云
 
  规模是构成数据服务价值的核心因素,联网大数据服务创造了巨大的服务规模,形成了完整的产业链,包含云计算、互联网、数据资源、用户终端及大量的应用软件,构建了完整的服务体系,把众多服务资源供应方和用户群组织成完整的服务云,实现了大规模的社会服务,数据服务的价值因规模的膨胀而升级,这种模式已成为智慧城市网络服务的大方向。
 
  3.动态数据让网络联机服务能力升级
 
  使用动态实时的数据大大提升了系统服务的层次,对比联机与脱机的地理导航明显看出两者的服务档次不同,脱机的地理导航根本不知道车开到哪里,不知道路况的变化,无法绕过拥堵路段无法另选行车路线,实时在线服务则完全克服了这些障碍,实现了服务的全面升级,云计算与互联网的结合是推动实时服务的技术支柱。
 
  七、数据价值理念小结
 
  数据应用的价值是一个复杂的问题,本文从四个视角小结:
 
  1.环境价值视角
 
  数据的价值并不是数据自身的属性,它是数据与应用环境互动状态的缩影,数据没有与生俱来的使用价值,数据的价值与用户的应用目标及使用能力有关,能帮助目标实现的数据才有价值,用户能力不足即使有用的数据也会变得无用。环境价值论提醒我们,数据的价值受服务规模制约,规模越大效益越好,在大城市很成功的应用在中小城市却会亏本,数据应用必须要因地制宜。
  城市级健康医疗大数据体系建设,是一个很宏大的命题。
 
  《“健康中国2030”规划纲要》明确将发展健康产业作为“健康中国”建设五大任务之一,并提出将健康产业发展成为国民经济支柱性产业的战略目标:2020年健康服务业总规模达到8万亿,到2030年达到16万亿,全年GDP占比超过10%。
 
  从医疗大数据过往的“大事件”来看:2017年上半年,在三个月内,医疗大数据产业“国家队”——中国健康医疗大数据产业发展集团公司、中国健康医疗大数据科技发展集团公司、中国健康医疗大数据股份有限公司相继宣布筹建,三大集团的格局迅速奠定。
 
  同一年,一些省市已经开展健康医疗大数据中心的建设。
 
  2017年9月,内蒙古健康医疗大数据应用工程启动,其主要任务是建设三级平台、五大数据库和十个应用系统。2017年12月,健康医疗大数据中心第二批国家试点启动,山东被确定为建设试点省,成为5个健康医疗大数据区域中心之一。
 
  而在新基建的七大领域中,作为城市底层基础设施和数字经济的底座,大数据中心的平台化水平和运营能力,将直接决定新基建的整体成效。而医疗,将是验证大数据中心建设成色的一把“放大镜”。
 
  玩家众多的产业链
 
  此前,雷锋网曾对医疗大数据的流程进行过拆解:其中,囊括了数据产出、数据收集、数据储存、数据加工、数据分析和数据应用等多个环节,每个环节都存在对应的供求关系。
 
  围绕这项工程,也存在一条分工明确的产业链。
 
  底层是芯片、服务器等制造厂商,这是整条产业链基础的“基础”,例如戴尔、惠普等老牌厂商。
 
  中层厂商多为存储计算服务以及医疗信息化解决方案的提供商,为整个产业底层做数据采集。
 
  以信息化而言,国内从事医疗信息化的厂商众多,据前瞻经济学人估计约有600多家,以区域性供应商为主。代表性的企业有东软集团、东华软件、卫宁健康、万达信息、创业软件等。但与此同时,医疗行业的格局比较分散,区域性的特点非常明显,使得这个行业“一家独大”的现象并不明显。
 
  最上层的是具有深度学习、自然语义分析等核心技术以及垂直场景探索的初创型企业,近年来涌现的医疗AI公司均围绕“数据处理服务”提供多样化的服务。
 
  例如,医疗AI领域的第一梯队成员——科亚医疗。
 
  目前,科亚医疗的技术和产品包括:冠脉血管疾病精准诊断产品线和智能影像解决方案,偏重于PAAS层的应用。
 
  在城市级医疗大数据体系的建设方面,科亚扮演的角色更多的是实现数据的增值——开发出好的人工智能医疗产品,提升医疗服务的质量和效率、让患者获益。
 
  2020年1月15日,国内第一张医疗AI三类证花落科亚。这在一定程度上,为沉寂已久的医疗AI行业实现了真正意义上的“破冰”。
 
  医疗大数据建设的六大痛点
 
  城市级医疗大数据建设,并不是一个新概念。从2014年开始,健康医疗大数据创业的公司大批涌现。各类企业以医院、医生、患者、医药、医险、医检等入口,纷纷布局智慧医疗与大数据。
 
  作为一家以心血管AI为主打产品的公司,科亚如何理解城市级医疗大数据体系在新形势下的建设内涵?
 
  科亚医疗负责人向雷锋网表示,城市级医疗大数据体系的建设就是:一个使医疗大数据从医疗真实世界的数据变成证据和工具,发挥其价值,推动临床试验和精准诊疗的发展过程。
 
  在医改和新基建的大背景下,实现城市级医疗大数据的有效应用成为医院管理、建设的重要工作之一,数据驱动医院精益运营升级将成为医院发展的重要战略方向,也成为价值医疗升级的基础保障。
 
  但随着医疗大数据体系建设的逐渐深入,也陆续暴露出一些问题和难点。
 
  首先,数据归属不明确
 
  目前,我国没有明确的法律规定数据归属问题,医疗数据使用权到底是患者个人、医疗机构、还是参与建设的企业?
 
  医疗行业内的共识是:数据是患者、医生、医院三方共同的资源,且不能直接用作盈利,一般来说数据可以找科研项目合作中使用,使用前必须经过患者同意、医生必须得到医院科研项目申请批复。
 
  因此,大多数AI医疗公司仍是通过与医院或主任合作科研项目,获取数据训练模型。
 
  其次,数据安全要求高
 
  医疗数据涉及个人数据隐私方面的问题,因此要特别注意个人数据隐私保护,中国《网络安全法》规定“网络运营者不得泄露、篡改、毁损其收集的个人信息;未经被收集者同意,不得向他人提供个人信息。但是经过处理无法识别特定个人且不能复原的除外”
 
  所以,AI医疗公司在使用数据时要进行数据的无法识别特定个人处理,这在一定程度上能够帮助AI医疗公司规避数据安全问题。
 
  第三,数据开放受限制
 
  中国的医疗数据开放程度有限,主要体现两个方面:一是境内与境外的流通限制,二是医院与医院或医院与公司之间流通的限制。
 
  境内与境外的限制其实很简单,这个各个国家都有相关规定,而且有的国家规定的更加严格,比如美国和欧洲。在医院与医院的流通限制方面,我国大部分的医院数据都是独立存在的,流通起来相对困难,更谈不上共享和数据交叉应用及数据变现。
 
  2017年以来,国家通过立法逐步规范和开放数据的使用,同时陆续建立各类数据应用平台,通过国家力量和产业资本的结合,加快医疗数据的互联互通和数据共享机制,为医疗大数据的应用带来红利。
 
  第四,数据标准不统一
 
  我国人口众多,医疗数据丰富,但”数据大“不等于 “大数据“,临床数据不够统一和规范,不同地区、不同医院之间的数据没有建立起联系,也没有统一的标准,因此价值也得不到体现。
 
  比如影像系统的数据标准问题,超过80%的医疗大数据为影像形式,但PACS系统的生产设备和数据标准是不一致的,数据交流存在诸多障碍。
 
  第五,数据伦理有争议
 
  尽管AI在医疗行业取得了令人瞩目的进展,但不可否认的是,AI的应用依然存在一系列的伦理问题,比如:AI造成了个人信息泄露,导致医疗事故,责任方是谁?AI的使用造成了医疗人员的失业,引发医疗产业结构的转型,社会应该如何应对?诸如此类的问题很多,都需要行业从业者去面对和解决。
 
  第六,数据成本代价高
 
  所有基于AI的医疗技术,都是以”数据“为基础的,目前AI医疗公司获得数据的渠道分为三种:第一种,与医院合作科研项目 第二种,从公开数据集下载数据,第三种,购买数据。
 
  总体来说,AI公司获取数据的成本主要在数据获取和数据标注上,而且随着模型训练的逐步深入,数据吞吐量可能会是几何级数增长,代价也会水涨船高。这对于AI公司的运营来看,将是一笔不小的负担。
 
  医疗新基建下,谁能把握主动权?
 
  随着行业发展,产品、用户体验及上下游产业协同的逐步完善,尤其在医疗新基建的建设浪潮推动下,服务于B端、G端的医疗大数据企业将迎来无限商机。
 
  如影像识别、基因测序,在经过临床验证、临床审批、付费目录后,将在医疗大数据体系的建设中,进一步反推底层数据基础的丰富和完善。
 
  在此过程中,谁能够率先突围,将能把握更多的主动权。
 
  目前,科亚医疗现有100多位研发人员,其中20多位海归博士,多人曾在医学影像全球知名企业北美研发中心担任核心研发职务,在AI技术、影像分析及医疗大数据方面经验丰富。强大的技术研发能力也是科亚在国内人工智能医疗成为头部企业的根本。
 
  据雷锋网了解,科亚医疗现拥有4大中心(影像分析中心,生物实验中心,临床检测中心,工程研发中心),2个专项实验室(人工智能实验室、免疫治疗实验室),能够整合包括影像、病历、病理、生化、免疫、分子诊断等多组学信息,并以此来保障未来医疗人工智能在多个临床场景上的服务应用。
 
  当然,随着一家公司在行业里的优势不断巩固,将盘子做大是一件非常正常的事情。
 
  对于“是否会往医疗大数据产业的上游延伸”这个问题,科亚医疗表示,暂未考虑往上游延伸。
 
  “科亚医疗的优势在机器学习、医学图像分析、自然语言处理、基因信息分析等方面拥有核心技术,因此会聚焦在医疗大数据产业的中游,希望开发出更多、更好的人工智能医疗产品,为患者、医疗机构、生命科学研究机构提供精准医疗服务。”
 
  800亿的市场,大有可为
 
  据前瞻产业研究院预计,到2020年我国健康医疗大数据行业规模将突破800亿元。
 
  从这次疫情之后,医疗大数据的研究与应用会被更多提上议事日程。电子病历、智慧医院、医疗AI、DRG等投入将进一步加大,医联体、基层医疗卫生服务体系等新模式建设也将成为建设重点。
 
  如何利用AI、大数据、物联网等技术,提升医疗机构诊治水平、优化城市公卫体系的精细化管理能力,将成为地方政府与科技企业共同面对的一场大考。
 
  找准自身定位,补足公共卫生治理体系方面现存的“短板”,医疗大数据产业的上下游企业将大有可为。
  2.操作价值视角
 
  业务数据作为一种记忆工具其使用目的并不都是要提取信息,数据更多的应用场合是直接改进管理操作,使其更精准更有效率,政府精细化管理的核心任务是提高操作效率,这是基层工作改进的主要内容。
 
  政府业务管理的数据是业务处理的记忆数据,是不可替代的,它没有交换价值只有使用价值,数据处理的速度是提高数据价值的关键,政府管理数据的价值取决于数据整体调用的精准与流畅,这是政府数据整合的主要目标。
 
  3.信息价值视角
 
  政府数据的另一个应用是提取信息改进决策。这种应用关注的是信息而非数据本身,数据不需要精准,数据源是可替代的,重要的是能够挖掘出有用的信息。数据分析产生的信息成果是供人脑使用,最后的决策还是由人脑完成。由于这种数据的可替代性,其价值必然受到市场竞争的冲击,网上数据泛滥使数据的价值不断下降,大数据应用提升了政府信息获取能力,并不意味着大数据分析无所不能,大数据涉及的范围太窄,只适合微观问题的决策而不适合政府的宏观决策。
 
  4.规模价值视角
 
  数据服务的价值与服务规模密切相关,公众的获得感要靠服务规模来支撑,扩大规模的关键措施是采取网络连机服务的模式,影响力最大的数据服务如手机支付、电子商务、地理导航等都是网络联机数据服务模式。网络联机服务是一个资源全面整合强有力的平台,能够将云计算人工智能等技术、数据与服务资源与网络用户群共同组织成为大规模的实时服务云,推动数据服务价值大幅度升级,这种大规模的网络服务云是智慧城市大数据应用的支柱。

(编辑:柳州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读