宗仁杰
江苏力磁医疗设备有限公司
摘要:健康医疗大数据是我国一项重要的基础战略资源,数据的爆炸式增长促进了健康医疗大数据分析和知识发现的研究。为合理有效地进行数据分析及应用,现急需建立一套完整的健康医疗大数据分析方法理论体系框架,如何将数据分析方法应用到实践中已经成为健康医疗大数据分析研究中十分重要的问题。基于此,以下对健康医疗大数据的应用及其挑战进行了探讨,以供参考。
关键词:健康医疗;大数据应用;挑战
引言
作为国家卫生发展的基本战略资源,卫生数据对于提高国家总体卫生水平十分重要。随着卫生大数据的持续使用和发展,传统卫生数据的应用已逐渐超越极限,导致卫生保健模式发生重大变化,有助于深化卫生系统改革,提高积极性、活力、效率和质量因此,卫生保健人员应加强对大量医疗数据的关注和理解,阐明其发展前景,促进工业现代化。
1健康医疗大数据的概念
大数据概念的提出,可以追溯到20世纪80年代。传统意义上的“数据”,是指“有根据的数字”,但在进入信息时代之后,“数字”二字的内涵在不断扩大,不仅指代“数字”,还统称一切保存在计算机中的信息,包括文本、声音、视频等。具体多大的数据才能称为“大”,尚无明确定义。一般认为,大数据的数量级应该是在“太字节”(240)的,常规的软件工具难以捕捉、存储、管理和分析。因此,目前有关健康医疗大数据的定义不一。根据2018年9月国家卫健委发布的《国家健康医疗大数据标准、安全和服务管理办法(试行)》中对“健康医疗大数据”的定义,认为健康医疗大数据是指“在人们疾病防治、健康管理等过程中产生的与健康医疗相关的数据”。主要包括各级行政机关以及具有公共管理和服务职能的事业单位,在依法履行职责过程中获得的公共健康医疗数据资源,以及社会组织、企业等其他组织和社会公众通过信息技术手段产生的健康医疗数据资源,是覆盖全员人口和全生命周期、涉及国家公共卫生、医疗服务、医疗保障、药品供应、计划生育和综合管理业务等领域的极大量数据。有学者基于国内万方数据库的研究发现,中国有关健康医疗大数据的研究最早始于2013年,并之后呈现出逐年迅速增长的研究态势。
2健康医疗大数据应用范围
卫生保健大数据是一种基于信息和通信技术的数据形式,可为与卫生有关的工业和研究提供数据支持,并可广泛应用于许多领域。特别是,它主要适用于卫生决策。国家卫生和计划生育委员会可以利用医疗数据与有关个人和部门分析、整合和分享相关信息,并将其用于卫生决策。第二,病人保健服务。在出生时,一般人口建立了个人健康信息档案,这是一般保健数据的一个组成部分,使保健人员能够通过分析信息和制定有效的保健服务方案来了解人口的健康状况。第三,医疗服务。使用医疗大数据可以为有关疾病的研究提供大量支持,加快研究进展,帮助人们更好地了解疾病,并迅速分析治疗方案。第四,药品安全。收集关于病人使用药物期间药物的身体状况、效力和副作用的信息有助于全面评估药物的有效性,是不断改进药物方案和加强药物安全的重要指南。五是技术创新对卫生部门新项目的科学研究需要大量医疗信息的支持,使用大量医疗数据可以为医学科学的发展和加快科学创新提供良好的基础。
3健康医疗大数据的应用
3.1疾病分析
得益于生物技术和设备便携化的迅速发展,可供分析的数据量迅速增加。在大量数据涌入观察和分析过程时,通过数据挖掘等大数据手段,可以从海量且看似毫无规律的数据中提取隐含在其中有价值的信息和知识。Shen等[15]通过将帕金森病患者测序、生理、生化等相关数据内容收入研究者创建的“神经退行性疾病变异数据库”,利用“翻译生物信息学”等手段,在众多基因位点中发现变异点。这类研究提供了在未来筛查中发现更多危险因素的可能。
另外,基于测序技术、可穿戴设备以及云计算在内的科技产品,通过监测个体健康数据,研究者以及个体本人可以获取可供随时分析的数据集合。这些研究利用大数据技术为疾病分析提供了新的方法,同时为普通个体了解自身情况提供了新的机会。
3.2研究风险受益比
研究可能遭受的风险程度与研究预期的受益相比的合理性是评估研究能否开展的必要条件。涉及健康医疗大数据的研究,其风险是对个人或社会或国家可能的伤害,应对该风险的严重性、程度和发生概率,有无采取使风险最小化的方法进行评估,而受益则包括对个体的受益和对社会的受益。在具体实践中,其评判内容可以从使用数据的涉密性和敏感性,数据来源的合理合法性,以及研究目的性质是基于商业利益、公共利益还是国家利益进行审慎评估。隐私泄露是涉及健康医疗大数据研究的主要风险之一,有些风险可能难以预测。研究人员应对数据的收集和使用遵循最小必要原则,除非研究需要,尽可能少用可识别信息和敏感数据,避免数据采集与数据主体授权不一致、过度采集数据等问题。
3.3慢性病管理干预
全世界卫生系统受到慢性病流行的挑战,推动了医学范式的变革。在挑战与变革中,欧盟委员会从群体角度创建了“欧洲健康和积极老龄化创新伙伴关系”(the European Innovation Partner-ship for Active and Healthy Aging,EIP-AHA)[24],其目的就是通过大规模部署以信息和通信技术为支持的健康医疗大数据服务,奠定以个性化的医疗方式为慢性病患者提供综合护理服务的基础。而针对个体管理方面,诸如Gachet等已经开始着手可携带设备对慢性病患者个体管理的可行性分析。这都为慢性病的管理和干预,提供了一种更高效方便的方法。
3.4支持向量机(SVM)在高血压中医辩证中的应用
健康医疗大数据之间存在错综复杂的非线性关系,支持向量机(SVM)模型具有较强的泛化能力,适用于小样本分类及高维输入单输出的非线性回归问题。使用SVM算法进行高血压病辨证分析,根据符合高血压病诊断的419例患者资料读取数据集,以高血压病中常见的21个症状、舌苔及舌体、脉象的量化数据为输入进行特征设计,将高血压病证型作为输出,并进行归一化处理,把属性缩放到[0,1]之间。基于MATLAB环境,选取Libsvm支持向量机集成工具包,使用Python直接导入SVM模块并选择RBF核函数,使用419例样本训练,130例样本测试。构造5个2类分类器,训练得到最优参数C=2和γ=1,建立基于SVM的肾气亏虚、痰瘀互结、肝火亢盛、阴虚阳亢和其他5种证型的高血压病患者中医证候诊断模型,并用测试集和交叉验证集比较所建模型的诊断识别率。根据SVM模型测试与临床诊断结果比较结果显示,5种证型准确率均高于66%,除其他外的4种主要证型准确率均高于85%,总体准确率达到90%[2]。说明基于SVM建模对高血压病进行中医证候诊断分析具有很高可行性,可以提高诊断准确性和及时性,在高血压病中医辅助辩证过程中具有良好的应用前景。
结束语
随着医疗和数据相关技术的不断发展,健康医疗大数据的来源、规模和应用将进一步提升。药学、临床医学、公共卫生等众多医疗领域已从中获益。虽然现代技术为使用健康医疗大数据提供了前所未有的机会,但由于医疗数据的复杂性、相关临床诊疗决策的高风险性,其研究与应用领域仍存在许多问题,有待多学科的通力合作和相关关键技术的突破。
参考文献
[1]袁杨,关健.健康医疗大数据面临的伦理挑战与应对思考[J].中华医学科研管理杂志,2019,32(06):405-408.
[2]律琼馨,刘智勇.健康医疗大数据研究热点与前沿的可视化分析[J].中国卫生信息管理杂志,2019,16(06):655-660+702.
[3]傅昊阳,徐飞龙,范美玉.论医院健康医疗大数据治理及体系构建[J].中国中医药图书情报杂志,2019,43(03):1-5.
[4]韩亦舜.健康医疗大数据应用研究[J].中国国情国力,2019(02):60-61.
[5]刘春富,陈红敏.论健康医疗大数据保护的相对安全观[J].浙江大学学报(医学版),2018,47(06):563-576.