科研数据中心
从HIS、LIS、电子病历、PACS、超声、病理等院内系统,通过数据同步汇聚全院科研所需的医疗大数据,构建具有自主知识产权的的科研数据中心。在此基础上进行数据标准化和数据治理,完成核心数据的清洗、整合、转化、治理、归一等流程,建立面向临床科研、灵活使用的科研数据库,有效解决数据孤岛问题并延展研究范围和深度,为疾病预测奠定基础。科研数据中心,由科研数据中心库、科研检索数据库、管理平台数据库组成。科研数据中心库,主要从集成平台、HIS、LIS、电子病历、超声、病理等院内系统,通过数据同步技术,获取全院的科研所需的医疗核心数据,汇聚到全院统一的科研数据中心库。科研检索数据库,主要在大数据中心库的基础上进行数据标准化和数据治理,完成核心数据的清洗、归一、结构化和建模等流程,形成便于科研可便捷,灵活使用的科研检索数据库。(1)数据汇聚:通过数据汇聚管理功能,串联各信息系统孤岛,将集成平台、HIS、LIS、电子病历等各个系统医疗数据汇聚到一起。利用数据汇聚配置,将需要汇聚的表、字典等数据,定时从临床数据中心或第三方系统中采集汇聚到数据中心,通过数据抽取、数据转换、数据加载,生成高质量的科研数据库。(2)数据标准:数据目录记录汇入科研检索数据库的所有数据的编目信息,使用可视化方式帮助科研人员更加直观简单地理解数据。它以物理表为单位,按照数据来源、所属用户等维度来展示数据表和字段的元信息,包括数据源、汇入时间、所属用户、表中英文名称以及字段的中英文名称、数据类型、长度、是否主键等内容。(3)数据模型,数据元模型定义了各种元数据的结构以及元数据之间的关系,每个元数据都有对应的元模型。因此可以通过新建或者修改元模型来适应业务需求的不断变更。针对全院的医疗核心数据,制定数据检索模型,模型由数据元自由组合。组成的模型可以应用在科研检索,和科研数据导出。通过模型实现可视化操作页面,使用方便快捷。模型中的数据元名称支持自定义修改,设置是否显示,排序号。(4)数据采集:平台的数据存储基于分布式存储,支持水平扩容,支持多种存储数据类型,提供结构化、半结构化、非结构化数据的存储解决方案。充分利用其水平伸缩性,能使数据变得更有价值。数据汇聚后存储,并通过定义标准数据模型,配置数据存储实体,最终采集并生成科研数据库,并能够实现科研数据的高性能查询检索和统计分析。
大数据搜索系统
科研大数据平台汇聚来自集成平台、HIS、LIS、电子病历、超声、病理、心电图等不同院内系统的不同存储类型的数据,平台的数据量将迅速增长,大数据检索提供了对于现有海量数据资源的综合检索能力,提供多维度、多病种符合专病模型的检索功能,为医疗数据的科研使用提供一个稳定可靠的查询能力。针对原始病历不同数据格式,检索引擎提供支持全文检索和组合条件检索两种方式。主要功能应包括:(1)普通检索:其查询条件主要是内置常用检索数据内容,如患者姓名,接诊医生,就诊号。(2)高级检索:包含病人维护和病历两种维度检索模式,可以自由组合设置查询条件、逻辑条件以及查询的条件值。查询条件包含了检索数据库的数据集信息,根据业务模型,动态展示所属模型的数据元。(3)条件树检索:在高级检索的基础上,以图形化界面展示,更加直观展示数据内容。(4)智能全文检索:电子病历作为临床信息的载体,在病历文本中存在于大量非结构的信息不能直接作为检索条件,导致大量病历数据都不能为临床、科研充分利用。平台通过建立全文检索引擎技术,建立支持全文本检索查询的数据搜索系统,根据用户输入文本关键词,利用分词技术自动分词,然后进行数据检索,查询结果包含患者就诊记录基本情况,如就诊类型,就诊日期,姓名,性别,同时汇总门诊和住院就诊次数。同时,为方便医护人员查看检索患者诊疗信息,检索结果支持链接到患者全息视图,展示患者所有就诊记录数据。
重点学科专病库
重点学科专病库:将专科各病种领域数据元进行有机组合,建立专病数据模型,为数据的汇聚、采集、检索、统计分析和科研利用提供基础框架模型。基于这个基础模型的建立,将专病模型中对应的用药、治疗、检验、检查等各类数据进行分类管理,解决数据杂乱不一、寻找困难等问题。支持模型的个性化定制、批量维护、导入导出,支持模型数据元的统一捆绑和引用,解决各领域同一数据元的冗余维护问题。(1)专病库可视化展示:包括展示研究对象分布,汇总展示专病库的关键指标数据,如:患者总数、就诊总人次、科研项目总数、数据模型指标数量等;统计分析,汇总展示专科病种数据库整体数据情况,如包含诊断分析,研究对象分布,统计分析,数据采集分析汇总,统计分析包含门诊诊断TOP5分布等。分别以柱状图、饼图、曲线图等不同的方式展示该病种总门急诊人次、出院人次、科室门急诊量排行以及相关的挂号类型和对应趋势内容,并实现关键指标从全院到科室再到医生的层级下钻分析。(2)研究对象筛选:根据科研小组的指标库入组条件以及设置观察指标内容,通过后台数据采集服务,从检索数据库中抽取所需数据,动态设置样本量,将数据存储于科研数据集市中,用以对专病进行各类科研队列分析。取代传统人工检索查找研究对象,提高专科科研数据收集的效率,方便临床医生。(3)科研数据治理:对科研项目组中的数据,根据实际需要,进行数据纠错维护。日常诊疗数据由于书写不规范,或者数据标准规范不统一等原因,导致数据差异化。这时候就需要人工进行干预修改。(4)科研数据导出:平台可以在科研项目管理进行角色权限设置,授权数据导出功能。导出EXCEL的同时,记录申请和导出记录,保存用户操作的历史记录,保证数据使用安全。同时为了加强平台数据安全使用,所有导出数据内容项目,平台统一根据脱敏规则,绑定数据标准元,使得导出数据内容均为脱敏后的数据,保证科研项目和科研病例数据的安全与隐私管理。(5)科研成果管理:科研成果主要是对医院的科研项目的成果进行统一的管理,主要是科研奖项、出版专著、个人专利等相关信息进行统一管理。系统提供导入、导出、数据查询、分析,生成相关的图形报表信息。科研成果支持申报流程,通过申报的成果进入成果管理,若无申报需求,也可跳过申报阶段,直接进行成果管理。(6)建立专科病种全息视图:展现该专科病例从首诊、复诊、第N次复诊在医院整个治疗过程中产生的诊疗数据集合。以时间轴和诊疗信息类型的展现维度,全面、准确地展现病例数据。全息视图是比病人集成视图更精细化的数据可视化应用,深入展现诊疗信息中有价值的部分,是针对某个专科专病的治疗过程全面的诊疗数据展现。
科研项目管理系统
科研管理采用项目生命周期的管理办法,有效地跟踪和管理科研课题的申请、立项、执行、结题等阶段,在课题的不同进展阶段,将围绕课题的文档、经费、进度、成员、质量等几大要素统一进行管理,实现高效管理科研业务的信息化系统,助力科研工作。包括课题管理、经费管理、论文管理、任职管理、学术会议、诚信管理等功能模块。(1)无纸化:每位用户可通过登录系统的医务人员,都可以通过课题申请、论文提交、科研成果和科研奖励等电子文档的申报。(2)网络化:科研处管理人员在线审核课题、论文、学术著作、科研成果等,检查课题进展、课题经费使用情况;自定义出所需要的各种报表。(3)标准化:统一流程固化考核与奖惩制度,加大透明度,提供科研创新积极性。
科研随访管理系统
(1)为医护人员提供随访患者服务平台,主要包括对患者基本信息的维护管理,支持患者档案的查询、增加、删除、修改、作废处理。同时也支持随访任务的开展。(2)医护人员对需要进行随访的患者,制定随访方案,随访任务执行频率,随访方式,随访表单,随访项目等信息。在日常的随访工作中,系统根据随访计划,每天自动提醒患者随访。(3)针对随访患者进行随访计划设定,设置定期随访计划并可以自动进行设置,如每周随访一次或是每月随访一次等,或指定日期。同时还提供绑定具体的随访医护人员以及随访所需要的随访表单。(4)平台支持对待随访患者的任务提醒,如当天待随访患者列表,1天内待随访患者,3天内待随访患者,7天内待随访患者及过期未随访患者列表。
多中心科研系统
多中心协作应用目的在于建立跨平台、跨机构间数据标准化、统一化管理,实现多中心的数据共享与交换,以实现医院各业务系统信息互联共享,完成相关的业务流程连通,快速累积病例,提高临床和科研水平。(1)患者在各医院机构多中心间的就诊数据存储在HIS、LIS、电子病历、超声、病理、心电图等院内系统,供数据抽取、数据转换、数据加载功能,最后将这些各系统分布的、异构的数据源加载到科研数据中心库。然后对于中心库的数据进行标准化,通过数据中心管理,可将数据中心的临床业务标准库、指标库、数据集市库进行集中可视化的管理。(2)主数据是描述核心业务实体信息及互相关系的数据,主数据管理通过建设医院消息处理机制实现HIS与LIS、PACS等业务系统间的字典同步,实现医疗机构各系统私有数据与标准数据的格式转换和内容转换的定义,集中管理各科室系统使用的医学术语、基础字典,用于跨业务、跨系统、跨医院之间数据共享。(3)由于数据分布在各医疗机构,众多医院出于安全考虑,不愿意开放各自数据到中心端进行分析利用。平台数据安全服务基于数据中心构建,为平台数据开放共享提供安全的流通渠道,从应用可靠性、可扩展性及安全保密机制等几个部分对数据服务进行封装,平台遵循标准的授权管理机制,包括为服务提供统一的IP映射,实现对访问地址的统一封装,对院外隐藏服务的真实路径,在提高院内安全性的同时,简化了服务的调用。(4)平台MDT管理支持医生对临床患者的跨科室、跨机构、跨区域的实时联合会诊活动,实时进行高清视音频沟通。(5)建立预防活动管理、健康知识管理和宣教管理等功能,建立一套完整的远程患教管理体系,为患者提供专业的患教服务。
【来源】查君林,汪卓赟. 医院科研大数据平台建设探索[J]. 齐齐哈尔医学院学报,2022,43(17):1659-1663. DOI:10.3969/j.issn.1002-1256.2022.17.014.
编辑:生物样本库