尽管临床科研与应用开发已经进入智慧化时代,但国内海量的医学影像数据并未形成可归纳、可应用的大数据。标准化的医学影像数据集仍是一种稀缺资源,影响着相关科研与产业的快速发展。
而今,这一局面即将迎来改变。
2022年7月5日,国家卫生健康委能力建设和继续教育中心(以下简称“继续教育中心”)发布《关于放射影像数据库建设项目课题立项评审结果公示的通知》,正式拉开影像数据库体系化建设的序幕。
放射影像数据库建设项目以国家卫生健康委能力建设和继续教育中心为主办单位,全面主导和统筹数据库的体系化建设,计划开展数据采集、数据处理、质量控制、科学研究、产品研发、技术转化、医学数据标准培训等关键数据库建设工作。
文件内容显示,第一批放射影像数据库建设项总计13项,包括心脑血管影像数据库、慢性肝病及原发性肝癌影像数据库、缺血性心脏病核医学多模态影像数据库、胃肠道疾病影像数据库、急诊影像数据库、慢性阻塞性肺疾病数据库等严重影响我国居民生命健康的重大疾病数据库,还有8项建设意向被列入储备库,有望在后续批次纳入建设之中。
本次影像数据库体系化建设对于病种的划分颗粒度更细腻,从数据库建设立项,到后续影像数据收集、标准、质控等环节中所涉及的各类标准也进行了明确的计划和要求。
同时,在此次数据库建设中,项目组非常注重工科团队的融合作用。国家卫生健康委能力建设和继续教育中心委托上海九州智慧医学影像研究院协助组建了医工交叉团队,从基础到整个路径进行了筹备,包括多源异构数据纳入,多中心安全收集的技术保障,分布式架构的数据收集系统、通用和定制化标注平台的开发、专病数据库的技术路线,以及涉及到的安全等保、电子病历数据标准、openEHR标准体系等,让技术为数据库铺路。此外,国内原创AI算法也会适时融合到建设过程中,服务于数据整理、图像提取、病灶重建、科研方向快速验证等场景。因此,整个进程会加速数据库技术和AI技术在放射影像领域的应用与突破。
为了解数据库建设背景、建设难点、未来价值,动脉网对相关文件进行了详细研究,并采访到了“放射影像数据库”专家委员会主任委员刘士远教授,尝试对以上三个问题进行解答。
时间回到两年前。人工智能产品在医学影像中的应用开始破局,个别产品获得国家药监局给予的三类医疗器械注册证。但从整体上看,数字化、结构化的医疗影像大数据未能形成体系;医学影像数据库依然是制约AI发展的重要因素之一;单任务AI产品的获批面对广泛的临床需求也显得不足。
为打破医学影像数据集缺失这一重要瓶颈问题导致的僵局,国家卫生健康委能力建设和继续教育中心于2020年启动了放射影像数据库建设工作,并聘请刘士远教授担任该项目的专家委员会主任委员,牵头打造国家级高标准医学影像数据库。
“不管从科研、临床教育还是人工智能的发展,我们都需要大样本的多样性、标准化、高标注的数据库,但这样的数据库我们现在非常缺乏。数据的所有权、安全性、伦理等等配套法律、法规的制定和完善也相对滞后。”刘士远教授表示。
在这一背景之下,刘士远团队将第一个项目落足于相对成熟的肺结节,意在通过构建标准化的肺结节医学影像数据库,推动肺部结节筛查及进行良、恶性质的精准鉴别诊断。同时希望通过肺结节数据库的建设,探索形成数据集的基本要素、构建过程、建设标准、标注和质控等环节的专家共识,为后续其他数据库建设提供参考。
截至2021年10月,团队利用基于医疗大数据和AI技术开发的数据平台,完成数据抽取、处理和转化,最终形成了一个高质量的肺结节影像专病数据库。目前该数据的价值及其建造流程已经获得医学界认可。
最初的“打样”取得良好成果后,影像数据库的体系化建设由此展开。
据重大疾病医学影像数据库建设项目实施方案所述,项目建设期为5年,分三个阶段开展。第一阶段为签约日起-2022年12月底,是标准建立期;第二阶段为2023-2025年,是数据平台建设期;第三阶段为2025-2027年,是开发应用期。
具体而言,第一阶段将建立基于部位或器官疾病的医学影像单病种或多病种图像采集规范与识别标准,图像分割与标注标准,相关数据库建设标准共识;建立数据建设技术队伍,搭建数据库技术和管理平台。
完成标准制定之后,更为重要的是第二阶段建设。该阶段的任务可分为建立符合中国人群特点和临床诊疗规范的多模态、大容量、高质量、丰富度好的医学影像数据库;建立多病种人工智能医学影像数据安全科研服务平台;培训体系建设;技术研发推广及应用四个方面。
实施方案并未给出第三阶段的详细建设任务及建设内容,但若能在给定的时间内完成一、二阶段的任务,医学影像研究及其衍生应用也将得到足够有力的支持,有能力跨入下一个发展阶段。
总的来说,项目计划未来三年,将建立基于部位或器官疾病的医学影像单病种或多病种图像采集规范与识别标准,图像分割与标注标准,相关数据库建设标准共识;建立符合中国人群特点和临床诊疗规范的多模态、大容量、高质量、丰富度好的医学影像数据库,用高质量的国家医学影像数据资源,助力健康中国建设。
放射影像数据库价值所在,正是因为它能解决我国影像数据现阶段面临的难点。
“中国是医学数据大国,医疗影像占据了医学数据80%~90%的比例,且仍以30%的增速持续增长。”刘士远教授告诉动脉网,“不过,医疗数据量的大不代表我国已拥有了成体系的医疗大数据。在这之中,有超过80%的数据为非结构化数据,没有办法进行价值挖掘。”
建设放射影像数据库是一种重要解决方式。通过建立规模化、标准化、结构化的放射影像数据库,不仅可以树立标准,打破医院与医院之间的壁垒,还能将成熟的数据库应用于医学教育、科研;推动相关人才培养,促进精准诊疗的革新。
然而,厘清放射影像数据库的价值简单,实际建起来却非常困难。
“建标准化数据库的呼吁较多,成果有限,说明这是一件非常复杂、非常困难的事。”
数据多样化是第一个难点。据刘士远教授介绍,要建立标准化的影像数据库,会遇到数据来源的多样性以及非同质化的问题,如何将这些“不同”纳入统一的规范或者标准,是难题之一。此外,多模态的数据,比如CT、钼靶、核磁等影像,临床病史、实验室检查等重要文档,如何整合成为便于归类、提取、协同使用的数据系统,也是数据收集需要考虑的重要问题。
其次是规范化的数据标注。“对于影像中的不同征象,我们必须在定量识别的方法、分割的方法、分类的方法上形成共识,在共识基础上进行培训,然后进行标注。标注环节则需要满足数据溯源的条件,且要能通过三级质量控制,通过仲裁审核才能入库。保证标准过程的准确性。”
最后是数据库的管理与更新。“数据库必须维持动态,不断增加数据数量,不断更新它的数据组成,并在整个过程保证数据的安全,同样需要我们持续投入精力。”中心化和去中心化的设计、相关伦理推进也是数据库建设的重要探索方向。
由于构建过程的复杂性,进行有效的顶层设计显得尤为重要。建库之初,相关负责人必须明确建库的目的(服务于怎样的病种)、建库的用途(用于研发、教育还是科研)、如何质控(怎样进行数据质控与过程质控),确定数据标准、标注方式等,逐步对整个团队的分工和协同做出规划。完成了这些之后,相关负责人才能开始执行。
除了建库本身的高技术门槛,整个流程需要相关人员在长周期内提供大量的人力、财力、精力支持,大部分项目无法捱过回报小且慢的建库初期。因此,国家对于放射影像数据库建设的支持与引导必不可少,企业、医生、学者也需同心协力共同参与。
刘士远教授认为:“只有通过政、企、研三方的通力合作,避免散、乱、差和重复建设,才能最快、最有效地将放射影像数据库建设起来,”
医学影像的相关从业者数量众多,要回答谁将因数据库的建成而受益,需要从教育、科研、研发三个角度独立分析。
首先是教育。随着医学人工智能在影像科之中的普遍落地,新放射科医生的培育方式也需要根据科技发展进行调整。此外,由于新技术带来的工作流程等因素变化,现有放射科医生的继续教育上也需跟上。但到目前为止,囿于没有标准数据库进行支撑,放射科医生基于标准化数据和人工智能的培训很难展开,医生的实践也很难自主进行。
在这一情况下,标准化放射影像数据库的建设是对现有影像教学体系的重要补充。数据库建成之后,中青年放射科医生在学习时既可用数据库构建模型,又可用其进行验证;还可以进行基于病例数据的临床诊治经验学习。此外,以临床需求驱动型应用为研究切入点,可以探索以患者为中心,以疾病为导向结合影像、病理、生化甚至基因等方面的多中心大数据精准医疗研究。
其次是科研与AI研发。数据是AI的基础,目前的人工智能辅助诊断、辅助检测大多采用监督学习,产品的研发、测试、质控均需要依托大量的标准检查病例,经监管机构、医院、企业、教育科研机构等认可共建的影像数据集,可以对人工智能产品研发上下游需求形成支撑,以促进更多AI新研产品的临床落地和使用。
因此,由卫健委牵头,多医院协作合作开发的放射影像数据库就显得尤为重要。有与现实世界中的实际情况高度贴合的数据库作为支持,无论是企业针对AI的研发审批,还是医生开展影像相关的课题,都能更频繁地开展多中心研究,或能加速医学影像的科研水平,有效扩大医疗AI的开发和应用范畴,推动医学影像研究进入快速发展时期。
建设医学影像数据库一事固然重要,但还需思考如何让数据库真正跑起来。
刘士远教授认为:“要让大家用上数据库,而不是把它放在那里,我们要有第三方公共的平台,充分考虑到合规性、安全性、伦理性,在国家法规要求下,进行权威、公正、中立、标准化的运作。同时,也要持续思考在监管机构认证下合规和安全的运营模式,真正让数据库产生学术价值、科研价值、社会价值,让人民的数据为人民的健康服务。”
影像数据库的未来价值值得期待,当国内放射影像数据库走入专病时代,也就意味着数字科技,比如医学影像人工智能,跃入更深入的探索之中。我们或能通过数据找到更多征象与疾病的逻辑,将放射科的“智能化”、“精准化”、“临床化”、“院前化”、“网络化”等诸多价值真正释放出来。
下一篇:广东省智慧托育信息系统上线