钛媒体APP|打破开放与隐私壁垒,7国30家机构创建最大医学AI协作系统


钛媒体APP|打破开放与隐私壁垒,7国30家机构创建最大医学AI协作系统
本文插图

图片来源@视觉中国
文丨学术头条
近年来 , 随着AI的发展 , 我们已经看到了人工智能在发现乳腺癌、肺癌和皮肤癌方面超过了医生 。 现在 , 研究人员又将注意力转向了脑瘤 。
由宾夕法尼亚大学医学院领导、29家国际医疗和研究机构参与的联合团队正在创建一个有史以来最大脑瘤数据集训练的人工智能模型 , 基于一种名为联邦学习(Federated Learning)的技术 , 可以在分散的服务器之间训练算法 。
这样以来 , 来自美国、加拿大、英国、德国、荷兰、瑞士和印度的医疗机构就可以在不共享病人数据的情况下协同工作 , 并创建一个比任何一家机构的数据集更大的数据集 。
联邦学习:分布式机器学习方法
我们都知道 , 做人工智能研究首先是要处理数据 , 而面对大量分散的数据 , 又该怎么办呢?
谷歌在2017年推出了联邦学习技术 , 这是一种分布式机器学习方法 , 可在深度学习项目上实现多机构协作 , 而无需共享患者数据 。
2018年 , 英特尔开始与宾夕法尼亚大学生物医学图像计算与分析中心(CBICA)合作 , 展示了联邦学习在现实医学成像中的首次概念验证应用 , 特别证明了联邦学习对肿瘤检测算法的功效 。
钛媒体APP|打破开放与隐私壁垒,7国30家机构创建最大医学AI协作系统
本文插图

联邦学习
英特尔表示 , 当测试基于单个医疗机构数据建立的人工智能模型时 , 发现其平均准确率为70% , 而使用联邦学习技术训练的人工智能模型的准确率为85.7% 。
英特尔实验室首席工程师Jason Martin是该项目的负责人之一 , 他说 , 训练算法的理想方法是将所有数据集中在一个地方 , 但这通常是不切实际的 。 “如果我是一家医院 , 我需要奇迹般地克服所有的监管压力和隐私问题 , 而联邦学习非常接近这一点 。 ”
联邦学习的优势在于 , 它使人工智能算法能够对驻留的数据进行训练 , 而不是将数据传输到中心位置 。 它的工作原理是让每个合作者在各自的数据上训练一个相同的AI模型 , 将一个伙伴的模型学习的内容与其他参与者的模型相结合 , 重复这个过程 , 直到更新的模型运行良好为止 。
这种联邦学习方法对卫生保健组织极有吸引力 , 因为疾病检测算法需要大量数据才能得出准确的结论 , 但对共享医疗数据的限制一直是开发此类系统的一大挑战 。
助力对抗脑癌
生长于颅内的肿瘤通称为脑瘤 , 包括由脑实质发生的原发性脑瘤和由身体其他部位转移至颅内的继发性脑瘤 。 近年来 , 颅内肿瘤发病率呈上升趋势 , 据统计 , 颅内肿瘤约占全身肿瘤的5% , 占儿童肿瘤的70% , 而其它恶性肿瘤最终会有20-30%转入颅内 。
据美国脑瘤协会 (American Brain Tumor Association) 估计 , 2020年美国将有超过8.7万人被诊断出患有源自大脑的肿瘤 , 其中超过3500名患者是儿童 。
为了训练并建立模型以有助于早期发现脑瘤 , 研究人员需要访问大量有关医学的数据 。 但是 , 最重要的是 , 数据必须保持私有和受保护 。 这也正是采宾夕法尼亚大学合作使用保护隐私的AI识别脑瘤的原因 。
通过使用联邦学习这种方法 , 所有合作伙伴组织的研究人员将能够共同构建和训练检测大脑的算法肿瘤 , 同时保护敏感的医学数据 。
【钛媒体APP|打破开放与隐私壁垒,7国30家机构创建最大医学AI协作系统】
钛媒体APP|打破开放与隐私壁垒,7国30家机构创建最大医学AI协作系统
本文插图

以训练机器学习算法来识别医学图像中脑肿瘤的边界
宾夕法尼亚大学医学院放射学和病理学讲师Spyridon Bakas表示 , 过去6年 , 他帮助汇编了可用于AI训练的最大脑瘤图像数据集之一 , 该数据集包含了大约600名患者的图像 , 但新的联邦学习项目将大大扩展这一数字 。


推荐阅读