癌症是一种具有多种遗传和表观遗传变异的复杂疾病。早期筛查和个性化治疗是降低癌症死亡率的重要工具。筛查试验的目的是在没有症状的情况下检测癌症或癌前病变,此时治疗最有效。确诊后,患者可以接受更准确、更有效的个性化基因治疗,也可以监测肿瘤的变化,并相应地调整治疗计划。然而,所有这些过程都依赖于分析大量数据,这些过程是劳动密集型和主观的。人工智能(AI)可以帮助缓解这一问题,几项研究表明,与经验丰富的放射科医生和病理学家相比,人工智能的表现更为出色。 尽管前景看好,但这些应用的发展仍处于早期阶段,人们对人工智能癌症模型的准确性和安全性存有疑问。截至2021年5月,只有71种AI癌症设备获得了FDA的批准。接下来的问题是这些应用程序是如何开发的,以及在不久的将来可以对它们有什么期望。 近日,杂志Nature Biotechnology上发表了一篇题为“The global patent landscape of artificial intelligence applications for cancer”的文章。本研究旨在分析人工智能和癌症相关专利的全球格局。从而提供有价值的信息,以支持明智的战略决策,例如确定潜在的伙伴、竞争对手和未来研究和发展的领域。专利景观展示了一项技术的发展现状,提供了对未来趋势的洞察。 图片来源:Nature Biotechnology 主要内容 专利记录的演变(1997-2022) 在分析的749个AI癌症专利记录中,前两项专利申请可以追溯到1997年(下图a)。从1997年到2014年,每年的最高记录数是2010年的3个。2015年开始持续增长,到2021年每年将超过200个记录。整个时期(1997-2022)的复合年均增长率(CAGR)为26%,而2015年至2022年CAGR为53%。超过95%的专利是在2015年至2022年间申请的。未来五年的曲线拟合预测表明,到2027年,新专利的数量可能达到每年390项。 专利记录的演变。图片来源:Nature Biotechnology 专利的地理覆盖范围 超过一半的专利首先在中国申请(53%),其次是印度(19%)和美国(14%)。中国的专利记录比所有其他局的记录总和还要多(图a)。然而,在2015年,美国获得的新注册数量最多,为8个(图b)。直到2017年,中国才超过了美国,并在2021年达到美国纪录数量的近6倍。尽管去年(2022年)的专利总数不完整,但印度在新专利记录数量上已超过了中国。 专利的地理覆盖范围。图片来源:Nature Biotechnology 专利受让人 专利受让人分为学术、企业、个人、医院和政府。学术(321人)和企业(280人)的受让人领先。2015年至2020年期间,企业受让人每年的新专利申请数量都居首位(图b)。2021年,新的学术专利数量比企业专利数量高出约24%。2022年,领先的位置变成了个人(80人),且几乎所有个人受让人都来自印度(77项)。 合作最多的两种受让人类型是企业和学术机构,共共享35项专利记录。紧随其后的是学术和医院,共有18项专利记录。在12个最大的受让人(不包括个人)(图d)中,7个是学术机构,4个是企业,1个是医院。前三名是中国复旦大学、山东大学和浙江大学。四家受让人企业拥有相同数量的专利记录(6项),分别来自美国(IBM、Paige AI、Varian Medical Systems)和中国(Ping An Technology)。 专利受让人概述。图片来源:Nature Biotechnology 国际专利分类 (IPC-4)(1997-2022) 所分析的749项专利记录被分配到67个国际专利分类(IPC-4)代码。在专利描述中最常用的IPC-4代码记录为G06N(388)、G06T(352)、G16H(338)和GO6K(278)(图a)。所有这些代码都来自G部分(物理)。 代码G06N不仅占有最高的份额(52%),而且也是最中心的节点,是中心度和加权中心度最高的节点。G06N是“基于特定计算模型的计算安排”。其他中心节点包括编码G06T、G06K、G16H、A61B,描述涉及一般图像数据处理或生成(G06T)、图形数据读取(G06K)、医疗信息学(G16H)和诊断(A61B)等主题。 国际专利分类信息。图片来源:Nature Biotechnology 癌症部位的专利分类 大多数记录(269)并不是针对特定的癌症部位,只是笼统地引用了疾病。最常被提及的癌症类型是乳腺癌(112例)、肺癌(98例)、脑癌(47例)和肝癌(43例)。从2017年到2021年,肝癌的复合年均增长率最高,为80%,其次是乳腺癌,为75%。 公司受让人在非特异性专利占47%,且在前列腺癌(52%)、子宫颈癌(45%)、结直肠癌(42%)和膀胱癌(35%)中领先。个人受让人在皮肤癌记录最多(48%)。在乳腺癌(35%)、脑癌(44%)、肝癌(45%)、直肠癌(45%)、胃癌(55%)和胰腺癌(46%)方面,学术受让人占主导地位。 在非特异性和特异性专利描述中最常见的IPC-4代码是G06N、G06T、G16H和G06K,涵盖了从计算模型到医疗保健信息学的各个领域。在癌症位点网络中,合并发病率最高的是结直肠癌和直肠癌(24例)、乳腺癌和肺癌(11例)以及乳腺癌和前列腺癌(11例)。中心节点是肺、乳腺、直肠和胰腺癌症。 隐含狄利克雷分布(LDA)分析 五个LDA主题。主题1标记为“生物标志物筛选”,涉及使用人工智能模型使用生物标志物进行癌症筛查。主题2标注为“癌症早期检测”,涉及用于癌症早期检测的基于人工智能的设备和模块的开发。主题3标记为“人工智能图像分析”。主题4是“基因表达模型”,主题5,标记为“机器学习图像训练”。 将五个LDA主题分为新兴、主导、饱和和衰退四种技术趋势(图a)。主题1(生物标志物筛选),2(早期癌症检测)和4(基因表达建模)因专利份额低于平均水平和正复合年增长率而被归类为新兴主题。主题3(人工智能图像分析)因其高于平均水平的专利份额和正的复合年增长率而被认为占据主导地位。最后,主题5处于下降和饱和之间的边界,其专利份额正好处于平均水平,且为负复合年均增长率。 图b显示了2015年至2021年间每个主题专利记录数量的演变情况。直到2017年,每个主题的记录数量相似,但从2018年开始,主题3开始起步并在2021年达到其他四个主题的两倍多。主题5(机器学习图像训练)在2015年领先,但逐渐落后。主题4(基因表达建模)在2015年的份额接近于零,在2016年排名第一,然后在2021年跌至第三。 专利LDA主题分类与演变。图片来源:Nature Biotechnology 总结与讨论 总之,研究结果表明,人工智能在肿瘤领域的影响预计将在未来几年迅速增长,新专利申请的数量将超过预计的市场增长。大多数人工智能癌症专利申请来自中国,其次是印度和美国。LDA主题建模结果揭示了人工智能通过早期诊断、生物标志物筛选、成像分析、肿瘤基因定位、治疗计划和缓解随访等各种应用革新肿瘤学的潜力。这项研究为研发经理、人工智能癌症研究人员以及制药和技术公司提供了有价值的见解。这些见解可以帮助他们在决策过程和研究战略规划。 据估计,2021年全球人工智能癌症市场的价值将超过5.75亿美元,预计到2030年的复合年均增长率将超过35%。在研究结果中,中国在专利申请数量上的领先地位可归因于中国政府的一项倡议——新一代人工智能(NGAI)。2018年,印度还启动了“国家人工智能战略”计划,该计划将医疗保健确定为获得投资的优先事项之一。在美国,投资主要来自公司,到2020年将达到800亿美元,而政府投资约为15亿美元。 LDA分析的范围从早期诊断到生物标志物筛选和图像分析,再到肿瘤的遗传定位、治疗计划和随访策略。LDA主题“生物标志物筛选”、“早期癌症检测”和“基因表达建模”被归类为新兴主题,代表了临床应用的新领域。“人工智能图像分析”被列为一个主导话题,是人工智能在癌症诊断中的关键承诺之一。而主题“机器学习图像训练”被分类为下降和饱和。 |