立即注册找回密码

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

手机动态码快速登录

手机号快速注册登录

搜索

图文播报

查看: 152|回复: 5

[分享] 如何看待利用大数据做疾病诊断这件事?

[复制链接]
发表于 2025-1-21 14:17 | 显示全部楼层 |阅读模式

登陆有奖并可浏览互动!

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录 手机动态码快速登录

×
先放上,晚点回来补充说明。
-----------------------------------------------------
起因是朋友的实习生跟朋友打了一个多小时的电话BLABLA各种向往移动医疗,号称大数据能改变医疗现状引领人类走向新时代,
而我俩约了吃饭结果我呆呆一个人吃了半天心生怨念。
---------------------------又是分割线---------------------------------------
我就想举个例子就是Dr. Saint SYR,
他是一名来自美国的全科医生,一直在北京普及PM2.5和空气污染等的相关知识(室内点蜡烛和吸烟会弄出特别多的PM2.5哦!),结果在去年11月因为单纯性呼吸困难给自己诊断了哮喘,使用支气管扩张剂之后明显好转,大家可以想象一下一个天天宣传怎么戴口罩开空气净化器的大夫得了这个病是如何得打脸。。
而他也经历了相当多的斗争,思考是不是要回美国。事情再今年2月又了变化,他的病情进展了,发现其实是细菌性的肺炎!抗生素治疗之后啥啥都好了!

讲这个故事,因为:
1,这是个很很有意思的八卦
2,很多人觉得之前的诊断是误诊,包括采访他的媒体都是这么报道的,但是我真觉得不是误诊
3,疾病在不同阶段展现出来的症状体征真的不一定典型,怎么能让数据诊断不变成数据误导医生诊断呢?

那些什么多中心回顾性的循证医学的实验,也是处理各种数据,对方这么多年都做不出来的数据,缘何这么多人如此信心满满?
原文地址:https://www.zhihu.com/question/33503928
楼主热帖
回复

使用道具 举报

发表于 2025-1-21 14:17 | 显示全部楼层
大数据这个概念,只是互联网想着圈钱的人+忽悠来的路人自high罢了。
Garbage in garbage out 这个道理难道不是自言而喻么?就凭那个破传感器的运动记录就想做出突破?Naive !

  • Validity/ Reliability (数据是什么东西?准不准?)有吗?没有的话,科学界不承认的哟,你说什么都没用
  • 这比传统的方法优秀在哪里?除了精确了一点,能带来什么新发现么?
  • 新发现能促进治疗么?
医学研究高投入低回报周期长,几千万RMB 也就支持一个中型实验室运转几年,基本上注定打水漂,全世界研究资金都是国家投入,想不出哪个公司会真想不开来投入这个。
想要研究大数据啊,我给你指条明路。出门左转,生物信息学,基因组学之类的,去研究下大自然创造的源代码吧?啥你说工资低没前途??我没听清.....
回复 支持 反对

使用道具 举报

发表于 2025-1-21 14:17 | 显示全部楼层
自动诊断是AI从50、60年代出现开始整个业界就一直在做的梦,是AI届最初最经典的几个被畅想的、应该备解决的问题之一。70年代就有两个被誉为自动诊断鼻祖的系统被相继创造:斯坦福的mycin和匹兹堡的internist(详情可参考相应wikipedia),其中mycin的创造者shortliffe今日就是美国医学信息学会的president,此人一手创立了美国几个最初的医学信息学专业,包括鄙人所在的哥大医学信息学系(做个广告,我们不干别的,就是研究医疗数据挖掘、医学人工智能)。
可惜,这个春秋大梦很快就被发现过于不切实际,疾病诊断的复杂性之强,已经超出了人类思维reasoning的范围。这也是为什么医疗被称为既是科学也是艺术,其艺术性的部分,恐怕正是AI难以逾越的鸿沟。到90年代之后,美国的主流学界就已经渐渐放弃了用机器直接取代医生这个梦想。2012年,医学信息的大拿之一Friedman写了一篇著名的文章“What information is and isn't”,这篇超级短超级短的论文(可自行pubmed),却因为其中点明主旨的一张图而被广为引用:


也就是说,现在在美国所有人为之努力的大数据系统、智能系统,其终极目标只是实现上面这个不等式。这个不等式也已经基本宣告,无论从技术上还是伦理上,计算机被认为只能辅助医生,而无法取代医生。这个不等式的左边,永远不能缺少了那个人脑。
从产业应用的角度,大数据、机器学习、人工智能的算法,也被越来越多的应用到了辅助性的应用上面,药物的安全性监控、医嘱系统的自动警报、药物副作用的挖掘等,已经广泛商用化。广泛的医疗数据挖掘也衍生了诸如inovalon,flatiron这样billion dollar级别的公司。但自动诊断这个梦,却已经变成一个多数人都不敢踩的大坑。
当然,如果你翻看AI和medicine结合领域的论文,包括医学信息学届最顶尖的JAMIA(不是JAMA)杂志,仍然会有层出不穷的疾病预测和诊断模型被不断探索,但这些模型多数由于可靠性和适用性的原因,只能停留在科研阶段。
当然也不是完全没有好消息,最近和一些大牛沟通,得知利用deep learning来基于fMRI或者CT图像,来做某些疾病的自动诊断,在极为接近临床的样本条件下,已经能达到100%的性能。由于此成果尚未发表,暂时不说更多细节。这种系统其实在业界说多不多(单病种的模型精度,过于依赖于病种本身的复杂性),说少也不少,但真正能投入到临床的,其实几乎还没有。
当然,如果你觉得奥巴马还算靠谱,认为他忽悠起来的精准医疗(说白了就是循证医学+基因)能够改变这一局面,那我们可以拭目以待。观海同志反正早就正式钦点精准医疗为下一个风口(虽然学术界最近已经开始渐渐不买账了),至于你们信不信?反正我是信了。
回复 支持 反对

使用道具 举报

发表于 2025-1-21 14:18 | 显示全部楼层
首先表明观点:我认为,自动化诊断是未来趋势,但现在不成熟,有很大的发展空间。
最先要指出的是,大数据诊断,并非单纯的收集数据得出统计结论,而是有一定的人工智能算法在其中起推断作用。其中简单有效,而且最符合人的判断逻辑的算法叫做贝叶斯网络,在足够多的数据(这点很难就是了)的前提下,完全可以比任何一个个人能做出的判断更加准确。在数据不足的情况下,也有可以和不少个人媲美的推断能力,至少在少见病的诊断上,其准确率是远远高于人的。国外有这样的诊断辅助产品,就是针对少见病诊断市场。国内目前完全空白。
我们先来看看现在的临床诊疗。
1、现代医学是循证医学(EBM)。也就是临床实践都是以基础科学研究和大规模的临床实验结果作为支持的。这些结论,都是大量的数据采集和分析的结果。
2、现代医学的临床实践仍然处于经验为主的阶段,EBM的结论,并不能直接完全覆盖实际病人身上发生的具体情况。基于EBM的基础部分的结论,结合实践经验,仍然是现阶段临床实践最重要的方式。
3、大量未得到良好教育和缺乏检查受手段的医务工作者,仍然是目前医疗的主要力量,尽管国内有最好教育的医生和最好检查手段的三甲医院,依然人满为患。
4、全科医生的作用被严重低估,而大量专科医生扮演起了全科医生的角色,化了很大的精力在处理一些“小病”上。
总结一下就是:EBM指导的部分有局限,EBM+经验医疗是主流,条件差,水平低,专业不对口的医生是主流。
大数据可以解决什么问题呢:
1、扩大EBM的适用范围。如果可以精确地采集数据,EBM在医疗中的比重将更快地上升,总体医疗质量提高。
2、个人经验无关紧要,大数据将使得个人经验更多地转变成全人类经验,误诊、漏诊将大大减少,从而提高整体医疗质量。
3、医院分工、医生分工将更加明确:大医院解决复杂病情,中医院解决一般病情,小医院解决慢性病于预防接种保健。因为医生的诊断已经不依赖个人经验,从而对普通疾病和罕见疾病的准确率可以有保证;只有病情复杂,治疗手段复杂,需要建立MDT(多学科团队)的病人,才需要大医院和专家的处理。
4、所有医生的工作负担均会一定程度上的减轻,从而带给病人的医疗服务质量会有提升。
而现阶段大数据做不到的事情:
1、精确地、自动化地数据采集。毫无疑问,同一个样品去不同医院的实验室同时做化验,结果都会不同,这已经是自动化程度非常高的了(这个问题其实可以通过实验室间校准解决)。跟别提那些可穿戴设备了,可以达到临床参考级别的设备实在是太少。而医疗数据的维度也特别高,如何让大数据去自动处理病人的CT资料?而病史,体检等描述性资料,更离不开临床工作者的采集。总之,数据采集方面,完全没办法离开一线临床工作者。
2、To cure sometimes,to relieve often,to comfort alway. ——E. L. Trudeau。真正能治愈的疾病实在是少得可怜(其实大多也不是治好的,只是身体自己好的),更多的时候,医生做的只是在减轻痛苦,抚慰心灵。这部分工作,大数据能帮上的忙就十分有限度,大数据最多只是减轻医生其他方面的工作,从而换取更多的精力到人文关怀上。
真正可以靠大数据看病了,那得是人工智能发展到可以超越大部分人类的时候了。但并不意味着大数据在现阶段完全没有价值。这部分的价值其实是非常巨大的,只是要找到有能力去做的人,同时又能找到买单的人很困难。就像Google研究无人驾驶汽车一样,未来一定会大部分时候完全无人驾驶,而现在的无人驾驶技术依然有巨大的技术价值(比如说可以避免很多高速公路上的车祸)。
P.S. 丁香园还没打算做这一块是相当可惜的(不然我就加入他们算了),毕竟国内有很多更容易解决,更重要的问题等他们去做。
欢迎大家来讨论。
回复 支持 反对

使用道具 举报

发表于 2025-1-21 14:19 | 显示全部楼层
可以用,但是有两点需要注意:

  • 相关不等于因果:举个例子,北京PM2.5全国第二,贵州倒数第二,北京人均期望寿命全国第二,贵州依旧倒数第二,但是你能得出雾霾严重的地方的居民活的更长这个结论吗?
  • 整体概率不等于个体概率:可以参照http://www.zhihu.com/question/19578400/answer/41653546 的答案,一群人的健康数据的结果不一定在个体适用。比如中国婴儿出现兔唇的概率是1/10万,那么你未出生的小宝宝出现兔唇的概率就是1/10万吗?也不一定,还要看你和你对象的基因情况。
回复 支持 反对

使用道具 举报

发表于 2025-1-21 14:19 | 显示全部楼层
套用一句废话说:大数据不是万能的。
很多外行就是在意淫。真的,我见过太多人在意淫一些看似完美的解决方案,实际这些方案根本没有任何可行性。
玩概念大概是这个行业最容易的事情了,哪怕这个概念听起来很唬人。但是,有能力的会去做真正更难做的事情。
回复 支持 反对

使用道具 举报

发表回复

您需要登录后才可以回帖 登录 | 立即注册 微信登录 手机动态码快速登录

本版积分规则

关闭

官方推荐 上一条 /3 下一条

快速回复 返回列表 客服中心 搜索 官方QQ群 洽谈合作
快速回复返回顶部 返回列表