金桔
金币
威望
贡献
回帖0
精华
在线时间 小时
|
#凑巧在这个领域工作过,既然我已经离开了这类岗位(本问题提出来是,我刚入行),可以不涉密的讨论这个问题。希望在45分钟内写完,
#2023-4-9 09:24
首先, 这个提问是本末倒置的。不是生物信息方面的精准治疗,而是精准治疗行业中存在生物信息工具。 这个看起来是个废话,但是却是影响工作状态和工作效率最大的因素:对生物信息工作者来说,这个行业里一定要谦卑,一定要特别谦卑(humble),否则出问题是大概率事件。
同时也建议精准行业中的同事们平视生信工作者,这帮家伙是工程师,本质上是做技术,和染片子,提DNA,建库,写微信软文,组织科室会,报账,送样本,等等行为一样,都是干活的。只要是活儿,就不好干。
然后,扯几句大的概念,精准治疗的本质,是利用细胞生物学+分子生物学+病理学+基因组学+IT自动化技术的工具,搞清楚患者群体和个体中的基因突变,来提供用药的方案建议,以减少试药的成本,降低药物负面反应的概率。 目前整体行业已经进入发展平台期,国家已经开始启动院内试点,这意味着从技术面和数据面上,已经日趋成熟。同时意味着激进的资本可能在逐步离开这个领域,而稳健性的长期回报性的资本可能会接棒,同时监管面在积累了足够的案例后开始规范管理制度。截止2023年,状态是这样的。男怕入错行,女怕入错行。对行业一定要保持冷静的甚至冷酷的判断。有些话要自己想,章北海们。认同这个背景下,我们讨论一下生信从业人员的生存策略。
第三,策略只有一个,那就是谦卑,请允许我拆解一下为什么要特别谦卑。
A, 哲学层面上,医疗面对的是患者的生命,不是实验动物,而是患者的生命。本质上生命科学和医疗是两个完全不同的行业,行业规范和对错误的容忍程度,差别是非常巨大的。这是很多从科研服务公司(含被服务的在校毕业生)进入精准医疗行业的工程师很难转过来弯儿的地方。几乎可以说,这个转变基本上决定了一个工程师的上限。
B, 我们回到生命科学本身,精准医疗面临的最大问题是数据量不足,数据精度不足,基因组学的工具总是刷出来成百上千的突变或者表达差异,这些分子层面的变化是不可能被一一验证的,还是一个很长很长的长尾效应,就算是借助目前最新的神经网络的方法去推测,也很难像经典的生物学通路那样一个一个相互作用的阐述清楚,本身遗传学单个基因突变--临床表型之间的关联上进展的非常让人灰心。这对精准医学的应用埋了一个很大的隐患: 清楚的已经清楚,不清楚的很难再清楚(维特根斯坦式的冷笑)。在临床应用上成了一个赌概率的经济学问题,如果患者有钱而且运气好,可以全部测出来再说,如果患者运气好,可能小范围的测序能为用药指明方向,如果患者没啥钱,那就不用尝试精准治疗这个领域了,保守一点也是日常。 科学技术的现状,让生信工作者的价值是有明显的天花板的。
C, 再讨论一下公司的内部流程,做生信一定要把耳朵伸出去,把手袖起来。耳朵伸出去的意思,是一定要把公司的从头到位的流程全部过一遍,永远相信墨菲定理,你手里的数据会受到各种步骤的影响,PI和学生的沟通小gap,从医生取样的那一刀,到送样销售的手一乱,提核酸的同事手一抖,大家常用词的混淆,都可能让你的突变分析举步维艰,这些都不是你能控制的,但是你必须去了解,你不了解坑,就砸在你手里了。大家觉得你数据分析能力不行,或者软件不行。 我接过最离谱的事情是本来要分析体细胞突变的样本,销售转进来是SNP分析的需求。 客户一脸郁闷的找回来说大哥这玩意味儿不对啊,重新对齐需求连夜分析还回去。这也是我说请平视生信工作者的原因。生信工作最需要专心写代码,然而最考验他们的全TM是代码以外的事情(plus,有公司已经开始设置生信工作对接需求的专门岗位了,要求有资深生信背景)。至于什么样本性别搞错,对照血标错,瘤种写错,都是大公司见惯不惊有标准和完善的处理流程的异常了(这些事情也是国家为什么要在医院搞试点没有马上接棒的原因之一)。这样的工作状态持续个两年,你就会特别的谦卑,技术是工具,用好还是要看人。
D,最后才讨论生信工具本身的误差问题,本质上,这个岗位不需要特别会写代码的人,甚至理论上你是不能自己从头写突变分析的软件的(错了算谁的?),当然如果你基于GATK或者varscan魔改一版大家会觉得你很高端(毕竟这些软件审稿人看过同行也认可)。然而这些工具都有自己的分析假设和适用范围的。但是按我的经验看,绝大部分人和绝大部分软件是没有办法搞清楚是否适用你手上的场景的,只能试错,同时行业内部都藏着捂着,生信同行之间又没法交流,你自己定的参数好不好用天知道。这样的业态已经让大公司的头部效应快速积累,小公司的流程既没法改也没法验证。但是我见过聪明的公司,是聚焦在某一个小的细分领域,每个样本都用手搓突变的方式(calling+IGV check),一两年看不出来,五年之后软件的准确性,参数的可靠性和对异常样本的灵敏性就会存在壁垒。所以本质上生信分析只是给了一个可能性,然后大量的工作要其他岗位的同事来补,这也是为什么一定要谦卑的客观原因。
E, 是合规的问题。 不是谁跑的快,而是谁不栽跟头。数据的安全性,代码的规范性,操作的管理制度,这些都是业内生信人员的必须具备的素质。 如果贵司没有IT,请自觉扮演IT,服务器的端口安全,U盘的使用,数据发送的邮箱选择,邮件抄送人的点击,患者个人隐私数据的隔离,都要特别规范,合规无小事。包括离职之后对前东家的自觉保密义务。这是之管理者判断一个人有没有入行的问题。 这个问题上请保持绝对的谦卑。 对自己和对同行都好。履历中没出过幺蛾子本身就很值钱。具体操作就是时时刻刻搞清楚每一件事情的 stakeholder是谁(通俗说锅/好处在谁哪儿,感谢@大兄弟指出拼写错误,感恩),每一件事情都要有被授权的记录(邮件写清楚谁让做的),每一个分析都要有可回溯的过程(万一错了,信息不足和刻意使坏是两码事儿)。 这点希望刚毕业准备进入工业界打工的萌新们注意适应一下,提问者关于到处都是公司的事儿,其实最大的差别是头部公司在合规方面的降维打击,这我们以后再看。
最后,对做生信的从业者来说,这个帖子可能价值不大,没做过这个岗位的人会感觉云里雾里不知所云。做过这个岗位的人感同身受无需多言。那我为什么写下来呢,其实希望不做生信的人能看到,能了解生信工程师的日常和他们的生存规则是什么样子的,这样在和生信分析沟通的过程中,也能提高沟通效率,减少不必要的时间浪费。节省的每一分钟可能给患者临床治疗带来一点点的改善。
若真如此,善莫大焉,阿弥陀佛。
#2023-4-9 10:25 ; 1hour。
#草草写完,如有笔误,望谅解。 |
|