为什么应用场景决定诊断产品开发?
诊断不是闭环,诊疗才是闭环
对于诊断产品来说,我们首先要明确一个概念,那就是“诊断不是闭环,诊疗才是闭环”,实际上这也就是之前我们谈到的,诊断产品是计量产品的问题,对于计量产品而言,光测量是不能产生价值的,只有当我们根据测量的结果,采取适当的行动的时候,整个行为才能形成闭环,并且产生价值,这也是为什么我们会说诊疗闭环。在医疗领域当中,这也被称为医疗决策树模型,也是现在在医疗领域所推行的DRGs政策的基础逻辑。
上图就是一个在慢性胰腺炎的手术和药物治疗之间做出决定的决策树模型。其中正方形代表决策节点,圆形代表机会节点,长方形内文字代表选择造成的最终结果。在该示例中,对于患者来说,无论是否采取手术,其的预期寿命都是20年。手术的死亡率为5%,而采用手术这样的治疗行为后,只有大约60%的患者在手术后获得疼痛的缓解。在和患者沟通后,患者表示,20年的慢性疼痛生活相当于12年的无痛生活,所以手术后患者的收益我们可以采用如下公式换算:0.95×(0.6×20+0.4×12)=15.96,15.96大于不进行手术的12年,所以医生最终选择了手术。正式因为如此,我们在诊断产品设计开发的过程当中,需要结合整个诊疗循环来考虑产品本身的性能要求。
医疗决策阈值模型
对于一名医生来说,当他面对一名患者时,有三种选择,分别是什么都不做、收集更多的患者信息以及现在就开始治疗。那么,到底该如何选择呢?为了解决这个选择问题所提出的方法被称为医疗决策阈值模型。其关键思想是治疗阈值概率,即在治疗与不治疗之间无所谓的疾病概率。阈值模型的基本原则是:只有当疾病概率的变化足以跨越治疗阈值概率时,检验才是有效的。治疗阈值的计算公式如下所示:
其中C是治疗健康人的成本,B是治疗患者的收益。成本和收益必须用相同的单位表示,可以是货币单位,也可以是患者的预期寿命,又或者是衡量患者对治疗和疾病的态度。但我们需要注意,当治疗健康人的成本等于治疗患者的收益时,治疗阈值为0.5。对于许多治疗方法而言,治疗阈值概率将小于0.50。例如,对于普通感冒药这种安全、有益的治疗,治疗阈值概率可能低于0.10。如果有充分的理由怀疑感冒了(流鼻涕。咳嗽等等),那么检验前概率就会高于治疗阈值,所以我们一般就可以直接采取治疗措施:吃感冒药。但这并不意味着检验就没有意义了,因为若治疗方案存在一定的副作用的话,临床医生就必须要考虑检验结果为阴性后的检验概率是否会低于治疗阈值的概率,如果确实存在这种情况,那我们依然要进行检测。
诊断产品存在性能上限
正式应为如此,对于诊断产品而言,其性能要求就是能帮助临床医生作出治疗决策,换句话说,就是能通过诊断产品的检测,来看检验后概率是否能跨越治疗阈值,影响治疗路径的选择。
上图是检测对治疗决策影响的模型,我们可以考到,如果检验前概率(P0)远远高于或低于治疗阈值,检验结果就不会影响治疗选择,因为检验后概率将与检验前概率处于治疗阈值的同一侧,那在这种情况下,都不需要进行测试。有一个检验前概率,其检验后概率正好是为治疗阈值概率,这种情况刚好是是否要进行治疗的分界线,所以我们将这个检验前概率(P0)称为不治疗-检验阈值。这是因为当检验前概率低于或等于这个概率时,均没有治疗和检验的意义。当检验前概率越过不治疗-检验阈值后,检验后概率将超过治疗阈值,这个时候检验就具有临床意义,因此我们需要检测。从上述模型当中,我们就可以了解到,对于诊断产品而言,其存在一个性能天花板,首先你必须要达到这个天花板,这样才能拿到产品的入场卷,但你高于天花板太多又没有意义,因为临床路径选择上并没有改变,而出于计量产品本身的性能特征,当你的计量水平更高的时候,你的成本往往就会更高,这样会丧失了产品的竞争优势。在这种情况下,我们就能解释很多现象,比如,在疫情期间的时候,国家对新冠核酸检测限的要求很高,当时笔者看到有自媒体吐槽说检测限这么低,要达到是很困难的,而且没什么意义,这是形式主义诸如此类。但如果把当时整个新冠诊疗逻辑放一起看,就会发现这个要求其实没什么问题,当时国内要求是动态清零,而去年12月开放前,国内新冠的检验前概率是非常低的,都不到万分之一,而动态清零这个治疗方案,对检测区分度要求又非常高,阴性就是阴性,阳性就是阳性,可以说检验后概率必须无限接近100%,在这种情况下,自然对诊断产品的性能会提出一些看起来过高的要求。但如果我们希望一款产品能上市,并且大卖,那就必须明确和接受自己的产品在整个诊疗闭环当中的定位,而不是和其他专家论证有无必要,毕竟最终,诊断是为治疗服务的。
上图是检测对治疗决策影响的模型,我们可以考到,如果检验前概率(P0)远远高于或低于治疗阈值,检验结果就不会影响治疗选择,因为检验后概率将与检验前概率处于治疗阈值的同一侧,那在这种情况下,都不需要进行测试。有一个检验前概率,其检验后概率正好是为治疗阈值概率,这种情况刚好是是否要进行治疗的分界线,所以我们将这个检验前概率(P0)称为不治疗-检验阈值。这是因为当检验前概率低于或等于这个概率时,均没有治疗和检验的意义。当检验前概率越过不治疗-检验阈值后,检验后概率将超过治疗阈值,这个时候检验就具有临床意义,因此我们需要检测。从上述模型当中,我们就可以了解到,对于诊断产品而言,其存在一个性能天花板,首先你必须要达到这个天花板,这样才能拿到产品的入场卷,但你高于天花板太多又没有意义,因为临床路径选择上并没有改变,而出于计量产品本身的性能特征,当你的计量水平更高的时候,你的成本往往就会更高,这样会丧失了产品的竞争优势。在这种情况下,我们就能解释很多现象,比如,在疫情期间的时候,国家对新冠核酸检测限的要求很高,当时笔者看到有自媒体吐槽说检测限这么低,要达到是很困难的,而且没什么意义,这是形式主义诸如此类。但如果把当时整个新冠诊疗逻辑放一起看,就会发现这个要求其实没什么问题,当时国内要求是动态清零,而去年12月开放前,国内新冠的检验前概率是非常低的,都不到万分之一,而动态清零这个治疗方案,对检测区分度要求又非常高,阴性就是阴性,阳性就是阳性,可以说检验后概率必须无限接近100%,在这种情况下,自然对诊断产品的性能会提出一些看起来过高的要求。但如果我们希望一款产品能上市,并且大卖,那就必须明确和接受自己的产品在整个诊疗闭环当中的定位,而不是和其他专家论证有无必要,毕竟最终,诊断是为治疗服务的。
产品降级有时反而能开拓新市场
虽然我们在上一节当中举了一个对诊断产品性能要求很高的例子,但在大多数情况下,事情并非如此,甚至可能恰恰相反,因为对于计量产品来说,高准确度和高精密度的产品,往往成本高昂,而且对操作人员和场地等等的要求都很高,结果导致检测方法无法铺开,大部分人的诊断需求无法得到满足,毕竟,像新冠这样不计成本的往下铺开PCR仪的情况,是少数。笔者之前经历过这样一个案例,之前在进行肺炎支原体检测时,一般来说都是采用富士的肺炎支原体明胶颗粒凝集法进行,这种试剂盒也被认为是该检测的金标准,但本身对操作和判读人员的要求还是比较高,加上实验室场地等一些要求,普及面不是很广泛。后来有厂家退出了肺炎支原体IgM胶体金试剂盒,可以在检验科窗口直接进行检测,出结果之后开药,由于操作方便而且检测结果可接受,所以直接让肺炎支原体检测的市场规模翻了好几番。坦率的说,虽然有厂家宣称胶体金法和明胶颗粒凝集法的性能相当甚至有可能更优,但从大规模出货的角度上来说,这种情况是不太可能的,因为违背了产品技术平台本身的性能特点(少量优中选优的产品存在可能),但性能上的差距实际上并没有阻挡产品的热卖,这就是因为胶体金产品的性能已经达标,可以让医生做出相应的治疗路径选择了。另外,还有一个案例就是现在诺辉在网上大卖的幽幽管,实际上,对于幽门螺旋杆菌检测来说,13C呼气检测才是金标准,而幽幽管实际上只是一个胶体金法试剂,从本身技术难度而言,呼气检测比幽幽管强很多,但幽幽管现在卖的就很好,这就是因为它的性能足够满足需求,而在操作和场所要求上,又更加便捷导致的。如果是因为大众对幽门螺旋杆菌的认知增加导致的话,为什么他们不去医院做呼气检测呢?从上述案例当中,我们可以看到,由于诊断产品本身存在性能CAP,所以只要产品的性能达标,那么在后续的市场竞争当中,产品对使用场景的适应性,就是重中之重。对操作人员要求越低、成本越低、周转时间越快的产品,在市场上就越有竞争力。应用场景,而非检测技术,决定了一项成功产品的开发和设计。
来源于诊断科学