• 患者服务: 与癌共舞小助手
  • 微信号: yagw_help22

QQ登录

只需一步,快速开始

开启左侧

怎么才能证明一款药有效?

[复制链接]
4482 0 小曲 发表于 2021-5-24 10:16:04 |

马上注册,结交更多好友,享用更多功能,让你轻松玩转社区。

您需要 登录 才可以下载或查看,没有账号?立即注册

x
1.jpg

) z$ \5 }9 e; [; L
文章来源:混乱博物馆4 W7 k+ q3 J8 W3 U9 E; u, e

1 z3 v# s! m4 ]5 Q* B数万年来,为了对抗疾病加诸于人身的种种痛苦,人们一直在苦苦追寻着各种治病救人的方法,从石器时代祛魔治病的开颅手术,到19世纪出现的全身麻醉手术;从各种历史悠久的草药、动物药,到1805年第一次从植物中分离出吗啡,再到1832年发明第一种合成药物水合氯醛,所有这些努力都见证着人类医学的发展。
. L, l! J& G( }. @% v6 ?' [. k9 l4 C1 R
2.jpg
6 v# I* T1 m/ F0 P
5 o) P4 }( D* O! _# j1 ?
然而在这漫长的历史中,有一个看似简单却最为重要的问题,大部分时候都没有得到解决,那就是如何判断一种药物或疗法是真实有效的。
. N% e; e3 i: x' e8 L
% W# A9 G1 i, h1 G+ j$ _' M& @一直到1747年,英国的詹姆斯·林德通过将病人分为6组,分别给予不同的食物或药物,成功发现了柑橘可以治疗坏血症。对病人分组,给予不同药物,观察治疗结果的差异来判断药效,这一开创性的研究方法,成为医学历史上里程碑式的事件。% T4 p- I6 w+ v6 |8 P5 s, g6 l7 D! k$ Y

& D7 v! y  H" Y! i3 F$ i1 P
3.jpg

- ~8 y$ }3 s; q' q- q8 @6 j( I( x. y
当然以今天的眼光来看,其试验条件和试验设计都极为原始,比如病人一共只有12个,分组完全靠医生指定,而林德一次试验竟然就能得到完全正确的结论,运气之好实在让人嫉妒。、
, x9 p$ s& @  V( Y1 `. d
) j6 H; y5 I9 u
4.jpg

2 T  R% [: T- H1 [8 Q  m
, W$ d) ~5 A1 y) Y; z因为这其中难以捉摸的因素实在太多了。比如一种疗法究竟需要治好几个人才能算有效?如何知道一种“药物”与“治好”之间存在因果关系,而非碰巧?又如何证明吃药后祈祷30分钟并不能增强疗效?6 q  `8 R) q2 ^0 g* _& p9 I: R& t
6 N6 R: l9 X* P: Z
5.jpg
9 ?9 Q& k/ q: B5 |3 H# j
9 l$ ~6 I" U. t6 y
现实世界充满了复杂性,人类个体之间的情况千差万别,实验动物和人体之间的巨大差异,甚至还有安慰剂效应这样搅混水的因素等等,如同在物理实验室那样控制各种变量,分析出因果关系进而得到一个简洁优美、包治百病的公式,对于正经的医学来说是几乎不可能的。5 g: P; F( h- V* e
6 w  o  R; }# J* I
6.jpg

' x( o+ I9 ?. R2 n& y9 u+ ]
4 c* B9 |0 N4 ~但是我们可以通过一些间接的办法来解决这个问题。为了理解这种方法的精髓,我们可以先看看一个更简单的问题:为何自然出生的人口性别比并非男女1:1。
: [/ ?% F- h; a9 t, |8 M6 q6 \2 S. V" S
7.jpg
0 w6 B, |) ]' o7 j- P$ m
1710年,英国的约翰·阿巴思诺特,收集了1629年到1710年伦敦的教堂记录中每一年受洗男孩儿和女孩儿的数目,这也就大致对应着每年婴儿出生的情况。他发现,每一年出生的男孩数量都要大于女孩。借由常识我们也能得到一个直观的结论:那就是正常情况下,男孩出生率要高于女孩,因为你们不能说连续这么多次都是巧合。譬如庄家掷骰子,一次、两次出现三个六,那是巧合,但连续几十次都是,我们就有理由相信他肯定是在作弊。
* a: Z6 P, c) c
5 V8 }  m1 f) z3 }0 d
8.jpg
. @4 N0 M# _" W. A( j3 h
约翰·阿巴思诺特对此进行了更加严谨的论证:他首先假设诞生男孩的概率和女孩一样,都是1/2。那么每一年男孩多还是女孩多,就如同掷硬币一样,都有一半的可能性。通过简单的条件概率计算,也就是第一年男孩多的可能是1/2,那么第一年、第二年同样男孩多的可能就是1/2乘以1/2,以此类推,每一种可能的现实就如同在时间之树上不断分叉的树枝,其可能性不断减半,连续八十二年男孩都比女孩儿多,这一事件发生的概率为1/2连续相乘82次之多,结果约为10的-25次方,这样低的概率自然极度不可能发生。但现实中确实发生了这样的事情,由此可以反证,原假设——也就是男女自然出生比率相同的结论,是几乎不可能成立的。(Q.E.D)( P. W9 z8 y! ]2 [; }0 R
2 I  D; U$ @& \6 S2 [
9.jpg
9 W8 q/ J# V5 `$ o- u" U: t$ A
使用这样一种更加曲折的方法,是因为在现实世界中,作为凡人的我们,永远只拥有不完全的信息和有限的试验次数、观察次数,无法通过穷举一切迫近绝对真理,但我们又必须根据这有限的信息去选择,去行动,那么就只能通过有限的样本去计算、去推断。
/ V. B5 Y+ s3 _2 C4 b7 O3 Q. N. Y( B2 ~: m# c" _/ `  g( a4 G; v
10.jpg
! z' G6 V' U$ n( u# H6 `  q
一旦人们认识到这种统计学思维的重大意义,其与分组对照试验的结合,就不可避免地产生了。6 S6 K5 p" l3 w
4 J; M! j6 ^6 Y9 q
在1948年,为了验证链霉素是否真的对肺结核有疗效所作的对比试验,堪称经典范例。经细菌学检查确诊为肺结核的患者,共107例,采用随机数字表产生随机序列号,随机分配为2组,并通过密闭信封保存随机序列号。试验组55例,接受链霉素治疗加卧床休养的方案,对照组52例只接受卧床休养。
- t. f3 X1 g( F. l$ _
. G7 e* T1 G9 L" A" q: J' `: d
11.jpg

' @& w. X% o& B  O在这里,对照组实际上充当了零假设的作用,也就是药物如果无效,治疗的结果应该是什么样的。通过实际用药后显示,试验组和对照组6个月的生存率分别为93%和73%,通过计算,两者数值的不同仅仅来自于随机分布的可能性小于1%,这也就是通常所说的p值<0.01;换句话说就是:试验组和对照组确实有差异的可能性高达99%。由此证明了,链霉素可显著改善肺结核患者的生存率。
1 C( h: |3 b  U% i6 g) X2 `$ u
$ N7 Z% X* x/ |& E- z/ H
12.jpg

  J9 P, ]0 v7 H* _( c! w其精髓就在于,我们并不在假定它有效的前提下去证明它有效,而是首先假设它无效,这被称为零假设,就如同法律上的无罪推定,是为了减少冤假错案的发生,零假设则是为了排除药物无效的可能。既然它是无效的,那么和没有药物干预的病人们的病情发展状况应该非常相似。然后我们拿真正用药的病人的数据做对比,就可以计算出这个零假设是正确还是错误的可能性有多高。
( o+ f' e# ^/ {% l4 N( [# r; V
5 K1 ?, o0 k0 D* L/ ]
13.jpg
$ h* E7 @- R! O1 f9 R0 L" [
由此开始,现代医学的临床试验才走上了正轨。这也就是我们所熟知的随机双盲对照试验,并发展为一套更加严格的Ⅲ期临床试验审批程序。* O& P; S& @4 S
& X' v8 k4 t3 b( D
14.jpg
( Q% ~# s( \5 G5 C/ c1 T
也许人们会疑惑为何不能直接测试一个药的有效性,搞这么多不同的阶段,但是大家都忘了一件事,那就是在确定一个药能否治好人之前,首先要确定这药不会把试验对象(人类)都毒死了,或者副作用过于严重,至少也要搞清楚安全用药的剂量到底是多高。否则盲目进行的试验,就会演变成科幻电影中,邪恶科学家随便拿大众当小白鼠,却声称自己是为了全人类福利着想的场景。
# c6 ~6 O% e3 u0 J
% a% S' b, m) a' E, U4 e
15.jpg

3 E7 ]* m# x  ]- C所以必须有一个Ⅰ期临床试验,观察人体对于新药的耐受程度和药代动力学,为制定给药方案提供依据。比如为了测试人体对不同剂量的耐受程度,先从动物半致死量的1/600或者动物最小有效剂量的1/100开始给药,然后逐渐加大剂量,观察人体的反应,即所谓的剂量爬坡试验。% Q( j( v& D; I  }- B

! q# p' O% i7 @" m2 S% Q
16.jpg

  v* [  U2 n( R9 Y3 {9 Y临床Ⅱ期与临床Ⅲ期的主要目的似乎都是关于验证药物的有效性(其实也继续包括了安全性的评估),然而它们在统计学意义上的「有效性」差别也很大。最直接的差异就是试验的规模。
) G! `5 E, ?7 g* F
7 x/ q1 Y5 g4 d  d. D
17.jpg
% n4 r  U" L1 B/ `
Ⅱ期每一次试验的规模通常只有100人左右,每一个分组只有几十人;而在Ⅲ期,试验的规模会扩大十倍,接近1000人。
6 |; [3 E/ }' d( I& ]
, D5 Y1 W9 B) A; i9 f- V( Y5 v
18.jpg
: y0 c9 o$ R) |& F! k
Ⅱ期试验其实就是需要去试错,在更小规模的试验中更加快速、更加低成本地排除掉没有希望的药物,降低赌上一切最终却一无所获的风险。
- J' y: d; x$ U. A$ k! i5 h
% Y2 m; C0 k/ r9 K* M( d所以Ⅱ期被称为探索性试验,意思就是赌博的成分很大。这类试验大部分采用单臂设计,即不设对照组,只与历史数据进行对比。正所谓十赌九输,Ⅱ期试验成功者继续通关乃至上市的成功率很低,在近十年中,一般只有1/4的新药可以进入Ⅲ期临床研究阶段。" `% J0 F# |/ I% X9 O! J
7 q4 f5 p5 i. d5 M0 p
19.jpg
/ f* @: K' n* I. R+ i' B

5 i$ N  Z* I( \5 U
20.jpg
( d0 H- s3 K4 \
当然也存在一些特例,在II期试验完成后就可以提前获得药品监管部门的上市许可,也就是走了加速审批程序。那些致命却缺少有效疗法的疾病,或者是一些罕见病,只有针对于它们的新药才能享受到这种待遇。其中的伦理和人道考量相信大家都很容易理解。而且如果它们在接下来的临床III期无法证明疗效,依然会被撤销许可。7 S  u+ u$ `" Q: l" j

- {- x) K9 X( r3 {* I5 G# b
21.jpg
# [! P) n+ k, U8 K6 G, q/ _! O; P
当一种新药进入临床III期后,一切都变得更加严格。Ⅲ期试验一般都需要采用随机盲法、平行对照等试验设计,并且必须有足够大的样本,这才能确证在特定目标人群中的有效性和安全性。最直观的就是,我们最终在药品上看到的适应症、禁忌症等重要信息,主要都直接来自于这一阶段的试验结论,当人们说一种药物是否有效,一般指的都是这一阶段的结论。9 q  r- @) ~" M( Q! i; i

; }: Z3 o6 _) x
22.jpg
; a- e) R5 o# ?% ?2 @& B
甚至当一种药物通过了目前为止最为严苛、试验规模更大的Ⅲ期临床试验,拿到了卫生监管部门的上市许可,换句话说它的疗效已经得到了权威机构的认可,但是依然需要继续进行试验、收集数据,进一步验证其安全性和疗效。! d) D, R& r; o+ s) e. j

( X& M8 N2 y, \" e  Q* [
23.jpg

# L  l* i4 h/ q3 x因为Ⅲ期临床研究的数百到上千例患者,对于观察疗效算是足够了,但对于安全性,尤其是小概率发生的安全性事件,这样的样本量依然显得有些不够充分。所以需要在药物上市后,进行更大规模的临床试验,也就是所谓的Ⅳ期临床试验,这种研究一般需要纳入2000例以上的患者,观察药物在更广泛人群中的安全性。
* Q$ M  l8 c/ F4 ]
$ A  @9 T9 Y4 ]! K2 Y
24.jpg
2 M3 L5 E) y% E# {6 r7 ?
归根结底,更多的样本,更多的试验,更多的尝试,才有可以让我们逼近那条可能性最高的道路。或者借用贝叶斯主义的观点:我们因此才增加了对我们的知识是正确的信念。* Q0 x0 I$ ]' h4 x* ?
5 W+ h/ @9 f7 U+ e! ~
25.jpg

3 ^- _; Z% P" N. z# \- i, e/ g+ t+ S1 m
参考文献
/ F, J% G/ g6 i  j$ Fhttps://commons.wikimedia.org/wiki/Fileuentin_Matsys_-_A_Grotesque_old_woman.jpg5 g( z( j, p1 m. V, n
https://commons.wikimedia.org/wi ... -P4140363-black.jpg$ {: L* w  n$ @: {4 K- m
https://www.youtube.com/watch?v=Qxx14RCxblg
0 B6 s6 p5 P2 v0 o, l/ B1 Qhttps://blogs.bl.uk/digitisedman ... english-herbal.html" F/ Z' g$ y. V% ]8 |( i
https://wellcomecollection.org/works/ayd5f93 ]+ O1 a* m3 n7 \- N

7 R) l! W, t, y: c! {

发表回复

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

  • 回复
  • 转播
  • 评分
  • 分享
帮助中心
网友中心
购买须知
支付方式
服务支持
资源下载
售后服务
定制流程
关于我们
关于我们
友情链接
联系我们
关注我们
官方微博
官方空间
微信公号
快速回复 返回顶部 返回列表