DoE系列②实验效率革命:部分析因设计如何用更少实验获取关键信息

2025-06-06ASPCMS社区 - fjmyhfvclm

️前言 IMEENG

️ 质量源于设计(QbD)是一项全球性的监管倡议,旨在通过药品制造工艺的主动设计和控制来加强药物开发,以提供一致的产品预期性能。随着2017年中国药监局加入ICH(人用药品技术要求国际协调理事会),实验设计(DoE)日益受到国内药企的重视。然而受限于DoE背后高深的统计学原理,很多药物研发人员敬而远之,望洋兴叹。

️ 本系列文章希望能用通俗易懂的语言,借助JMP软件,帮助读者一窥DoE的秘密,欢迎点赞转发。

在上一篇文章中,我们已经初步认识到了DOE的强大功能:借助DoE我们仅通过一组实验就快速确定了因子是否关键、是否具有交互作用,并为进一步优化指明了方向。

但是有的读者可能会不以为然:在此之前的案例中因子的数量很少(只有3个),而实际需要解决的问题会复杂得多。尤其是生物制药工艺,每一个实验包含十几个甚至几十个因子。如果继续采用完全析因设计的话,实验次数会随着因子数增加而急剧增加(图一),例如10个因子时,实验次数为1024;而15个因子时,实验次数则达到了惊人的32768次!因此,他就可能会认为:DOE只适合于少数因子的问题分析,至于处理多因子问题,则显得无能为力了。

图一

这个结论显然有失偏颇,其实DOE的一大特点就是可以处理包含多达50个甚至更多个因子的复杂问题,本期的主要内容就是向读者介绍多因子DOE的方法。从理论上讲,上一期的DOE案例实质上采用的是完全析因设计(Full Factorial Design),这类方法在因子数量较少的时候实施起来比较方便,她的优势是可以全面解析因子的主效应和交互作用。但如果因子数太多,这种设计方式就不够用了。这时,我们可以祭出另一大神器——部分析因设计(Fractional Factorial Design)。

顾名思义,部分析因设计源于完全析因设计,是与其对应的完全析因设计中的一部分。但究竟是哪一部分,是否可以随机选取?举一个简单的例子来说明:

表一显示的是一个部分析因设计的计划表,A、B 和 C表示三个主因子,+1和-1表示因子的两个不同水平,AB、AC 和 BC表示二阶交互作用,ABC表示三阶交互作用,总共需要做8次不同的水平组合来完成1次完全析因设计的计划。

aspcms.cn

表一:3因子的部分析因设计计划表

以上这个试验计划适用于3个或以下因子,可支持8次试验运行的DOE。如果增加了第四个因子D,但依然只能支持8次试验运行时,我们应该怎么办呢?原来表二中的计划表有8行7列,任意两列间是相互正交的。我们希望增加一列来安排因子D,而且希望此列仍然能与前面各列保持正交性。数学上可以证明,“找出一个与前7列不同的列而与前3列保持正交”是不可能的。换句话说,D列必须与第4、5、6、7列中的某列完全相同。完全相同意味着这两列的效应会被“混杂”(Confounded),即获得计算所得的分析结果后,分不清两种效应各是多少。权衡之下,我们认为取D=ABC是最好的安排,因为通常主因子作用与三阶交互作用混杂的可能性最小。根据上述决定,将D列取值设定与ABC列相同,并将其前移至第4列,可以得到表二所列的计划表。

表二:4因子的部分析因设计计划表

您一定会猜到还可以使用表二的计划表继续构建出第5、第6乃至第7个因子,但试验的规模依然保留在8次。当然,当同等规模的试验中所涉及的因子数量越多时,产生“混杂”的概率会越大,后期分析结果的精确程度也会有所降低。这就是试验成本与分析精度这对矛盾的平衡,也是“部分析因设计”产生的基本原理。值得一提的是,在制定部分析因设计的具体方案时,不必如此繁琐地逐一推算,成熟的分析软件例如JMP、Minitab等能帮助我们快速制定最合适的方案。

下面我们通过一个案例来体会下部分析因设计的优势。

某纯化工艺开发小组希望借助DoE提高层析工艺收率,初步锁定的因子有5个:洗脱流速、pH、Cond、洗脱体积和填料类型。其中前4个均为连续变量,而填料类型为离散变量,见表三。

表三:实验因子

如果使用完全析因设计,需要进行32次实验,但如果采用部分析因设计,仅需要一半,也就是16次实验即可找到所有的主效应和交互作用。

借助软件我们发现,pH、Cond、填料类型三个因子均能显著影响收率,而且pH和填料、Cond和填料之间还存在显著的交互作用(图二)。

图二

借助预测刻画器,我们很轻松就可以知道,如果想进一步提高收率,就应该提高pH和Cond的值,而且填料A明显优于填料B。

全部评论