首页 > 论文导航 > 医学
医学研究中交互作用综述
 
更新日期:2021-03-08   来源: 医学研究   浏览次数:166   在线投稿
 

核心提示:随着个体化治疗和精准医学的兴起,如何从广泛群体中发现不同亚人群的异质性是现代医学的终极问题和目标,由此开展更有针对性的精

 
随着个体化治疗和精准医学的兴起,如何从广泛群体中发现不同亚人群的异质性是现代医学的终极问题和目标,由此开展更有针对性的精准预防和治疗可以得到更大的成本效益。解决此问题的出发点就是寻找病因学和人群健康效应异质性的原因,从统计学的角度看解决此类问题的方法之一就是寻找交互作用,以确定对不同卫生干预措施有显著健康收益的亚组[1-3]。 医学研究中交互作用研究的结局通常是二分类变量,如疾病或某个事件是否发生。研究因素可以为二分类变量、多分类变量、等级变量或数值变量。最常见的是研究两个变量对于结局的交互作用,称之为一阶交互作用(one-order interaction 或 two-way interaction),研究方法和理论大多可以推广到高阶交互作用,但高阶交互作用不易解释。Rothman[4]指出交互作用的概念难于理解有两个原因,一个是因为交互作用依赖于分析尺度(measure scale)。另一个原因是交互作用在统计学、生物学和公共卫生等不同背景下都曾出现,在提出初期产生大量的争论,原因就是未能区别这些概念。为此,本文重点综述一阶统计交互作用的相关内容。 交互作用的概念 1.交互作用的定义 MacMahon(1970)[5]定义交互作用为两个或两个以上危险因素存在时,疾病的发生率不同于这些因素单独作用时所估计的累积发病率。定义的核心是一个因素的效应大小会随着另一个因素的水平而变化。反之,如果两个因素没有交互作用,那么,一个因素的效应大小在另一个因素的不同水平之间是相同的。 交互作用的定义常见于统计学或流行病学教科书或软件程序中(尤其是方差分析或回归分析中)。统计交互作用(statistical interaction)有时被称为效应修饰(effect modification),一些教科书认为两者等价。但VanderWeele和Knol[6-7]指出交互作用和效应修饰在混杂的控制上不同,效应修饰的同义词是调节效应(moderation)和效应异质(effect heterogeneity)。在交互作用分析中,有交互作用的两个因素都是研究者感兴趣的,且二者的混杂因素均得到控制;而在分析效应修饰时,研究者感兴趣的只有一个因素,且不需要控制另一个因素的混杂。当没有混杂时,统计交互作用等价于效应修饰[4]。 2.交互作用的分类 交互作用按照效应累积方式或效应尺度分为相加交互作用(additive interaction,亦称可加交互作用)和相乘交互作用(multiplicative interaction,亦称可乘交互作用)两类。按照作用方向可以分为协同作用(synergism,亦称正交互,positive interaction)和拮抗作用(antagonism,亦称负交互,negative interaction)。以结局和2个自变量均为二分类变量为例说明两种分类之间的关系,见表1。设pAB=P(D=1|A=a,B=b)表示感兴趣的二分类因素A和B分别取值为a和b时结局D发生的平均风险,其中,a,b均取值0或1,0表示未暴露于研究因素,1表示暴露于研究因素。假设因素A和B是对等的,即互换A和B不影响结论。 表1 交互作用类型的判定拮抗作用/负交互无交互作用协同作用/正交互相加交互作用p11-p10-p01+p00<0,次可加(sub-additive)p11-p10-p01+p00=0,可加(perfect additive)p11-p10-p01+p00>0,超可加(super-additive)相乘交互作用01,超可乘(super-multiplicative) 相加交互作用基于风险差(risk difference,RD)尺度,即交互作用估计为: (p11-p00)-[(p10-p00)+(p01-p00)]=p11-p10-p01+p00 也称为交互对比指标(interaction contrast,IC),衡量风险的绝对变化,可用于干预效果评价,具有公共卫生学意义。如果因素A和B对结局的效应可加,由(1)式可知:p11-p00=(p10-p00)+(p01-p00),表明风险差尺度上,同时暴露于因素A和B时的风险增量是分别暴露于因素A和B的风险增量的简单相加,这就是可加的含义。如果因素A和B对结局的效应在风险差尺度上有协同作用,则p11-p00>(p10-p00)+(p01-p00),表明风险差尺度上,同时暴露于因素A和B时的风险增量大于分别暴露于因素A和B的风险增量的和。如果因素A和B对结局的效应在风险差尺度上有拮抗作用,则p11-p00<(p10-p00)+(p01-p00),表明风险差尺度上,同时暴露于因素A和B时的风险增量小于分别暴露于因素A和B的风险增量的和。 相乘交互作用基于风险比(risk ratio,RR)尺度,即交互作用估计为: 衡量风险的相对变化,可用于病因学中危险因素评价,具有病因学意义。如果因素A和B对结局的效应可乘,由(2)式可知:p11/p00=(p10/p00)(p01/p00),表明风险比尺度上,同时暴露于因素A和B时的风险增量是分别暴露于因素A和B的风险增量的简单相乘,这就是可乘的含义。同理可以在风险比尺度上定义拮抗和协同作用。 3.相加交互作用与相乘交互作用的关系 (1)一个因素的效应在另外一个因素的不同水平上方向相反,则交互作用不依赖于效应尺度。假设因素B对结局在A=1时有正向作用,在A=0时有非正向作用,则p11-p10>0,p01-p00≤0,则p11-p10-p01+p00>0,两种尺度上均有正向交互作用。同理可以推出因素B对结局在A=1时有负向作用,在A=0时有非负向作用时,两种尺度上均有负向交互作用。VanderWeele和Knol[7]称之为定性交互作用。 [特例1]只要其中一个因素对结局单独无效应时,交互作用不依赖于效应尺度。假设因素B单独对结局没有效应,即p01=p00,代入(1)式得p11-p10,代入(2)式得p11/p10。此时,若p11=p10(即因素A发生时,因素B对结局无效应),则两个尺度上都不存在交互效应;若p11≠p10(即因素A发生时,因素B对结局有效应),则两个尺度上都存在交互效应,VanderWeele和Knol[7]称之为纯交互作用。 [特例2]如果因素A和B对结局都没有效应,即p10=p01=p00,代入(1)式得p11-p00,代入(2)式得p11/p00。此时,若p11=p00(即因素A和B都发生时对结局无效应),则两个尺度上都不存在交互效应;若p11≠p00(即因素A和B都发生时对结局有效应),则两个尺度上都存在交互效应,统计文献中称之为纯交互作用[8-9]。 (2)如果因素A和B的效应是可加的也是可乘的(即两个尺度均无交互作用),则两个因素中至少一个对结局无效。因为 在第一个等式中除以p00,并把p11/p00=(p10/p00)(p01/p00)代入其中,得到 (p10/p00)(p01/p00)-p10/p00-p01/p00+1=0 求解可以得到p10/p00=1(即因素A无效应)或p01/p00=1(即因素B无效应)。 (3)当两个因素对于结局均有效应时,相加交互作用和相乘交互作用中必有一个存在。因为此时(3)式中两个等式不能同时成立。当因素A和B均为正向效应,相加交互作用和相乘交互作用的关系[10]如图1所示。当因素A和/或B对结局有负向效应时,改变赋值后,可以转化为正向效应。 图1 相加交互作用与相乘交互作用的关系 假设因素A和B对结局的单独效应均为5,两个效应可加时的联合效应为10,两个效应可乘时的联合效应为25。 (4)两个因素对于结局均有非零效应,如果效应在对数风险尺度可加,那么,效应在风险尺度一定不可加,反之亦然。因为对(2)式取对数后得到, 当没有相乘交互作用,即时,等价于lnp11-lnp10-lnp01+lnp00=0,这说明两个效应可乘等价于两个效应对数尺度可加。而如果两个因素对于结局均有非零效应,此时相加交互作用和相乘交互作用中必有一个存在,而效应在对数风险尺度可加等价于效应可乘,因此,此时一定存在相加交互作用,即风险尺度不可加。 (5)VanderWeele和Knol指出在具有非负主效应的对数线性模型中,如果风险比尺度上有正相乘交互作用,那么在风险差尺度上也会有正相加交互作用,但反之不一定成立[7]。 4.交互作用的研究意义 VanderWeele和Knol[7]指出,在资源有限的情况下,交互作用可以用于识别对某干预措施收益最大或反应最安全的人群(或亚组),寻找最优治疗方案,为个体提供个性化的精准干预。在一个主要暴露因素不容易施加干预的情况下,交互作用可用于识别最可能施加干预的协变量,以降低主要暴露因素的效应。此外,交互作用可揭示暴露影响疾病发生的机制,可提高评价某暴露对结局影响总效应的把握度。仅从纯统计学角度,包含交互作用项的模型拟合数据更好。 交互作用的国内外研究进展 Rothman[4]介绍了各种交互作用的概念及其区别与联系;讨论了因果交互模型中潜在结果模型和充分病因模型,以及二者的联系;介绍了识别和测量统计学交互作用的方法,以及基因-环境交互作用的常见类型及其识别方式。胡志斌等[11]系统地介绍了这些概念和方法。VanderWeele和Knol[7]撰写了一份教程,详细介绍了交互作用的研究意义、评价指标、分析与统计推断、程序实现、混杂控制、研究设计、样本量和功效计算、扩展与局限等。VanderWeele(2015)[12]在他的专著中全面介绍了交互作用、机制交互作用、交互作用的偏倚分析、遗传学中的交互作用、功效和样本量计算等内容。Hayes(2018)[13]介绍了二分类变量和多分类变量进行交互作用分析的基本方法和可视化方法,提供了分析用的SPSS和SAS宏程序,以及数据中心化和标准化等问题。本文从研究设计、分析模型、交互作用的筛选、评价指标、程序实现、结果报告几部分对交互作用进行回顾。 1.研究设计 探索性研究相加和相乘交互作用的设计包括:病例对照设计、队列研究和随机对照研究。此外,单纯病例设计可以估计相乘交互作用,但是不能估计两个因素的主效应。确定了研究的设计后,很重要的一步就是计算所需要的样本例数。检验交互作用需要的样本量比单个主效应需要的样本量大,一项模拟研究显示:两个因素的相乘交互作用所需的样本量至少是分析每个因素单独作用所需样本量的4倍[14]。 Gauderman(2002)[15]给出了匹配的病例对照设计、病例-同胞设计(case-sibling design)、病例-亲本设计(case-parent design)、单纯病例设计下,基于似然比检验相乘交互作用的样本量计算公式,并提供了计算软件QUANTO(http://biostats.usc.edu/Quanto.html)。 Demidenko(2008)[16]基于logistic回归中相乘交互项的Wald检验,给出了相乘交互作用样本量和功效计算的公式,被收录到PASS15.0 及以上版本中。该方法很容易推广到广义线性模型中,但是没有考虑协变量。VanderWeele(2012)[17]把该方法应用于logistic回归、对数线性模型、线性风险模型中相加交互作用的Wald检验,推导出了样本量和功效的计算公式,并提供了计算用Excel插件。通过比较发现,当两个暴露因素的效应为正,样本量相同时,发现正向相加交互作用的功效高于相乘交互作用。 验证交互作用的研究设计包括:析因设计、拉丁方设计、正交设计,这些研究设计的样本量计算和分析方法在数理统计和研究设计的教材[18]中有详细讲解,这里不再赘述。 2.分析模型 分析模型的选择与研究的设计有关,不同研究设计下模型的选择见表2。无论疾病的发病率大小,病例对照研究估计优势比(OR),能否近似队列研究估计风险比(RR)[19],取决于发病研究还是患病研究、人群来源、选择对照的抽样方式和潜在的假设。一般只有疾病为罕见病(发生率小于10%时)或采用发病密度抽样(incidence density sampling,巢式病例对照研究中常用的选择对照的方法)时,OR可以近似RR[12];对于常见病,OR会高估RR,且高估程度随着OR值增加呈指数变化[20],从而导致高估RERI(relative excess risk due to interaction,超额相对危险度,也被称为interaction contrast ratio,简称ICR)[21-22]。因此,在队列研究和随机对照研究中应报告RR,尽量避免报告OR[22]。 表2 不同研究设计下分析模型的选择研究类型相加交互作用相乘交互作用横断面调查罕见疾病:logistic回归常见疾病:线性比值模型罕见疾病:logistic回归常见疾病:对数线性模型病例对照研究不校正混杂:logistic回归或线性比值模型校正混杂:logistic回归logistic回归队列研究罕见疾病:logistic回归,Cox模型常见疾病:线性风险模型、Cox模型、对数线性模型罕见疾病:logistic回归,Cox模型常见疾病:对数线性模型、Cox模型单纯病例设计罕见疾病:logistic回归常见疾病:对数线性模型 logistic回归直接估计的是OR,能否应用于队列研究取决于疾病的发病率。Knol(2012)[23]模拟比较了8种logistic回归代替方法估计RR及其可信区间的准确度,根据结果推荐,只有一个或两个分类型协变量时,采用Mantel-Haenszel风险比方法;如果有多个分类型或连续型协变量,推荐采用对数二项式回归(log-binomial regression,也就是本文中的对数线性模型);如果对数二项式回归不收敛,推荐采用稳健估计标准误的泊松回归,但是二者均不能确保预测概率在0~1之间。当数据存在拟分离或完全分离的时候,logistic回归可能出现最大似然估计不存在,此时可以改用Firth估计或者精确估计法[24-25]。 线性风险模型、线性比值模型、对数线性模型和泊松回归不要求疾病为罕见病,但是可能出现最大似然估计不收敛的问题,尤其,当协变量为连续型变量的时候,不能确保预测概率在0~1之间[7],增加回归系数的约束条件可部分解决这个问题。SAS proc nlmixed中不易增加非线性约束,proc nlp可以增加非线性约束,但仍可能出现解不存在。此外,这两个过程需要指定初始值,为了让模型快速收敛,减少计算时间,可以用logistic回归的结果作为二者的初值。因为当模型不需校正协变量时,采用logistic回归和线性比值模型得到的结果一致。 3.交互作用的筛选 通常交互作用的分析需基于研究背景和专业知识,先找出可能导致效应产生异质性的因素,然后逐个进行统计检验。但是在探索性研究中先验知识很少或研究的因素特别多时,通常会依赖于统计方法来筛选和识别统计学交互作用,主要包含非参数方法、参数方法和贝叶斯方法三类。非参数方法中代表性的是多因子降维法[26](multifactor dimensional reduction,MDR),可以识别病例对照研究中的高阶交互效应,但不能分析连续变量,无法调整混杂因子。广义多因子降维法[27](generalized multifactor dimensional reduction,GMDR)和基于模型的MDR[28]弥补了MDR的以上缺点,但只能报告统计意义,不能直接给出效应估计。贝叶斯分析的计算量取决于MCMC算法的复杂性和样本量,由于计算量比较大,在高维交互效应的计算中研究较少。参数方法主要基于变量选择或变量筛选的方法来筛选一阶交互作用,它假定模型具有稀疏性,即真实情况下许多未知候选变量的回归系数为0或者接近0,因此,自变量的选择问题转化为确定正确的子模型的问题,且在选择变量的同时给出模型参数的估计。 变量筛选类方法按照适用范围可以分为解决高维问题的筛选方法[8,29]和极高维问题的方法[9,30],都适用于自变量大于样本量的情形,但前者通常能快速同时研究几百个变量,而后者可以研究更大量的变量。变量筛选类方法按照是否考虑主效应和交互作用的层次关系,即边际原则[31],可分为两类。边际原则是指模型中包含两个变量的交互项的时候,必需包含对应的一个或两个主效应。边际原则在一定程度上合理,可以大大缩小交互作用筛选的范围。把边际原则融入变量筛选过程的方法有三类:一阶段法[8,29],两阶段法[32-33]和迭代法[30]。而另一类没有考虑这个层次关系,认为纯交互作用在生物学上也是合理的[9]。 4.评价指标 相乘交互作用评价指标就是OR或RR的对数值,为logistic回归、对数线性模型、泊松回归和Cox模型中交互项的回归系数,直接通过判定回归系数是否为0就可以检验相乘交互作用。 Rothman[4]、VanderWeele和Knol[7]详细讲述了基于RR和OR的IC替代指标来评价可加交互作用:RERI、AP(attributable proportion due to interaction,归因比)和S(synergy index,协同作用指数)的计算和意义。这里,我们按照分析模型把这些指标的计算公式汇总于表3,其中假定了结局和2个自变量均为二分类变量,如果结局和自变量为多分类变量,可以通过设置哑变量转换为均为二分类的情况。 表3 不同模型下相加交互作用指标的计算*:x1和x2是感兴趣的有交互作用的两个因素,均为二分类变量,结局也为二分类变量,z为控制的混杂因素。指标计算公式线性风险模型logistic回归线性比值模型对数线性模型Cox模型模型x1=1 if j=10 if j=0 ,x2=1 if k=10 if k=0 Rjkz=a+b1x1+b2x2+b3x1x2+gz,其中a>0,b1>0,b2>0,gz>0.Rjkz=ea+b1x1+b2x2+b3x1x2+gz1+ea+b1x1+b2x2+b3x1x2+gzOjkz=a+b1x1+b2x2+b3x1x2+gz,其中a>0,b1>0,b2>0,gz>0.Rjkz=ea+b1x1+b2x2+b3x1x2+gz,λjkz(t)=λ0(t)ea+b1x1+b2x2+b3x1x2+gz条件风险Rjkz=P(Y=1|x1,x2,z)R00z=a+gzR10z=a+b1+gzR01z=a+b2+gzR11z=a+b1+b2+b3+gzR00z=ea+gz1+ea+gzR10z=ea+b1+gz1+ea+b1+gzR01z=ea+b2+gz1+ea+b2+gzR11z=ea+b1+b2+b3+gz1+ea+b1+b2+b3+gzR00z=ea+gz,R10z=ea+b1+gz,R01z=ea+b2+gz,R11z=ea+b1+b2+b3+gz,λ00z(t)=λ0(t)ea+gzλ10z(t)=λ0(t)ea+b1+gzλ01z(t)=λ0(t)ea+b2+gzλ11z(t)=λ0(t)ea+b1+b2+b3+gz风险差值(RD)Djkz=Rjkz-R00zD00z=0D10z=b1D01z=b2D11z=b1+b2+b3D00z=0D10z=ea+gz,(eb1-1)D01z=ea+gz,(eb2-1)D11z=ea+gz,(eb1+b2+b3-1)D00z=0D10z(t)=λ0(t)ea+gz(eb1-1)D01z(t)=λ0(t)ea+gz(eb2-1)D11z(t)=λ0(t)ea+gz(eb1+b2+b3-1)相对风险(RR)RRjkz=Rjkz/R00zRR00z=1RR10z=1+b1a+gzRR01z=1+b2a+gzRR11z=1+b1+b2+b3a+gzRR00z=1RR10z=eb1RR01z=eb2RR11z=eb1+b2+b3HR00z=1HR10z=eb1HR01z=eb2HR11z=eb1+b2+b3比值oddsOjkz=Rjkz/(1-Rjkz)O00z=ea+gzO10z=ea+b1+gzO01z=ea+b2+gzO11z=ea+b1+b2+b3+gzO00z=a+gzO10z=a+b1+gzO01z=a+b2+gzO11z=a+b1+b2+b3+gz优势比Odds ratio(OR)ORjkz=Ojkz/O00zOR00z=1OR10z=eb1OR01z=eb2OR11z=eb1+b2+b3OR00z=1OR10z=1+b1a+gzOR01z=1+b2a+gzOR11z=1+b1+b2+b3a+gz交互对比指标ICD11z-D10z-D01z=R11z-R10z-R01z+R00zb3超额相对危险度RERIRERIz=R11z-R10z-R01z+R00zR00z=RR11z-RR10z-RR01z+1RERIz=b3a+gz用OR近似RR得到,RERIz=eb1+b2+b3-eb1-eb2+1用OR近似RR得到,RERIz=b3a+gzRERIz=eb1+b2+b3-eb1-eb2+1用HR近似RR得到,RERIz=eb1+b2+b3-eb1-eb2+1归因比APAPz=R11z-R10z-R01z+R00zR11z=RR11z-RR10z-RR01z+1RR11z=RERIzRR11zAPz=b3a+b1+b2+b3+gz用OR近似RR得到,APz=eb1+b2+b3-eb1-eb2+1eb1+b2+b3用OR近似RR得到,APz=b3a+b1+b2+b3+gzAPz=eb1+b2+b3-eb1-eb2+1eb1+b2+b3用HR近似RR得到,APz=eb1+b2+b3-eb1-eb2+1eb1+b2+b3协同作用指数SSz=R11z-R00z(R10z-R00z)+(R01z-R00z)=RR11z-1(RR10z-1)+(RR01z-1)Sz=b1+b2+b3b1+b2用OR近似RR得到,Sz=eb1+b2+b3-1eb1+eb2-2用OR近似RR得到,Sz=b1+b2+b3b1+b2Sz=eb1+b2+b3-1eb1+eb2-2用HR近似RR得到,Sz=eb1+b2+b3-1eb1+eb2-2 RERI反映归因交互作用引起的相对危险度;AP反映在两因素同时存在时,它们的总效应中归因于交互作用的部分所占的比例;S反映的是两因素同时存在时的效应与两因素独立效应和的比值。这里有几点需要说明: (1)AP和S是比值形式,因此,需要先取对数再计算可信区间,然后对上下限取幂后得到AP和S的可信区间[34]。 (2)RERI和AP的可信区间不包含0,S的可信区间不包含1,则说明存在相加交互作用,以排除抽样误差引入的偏倚。 (3)RERI不为0,说明存在相加交互作用,但是RERI等于0,也可能存在相互抵消的相加交互作用[4]。 (4)这三个指标适用于评价危险因素的相加交互作用,对于保护因素,赋值应以最低风险的一类为参照,否则,可能导致三个指标的结果解释方向不一致[35-36]。 (5)存在混杂因素的情况下,采用logistic回归、对数线性模型、Cox模型估计的三个指标与混杂因素无关;线性风险模型和线性比值模型中S的估计不因混杂因素的水平而变化,但是RERI和AP的估计与混杂因素的取值有关,因此,得到的估计不唯一[37]。 Skrondal(2003)[37]通过模拟研究说明,在病例对照研究中,线性比值模型比logistic回归得到的S的可信区间覆盖率高,尤其当协变量效应较强时。而VanderWeele和Vansteelandt(2011)[23]提出在病例对照研究中采用边际结构模型中逆概率加权的方法来估计相加交互作用。 Li和Chambless(2007)[38]等在Cox模型中模拟比较三个指标评价相加交互作用的性能,结果显示RERI的估计值最接近真值,覆盖率最接近95%,S的稳定性最差,原因是S的分母可能接近0。Zou(2008)[21]通过模拟研究发现,MOVER法下RERI的覆盖率最佳,S的覆盖率不理想,通过计算ln(1-AP)的可信区间可以改善AP的覆盖率。采用Wald法计算可信区间,需假定指标服从正态分布,而AP和S是比值型指标,相比于RERI更容易偏离正态分布。因此,如果采用Wald法计算可信区间,RERI可能比AP和S更可靠。 5.程序实现 Spiegelman等[39]给出SAS PROC GENMOD实现稳健估计标准误的泊松回归、对数二项式回归的程序,可在此基础上实现可加交互作用和相乘交互作用的计算。但通常不能直接得到可加交互作用的三个指标及其可信区间,需要编程实现。可信区间估计方法主要有3类:基于delta方法计算三个指标的方差后采用Wald法计算可信区间、bootstrap类方法和基于似然比统计量的可信区间,不同模型下的软件实现见表4汇总。 表4 文献中不同相加风险模型下实现RERI的95%可信区间计算的软件汇总模型Wald法Bootstrap似然比logistic回归excel[6,41]、SAS[7,42-43]、R[41-44]、Stata[7]SPLUS[45],SAS[46]SAS[43,47]线性风险模型WinBUGS[48]线性比值模型SAS[47,49],Stata[49],WinBUGS[48]SAS[47,49]Cox模型SAS[38,47]SPLUS[22]SAS[47] 针对结局和关注的因素均为二分类情形,Hosmer和Lemeshow(1992)[34]采用delta方法计算RERI、AP和S的方差,最早给出了logistic回归模型中这三个指标的可信区间计算公式,向惠云(1999)[40]等介绍了该方法。为了便于应用,Andersson(2005)[41]编制了一个excel表格,以SAS、Stata、SPSS中logistic回归或Cox回归输出的主效应和交互效应的回归系数、协方差矩阵为输入,计算这三个指标的点估计及其可信区间,并给出可视化图形。邱宏(2008)[36]等介绍了SPSS输出结果与此excel表格的结合使用。 Assmann(1996)[50]等模拟比较了3种bootstrap可信区间方法(Wald型可信区间、百分位数法和Hamilton百分位数法)与Wald法,结果显示百分位数法得到的区间估计最优。Knol(2007)[45]把相加交互作用的评价扩展到了一个或两个因素为连续变量,提供了SPLUS程序,参考Assmann[50]的结果,推荐BCa可信区间,因为可以校正bootstrap方法过拟合引入的偏倚。Kuss(2010)[43]用SAS软件proc nlmixed和proc nlp分别实现了logistic回归中RERI及其可信区间计算,二者分别采用Wald法和似然比方法计算可信区间。 Nie(2010)[46]指出如果观测数据有频数为0的格子时,Wald方法中的极大似然估计、Zou的方法和基于似然比的方法的估计都不存在。即使观测数据没有频数为0的格子,数据稀疏(sparse)或四个格子的样本量不均时,重抽样(bootstrap)得到的数据可能有频数为0的格子,会导致RERI的可信区间估计不存在或很宽。因此,提出了连续校正的参数和非参数方法计算RERI的可信区间,并提供了SAS程序。模拟研究结果显示,与基于似然的方法[49]、Zou[21]的方法比较,当数据稀疏的时候,采用连续性校正得到的可信区间更合理。 针对logistic回归中二分类变量、无序多分类变量、连续变量和有序多分类变量的交互作用,VanderWeele和Knol(2014)[7]给出了基于Wald法的Stata和SAS程序。Mathur和VanderWeele[44](2018)编写了一个R函数additive_interactions,要求结局和感兴趣的因素均为二分类变量,可以调用glm函数的结果计算RERI和AP及其可信区间和P值,同时检验机制交互作用。 综上,当样本量大,数据不稀疏时,三种可信区间计算方法的结果很接近[49]。当存在数据稀疏问题时,采用连续校正后的bootstrap方法得到的结果更可靠[46]。当感兴趣的因素中有一个为连续变量时,可信区间的估计建议采用bootstrap方法[36,45]。 6.结果报告 Knol和VanderWeele[6]给出了交互作用分析推荐报告的内容和表格模板(表5),包含4部分:(1)相对于一个参照组的率差、率比或优势比(RD/RR/OR);(2)按一个因素分层后,另一个因素的率差、率比或优势比(RD/RR/OR);(3)相乘或相加交互作用指标及其95%CI;(4)暴露因素的混杂控制。需要说明的是,表5针对的是交互效应的分析,如果需要报告效应修饰的结果,假设因素A是我们感兴趣的因素,因素B是效应修饰因子,那么只需要去掉表5中最后一行的结果。由于大多数交互作用的分析是基于观察性资料的探索性研究,结果报告还需要遵循STROBE声明[51-53],Knol和VanderWeele[6]给出的报告模板符合STROBE声明中关于交互作用分析的要求。 表5 Knol和VanderWeele 推荐的分析A和B的交互作用结果报告模板A=0N是/否发生结局RR/OR/RD(95%CI)P值A=1N是/否发生结局RR/OR/RD(95%CI);P值按B分层后比较A=1与A=0RR/OR/RD(95%CI);P 值B=01(参照组)B=1按A分层比较B=1 与 B=0RR/OR/RD(95%CI);P值 相加交互作用:指标(95%CI),P值;相乘交互作用:指标(95%CI),P值;计算RR/OR/RD校正的协变量有。 这里,我们以一项ALDH2 rs671基因与体力活动的交互作用对冠心病风险影响的研究[54]为例展示表格模板的使用和结果解释(表6),该研究为2013年在浙江宁波开展的一项巢式病例对照研究,其中,冠心病患者161例,对照495例。结果显示,控制混杂后久坐或轻度体力活动的ALDH2 rs671风险等位基因携带者(A/A或A/G)发生冠心病的风险显著高于其他三组,RERI(95%CI)为0.933(0.021~1.845)表示:在风险差值尺度上,久坐或轻度体力活动的ALDH2 rs671风险等位基因携带者(A/A或A/G)发生冠心病的风险增量高于这两个因素单独作用时风险增量的和。尽管原文没有报告相乘交互作用结果,但根据表6可知,携带ALDH2 rs671风险等位基因与体力活动不足单独并没有增加冠心病风险,而两者同时存在时显著增加冠心病风险,根据上文的特例2,ALDH2 rs671基因与体力活动为纯交互作用,因而,相乘交互作用也一定存在,即久坐或轻度体力活动与携带ALDH2 rs671风险等位基因在相乘和相加尺度均有协同作用。 表6 ALDH2 rs671 SNP与体力活动对冠心病的交互作用体力活动ALDH2 rs671 SNP基因型非风险等位基因携带者(G/G)N病例/对照OR(95%CI);P值风险等位基因携带者(A/A或A/G)N病例/对照OR(95%CI);P值分层比较等位基因OR(95%CI);P值中/重度12/5919/490.793(0.299~2.101)P=0.6400.793(0.299~2.101)P=0.640久坐/轻度60/2151.345(0.669~2.701)P=0.40680/1722.071(1.013~4.234)P=0.0461.540(1.012~2.344)P=0.044分层比较体力活动OR(95%CI);P值1.345(0.669~2.701)P=0.4062.612(1.202~5.674)P=0.015 相加交互作用:RERI(95%CI)=0.933(0.021~1.845);Pvalue=0.045;相乘交互作用:未报告;计算OR校正的协变量有:年龄、性别、体重指数、收缩压、总胆固醇水平、甘油三酯水平、高密度值胆固醇水平、目前是否吸烟、目前是否饮酒、糖尿病史。 对于表格模板中第4部分暴露因素的混杂控制,VanderWeele和Knol[7]指出如果两个因素都是研究感兴趣的,那么需要同时控制这两个变量的混杂因素,此时,结果表示两个因素的交互作用;如果感兴趣的因素只有一个,那么控制该因素与结局的混杂因素,此时,结果应解释为效应异质或效应修饰,表5中应去掉最后一行。 另外,需要注意的是,未观测到的混杂对于结果也会产生影响,尤其是研究设计或数据收集中遗漏了重要的混杂因素时。而观察性研究中常用的混杂控制的方法:分层、匹配、协变量校正、倾向性评分[55]等只能控制观测到的混杂。未观测到的混杂对于结果的影响可以通过敏感性分析来探讨,VanderWeele(2012)[56]给出了相加和相乘交互作用的敏感性分析公式。敏感性分析结果也是STROBE声明[51-53]推荐报告的内容之一。 综上,在实际应用中,研究者应给出所研究的交互作用的明确定义和分析尺度,结合研究的设计类型和疾病特征,选择合适的统计模型、评价指标和统计程序,并按照推荐表格报告研究结果。 [1] 王波,李立明.科学看待精准医学的研究与进展.中华流行病学杂志,2017,38(1):1-2. [2] 王冬,Hu FB.从精准医学到精准公共卫生.中华内分泌代谢杂志,2016,32(9):711-715. [3] 吴伟旋,向前,许军,等.精准医学对慢性病防控的作用及发展策略.卫生经济研究,2017,(7):44-47. [4] Rothman KJ,Greenland S,Lash TL.Modern epidemiology.3rd ed.Wolters Kluwer Health/Lippincott Williams & Wilkins Philadelphia. [5] Rothman KJ.Interaction and evolution in epidemiology.Soz Praventivmed,2004,49(2):105-106. [6] Knol MJ,VanderWeele TJ.Recommendations for presenting analyses of effect modification and interaction.Int J Epidemiol,2012,41(2):514-520. [7] VanderWeele TJ,Knol MJ.A tutorial on interaction.Epidemiologic Methods,2014,3(1):33-72. [8] Lim M,Hastie T.Learning interactions via hierarchical group-lasso regularization.J Comput Graph Stat,2015,24(3):627-654. [9] Fan Y,Kong Y,Li D,et al.Interaction pursuit with feature screening and selection.arXiv preprint arXiv:1605.08933,2016. [10] Hosmer JDW,Lemeshow S,Sturdivant RX.Applied Logistic Regression.3rd ed.John Wiley & Sons,Inc. [11] 谭红专,现代流行病学.第3版.2018,人民卫生出版社. [12] VanderWeele T.Explanation in causal inference:methods for mediation and interaction.Oxford University Press. [13] Hayes AF.Introduction to mediation,moderation,and conditional process analysis:A regression-based approach.2nd ed.The Guilford Press. [14] Smith PG,Day NE.The design of case-control studies:the influence of confounding and interaction effects.Int J Epidemiol,1984,13(3):356-365. [15] Gauderman WJ.Sample size requirements for matched case-control studies of gene-environment interaction.Stat Med,2002,21(1):35-50. [16] Demidenko E.Sample size and optimal design for logistic regression with binary interaction.Stat Med,2008,27(1):36-46. [17] VanderWeele TJ.Sample Size and Power Calculations for Additive Interactions.Epidemiol Methods,2012,1(1):159-188. [18] 孙振球,徐勇勇,医学统计学.第4版.2016,人民卫生出版社. [19] Knol MJ,Vandenbroucke JP,Scott P,et al.What do case-control studies estimate? Survey of methods and assumptions in published case-control research.Am J Epidemiol,2008,168(9):1073-1081. [20] Schmidt CO,Kohlmann T.When to use the odds ratio or the relative risk.Int J Public Health,2008,53(3):165-167. [21] Zou GY.On the estimation of additive interaction by use of the four-by-two table and beyond.Am J Epidemiol,2008,168(2):212-224. [22] 潘金仁,陈坤.队列研究资料相加交互作用可信区间的Bootstrap法估计.中华流行病学杂志,2010,31(7):808-811. [23] Knol MJ,Cessie SL,Algra A,et al.Overestimation of risk ratios by odds ratios in trials and cohort studies:alternatives to logistic regression.CMAJ,2012,184(8):895-899. [24] 张彦荣,王彤.关于Logistic回归中最大似然估计的可估性.现代预防医学,2009,36(10):1807-1809. [25] 顾彩姣,韩婷,王慧,等.解决Logistic回归中分离问题的统计方法比较.中华疾病控制杂志,2016,20(3):307-311. [26] 唐迅,李娜,陈大方,等.多因子降维法分析基因-基因交互作用的应用进展.中华流行病学杂志,2007,28(9):918-921. [27] 陈卿,唐迅,胡永华.应用广义多因子降维法分析数量性状的交互作用.中华流行病学杂志,2010,31(8):938-941. [28] 范伟,沈超,郭志荣.基于模型的多因子降维方法在基因-基因/环境交互作用分析中的应用.中华流行病学杂志,2015,36(11):1305-1310. [29] Bien J,Taylor J,Tibshirani R.A lasso for hierarchical interactions.Annals of statistics,2013,41(3):1111. [30] Hao N,Feng Y,Zhang HH.Model selection for high-dimensional quadratic regression via regularization.Journal of the American Statistical Association,2018,113(522):615-625. [31] Nelder J.A reformulation of linear models.Journal of the Royal Statistical Society:Series A(General),1977,140(1):48-63. [32] Hao N,Zhang HH.Interaction screening for ultrahigh-dimensional data.Journal of the American Statistical Association,2014,109(507):1285-1301. [33] Hao N,Zhang HH.A note on high-dimensional linear regression with interactions.The American Statistician,2017,71(4):291-297. [34] Hosmer DW,Lemeshow S.Confidence interval estimation of interaction.Epidemiology,1992,3(5):452-456. [35] Knol MJ,VanderWeele TJ,Groenwold RH,et al.Estimating measures of interaction on an additive scale for preventive exposures.Eur J Epidemiol,2011,26(6):433-438. [36] 邱宏,余德新,王晓蓉,等.logistic回归模型中交互作用的分析及评价.中华流行病学杂志,2008,29(9):934-937. [37] Skrondal A.Interaction as departure from additivity in case-control studies:a cautionary note.Am J Epidemiol,2003,158(3):251-258. [38] Li R,Chambless L.Test for additive interaction in proportional hazards models.Ann Epidemiol,2007,17(3):227-236. [39] Spiegelman D,Hertzmark E.Easy SAS calculations for risk or prevalence ratios and differences.Am J Epidemiol,2005,162(3):199-200. [40] 向惠云,余松林,孙奕,等.疾病资料多元分析中交互作用指标及可信区间的估计.中国卫生统计,1999,16(3):130-132. [41] Andersson T,Alfredsson L,Kallberg H,et al.Calculating measures of biological interaction.Eur J Epidemiol,2005,20(7):575-579. [42] Lundberg M,Fredlund P,Hallqvist J,et al.A SAS program calculating three measures of interaction with confidence intervals.Epidemiology,1996,7(6):655-656. [43] Kuss O,Schmidt-Pokrzywniak A,Stang A.Confidence intervals for the interaction contrast ratio.Epidemiology,2010,21(2):273-274. [44] Mathur MB,VanderWeele TJ.R Function for Additive Interaction Measures.Epidemiology,2018,29(1):e5-e6. [45] Knol MJ,VanderWede TJ,Grobbee DE,et al.Estimating interaction on an additive scale between continuous determinants in a logistic regression model.Int J Epidemiol,2007,36(5):1111-1118. [46] Nie L,Chu H,Li F,et al.Relative excess risk due to interaction:resampling-based confidence intervals.Epidemiology,2010,21(4):552-556. [47] 聂志强,欧艳秋,庄建,等.实现logistic与Cox回归相乘相加交互作用的临床实践宏程序.中华流行病学杂志,2016,37(5):737-740. [48] Chu H,Nie L,Cole SR.Estimating the relative excess risk due to interaction:a bayesian approach.Epidemiology,2011,22(2):242-248. [49] Richardson DB,Kaufman JS.Estimation of the relative excess risk due to interaction and associated confidence bounds.American journal of epidemiology,2009,169(6):756-760. [50] Assmann SF,Hosmer DW,Lemeshow S,et al.Confidence intervals for measures of interaction.Epidemiology,1996,7(3):286-290. [51] Von Elm E,Altman DG,Egger M,et al.The Strengthening the Reporting of Observational Studies in Epidemiology(STROBE)statement:guidelines for reporting observational studies.Annals of internal medicine,2007,147(8):573-577. [52] 詹思延.第三讲:如何报告观察性流行病学研究:国际报告规范STROBE解读.中国循证儿科杂志,2010,5(3):223-227. [53] Vandenbroucke JP,Von Elm E,Altman DG,et al.Strengthening the Reporting of Observational Studies in Epidemiology(STROBE):explanation and elaboration.PLoS medicine,2007,4(10):e297. [54] Huang L,Cai X,Lian F,et al.Interactions between ALDH2 rs671 polymorphism and lifestyle behaviors on coronary artery disease risk in a Chinese Han population with dyslipidemia:A guide to targeted heart health management.Environ Health Prev Med,2018,23(1):29. [55] Agoritsas T,Merglen A,Shah ND,et al.Adjusted Analyses in Studies Addressing Therapy and Harm:Users' Guides to the Medical Literature.JAMA,2017,317(7):748-759. [56] VanderWeele TJ,Mukherjee B,Chen J.Sensitivity analysis for interactions under unmeasured confounding.Stat Med,2012,31(22):2552-2564. 随着个体化治疗和精准医学的兴起,如何从广泛群体中发现不同亚人群的异质性是现代医学的终极问题和目标,由此开展更有针对性的精准预防和治疗可以得到更大的成本效益。解决此问题的出发点就是寻找病因学和人群健康效应异质性的原因,从统计学的角度看解决此类问题的方法之一就是寻找交互作用,以确定对不同卫生干预措施有显著健康收益的亚组[1-3]。医学研究中交互作用研究的结局通常是二分类变量,如疾病或某个事件是否发生。研究因素可以为二分类变量、多分类变量、等级变量或数值变量。最常见的是研究两个变量对于结局的交互作用,称之为一阶交互作用(one-order interaction 或 two-way interaction),研究方法和理论大多可以推广到高阶交互作用,但高阶交互作用不易解释。Rothman[4]指出交互作用的概念难于理解有两个原因,一个是因为交互作用依赖于分析尺度(measure scale)。另一个原因是交互作用在统计学、生物学和公共卫生等不同背景下都曾出现,在提出初期产生大量的争论,原因就是未能区别这些概念。为此,本文重点综述一阶统计交互作用的相关内容。交互作用的概念1.交互作用的定义MacMahon(1970)[5]定义交互作用为两个或两个以上危险因素存在时,疾病的发生率不同于这些因素单独作用时所估计的累积发病率。定义的核心是一个因素的效应大小会随着另一个因素的水平而变化。反之,如果两个因素没有交互作用,那么,一个因素的效应大小在另一个因素的不同水平之间是相同的。交互作用的定义常见于统计学或流行病学教科书或软件程序中(尤其是方差分析或回归分析中)。统计交互作用(statistical interaction)有时被称为效应修饰(effect modification),一些教科书认为两者等价。但VanderWeele和Knol[6-7]指出交互作用和效应修饰在混杂的控制上不同,效应修饰的同义词是调节效应(moderation)和效应异质(effect heterogeneity)。在交互作用分析中,有交互作用的两个因素都是研究者感兴趣的,且二者的混杂因素均得到控制;而在分析效应修饰时,研究者感兴趣的只有一个因素,且不需要控制另一个因素的混杂。当没有混杂时,统计交互作用等价于效应修饰[4]。2.交互作用的分类交互作用按照效应累积方式或效应尺度分为相加交互作用(additive interaction,亦称可加交互作用)和相乘交互作用(multiplicative interaction,亦称可乘交互作用)两类。按照作用方向可以分为协同作用(synergism,亦称正交互,positive interaction)和拮抗作用(antagonism,亦称负交互,negative interaction)。以结局和2个自变量均为二分类变量为例说明两种分类之间的关系,见表1。设pAB=P(D=1|A=a,B=b)表示感兴趣的二分类因素A和B分别取值为a和b时结局D发生的平均风险,其中,a,b均取值0或1,0表示未暴露于研究因素,1表示暴露于研究因素。假设因素A和B是对等的,即互换A和B不影响结论。表1 交互作用类型的判定拮抗作用/负交互无交互作用协同作用/正交互相加交互作用p11-p10-p01+p00<0,次可加(sub-additive)p11-p10-p01+p00=0,可加(perfect additive)p11-p10-p01+p00>0,超可加(super-additive)相乘交互作用0<p11p00p10p01<1,次可乘(sub-multiplicative)p11p00p10p01=1,可乘(perfect multiplicative)p11p00p10p01>1,超可乘(super-multiplicative)相加交互作用基于风险差(risk difference,RD)尺度,即交互作用估计为:(p11-p00)-[(p10-p00)+(p01-p00)]=p11-p10-p01+p00(1)也称为交互对比指标(interaction contrast,IC),衡量风险的绝对变化,可用于干预效果评价,具有公共卫生学意义。如果因素A和B对结局的效应可加,由(1)式可知:p11-p00=(p10-p00)+(p01-p00),表明风险差尺度上,同时暴露于因素A和B时的风险增量是分别暴露于因素A和B的风险增量的简单相加,这就是可加的含义。如果因素A和B对结局的效应在风险差尺度上有协同作用,则p11-p00>(p10-p00)+(p01-p00),表明风险差尺度上,同时暴露于因素A和B时的风险增量大于分别暴露于因素A和B的风险增量的和。如果因素A和B对结局的效应在风险差尺度上有拮抗作用,则p11-p00<(p10-p00)+(p01-p00),表明风险差尺度上,同时暴露于因素A和B时的风险增量小于分别暴露于因素A和B的风险增量的和。相乘交互作用基于风险比(risk ratio,RR)尺度,即交互作用估计为:(2)衡量风险的相对变化,可用于病因学中危险因素评价,具有病因学意义。如果因素A和B对结局的效应可乘,由(2)式可知:p11/p00=(p10/p00)(p01/p00),表明风险比尺度上,同时暴露于因素A和B时的风险增量是分别暴露于因素A和B的风险增量的简单相乘,这就是可乘的含义。同理可以在风险比尺度上定义拮抗和协同作用。3.相加交互作用与相乘交互作用的关系(1)一个因素的效应在另外一个因素的不同水平上方向相反,则交互作用不依赖于效应尺度。假设因素B对结局在A=1时有正向作用,在A=0时有非正向作用,则p11-p10>0,p01-p00≤0,则p11-p10-p01+p00>0,两种尺度上均有正向交互作用。同理可以推出因素B对结局在A=1时有负向作用,在A=0时有非负向作用时,两种尺度上均有负向交互作用。VanderWeele和Knol[7]称之为定性交互作用。[特例1]只要其中一个因素对结局单独无效应时,交互作用不依赖于效应尺度。假设因素B单独对结局没有效应,即p01=p00,代入(1)式得p11-p10,代入(2)式得p11/p10。此时,若p11=p10(即因素A发生时,因素B对结局无效应),则两个尺度上都不存在交互效应;若p11≠p10(即因素A发生时,因素B对结局有效应),则两个尺度上都存在交互效应,VanderWeele和Knol[7]称之为纯交互作用。[特例2]如果因素A和B对结局都没有效应,即p10=p01=p00,代入(1)式得p11-p00,代入(2)式得p11/p00。此时,若p11=p00(即因素A和B都发生时对结局无效应),则两个尺度上都不存在交互效应;若p11≠p00(即因素A和B都发生时对结局有效应),则两个尺度上都存在交互效应,统计文献中称之为纯交互作用[8-9]。(2)如果因素A和B的效应是可加的也是可乘的(即两个尺度均无交互作用),则两个因素中至少一个对结局无效。因为(3)在第一个等式中除以p00,并把p11/p00=(p10/p00)(p01/p00)代入其中,得到(p10/p00)(p01/p00)-p10/p00-p01/p00+1=0求解可以得到p10/p00=1(即因素A无效应)或p01/p00=1(即因素B无效应)。(3)当两个因素对于结局均有效应时,相加交互作用和相乘交互作用中必有一个存在。因为此时(3)式中两个等式不能同时成立。当因素A和B均为正向效应,相加交互作用和相乘交互作用的关系[10]如图1所示。当因素A和/或B对结局有负向效应时,改变赋值后,可以转化为正向效应。图1 相加交互作用与相乘交互作用的关系假设因素A和B对结局的单独效应均为5,两个效应可加时的联合效应为10,两个效应可乘时的联合效应为25。(4)两个因素对于结局均有非零效应,如果效应在对数风险尺度可加,那么,效应在风险尺度一定不可加,反之亦然。因为对(2)式取对数后得到,当没有相乘交互作用,即时,等价于lnp11-lnp10-lnp01+lnp00=0,这说明两个效应可乘等价于两个效应对数尺度可加。而如果两个因素对于结局均有非零效应,此时相加交互作用和相乘交互作用中必有一个存在,而效应在对数风险尺度可加等价于效应可乘,因此,此时一定存在相加交互作用,即风险尺度不可加。(5)VanderWeele和Knol指出在具有非负主效应的对数线性模型中,如果风险比尺度上有正相乘交互作用,那么在风险差尺度上也会有正相加交互作用,但反之不一定成立[7]。4.交互作用的研究意义VanderWeele和Knol[7]指出,在资源有限的情况下,交互作用可以用于识别对某干预措施收益最大或反应最安全的人群(或亚组),寻找最优治疗方案,为个体提供个性化的精准干预。在一个主要暴露因素不容易施加干预的情况下,交互作用可用于识别最可能施加干预的协变量,以降低主要暴露因素的效应。此外,交互作用可揭示暴露影响疾病发生的机制,可提高评价某暴露对结局影响总效应的把握度。仅从纯统计学角度,包含交互作用项的模型拟合数据更好。交互作用的国内外研究进展Rothman[4]介绍了各种交互作用的概念及其区别与联系;讨论了因果交互模型中潜在结果模型和充分病因模型,以及二者的联系;介绍了识别和测量统计学交互作用的方法,以及基因-环境交互作用的常见类型及其识别方式。胡志斌等[11]系统地介绍了这些概念和方法。VanderWeele和Knol[7]撰写了一份教程,详细介绍了交互作用的研究意义、评价指标、分析与统计推断、程序实现、混杂控制、研究设计、样本量和功效计算、扩展与局限等。VanderWeele(2015)[12]在他的专著中全面介绍了交互作用、机制交互作用、交互作用的偏倚分析、遗传学中的交互作用、功效和样本量计算等内容。Hayes(2018)[13]介绍了二分类变量和多分类变量进行交互作用分析的基本方法和可视化方法,提供了分析用的SPSS和SAS宏程序,以及数据中心化和标准化等问题。本文从研究设计、分析模型、交互作用的筛选、评价指标、程序实现、结果报告几部分对交互作用进行回顾。1.研究设计探索性研究相加和相乘交互作用的设计包括:病例对照设计、队列研究和随机对照研究。此外,单纯病例设计可以估计相乘交互作用,但是不能估计两个因素的主效应。确定了研究的设计后,很重要的一步就是计算所需要的样本例数。检验交互作用需要的样本量比单个主效应需要的样本量大,一项模拟研究显示:两个因素的相乘交互作用所需的样本量至少是分析每个因素单独作用所需样本量的4倍[14]。Gauderman(2002)[15]给出了匹配的病例对照设计、病例-同胞设计(case-sibling design)、病例-亲本设计(case-parent design)、单纯病例设计下,基于似然比检验相乘交互作用的样本量计算公式,并提供了计算软件QUANTO(http://biostats.usc.edu/Quanto.html)。Demidenko(2008)[16]基于logistic回归中相乘交互项的Wald检验,给出了相乘交互作用样本量和功效计算的公式,被收录到PASS15.0 及以上版本中。该方法很容易推广到广义线性模型中,但是没有考虑协变量。VanderWeele(2012)[17]把该方法应用于logistic回归、对数线性模型、线性风险模型中相加交互作用的Wald检验,推导出了样本量和功效的计算公式,并提供了计算用Excel插件。通过比较发现,当两个暴露因素的效应为正,样本量相同时,发现正向相加交互作用的功效高于相乘交互作用。验证交互作用的研究设计包括:析因设计、拉丁方设计、正交设计,这些研究设计的样本量计算和分析方法在数理统计和研究设计的教材[18]中有详细讲解,这里不再赘述。2.分析模型分析模型的选择与研究的设计有关,不同研究设计下模型的选择见表2。无论疾病的发病率大小,病例对照研究估计优势比(OR),能否近似队列研究估计风险比(RR)[19],取决于发病研究还是患病研究、人群来源、选择对照的抽样方式和潜在的假设。一般只有疾病为罕见病(发生率小于10%时)或采用发病密度抽样(incidence density sampling,巢式病例对照研究中常用的选择对照的方法)时,OR可以近似RR[12];对于常见病,OR会高估RR,且高估程度随着OR值增加呈指数变化[20],从而导致高估RERI(relative excess risk due to interaction,超额相对危险度,也被称为interaction contrast ratio,简称ICR)[21-22]。因此,在队列研究和随机对照研究中应报告RR,尽量避免报告OR[22]。表2 不同研究设计下分析模型的选择研究类型相加交互作用相乘交互作用横断面调查罕见疾病:logistic回归常见疾病:线性比值模型罕见疾病:logistic回归常见疾病:对数线性模型病例对照研究不校正混杂:logistic回归或线性比值模型校正混杂:logistic回归logistic回归队列研究罕见疾病:logistic回归,Cox模型常见疾病:线性风险模型、Cox模型、对数线性模型罕见疾病:logistic回归,Cox模型常见疾病:对数线性模型、Cox模型单纯病例设计罕见疾病:logistic回归常见疾病:对数线性模型logistic回归直接估计的是OR,能否应用于队列研究取决于疾病的发病率。Knol(2012)[23]模拟比较了8种logistic回归代替方法估计RR及其可信区间的准确度,根据结果推荐,只有一个或两个分类型协变量时,采用Mantel-Haenszel风险比方法;如果有多个分类型或连续型协变量,推荐采用对数二项式回归(log-binomial regression,也就是本文中的对数线性模型);如果对数二项式回归不收敛,推荐采用稳健估计标准误的泊松回归,但是二者均不能确保预测概率在0~1之间。当数据存在拟分离或完全分离的时候,logistic回归可能出现最大似然估计不存在,此时可以改用Firth估计或者精确估计法[24-25]。线性风险模型、线性比值模型、对数线性模型和泊松回归不要求疾病为罕见病,但是可能出现最大似然估计不收敛的问题,尤其,当协变量为连续型变量的时候,不能确保预测概率在0~1之间[7],增加回归系数的约束条件可部分解决这个问题。SAS proc nlmixed中不易增加非线性约束,proc nlp可以增加非线性约束,但仍可能出现解不存在。此外,这两个过程需要指定初始值,为了让模型快速收敛,减少计算时间,可以用logistic回归的结果作为二者的初值。因为当模型不需校正协变量时,采用logistic回归和线性比值模型得到的结果一致。3.交互作用的筛选通常交互作用的分析需基于研究背景和专业知识,先找出可能导致效应产生异质性的因素,然后逐个进行统计检验。但是在探索性研究中先验知识很少或研究的因素特别多时,通常会依赖于统计方法来筛选和识别统计学交互作用,主要包含非参数方法、参数方法和贝叶斯方法三类。非参数方法中代表性的是多因子降维法[26](multifactor dimensional reduction,MDR),可以识别病例对照研究中的高阶交互效应,但不能分析连续变量,无法调整混杂因子。广义多因子降维法[27](generalized multifactor dimensional reduction,GMDR)和基于模型的MDR[28]弥补了MDR的以上缺点,但只能报告统计意义,不能直接给出效应估计。贝叶斯分析的计算量取决于MCMC算法的复杂性和样本量,由于计算量比较大,在高维交互效应的计算中研究较少。参数方法主要基于变量选择或变量筛选的方法来筛选一阶交互作用,它假定模型具有稀疏性,即真实情况下许多未知候选变量的回归系数为0或者接近0,因此,自变量的选择问题转化为确定正确的子模型的问题,且在选择变量的同时给出模型参数的估计。变量筛选类方法按照适用范围可以分为解决高维问题的筛选方法[8,29]和极高维问题的方法[9,30],都适用于自变量大于样本量的情形,但前者通常能快速同时研究几百个变量,而后者可以研究更大量的变量。变量筛选类方法按照是否考虑主效应和交互作用的层次关系,即边际原则[31],可分为两类。边际原则是指模型中包含两个变量的交互项的时候,必需包含对应的一个或两个主效应。边际原则在一定程度上合理,可以大大缩小交互作用筛选的范围。把边际原则融入变量筛选过程的方法有三类:一阶段法[8,29],两阶段法[32-33]和迭代法[30]。而另一类没有考虑这个层次关系,认为纯交互作用在生物学上也是合理的[9]。4.评价指标相乘交互作用评价指标就是OR或RR的对数值,为logistic回归、对数线性模型、泊松回归和Cox模型中交互项的回归系数,直接通过判定回归系数是否为0就可以检验相乘交互作用。Rothman[4]、VanderWeele和Knol[7]详细讲述了基于RR和OR的IC替代指标来评价可加交互作用:RERI、AP(attributable proportion due to interaction,归因比)和S(synergy index,协同作用指数)的计算和意义。这里,我们按照分析模型把这些指标的计算公式汇总于表3,其中假定了结局和2个自变量均为二分类变量,如果结局和自变量为多分类变量,可以通过设置哑变量转换为均为二分类的情况。表3 不同模型下相加交互作用指标的计算*:x1和x2是感兴趣的有交互作用的两个因素,均为二分类变量,结局也为二分类变量,z为控制的混杂因素。指标计算公式线性风险模型logistic回归线性比值模型对数线性模型Cox模型模型x1=1 if j=10 if j=0 ,x2=1 if k=10 if k=0 Rjkz=a+b1x1+b2x2+b3x1x2+gz,其中a>0,b1>0,b2>0,gz>0.Rjkz=ea+b1x1+b2x2+b3x1x2+gz1+ea+b1x1+b2x2+b3x1x2+gzOjkz=a+b1x1+b2x2+b3x1x2+gz,其中a>0,b1>0,b2>0,gz>0.Rjkz=ea+b1x1+b2x2+b3x1x2+gz,λjkz(t)=λ0(t)ea+b1x1+b2x2+b3x1x2+gz条件风险Rjkz=P(Y=1|x1,x2,z)R00z=a+gzR10z=a+b1+gzR01z=a+b2+gzR11z=a+b1+b2+b3+gzR00z=ea+gz1+ea+gzR10z=ea+b1+gz1+ea+b1+gzR01z=ea+b2+gz1+ea+b2+gzR11z=ea+b1+b2+b3+gz1+ea+b1+b2+b3+gzR00z=ea+gz,R10z=ea+b1+gz,R01z=ea+b2+gz,R11z=ea+b1+b2+b3+gz,λ00z(t)=λ0(t)ea+gzλ10z(t)=λ0(t)ea+b1+gzλ01z(t)=λ0(t)ea+b2+gzλ11z(t)=λ0(t)ea+b1+b2+b3+gz风险差值(RD)Djkz=Rjkz-R00zD00z=0D10z=b1D01z=b2D11z=b1+b2+b3D00z=0D10z=ea+gz,(eb1-1)D01z=ea+gz,(eb2-1)D11z=ea+gz,(eb1+b2+b3-1)D00z=0D10z(t)=λ0(t)ea+gz(eb1-1)D01z(t)=λ0(t)ea+gz(eb2-1)D11z(t)=λ0(t)ea+gz(eb1+b2+b3-1)相对风险(RR)RRjkz=Rjkz/R00zRR00z=1RR10z=1+b1a+gzRR01z=1+b2a+gzRR11z=1+b1+b2+b3a+gzRR00z=1RR10z=eb1RR01z=eb2RR11z=eb1+b2+b3HR00z=1HR10z=eb1HR01z=eb2HR11z=eb1+b2+b3比值oddsOjkz=Rjkz/(1-Rjkz)O00z=ea+gzO10z=ea+b1+gzO01z=ea+b2+gzO11z=ea+b1+b2+b3+gzO00z=a+gzO10z=a+b1+gzO01z=a+b2+gzO11z=a+b1+b2+b3+gz优势比Odds ratio(OR)ORjkz=Ojkz/O00zOR00z=1OR10z=eb1OR01z=eb2OR11z=eb1+b2+b3OR00z=1OR10z=1+b1a+gzOR01z=1+b2a+gzOR11z=1+b1+b2+b3a+gz交互对比指标ICD11z-D10z-D01z=R11z-R10z-R01z+R00zb3超额相对危险度RERIRERIz=R11z-R10z-R01z+R00zR00z=RR11z-RR10z-RR01z+1RERIz=b3a+gz用OR近似RR得到,RERIz=eb1+b2+b3-eb1-eb2+1用OR近似RR得到,RERIz=b3a+gzRERIz=eb1+b2+b3-eb1-eb2+1用HR近似RR得到,RERIz=eb1+b2+b3-eb1-eb2+1归因比APAPz=R11z-R10z-R01z+R00zR11z=RR11z-RR10z-RR01z+1RR11z=RERIzRR11zAPz=b3a+b1+b2+b3+gz用OR近似RR得到,APz=eb1+b2+b3-eb1-eb2+1eb1+b2+b3用OR近似RR得到,APz=b3a+b1+b2+b3+gzAPz=eb1+b2+b3-eb1-eb2+1eb1+b2+b3用HR近似RR得到,APz=eb1+b2+b3-eb1-eb2+1eb1+b2+b3协同作用指数SSz=R11z-R00z(R10z-R00z)+(R01z-R00z)=RR11z-1(RR10z-1)+(RR01z-1)Sz=b1+b2+b3b1+b2用OR近似RR得到,Sz=eb1+b2+b3-1eb1+eb2-2用OR近似RR得到,Sz=b1+b2+b3b1+b2Sz=eb1+b2+b3-1eb1+eb2-2用HR近似RR得到,Sz=eb1+b2+b3-1eb1+eb2-2RERI反映归因交互作用引起的相对危险度;AP反映在两因素同时存在时,它们的总效应中归因于交互作用的部分所占的比例;S反映的是两因素同时存在时的效应与两因素独立效应和的比值。这里有几点需要说明:(1)AP和S是比值形式,因此,需要先取对数再计算可信区间,然后对上下限取幂后得到AP和S的可信区间[34]。(2)RERI和AP的可信区间不包含0,S的可信区间不包含1,则说明存在相加交互作用,以排除抽样误差引入的偏倚。(3)RERI不为0,说明存在相加交互作用,但是RERI等于0,也可能存在相互抵消的相加交互作用[4]。(4)这三个指标适用于评价危险因素的相加交互作用,对于保护因素,赋值应以最低风险的一类为参照,否则,可能导致三个指标的结果解释方向不一致[35-36]。(5)存在混杂因素的情况下,采用logistic回归、对数线性模型、Cox模型估计的三个指标与混杂因素无关;线性风险模型和线性比值模型中S的估计不因混杂因素的水平而变化,但是RERI和AP的估计与混杂因素的取值有关,因此,得到的估计不唯一[37]。Skrondal(2003)[37]通过模拟研究说明,在病例对照研究中,线性比值模型比logistic回归得到的S的可信区间覆盖率高,尤其当协变量效应较强时。而VanderWeele和Vansteelandt(2011)[23]提出在病例对照研究中采用边际结构模型中逆概率加权的方法来估计相加交互作用。Li和Chambless(2007)[38]等在Cox模型中模拟比较三个指标评价相加交互作用的性能,结果显示RERI的估计值最接近真值,覆盖率最接近95%,S的稳定性最差,原因是S的分母可能接近0。Zou(2008)[21]通过模拟研究发现,MOVER法下RERI的覆盖率最佳,S的覆盖率不理想,通过计算ln(1-AP)的可信区间可以改善AP的覆盖率。采用Wald法计算可信区间,需假定指标服从正态分布,而AP和S是比值型指标,相比于RERI更容易偏离正态分布。因此,如果采用Wald法计算可信区间,RERI可能比AP和S更可靠。5.程序实现Spiegelman等[39]给出SAS PROC GENMOD实现稳健估计标准误的泊松回归、对数二项式回归的程序,可在此基础上实现可加交互作用和相乘交互作用的计算。但通常不能直接得到可加交互作用的三个指标及其可信区间,需要编程实现。可信区间估计方法主要有3类:基于delta方法计算三个指标的方差后采用Wald法计算可信区间、bootstrap类方法和基于似然比统计量的可信区间,不同模型下的软件实现见表4汇总。表4 文献中不同相加风险模型下实现RERI的95%可信区间计算的软件汇总模型Wald法Bootstrap似然比logistic回归excel[6,41]、SAS[7,42-43]、R[41-44]、Stata[7]SPLUS[45],SAS[46]SAS[43,47]线性风险模型WinBUGS[48]线性比值模型SAS[47,49],Stata[49],WinBUGS[48]SAS[47,49]Cox模型SAS[38,47]SPLUS[22]SAS[47]针对结局和关注的因素均为二分类情形,Hosmer和Lemeshow(1992)[34]采用delta方法计算RERI、AP和S的方差,最早给出了logistic回归模型中这三个指标的可信区间计算公式,向惠云(1999)[40]等介绍了该方法。为了便于应用,Andersson(2005)[41]编制了一个excel表格,以SAS、Stata、SPSS中logistic回归或Cox回归输出的主效应和交互效应的回归系数、协方差矩阵为输入,计算这三个指标的点估计及其可信区间,并给出可视化图形。邱宏(2008)[36]等介绍了SPSS输出结果与此excel表格的结合使用。Assmann(1996)[50]等模拟比较了3种bootstrap可信区间方法(Wald型可信区间、百分位数法和Hamilton百分位数法)与Wald法,结果显示百分位数法得到的区间估计最优。Knol(2007)[45]把相加交互作用的评价扩展到了一个或两个因素为连续变量,提供了SPLUS程序,参考Assmann[50]的结果,推荐BCa可信区间,因为可以校正bootstrap方法过拟合引入的偏倚。Kuss(2010)[43]用SAS软件proc nlmixed和proc nlp分别实现了logistic回归中RERI及其可信区间计算,二者分别采用Wald法和似然比方法计算可信区间。Nie(2010)[46]指出如果观测数据有频数为0的格子时,Wald方法中的极大似然估计、Zou的方法和基于似然比的方法的估计都不存在。即使观测数据没有频数为0的格子,数据稀疏(sparse)或四个格子的样本量不均时,重抽样(bootstrap)得到的数据可能有频数为0的格子,会导致RERI的可信区间估计不存在或很宽。因此,提出了连续校正的参数和非参数方法计算RERI的可信区间,并提供了SAS程序。模拟研究结果显示,与基于似然的方法[49]、Zou[21]的方法比较,当数据稀疏的时候,采用连续性校正得到的可信区间更合理。针对logistic回归中二分类变量、无序多分类变量、连续变量和有序多分类变量的交互作用,VanderWeele和Knol(2014)[7]给出了基于Wald法的Stata和SAS程序。Mathur和VanderWeele[44](2018)编写了一个R函数additive_interactions,要求结局和感兴趣的因素均为二分类变量,可以调用glm函数的结果计算RERI和AP及其可信区间和P值,同时检验机制交互作用。综上,当样本量大,数据不稀疏时,三种可信区间计算方法的结果很接近[49]。当存在数据稀疏问题时,采用连续校正后的bootstrap方法得到的结果更可靠[46]。当感兴趣的因素中有一个为连续变量时,可信区间的估计建议采用bootstrap方法[36,45]。6.结果报告Knol和VanderWeele[6]给出了交互作用分析推荐报告的内容和表格模板(表5),包含4部分:(1)相对于一个参照组的率差、率比或优势比(RD/RR/OR);(2)按一个因素分层后,另一个因素的率差、率比或优势比(RD/RR/OR);(3)相乘或相加交互作用指标及其95%CI;(4)暴露因素的混杂控制。需要说明的是,表5针对的是交互效应的分析,如果需要报告效应修饰的结果,假设因素A是我们感兴趣的因素,因素B是效应修饰因子,那么只需要去掉表5中最后一行的结果。由于大多数交互作用的分析是基于观察性资料的探索性研究,结果报告还需要遵循STROBE声明[51-53],Knol和VanderWeele[6]给出的报告模板符合STROBE声明中关于交互作用分析的要求。表5 Knol和VanderWeele 推荐的分析A和B的交互作用结果报告模板A=0N是/否发生结局RR/OR/RD(95%CI)P值A=1N是/否发生结局RR/OR/RD(95%CI);P值按B分层后比较A=1与A=0RR/OR/RD(95%CI);P 值B=01(参照组)B=1按A分层比较B=1 与 B=0RR/OR/RD(95%CI);P值相加交互作用:指标(95%CI),P值;相乘交互作用:指标(95%CI),P值;计算RR/OR/RD校正的协变量有。这里,我们以一项ALDH2 rs671基因与体力活动的交互作用对冠心病风险影响的研究[54]为例展示表格模板的使用和结果解释(表6),该研究为2013年在浙江宁波开展的一项巢式病例对照研究,其中,冠心病患者161例,对照495例。结果显示,控制混杂后久坐或轻度体力活动的ALDH2 rs671风险等位基因携带者(A/A或A/G)发生冠心病的风险显著高于其他三组,RERI(95%CI)为0.933(0.021~1.845)表示:在风险差值尺度上,久坐或轻度体力活动的ALDH2 rs671风险等位基因携带者(A/A或A/G)发生冠心病的风险增量高于这两个因素单独作用时风险增量的和。尽管原文没有报告相乘交互作用结果,但根据表6可知,携带ALDH2 rs671风险等位基因与体力活动不足单独并没有增加冠心病风险,而两者同时存在时显著增加冠心病风险,根据上文的特例2,ALDH2 rs671基因与体力活动为纯交互作用,因而,相乘交互作用也一定存在,即久坐或轻度体力活动与携带ALDH2 rs671风险等位基因在相乘和相加尺度均有协同作用。表6 ALDH2 rs671 SNP与体力活动对冠心病的交互作用体力活动ALDH2 rs671 SNP基因型非风险等位基因携带者(G/G)N病例/对照OR(95%CI);P值风险等位基因携带者(A/A或A/G)N病例/对照OR(95%CI);P值分层比较等位基因OR(95%CI);P值中/重度12/5919/490.793(0.299~2.101)P=0.6400.793(0.299~2.101)P=0.640久坐/轻度60/2151.345(0.669~2.701)P=0.40680/1722.071(1.013~4.234)P=0.0461.540(1.012~2.344)P=0.044分层比较体力活动OR(95%CI);P值1.345(0.669~2.701)P=0.4062.612(1.202~5.674)P=0.015相加交互作用:RERI(95%CI)=0.933(0.021~1.845);Pvalue=0.045;相乘交互作用:未报告;计算OR校正的协变量有:年龄、性别、体重指数、收缩压、总胆固醇水平、甘油三酯水平、高密度值胆固醇水平、目前是否吸烟、目前是否饮酒、糖尿病史。对于表格模板中第4部分暴露因素的混杂控制,VanderWeele和Knol[7]指出如果两个因素都是研究感兴趣的,那么需要同时控制这两个变量的混杂因素,此时,结果表示两个因素的交互作用;如果感兴趣的因素只有一个,那么控制该因素与结局的混杂因素,此时,结果应解释为效应异质或效应修饰,表5中应去掉最后一行。另外,需要注意的是,未观测到的混杂对于结果也会产生影响,尤其是研究设计或数据收集中遗漏了重要的混杂因素时。而观察性研究中常用的混杂控制的方法:分层、匹配、协变量校正、倾向性评分[55]等只能控制观测到的混杂。未观测到的混杂对于结果的影响可以通过敏感性分析来探讨,VanderWeele(2012)[56]给出了相加和相乘交互作用的敏感性分析公式。敏感性分析结果也是STROBE声明[51-53]推荐报告的内容之一。综上,在实际应用中,研究者应给出所研究的交互作用的明确定义和分析尺度,结合研究的设计类型和疾病特征,选择合适的统计模型、评价指标和统计程序,并按照推荐表格报告研究结果。参 考 文 献[1] 王波,李立明.科学看待精准医学的研究与进展.中华流行病学杂志,2017,38(1):1-2.[2] 王冬,Hu FB.从精准医学到精准公共卫生.中华内分泌代谢杂志,2016,32(9):711-715.[3] 吴伟旋,向前,许军,等.精准医学对慢性病防控的作用及发展策略.卫生经济研究,2017,(7):44-47.[4] Rothman KJ,Greenland S,Lash TL.Modern epidemiology.3rd ed.Wolters Kluwer Health/Lippincott Williams & Wilkins Philadelphia.[5] Rothman KJ.Interaction and evolution in epidemiology.Soz Praventivmed,2004,49(2):105-106.[6] Knol MJ,VanderWeele TJ.Recommendations for presenting analyses of effect modification and interaction.Int J Epidemiol,2012,41(2):514-520.[7] VanderWeele TJ,Knol MJ.A tutorial on interaction.Epidemiologic Methods,2014,3(1):33-72.[8] Lim M,Hastie T.Learning interactions via hierarchical group-lasso regularization.J Comput Graph Stat,2015,24(3):627-654.[9] Fan Y,Kong Y,Li D,et al.Interaction pursuit with feature screening and selection.arXiv preprint arXiv:1605.08933,2016.[10] Hosmer JDW,Lemeshow S,Sturdivant RX.Applied Logistic Regression.3rd ed.John Wiley & Sons,Inc.[11] 谭红专,现代流行病学.第3版.2018,人民卫生出版社.[12] VanderWeele T.Explanation in causal inference:methods for mediation and interaction.Oxford University Press.[13] Hayes AF.Introduction to mediation,moderation,and conditional process analysis:A regression-based approach.2nd ed.The Guilford Press.[14] Smith PG,Day NE.The design of case-control studies:the influence of confounding and interaction effects.Int J Epidemiol,1984,13(3):356-365.[15] Gauderman WJ.Sample size requirements for matched case-control studies of gene-environment interaction.Stat Med,2002,21(1):35-50.[16] Demidenko E.Sample size and optimal design for logistic regression with binary interaction.Stat Med,2008,27(1):36-46.[17] VanderWeele TJ.Sample Size and Power Calculations for Additive Interactions.Epidemiol Methods,2012,1(1):159-188.[18] 孙振球,徐勇勇,医学统计学.第4版.2016,人民卫生出版社.[19] Knol MJ,Vandenbroucke JP,Scott P,et al.What do case-control studies estimate? Survey of methods and assumptions in published case-control research.Am J Epidemiol,2008,168(9):1073-1081.[20] Schmidt CO,Kohlmann T.When to use the odds ratio or the relative risk.Int J Public Health,2008,53(3):165-167.[21] Zou GY.On the estimation of additive interaction by use of the four-by-two table and beyond.Am J Epidemiol,2008,168(2):212-224.[22] 潘金仁,陈坤.队列研究资料相加交互作用可信区间的Bootstrap法估计.中华流行病学杂志,2010,31(7):808-811.[23] Knol MJ,Cessie SL,Algra A,et al.Overestimation of risk ratios by odds ratios in trials and cohort studies:alternatives to logistic regression.CMAJ,2012,184(8):895-899.[24] 张彦荣,王彤.关于Logistic回归中最大似然估计的可估性.现代预防医学,2009,36(10):1807-1809.[25] 顾彩姣,韩婷,王慧,等.解决Logistic回归中分离问题的统计方法比较.中华疾病控制杂志,2016,20(3):307-311.[26] 唐迅,李娜,陈大方,等.多因子降维法分析基因-基因交互作用的应用进展.中华流行病学杂志,2007,28(9):918-921.[27] 陈卿,唐迅,胡永华.应用广义多因子降维法分析数量性状的交互作用.中华流行病学杂志,2010,31(8):938-941.[28] 范伟,沈超,郭志荣.基于模型的多因子降维方法在基因-基因/环境交互作用分析中的应用.中华流行病学杂志,2015,36(11):1305-1310.[29] Bien J,Taylor J,Tibshirani R.A lasso for hierarchical interactions.Annals of statistics,2013,41(3):1111.[30] Hao N,Feng Y,Zhang HH.Model selection for high-dimensional quadratic regression via regularization.Journal of the American Statistical Association,2018,113(522):615-625.[31] Nelder J.A reformulation of linear models.Journal of the Royal Statistical Society:Series A(General),1977,140(1):48-63.[32] Hao N,Zhang HH.Interaction screening for ultrahigh-dimensional data.Journal of the American Statistical Association,2014,109(507):1285-1301.[33] Hao N,Zhang HH.A note on high-dimensional linear regression with interactions.The American Statistician,2017,71(4):291-297.[34] Hosmer DW,Lemeshow S.Confidence interval estimation of interaction.Epidemiology,1992,3(5):452-456.[35] Knol MJ,VanderWeele TJ,Groenwold RH,et al.Estimating measures of interaction on an additive scale for preventive exposures.Eur J Epidemiol,2011,26(6):433-438.[36] 邱宏,余德新,王晓蓉,等.logistic回归模型中交互作用的分析及评价.中华流行病学杂志,2008,29(9):934-937.[37] Skrondal A.Interaction as departure from additivity in case-control studies:a cautionary note.Am J Epidemiol,2003,158(3):251-258.[38] Li R,Chambless L.Test for additive interaction in proportional hazards models.Ann Epidemiol,2007,17(3):227-236.[39] Spiegelman D,Hertzmark E.Easy SAS calculations for risk or prevalence ratios and differences.Am J Epidemiol,2005,162(3):199-200.[40] 向惠云,余松林,孙奕,等.疾病资料多元分析中交互作用指标及可信区间的估计.中国卫生统计,1999,16(3):130-132.[41] Andersson T,Alfredsson L,Kallberg H,et al.Calculating measures of biological interaction.Eur J Epidemiol,2005,20(7):575-579.[42] Lundberg M,Fredlund P,Hallqvist J,et al.A SAS program calculating three measures of interaction with confidence intervals.Epidemiology,1996,7(6):655-656.[43] Kuss O,Schmidt-Pokrzywniak A,Stang A.Confidence intervals for the interaction contrast ratio.Epidemiology,2010,21(2):273-274.[44] Mathur MB,VanderWeele TJ.R Function for Additive Interaction Measures.Epidemiology,2018,29(1):e5-e6.[45] Knol MJ,VanderWede TJ,Grobbee DE,et al.Estimating interaction on an additive scale between continuous determinants in a logistic regression model.Int J Epidemiol,2007,36(5):1111-1118.[46] Nie L,Chu H,Li F,et al.Relative excess risk due to interaction:resampling-based confidence intervals.Epidemiology,2010,21(4):552-556.[47] 聂志强,欧艳秋,庄建,等.实现logistic与Cox回归相乘相加交互作用的临床实践宏程序.中华流行病学杂志,2016,37(5):737-740.[48] Chu H,Nie L,Cole SR.Estimating the relative excess risk due to interaction:a bayesian approach.Epidemiology,2011,22(2):242-248.[49] Richardson DB,Kaufman JS.Estimation of the relative excess risk due to interaction and associated confidence bounds.American journal of epidemiology,2009,169(6):756-760.[50] Assmann SF,Hosmer DW,Lemeshow S,et al.Confidence intervals for measures of interaction.Epidemiology,1996,7(3):286-290.[51] Von Elm E,Altman DG,Egger M,et al.The Strengthening the Reporting of Observational Studies in Epidemiology(STROBE)statement:guidelines for reporting observational studies.Annals of internal medicine,2007,147(8):573-577.[52] 詹思延.第三讲:如何报告观察性流行病学研究:国际报告规范STROBE解读.中国循证儿科杂志,2010,5(3):223-227.[53] Vandenbroucke JP,Von Elm E,Altman DG,et al.Strengthening the Reporting of Observational Studies in Epidemiology(STROBE):explanation and elaboration.PLoS medicine,2007,4(10):e297.[54] Huang L,Cai X,Lian F,et al.Interactions between ALDH2 rs671 polymorphism and lifestyle behaviors on coronary artery disease risk in a Chinese Han population with dyslipidemia:A guide to targeted heart health management.Environ Health Prev Med,2018,23(1):29.[55] Agoritsas T,Merglen A,Shah ND,et al.Adjusted Analyses in Studies Addressing Therapy and Harm:Users' Guides to the Medical Literature.JAMA,2017,317(7):748-759.[56] VanderWeele TJ,Mukherjee B,Chen J.Sensitivity analysis for interactions under unmeasured confounding.Stat Med,2012,31(22):2552-2564.
 

上一篇:负责任的研究与创新视角下的医学研究伦理责任

下一篇: 马黎明:有工匠精神才更有作为

 
相关论文导读
 
发布日期:2022-05-26 来源: 浏览次数:93
 
 
发布日期:2022-05-26 来源: 浏览次数:64
 
 
发布日期:2022-05-26 来源: 浏览次数:62
 
 
 
发布日期:2022-05-26 来源: 浏览次数:57
 
 
发布日期:2022-05-26 来源: 浏览次数:67
 
 
发布日期:2022-05-26 来源: 浏览次数:93
 
 
 
发布日期:2022-05-26 来源: 浏览次数:61
 
 
发布日期:2022-05-26 来源: 浏览次数:71
 
分类浏览
 
论文阅读排行
 
最新论文阅读
 
 
 



2018-2020 400农业期刊网 专业学术期刊名单推荐平台

 

免责声明:本平台并非任何杂志官网,仅限于整理学术信息以及期刊投稿渠道