一、研究背景与动机
过去25年,中介效应模型的使用量暴增(1994-2003年共148篇 → 2015-2024年超1389篇,增长9倍)。但大量讨论聚焦于统计技术(如Bootstrap置信区间、SEM、多层模型等),而非研究设计本身。
多位学者指出:中介的本质是识别因果机制,单纯依赖相关设计的统计检验无法做出强因果推断。因此本文聚焦实验设计路径,对已有文献做"方法现状审查"。
二、文献筛选流程
-
在Web of Science中检索所有引用Spencer et al. (2005)的文章(N=1590)
-
限定为应用心理学与管理学期刊 → 291篇
-
排除非实证文章(26篇)和主题不相关文章(23篇)
-
随机抽取2/3 → 最终样本160篇,含310项研究
-
其中29篇(18%)仅引用Spencer等承认研究局限而未实际使用实验方法;实际使用实验方法的有131篇/249项研究
三、三种实验检验中介的路径
1. 测量中介法(MOM:Measurement-of-Mediation)
设计逻辑:操纵X,测量M和Y,统计检验间接效应。
使用比例:56%(140/249),最常见。
优势:
-
实施相对容易
-
可估计直接效应、间接效应和总效应
-
可判断完全/部分中介
-
可同时检验多个并行或序列中介
-
适用于多层模型
局限:
-
M和Y通常同时同源测量,无法建立M→Y因果顺序
-
56%的MOM研究未报告区分效度检验(因子分析)
-
86%的M和Y来自同一数据源 → 共同方法偏差风险
-
61%未纳入任何协变量 → 内生性担忧
-
M→Y关系本质上是相关的,第三变量可能解释观察到的关系
-
测量M可能启动/干扰参与者对Y的作答
实例:
-
Allen & Rush (1998, Study 2):操纵OCB,测量喜欢感和承诺感,检验对绩效评价和奖励建议的中介。但两个中介变量高度相关(r=.81),无法分离独特效应。
-
Baer et al. (2018, Study 2):操纵不公平言论和重构回应,检验情绪→宽恕→OCB的序列中介。采用了多来源测量(不同评价者分别评M和Y),但M和Y仍无时间分离。
2. 实验因果链法(ECC:Experimental-Causal-Chain)
设计逻辑:至少两个实验——实验1操纵X测量M_obs,实验2操纵M_man测量Y。通过两步因果链推断中介。
使用比例:13.3%(33/249),最少使用。
优势:
-
因果推断最强:两步随机实验排除了多种内部效度威胁
-
满足时间先后要求
-
降低内生性偏差
-
方法偏差几乎不可能同时解释两个独立实验的结果
-
特别适合M的测量容易产生社会赞许性偏差的情况
局限:
-
必须能同时测量和操纵M
-
必须论证M_obs(测量)和M_man(操纵)的概念等价性——仅24%的研究做了概念论证,30%做了实证支持,0%检验了分布等价性
-
M_man可能无意中操纵了非假设的中介或X本身
-
无法直接统计检验间接效应,只能从两个实验的主效应模式推断
-
难以判断完全/部分中介
-
序列/并行多中介需要更多实验,复杂度高
-
多层或组织层面研究难以用实验室实验实现
实例:
-
Liang et al. (2016):Study1操纵下属绩效归因→测量敌意;Study2操纵敌意/愉悦感→测量虐待监管意图。但Study2的"敌意"操纵与Study1的"敌意"测量可能不等价(敌意 vs. 敌意/愉悦对比)。
-
Hill et al. (2021):三步ECC,完美演示序列中介的实验检验——情绪→乐观/悲观→公正感知→绩效。
-
Newton et al. (2024):序列中介中,两个近端中介(过载、后悔)在ECC1中同时测量,未实验检验过载→后悔的因果链。
3. 过程调节法(MOP:Moderation-of-Process)
设计逻辑:在一个随机实验中,同时操纵X和Z_pro(代表中介过程的阻断/增强变量),通过X×Z_pro交互效应推断中介过程的存在。
使用比例:30.5%(76/249)。
两种变体:
- 阻断设计(Blockage)
:Z_pro阻断中介过程,使X→Y效应消失或减弱
- 增强设计(Enhancement)
:Z_pro增强中介过程,使X→Y效应出现或增强
优势:
-
特别适合M难以直接测量或操纵、或测量M会产生需求特征/启动效应的情况
-
随机实验增强因果推断
-
降低内生性担忧
局限:
-
研究者必须论证Z_pro只影响假设的中介过程、不影响其他过程 → 0%的研究提供了令人信服的排除替代解释的证据
-
56.6%的研究提供了中等或较强的概念论证,但没有任何研究论证Z_pro不影响非假设过程
-
难以操纵的过程不适用
-
多中介难以处理(需分别在不同实验中检验)
-
无法直接估计间接效应大小或中介比例
-
交互效应检测常面临统计功效不足的问题
实例:
-
Marr & Thau (2014, Study 3):操纵地位丧失×自我肯定,发现高地位者未受肯定时绩效下降(自我威胁被阻断后效应消失)→推断自我威胁中介地位丧失→绩效。
-
Belmi & Pfeffer (2016, Study 5):操纵权力感×安全感提升,发现未提升安全感时CEO角色恐惧更低→推断心理安全感中介权力→死亡焦虑。
-
Lount et al. (2015, Study 3):操纵团队多样性×关系冲突水平,发现中等冲突时多样性降低资源分配意愿(阻断设计)→推断关系冲突中介多样性→资源分配。
四、核心推荐(Table 2汇总)
通用建议
- 无论哪种设计,必须提供清晰的理论论证
:解释为什么X→M、为什么M→Y,而非仅声明"M中介X→Y"。定义构念、呈现假设模型图、解释因果排序的理由。
MOM建议
-
竞争检验多个中介(而非只检验一个)
-
提供收敛效度和区分效度证据(CFA + Fornell-Larcker准则)
-
M和Y尽量从不同来源获取
-
纳入合理协变量并说明理由
-
报告直接效应、间接效应和总效应
-
尽量采用时间滞后设计
-
用Bootstrap置信区间检验间接效应,不应再用Baron & Kenny因果步骤法
-
对X的操纵做操纵检查和混淆检查(排除操纵污染)
ECC建议
-
论证M为什么可以同时被测量和操纵
-
提供M_obs与M_man的概念等价性论证(操纵内容是否与量表条目对应)
-
提供M_obs与M_man的实证等价性(用ECC1的M量表作为ECC2的操纵检查)
-
尝试建立分布等价性(Kolmogorov-Smirnov检验比较两个实验中M的分布)
-
在ECC1中同时测量M和Y,以获得间接效应估计(但需承认MOM设计的局限)
-
考虑用元分析技术整合多个ECC实验的证据
MOP建议
-
Z_pro的选择最为关键:应理解为"操纵过程是否可以自由运行",而非"直接操纵中介变量"
-
清晰解释Z_pro如何阻断/增强中介过程,并在实验前呈现预期的交互效应图
-
论证Z_pro不影响非假设的心理过程
-
提供先前研究或预实验证据表明Z_pro确实影响假设的中介过程
-
实验后绘制Z_pro对X→Y关系的调节效应图,确认与理论预期一致
-
尽可能获取X和Z_pro的操纵检查和混淆检查
-
如果Z_pro只能测量不能操纵,则不应使用MOP设计
文献出处:Podsakoff, P. M., Podsakoff, N. P., & Shao, Y. (2026). Experimental approaches for testing mediation effects models: A review, assessment, and recommended practices. Journal of Business and Psychology, 41(1), 1–26. https://doi.org/10.1007/s10869-025-10089-6
原文链接:https://mp.weixin.qq.com/s/iiywvWyCgOKI94hh5CEFCg
编辑 | 人格与社会课题组徐前
