实验法中如何检验中介效应

  • 作者:Podsakoff等人
  • 来源/出处:Journal of Business and Psychology、Me Inc
  • 发布时间:2026-06-19
  • 访问量:50

一、研究背景与动机

过去25年,中介效应模型的使用量暴增(1994-2003年共148篇 → 2015-2024年超1389篇,增长9倍)。但大量讨论聚焦于统计技术(如Bootstrap置信区间、SEM、多层模型等),而非研究设计本身。

多位学者指出:中介的本质是识别因果机制,单纯依赖相关设计的统计检验无法做出强因果推断。因此本文聚焦实验设计路径,对已有文献做"方法现状审查"。

 

二、文献筛选流程

  1. 在Web of Science中检索所有引用Spencer et al. (2005)的文章(N=1590)

  2. 限定为应用心理学与管理学期刊 → 291篇

  3. 排除非实证文章(26篇)和主题不相关文章(23篇)

  4. 随机抽取2/3 → 最终样本160篇,含310项研究

  5. 其中29篇(18%)仅引用Spencer等承认研究局限而未实际使用实验方法;实际使用实验方法的有131篇/249项研究

 

三、三种实验检验中介的路径

1. 测量中介法(MOM:Measurement-of-Mediation)

设计逻辑:操纵X,测量M和Y,统计检验间接效应。

使用比例:56%(140/249),最常见。

优势

  • 实施相对容易

  • 可估计直接效应、间接效应和总效应

  • 可判断完全/部分中介

  • 可同时检验多个并行或序列中介

  • 适用于多层模型

局限

  • M和Y通常同时同源测量,无法建立M→Y因果顺序

  • 56%的MOM研究未报告区分效度检验(因子分析)

  • 86%的M和Y来自同一数据源 → 共同方法偏差风险

  • 61%未纳入任何协变量 → 内生性担忧

  • M→Y关系本质上是相关的,第三变量可能解释观察到的关系

  • 测量M可能启动/干扰参与者对Y的作答

实例

  • Allen & Rush (1998, Study 2):操纵OCB,测量喜欢感和承诺感,检验对绩效评价和奖励建议的中介。但两个中介变量高度相关(r=.81),无法分离独特效应。

  • Baer et al. (2018, Study 2):操纵不公平言论和重构回应,检验情绪→宽恕→OCB的序列中介。采用了多来源测量(不同评价者分别评M和Y),但M和Y仍无时间分离。

2. 实验因果链法(ECC:Experimental-Causal-Chain)

设计逻辑:至少两个实验——实验1操纵X测量M_obs,实验2操纵M_man测量Y。通过两步因果链推断中介。

使用比例:13.3%(33/249),最少使用。

优势

  • 因果推断最强:两步随机实验排除了多种内部效度威胁

  • 满足时间先后要求

  • 降低内生性偏差

  • 方法偏差几乎不可能同时解释两个独立实验的结果

  • 特别适合M的测量容易产生社会赞许性偏差的情况

局限

  • 必须能同时测量和操纵M

  • 必须论证M_obs(测量)和M_man(操纵)的概念等价性——仅24%的研究做了概念论证,30%做了实证支持,0%检验了分布等价性

  • M_man可能无意中操纵了非假设的中介或X本身

  • 无法直接统计检验间接效应,只能从两个实验的主效应模式推断

  • 难以判断完全/部分中介

  • 序列/并行多中介需要更多实验,复杂度高

  • 多层或组织层面研究难以用实验室实验实现

实例

  • Liang et al. (2016):Study1操纵下属绩效归因→测量敌意;Study2操纵敌意/愉悦感→测量虐待监管意图。但Study2的"敌意"操纵与Study1的"敌意"测量可能不等价(敌意 vs. 敌意/愉悦对比)。

  • Hill et al. (2021):三步ECC,完美演示序列中介的实验检验——情绪→乐观/悲观→公正感知→绩效。

  • Newton et al. (2024):序列中介中,两个近端中介(过载、后悔)在ECC1中同时测量,未实验检验过载→后悔的因果链。

3. 过程调节法(MOP:Moderation-of-Process)

设计逻辑:在一个随机实验中,同时操纵X和Z_pro(代表中介过程的阻断/增强变量),通过X×Z_pro交互效应推断中介过程的存在。

使用比例:30.5%(76/249)。

两种变体

  • 阻断设计(Blockage)

    :Z_pro阻断中介过程,使X→Y效应消失或减弱

  • 增强设计(Enhancement)

    :Z_pro增强中介过程,使X→Y效应出现或增强

优势

  • 特别适合M难以直接测量或操纵、或测量M会产生需求特征/启动效应的情况

  • 随机实验增强因果推断

  • 降低内生性担忧

局限

  • 研究者必须论证Z_pro只影响假设的中介过程、不影响其他过程 → 0%的研究提供了令人信服的排除替代解释的证据

  • 56.6%的研究提供了中等或较强的概念论证,但没有任何研究论证Z_pro不影响非假设过程

  • 难以操纵的过程不适用

  • 多中介难以处理(需分别在不同实验中检验)

  • 无法直接估计间接效应大小或中介比例

  • 交互效应检测常面临统计功效不足的问题

实例

  • Marr & Thau (2014, Study 3):操纵地位丧失×自我肯定,发现高地位者未受肯定时绩效下降(自我威胁被阻断后效应消失)→推断自我威胁中介地位丧失→绩效。

  • Belmi & Pfeffer (2016, Study 5):操纵权力感×安全感提升,发现未提升安全感时CEO角色恐惧更低→推断心理安全感中介权力→死亡焦虑。

  • Lount et al. (2015, Study 3):操纵团队多样性×关系冲突水平,发现中等冲突时多样性降低资源分配意愿(阻断设计)→推断关系冲突中介多样性→资源分配。

 

四、核心推荐(Table 2汇总)

通用建议

  • 无论哪种设计,必须提供清晰的理论论证

    :解释为什么X→M、为什么M→Y,而非仅声明"M中介X→Y"。定义构念、呈现假设模型图、解释因果排序的理由。

MOM建议

  • 竞争检验多个中介(而非只检验一个)

  • 提供收敛效度和区分效度证据(CFA + Fornell-Larcker准则)

  • M和Y尽量从不同来源获取

  • 纳入合理协变量并说明理由

  • 报告直接效应、间接效应和总效应

  • 尽量采用时间滞后设计

  • 用Bootstrap置信区间检验间接效应,不应再用Baron & Kenny因果步骤法

  • 对X的操纵做操纵检查和混淆检查(排除操纵污染)

ECC建议

  • 论证M为什么可以同时被测量和操纵

  • 提供M_obs与M_man的概念等价性论证(操纵内容是否与量表条目对应)

  • 提供M_obs与M_man的实证等价性(用ECC1的M量表作为ECC2的操纵检查)

  • 尝试建立分布等价性(Kolmogorov-Smirnov检验比较两个实验中M的分布)

  • 在ECC1中同时测量M和Y,以获得间接效应估计(但需承认MOM设计的局限)

  • 考虑用元分析技术整合多个ECC实验的证据

MOP建议

  • Z_pro的选择最为关键:应理解为"操纵过程是否可以自由运行",而非"直接操纵中介变量"

  • 清晰解释Z_pro如何阻断/增强中介过程,并在实验前呈现预期的交互效应图

  • 论证Z_pro不影响非假设的心理过程

  • 提供先前研究或预实验证据表明Z_pro确实影响假设的中介过程

  • 实验后绘制Z_pro对X→Y关系的调节效应图,确认与理论预期一致

  • 尽可能获取X和Z_pro的操纵检查和混淆检查

  • 如果Z_pro只能测量不能操纵,则不应使用MOP设计


文献出处:Podsakoff, P. M., Podsakoff, N. P., & Shao, Y. (2026). Experimental approaches for testing mediation effects models: A review, assessment, and recommended practices. Journal of Business and Psychology, 41(1), 1–26. https://doi.org/10.1007/s10869-025-10089-6

原文链接:https://mp.weixin.qq.com/s/iiywvWyCgOKI94hh5CEFCg 

编辑 | 人格与社会课题组徐前