实验法中如何检验中介效应

课程内容
当前位置：首页 > 研究方法 > 课程内容

实验法中如何检验中介效应

作者：Podsakoff等人
来源/出处：Journal of Business and Psychology、Me Inc

发布时间：2026-06-19
访问量：190

一、研究背景与动机

过去25年，中介效应模型的使用量暴增（1994-2003年共148篇 → 2015-2024年超1389篇，增长9倍）。但大量讨论聚焦于统计技术（如Bootstrap置信区间、SEM、多层模型等），而非研究设计本身。

多位学者指出：中介的本质是识别因果机制，单纯依赖相关设计的统计检验无法做出强因果推断。因此本文聚焦实验设计路径，对已有文献做"方法现状审查"。

二、文献筛选流程

在Web of Science中检索所有引用Spencer et al. (2005)的文章（N=1590）
限定为应用心理学与管理学期刊 → 291篇
排除非实证文章（26篇）和主题不相关文章（23篇）
随机抽取2/3 → 最终样本160篇，含310项研究
其中29篇（18%）仅引用Spencer等承认研究局限而未实际使用实验方法；实际使用实验方法的有131篇/249项研究

三、三种实验检验中介的路径

1. 测量中介法（MOM：Measurement-of-Mediation）

设计逻辑：操纵X，测量M和Y，统计检验间接效应。

使用比例：56%（140/249），最常见。

优势：

实施相对容易
可估计直接效应、间接效应和总效应
可判断完全/部分中介
可同时检验多个并行或序列中介
适用于多层模型

局限：

M和Y通常同时同源测量，无法建立M→Y因果顺序
56%的MOM研究未报告区分效度检验（因子分析）
86%的M和Y来自同一数据源 → 共同方法偏差风险
61%未纳入任何协变量 → 内生性担忧
M→Y关系本质上是相关的，第三变量可能解释观察到的关系
测量M可能启动/干扰参与者对Y的作答

实例：

Allen & Rush (1998, Study 2)：操纵OCB，测量喜欢感和承诺感，检验对绩效评价和奖励建议的中介。但两个中介变量高度相关(r=.81)，无法分离独特效应。
Baer et al. (2018, Study 2)：操纵不公平言论和重构回应，检验情绪→宽恕→OCB的序列中介。采用了多来源测量（不同评价者分别评M和Y），但M和Y仍无时间分离。

2. 实验因果链法（ECC：Experimental-Causal-Chain）

设计逻辑：至少两个实验——实验1操纵X测量M_obs，实验2操纵M_man测量Y。通过两步因果链推断中介。

使用比例：13.3%（33/249），最少使用。

优势：

因果推断最强：两步随机实验排除了多种内部效度威胁
满足时间先后要求
降低内生性偏差
方法偏差几乎不可能同时解释两个独立实验的结果
特别适合M的测量容易产生社会赞许性偏差的情况

局限：

必须能同时测量和操纵M
必须论证M_obs（测量）和M_man（操纵）的概念等价性——仅24%的研究做了概念论证，30%做了实证支持，0%检验了分布等价性
M_man可能无意中操纵了非假设的中介或X本身
无法直接统计检验间接效应，只能从两个实验的主效应模式推断
难以判断完全/部分中介
序列/并行多中介需要更多实验，复杂度高
多层或组织层面研究难以用实验室实验实现

实例：

Liang et al. (2016)：Study1操纵下属绩效归因→测量敌意；Study2操纵敌意/愉悦感→测量虐待监管意图。但Study2的"敌意"操纵与Study1的"敌意"测量可能不等价（敌意 vs. 敌意/愉悦对比）。
Hill et al. (2021)：三步ECC，完美演示序列中介的实验检验——情绪→乐观/悲观→公正感知→绩效。
Newton et al. (2024)：序列中介中，两个近端中介（过载、后悔）在ECC1中同时测量，未实验检验过载→后悔的因果链。

3. 过程调节法（MOP：Moderation-of-Process）

设计逻辑：在一个随机实验中，同时操纵X和Z_pro（代表中介过程的阻断/增强变量），通过X×Z_pro交互效应推断中介过程的存在。

使用比例：30.5%（76/249）。

两种变体：

阻断设计（Blockage）
：Z_pro阻断中介过程，使X→Y效应消失或减弱
增强设计（Enhancement）
：Z_pro增强中介过程，使X→Y效应出现或增强

优势：

特别适合M难以直接测量或操纵、或测量M会产生需求特征/启动效应的情况
随机实验增强因果推断
降低内生性担忧

局限：

研究者必须论证Z_pro只影响假设的中介过程、不影响其他过程 → 0%的研究提供了令人信服的排除替代解释的证据
56.6%的研究提供了中等或较强的概念论证，但没有任何研究论证Z_pro不影响非假设过程
难以操纵的过程不适用
多中介难以处理（需分别在不同实验中检验）
无法直接估计间接效应大小或中介比例
交互效应检测常面临统计功效不足的问题

实例：

Marr & Thau (2014, Study 3)：操纵地位丧失×自我肯定，发现高地位者未受肯定时绩效下降（自我威胁被阻断后效应消失）→推断自我威胁中介地位丧失→绩效。
Belmi & Pfeffer (2016, Study 5)：操纵权力感×安全感提升，发现未提升安全感时CEO角色恐惧更低→推断心理安全感中介权力→死亡焦虑。
Lount et al. (2015, Study 3)：操纵团队多样性×关系冲突水平，发现中等冲突时多样性降低资源分配意愿（阻断设计）→推断关系冲突中介多样性→资源分配。

四、核心推荐（Table 2汇总）

通用建议

无论哪种设计，必须提供清晰的理论论证
：解释为什么X→M、为什么M→Y，而非仅声明"M中介X→Y"。定义构念、呈现假设模型图、解释因果排序的理由。

MOM建议

竞争检验多个中介（而非只检验一个）
提供收敛效度和区分效度证据（CFA + Fornell-Larcker准则）
M和Y尽量从不同来源获取
纳入合理协变量并说明理由
报告直接效应、间接效应和总效应
尽量采用时间滞后设计
用Bootstrap置信区间检验间接效应，不应再用Baron & Kenny因果步骤法
对X的操纵做操纵检查和混淆检查（排除操纵污染）

ECC建议

论证M为什么可以同时被测量和操纵
提供M_obs与M_man的概念等价性论证（操纵内容是否与量表条目对应）
提供M_obs与M_man的实证等价性（用ECC1的M量表作为ECC2的操纵检查）
尝试建立分布等价性（Kolmogorov-Smirnov检验比较两个实验中M的分布）
在ECC1中同时测量M和Y，以获得间接效应估计（但需承认MOM设计的局限）
考虑用元分析技术整合多个ECC实验的证据

MOP建议

Z_pro的选择最为关键：应理解为"操纵过程是否可以自由运行"，而非"直接操纵中介变量"
清晰解释Z_pro如何阻断/增强中介过程，并在实验前呈现预期的交互效应图
论证Z_pro不影响非假设的心理过程
提供先前研究或预实验证据表明Z_pro确实影响假设的中介过程
实验后绘制Z_pro对X→Y关系的调节效应图，确认与理论预期一致
尽可能获取X和Z_pro的操纵检查和混淆检查
如果Z_pro只能测量不能操纵，则不应使用MOP设计

文献出处：Podsakoff, P. M., Podsakoff, N. P., & Shao, Y. (2026). Experimental approaches for testing mediation effects models: A review, assessment, and recommended practices. Journal of Business and Psychology, 41(1), 1–26. https://doi.org/10.1007/s10869-025-10089-6

原文链接：https://mp.weixin.qq.com/s/iiywvWyCgOKI94hh5CEFCg

编辑 | 人格与社会课题组徐前

课程内容