[CL]《TheIllusionofIntervention:Your

爱生活爱珂珂 2026-05-22 07:36:47

[CL]《The Illusion of Intervention: Your LLM-Simulated Experiment is an Observational Study》V Lin, T Yun, M Matarić, J Canny… [Google DeepMind] (2026)

在LLM用户模拟领域,因果有效性是一个悬而未决的难题。过去的方法受困于把同一persona当作同一用户,本质原因是干预提示会反向改变模型补全出的隐含身份。

本文的核心洞见是:把LLM模拟实验重新看作观察性研究。由此,用负控制结果检测用户漂移,再把相关混杂因素写回persona,使不同干预下比较的用户群更接近。

这项工作真正留下的遗产是拆穿“合成RCT”的表象。它为后来者打开的新门是用因果诊断校准模拟用户,但尚未跨过的门槛是外部有效性、负控制选择与完全消除潜在混杂。

arxiv.org/abs/2605.20767 机器学习 人工智能 论文 AI创造营

0 阅读:0
爱生活爱珂珂

爱生活爱珂珂

感谢大家的关注