[LG]《Artificial Phantasia: Evidence for Propositional Reasoning-Based Mental Imagery in Large Language Models》M McCarty, J Morales [Northeastern University] (2025)
人工幻象:大型语言模型具备基于命题推理的“心象”能力?
近期研究《Artificial Phantasia》探讨了大型语言模型(LLMs)是否能完成传统认知心理学中被认为必须依赖视觉心象的任务。研究设计了一个经典的“物体重构任务”:根据3-5步文字指令,想象字母与简单图形的变化,最终识别并命名构建出的物体。此任务传统观点认为,只有视觉心象才能完成,单靠语言无法实现。
🔍 研究亮点:
- 采用了48个全新设计的题目,确保不在模型训练数据内,避免数据泄露。
- 100名人类参与者完成同样任务,建立基线表现,平均正确率约54.7%。
- 多款顶尖LLM测试结果显示,OpenAI的o3系列和GPT-5显著超越人类表现(提升9.4%-12.3%,p