medRxiv preprint 2026-06-18 Score 75

AI也会“视而不见”？

最新研究发现，视觉语言模型在视频和CT扫描中可能遗漏显著目标，类似人类的非注意盲视。

一项预印本研究探索了视觉语言模型（VLM）是否表现出类似人类的“非注意盲视”。研究者向模型展示了包含大猩猩的篮球视频和结节查找任务中的CT扫描。结果显示，VLM在静态图像中能识别大猩猩，但在视频和CT扫描中常遗漏该目标，这种现象随模型代际和任务类型而变化。例如，Gemini-3.1-Pro表现优于其他主流模型。该研究尚未经过同行评审，提示AI在复杂视觉任务中可能重蹈人类认知偏误。

computer visioncognitive biasartificial intelligence

原文来源： https://doi.org/10.64898/2026.06.16.26355792