medRxiv preprint Score 75

AI也会“视而不见”?

最新研究发现,视觉语言模型在视频和CT扫描中可能遗漏显著目标,类似人类的非注意盲视。

一项预印本研究探索了视觉语言模型(VLM)是否表现出类似人类的“非注意盲视”。研究者向模型展示了包含大猩猩的篮球视频和结节查找任务中的CT扫描。结果显示,VLM在静态图像中能识别大猩猩,但在视频和CT扫描中常遗漏该目标,这种现象随模型代际和任务类型而变化。例如,Gemini-3.1-Pro表现优于其他主流模型。该研究尚未经过同行评审,提示AI在复杂视觉任务中可能重蹈人类认知偏误。

computer visioncognitive biasartificial intelligence