Nature News news 2026-06-12 Score 70

人类在高难度数学测试中胜过AI

最新基准测试表明，面对全新数学难题，AI仍不及人类专家水平。

一项新的基准测试显示，人工智能在解决未见过的高难度数学问题时仍落后于人类专家。该测试引入了此前未公开的数学问题，旨在评估AI的推理能力，结果人类表现显著优于AI系统。研究人员指出，尽管AI在特定领域进步迅速，但在需要深度数学直觉的问题上仍存在局限。这一发现强调了人类智慧在复杂推理中的独特优势，同时也为AI进一步优化提供了方向。

AImathematics

原文来源： https://www.nature.com/articles/d41586-026-01888-9