Nature News news Score 70

人类在高难度数学测试中胜过AI

最新基准测试表明,面对全新数学难题,AI仍不及人类专家水平。

一项新的基准测试显示,人工智能在解决未见过的高难度数学问题时仍落后于人类专家。该测试引入了此前未公开的数学问题,旨在评估AI的推理能力,结果人类表现显著优于AI系统。研究人员指出,尽管AI在特定领域进步迅速,但在需要深度数学直觉的问题上仍存在局限。这一发现强调了人类智慧在复杂推理中的独特优势,同时也为AI进一步优化提供了方向。

AImathematics