"content": "In the dusty, old study of a warhistorian, the clock ticked as he pored over a
OpenAI的o3:在低计算模式下获得了75.7%的成绩,在高计算模式下达到了87.5%,这被视为AI推理能力的突破性进展。 这也正是ARC-AGI测试的核心意义——它揭示了人类智能与当前AI之间的根本差…