科技改变生活 · 科技引领未来
在最近的第六届阿里巴巴全球数学竞赛中,一项新的挑战吸引了全球的注意:AI大模型挑战赛。这次比赛不仅有来自全球的数学爱好者参与,还特别开放给了AI队伍,让人工智能与人类直接在同一赛场上竞技。
第六届阿里数学赛竞赛中,17岁学生姜萍位列12名成全球瞩目,同时AI队伍的表现也引人注目,平均分达到了18分,显示出它们在解决标准化问题上的能力已经与人类选手相当。然而,尽管AI的表现在某些方面已经接近人类,但在高分段的表现仍有很大差距。AI的最高分为34分,远低于人类选手的最高分113分。
这次比赛中,AI队伍的最高分是由上海建平中学的涂津豪设计的AI方案获得。他的方法是让多个大模型通过“自问自答自验证”的方式,进行深度思考和问题解决,最终从多个可能的答案中选择最优解。
此外,来自西南交通大学的特工宇宙团队和中国人民大学的SuperCarryMan团队也表现出色,分别以27分的成绩获得亚军和季军。这两支队伍都采用了多智能体系统,通过不同智能体的协作和多阶段推理来解决问题。
尽管AI在这次竞赛中展现了一定的能力,但赛事的结果也揭示了AI在进行复杂推理和创新思考方面的局限。浙江大学计算机系统结构实验室的陈天楚指出,目前的大语言模型主要是通过固定速率预测下一个词,而这种一次性输出的方式并不适合需要深层次逻辑推理和多次试错的任务。
AI挑战赛的结果不仅展示了人工智能在数学领域的进步和挑战,也引发了对AI本质的更深入探讨。技术总监认为,虽然AI在处理规则明确的计算问题上可能超越人类,但在需要高度创新和深度逻辑推理的领域,人类的优势仍然明显。
通过这次竞赛,AI的发展和人类的理解可能会进一步推动,不仅在数学理论上,也可能在AI技术的应用和发展上带来新的突破。而阿里数赛作为全球规模最大的在线数学竞赛之一,将继续为全球的数学爱好者和AI研究者提供一个展示和竞技的平台。
活泼溪流M