蚂蚁集团今日凌晨宣布,开源其自研的首个万亿参数大模型——Ring-1T-preview。这是一款自然语言推理大模型,也是全球范围内首个开源的万亿参数推理大模型。
据百灵大模型官方信息,Ring-1T-preview作为万亿参数推理大模型Ring-1T的预览版,已展现出十分出色的自然语言推理能力。在AIME 25测试中,该模型获得了92.6分,超越了所有已知开源模型及Gemini 2.5 Pro,成绩接近GPT-5(无工具使用)的94.6分。在CodeForces测试中,Ring-1T-preview更是以94.69分的成绩超过了GPT-5,充分展现了其强大的代码生成能力。此外,在LiveCodeBench及ARC-AGI-v1等权威榜单中,Ring-1T-preview均位列开源模型首位。
蚂蚁百灵研发团队还在IMO25(国际奥林匹克数学竞赛)上对Ring-1T-preview的推理能力进行了测试。结果显示,Ring-1T-preview可一次性做对第三题,同时在1、2、4、5题可一次推理出部分正确答案。蚂蚁百灵团队表示,他们一直在对Ling2.0家族1T语言基座进行后训练,旨在最大程度地挖掘这一万亿规模基座模型的自然语言推理潜力。目前,Ring-1T正式版正在训练之中。 |