科大讯飞发布讯飞星火X1升级版,综合能力与幻觉治理双跃升
科大讯飞正式推出了基于全国产算力训练的深度推理大模型——讯飞星火X1升级版。此次升级在多个关键任务上实现了显著进步,特别是在翻译、推理、文本生成、数学及多语言处理方面展现出卓越效果。讯飞星火X1升级版在综合能力上有了大幅提升,整体效果可与OpenAI o3等国内外一流大模型的最新版本相媲美,甚至在部分领域保持领先地位。同时,该模型在幻觉治理方面取得了显著进展,无论是针对模型自身生成内容的事实性校验,还是对用户提供参考资料的忠实性回复,均实现了明显提升,为模型在行业中的广泛应用提供了更高可靠性。
在语言处理能力上,讯飞星火X1升级版现已支持超过130种语言,为全球用户提供了全栈自主可控的大模型解决方案,成为继国际主流选择之外的“第二种选择”。此外,基于星火X1底座的语音同传大模型在翻译质量、实时响应、语音自然度及专业性方面均实现了大幅提升,持续引领行业发展。
得益于星火X1模型的全面升级,教育、医疗、企业应用、代码开发、科研等多个行业的大模型和智能体也取得了新的突破,更好地满足了复杂行业场景下的用户关键需求。用户现在可以直接通过讯飞星火网页版和App体验最新升级的功能,同时全新API也已在讯飞开放平台同步上线。
在测试环节,讯飞星火X1-0420版本在国内大模型挑战全国高考数学一卷的评测中取得了突破性成绩,得分超过140分。而本次升级后,其数学能力更是得到了进一步精进。
科大讯飞还采用了业界首创的基于文本自适应调度的流式语音合成技术,使“译”与“说”实现了无缝耦合,大幅提升了语音听感的自然度、拟人度和舒适度。在翻译效果上,新版本同传大模型通过多维度主客观评价,翻译综合质量得分较上一版本提升了20%,尤其在复杂场景如多人会议中的中英双向翻译得分可达80分以上,单人演讲翻译得分更是超过90分。
此外,新模型还具备智能双语识别功能,能够自动识别中英文混合发言并实时切换翻译方向,有效避免了因语言切换而造成的交流中断,为双边会议、国际商务洽谈等场景提供了极大便利。目前,最新语音同传大模型已在讯飞双屏翻译机2.0、讯飞AI录音笔、讯飞同传等产品中全面上线。
面向软件研发领域,星火代码大模型有效提升了项目级代码理解与生成、单元测试智能体、WEB应用对话式编程等核心任务的表现,已深度赋能金融、制造、能源、科技等100余家关键领域客户,在典型应用场景中驱动研发效率提升超过50%。
页:
[1]