[AI] 小米发布Mi-BRAG知识库问答框架:重构知识处理范式,赋能多场景智能问答

[复制链接]
34 |0
数码小喇叭 发表于 7 天前 | 显示全部楼层 |阅读模式    IP属地:广东东莞
小米官方近日详细介绍了其自主研发的Mi-BRAG知识库问答框架,该框架通过四大核心技术体系,即全格式兼容、全模态解析、多语种问答及细粒度溯源,重构了知识处理范式,并在公司多个场景中成功落地应用。

Mi-BRAG框架的全格式兼容能力得益于其搭载的智能解析引擎,该引擎能够无损处理PDF、Word、Excel等十余种文档格式,为企业构建统一知识库提供了坚实基础。同时,全模态解析技术突破了传统文本局限,能够精准解析复杂图片、表格、图文混排等多元信息,进一步丰富了知识库的内容。

在多语种问答方面,Mi-BRAG框架支持主流语言的文档解析与交互问答,有效打破了知识流通的语种壁垒,使得全球用户都能享受到便捷的知识问答服务。而细粒度溯源技术则通过动态溯源定位技术,对每个生成结果标注原始文档及引用位置,用户可一键追溯信息源头,从而构建了可信的知识生态。

针对大模型(LLM)在知识更新、私有知识理解及数据安全等方面面临的挑战,小米引入了RAG(Retrieval-Augmented Generation,检索增强生成)技术,通过检索最新的文档或数据库,为生成过程注入实时信息,确保输出内容的准确性与时效性。同时,RAG技术还通过构建外部知识库,增强了特定领域知识的准确性,并有效保护了企业敏感数据的安全。

小米大模型团队认为,一个完整的知识问答框架应包含知识库创建、知识检索、知识增强和回复生成四个部分。而Mi-BRAG框架在知识库创建模块中特别注重跨模态的知识融合及构建“金字塔型”动态知识体系,以提升问答效果。在知识检索与增强阶段,框架通过用户Query理解的增强及多维语义增强等技术,进一步提升了检索的准确性和效率。在回复生成阶段,Mi-BRAG为知识注入场景定制了模型,强化了无关信息的拒答能力及精细化的溯源能力。

据第三方评测机构SuperCLUE的综合评估,小米在2025年4月的SuperCLUE-RAG生成能力评测中登上榜首,这主要归功于Mi-BRAG在抗噪声数据处理与信息整合方面的创新数据构建方法,以及其突破性的模型训练范式。此外,在ASQA长格式事实类数据集上的测试也显示,Mi-BRAG在多文档生成溯源准召率方面表现出色。

目前,Mi-BRAG框架已在小爱同学个人信息问答、汽车问答助手、商品问答等场景落地应用。未来,小米大模型团队将持续攻坚端侧算力优化与云边协同架构等关键技术领域,同时深化多模态技术整合,打造覆盖文本、语音、视觉的全模态智能问答体系,以持续拓展智能家居、汽车问答等应用场景,全面赋能小米“人车家全生态”战略体系。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表