发帖
客户端
扫码下载

[AI] 阿里云发布多模态交互开发套件,赋能AI硬件创新

[复制链接]
4 |0
数字前沿 发表于 昨天 23:26 | 显示全部楼层 |阅读模式
这里可以调整气泡内文字大小!滑动试试吧! ×
12 px
26 px
在今日举办的阿里云通义智能硬件展上,阿里云全新推出多模态交互开发套件,该套件深度集成千问、万相、百聆三款通义基础大模型,并预置覆盖生活休闲、工作效率等领域的十余款Agent与MCP工具,实现听、看、思考及物理世界交互的全链路能力,可广泛应用于AI眼镜、学习机、陪伴玩具及智能机器人等硬件设备。

在硬件适配层面,该套件支持30余款主流ARM、RISC-V和MIPS架构终端芯片平台,满足绝大多数硬件设备的快速接入需求。未来,通义大模型将与玄铁RISC-V架构实现软硬协同优化,提升大模型在RISC-V架构上的部署效率与推理性能。针对多模态交互场景,阿里云推出专有模型,全面支持全双工语音、视频、图文交互,端到端语音交互时延低至1秒,视频交互时延低至1.5秒。

套件预置的Agent覆盖出行规划、旅行攻略等场景,用户可直接调用路线规划、吃喝玩乐探索等能力。同时,套件接入阿里云百炼平台生态,支持添加第三方开发者提供的MCP和Agent模板,并通过A2A协议兼容三方Agent,扩展应用能力边界。现场展示的解决方案包括AI眼镜领域的同声传译、多模态备忘录功能,以及家庭陪伴机器人场景的异常监测、视频定位与对话交互功能。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表