发帖
客户端
扫码下载

[AI] 微软发布机器人领域AI模型Rho-alpha,推动物理世界交互革新

[复制链接]
5 |0
未来视野 发表于 昨天 22:59 | 显示全部楼层 |阅读模式
这里可以调整气泡内文字大小!滑动试试吧! ×
12 px
26 px
微软发布了一款专为机器人领域设计的全新AI模型Rho-alpha,该模型旨在突破机器人传统运行环境的局限,使其能在更复杂、不可预测的真实世界中高效执行任务。作为微软“物理AI”战略的重要组成部分,Rho-alpha基于Phi视觉-语言模型家族打造,是微软首次专门面向机器人应用推出的系统。

Rho-alpha的核心优势在于其能将自然语言指令直接转化为机器人控制信号,让机器人无需依赖固定脚本和预设流程即可完成复杂的双手协同操作任务。目前,微软已在双臂机器人平台和类人机器人上对该系统展开评估测试。微软研究院企业副总裁兼总经理Ashley Llorens指出,相较于语言和视觉AI的快速发展,机器人技术的进步一直较为缓慢。但随着感知、推理和行动能力的深度融合,机器人有望在非结构化环境中展现出更高的自主性,从而彻底改变其与人类的协作方式。

在功能设计上,Rho-alpha不仅属于视觉-语言-行动模型的范畴,还创新性地引入了触觉感知能力。这使得机器人在执行任务时能够根据触觉反馈实时调整动作,而非仅依赖视觉信息。微软表示,未来版本还将集成力感知等更多传感模态,以进一步提升操作精度和安全性。此外,Rho-alpha具备出色的适应性,能在运行过程中动态调整行为策略。当机器人出现操作失误时,人类操作者可通过3D输入设备等直观工具进行干预,系统会将这些纠正反馈纳入学习过程,实现持续优化。

针对机器人领域长期存在的训练数据不足问题,微软也提出了创新解决方案。Rho-alpha采用了真实机器人演示、仿真任务以及大规模视觉问答数据相结合的训练方式,通过运行在Azure基础设施上的机器人仿真和强化学习流水线生成大量合成数据,再与商业及开放数据集中的真实机器人数据融合使用,有效解决了数据采集成本高、效率低的问题。微软表示,Rho-alpha将首先通过研究型早期访问计划向外部开放,后续还将提供更广泛的使用渠道,为机器人厂商和系统集成商提供更高自主性和可定制化的训练工具。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表