发帖
客户端
扫码下载

[AI] 苹果AI研究新突破:生成式AI优化App界面开发,Qwen3-Coder模型超越GPT-5

[复制链接]
4 |0
数字前沿 发表于 昨天 21:22 | 显示全部楼层 |阅读模式
这里可以调整气泡内文字大小!滑动试试吧! ×
12 px
26 px
苹果最新公示的AI研究论文聚焦于利用生成式AI优化App界面(UI)开发,其中经过特定方法微调的Qwen3-Coder模型在UI生成能力上展现出了超越GPT-5的实力。

该论文由苹果UICoder团队发表,主要探索了如何将生成式AI更高效地融入App开发流程。研究指出,目前主流的“人类反馈强化学习”(RLHF)方法并不完全适用于UI设计领域。传统的RLHF通常依赖人类对AI生成结果的简单“点赞/点踩”或排序评价,但这种二元评价体系忽略了设计背后的复杂逻辑,也无法充分体现设计师的工作流程。简单来说,AI只能得知“这个设计不好”,却难以理解“哪里不好”或“如何改进”。

为了解决这一问题,苹果招募了21位拥有2至30年经验的专业设计师参与实验。与以往的打分模式不同,设计师们被要求直接通过撰写评论、绘制草图甚至修改代码来优化AI生成的界面。研究团队收集了1460条此类深度注释,并将“修改前”与“修改后”的对比数据输入到一个奖励模型中。该模型通过学习截图和自然语言描述,逐渐掌握了像人类设计师一样判断UI美观度与功能性的能力。

实验数据显示,基于“草图反馈”训练的模型表现最为优异。令人惊讶的是,仅依靠181个草图注释进行微调,该模型就实现了对GPT-5的超越。研究团队表示,这一成果证明了“少而精”的专家级反馈能够让小参数模型在特定领域展现出超越大模型的潜力。

研究还揭示了一个关键现象:设计审美具有高度主观性。在单纯的排序任务中,研究人员与设计师的观点一致率仅为49.2%,几乎等同于随机猜测。然而,当设计师通过草图或直接编辑来表达设计意图后,双方的一致率分别飙升至63.6%和76.1%。这表明,在定义“什么是更好的设计”时,具体的视觉修改(Show)远比抽象的评分(Tell)更具共识价值,这也是未来AI辅助设计工具进化的核心方向。
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

热门版块
数码资讯
最新数码动态,尽在掌握。
快速回复 返回顶部 返回列表