微软于2025年11月5日宣布,其首个自主研发的图像生成模型 MAI-Image-1 已正式集成至 Bing Image Creator 与 Copilot Audio Expressions 两款产品中(欧盟地区暂未上线)。该模型在生成食物、自然风景、艺术化光影效果以及高写实细节方面表现突出,尤其在处理反射、漫射等复杂光照场景时,展现出优于部分更大、更慢模型的性能。微软强调,MAI-Image-1 在图像生成速度与质量之间取得了良好平衡,有助于用户更高效地实现创意构思,并快速将成果导入其他工具进行后续优化。
此外,MAI-Image-1 还将用于 Copilot Audio Expressions 的“故事模式”,为 AI 生成的音频内容同步配图,提升多模态体验。这一进展是微软逐步减少对 OpenAI 技术依赖的重要一步。早在今年8月,微软已推出自研的语音模型 MAI-Voice-1 与文本模型 MAI-1-preview,并计划在特定场景中将其应用于 Copilot。目前,Copilot 聊天机器人正逐步过渡至 OpenAI 的 GPT-5,同时也为用户提供 Anthropic 的 Claude 系列作为替代选项。在 Bing 图像生成服务中,MAI-Image-1 与 DALL·E 3、GPT-4o 并列为三大可选模型,标志着微软在 AI 自主化道路上迈出了实质性步伐。 |