据知情人士透露,Alphabet旗下谷歌正推进一项名为“TorchTPU”的新计划,旨在提升其人工智能芯片运行主流AI软件框架PyTorch的性能,削弱英伟达在AI计算市场的长期优势。该计划核心是让谷歌张量处理单元(TPU)成为英伟达GPU的可靠替代品,通过实现TPU与PyTorch完全兼容,提升开发者友好度,吸引已基于PyTorch构建技术架构的客户。PyTorch作为Meta支持的开源项目,是AI模型开发者最常用的工具之一,而英伟达凭借CUDA架构与其深度整合,构建了强大的软件生态壁垒。
谷歌此次对TorchTPU投入更多资源,原因在于企业客户认为软件栈是TPU落地的瓶颈。长期以来,谷歌内部开发主要依赖Jax框架,TPU芯片通过XLA工具优化运行效率,但与主流PyTorch框架存在兼容性鸿沟,导致客户迁移成本高昂。若TorchTPU计划成功,将大幅降低企业替换英伟达GPU的门槛。为此,谷歌正与PyTorch维护方Meta紧密合作,此前Meta已获得更多TPU使用权,推动兼容软件开发以降低模型推理成本,减少对英伟达的依赖。
谷歌云发言人证实,此举旨在为开发者提供更多硬件选择。2022年,谷歌云计算部门接管TPU销售团队后,外部客户配额大幅增加。随着AI需求激增,谷歌通过扩大产能和直接销售TPU把握市场机遇。然而,TPU推广仍面临挑战:多数开发者需放弃PyTorch转用Jax框架才能发挥TPU性能,这一过程耗时耗钱。若TorchTPU能消除兼容性障碍,谷歌云业务收入和TPU销售额有望成为关键增长引擎,同时支撑自研产品如Gemini聊天机器人和AI搜索引擎的运行。 |