发帖

客户端

扫码下载

立即注册

登录

QQ登陆

切换到宽版

NekoTeco»社区 › 宅闻情报 › 数码资讯 › 华为即将发布AI推理领域突破性技术成果，降低对HBM依赖 ...

返回列表发新帖

[AI] 华为即将发布AI推理领域突破性技术成果，降低对HBM依赖并提升性能

4 |0

数字前沿 发表于前天 22:18 | 显示全部楼层 |阅读模式 IP属地：广东东莞

据《科创板日报》报道，华为计划于8月12日在2025金融AI推理应用落地与发展论坛上，发布其在AI推理领域的最新技术成果。该成果有望减少中国AI推理对高带宽内存（HBM）技术的依赖，同时提升国内AI大模型的推理性能，进一步完善中国AI推理生态。

华为在AI推理领域已有显著进展。今年3月，北京大学与华为联合发布了DeepSeek全栈开源推理方案，该方案基于北大自研的SCOW算力平台系统和鹤思调度系统，整合了DeepSeek、openEuler、MindSpore及vLLM/RAY等开源组件，实现了在华为昇腾芯片上的高效DeepSeek推理。

在性能突破方面，华为昇腾已取得多项成就。例如，CloudMatrix 384超节点在部署DeepSeek V3/R1时，在50ms时延约束下，单卡Decode吞吐量突破1920 Tokens/s；Atlas 800I A2推理服务器在100ms时延约束下，单卡吞吐量达到808 Tokens/s。

此外，科大讯飞与华为的合作也取得了显著成果。双方率先实现了国产算力上MoE模型的大规模跨节点专家并行集群推理，使推理吞吐量提升了3.2倍，端到端时延降低了50%。

回复

使用道具举报

返回列表发新帖

社区元老

这位朋友什么都没有写…

主题 1005

精华0

听众0

收听TA 发消息

72小时热榜

评B站“虓虎手机官方”：我们机圈也有自己的“非法集资”

收货！飞智八爪鱼5 EVA明日香限量联名款

数码讨论

70人已阅读

【续-Part2】参加 OPPO K13 Turbo系列发布会！

酒馆杂谈

54人已阅读

【续-Part1】参加 OPPO K13 Turbo 系列发布会！

酒馆杂谈

60人已阅读

参加 OPPO K13 Turbo 系列发布会！

酒馆杂谈

64人已阅读

热门版块

技术讨论
主题: 10
数码资讯
主题: 1927
漫番资讯
主题: 11
游戏资讯
主题: 265
投诉建议
主题: 0

热门帖子

1

【盖楼抽奖】庆祝社区公测及UID破百，抽送年度最佳入门耳机！

Yangsh888

2025-03-26

2

【盖楼抽奖】庆祝社区App上架，抽送一副头戴耳机！

Yangsh888

2025-04-04

3

【盖楼抽奖】粽叶飘香、浓情端午，抽送一个智能音箱！

Yangsh888

2025-05-28

4

达美乐买一送一

oberon

2025-03-31

5

「用户共创」掌机及游戏设置互助系统需求征集与规划设计活动

Yangsh888

2025-05-30

6

独家 | 威联通TS_551升级CPU，双核变四核！

Yangsh888

2025-03-30

社区热门

1

【盖楼抽奖】庆祝社区公测及UID破百，抽送年度最佳入门耳机！

2025-03-26

2

【盖楼抽奖】庆祝社区App上架，抽送一副头戴耳机！

2025-04-04

3

【盖楼抽奖】粽叶飘香、浓情端午，抽送一个智能音箱！

2025-05-28

4

达美乐买一送一

2025-03-31

5

《租借女友》动画第四季主视觉图公开，将于2025年7月开播

2025-03-26

6

【内测招募】NekoTeco SpecWiki 参数百科，与你共建精准的设备参

2025-06-27

最新数码动态，尽在掌握。

关注"NekoTeco"社区

返回顶部

快速回复 返回顶部 返回列表