-
華為云CEO:384超節(jié)點(diǎn)每卡性能可達(dá)英偉達(dá)H20三倍
-
呂棟lvdong@guancha.cn
最后更新: 2025-09-10 15:05:57(文/觀察者網(wǎng) 呂棟 編輯/張廣凱)
“芯片重不重要?重要。但更重要的是,能夠提供客戶所需要的計(jì)算結(jié)果?!?月28日,在中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式上,華為常務(wù)董事、華為云計(jì)算CEO張平安說道。
這是華為云被傳出組織架構(gòu)大調(diào)整后,張平安首次公開發(fā)聲。他表示,華為云正在堅(jiān)定不移地造算力黑土地,通過昇騰AI云服務(wù)和Tokens服務(wù)滿足客戶的“最終計(jì)算結(jié)果”。
在當(dāng)下,大模型發(fā)展對AI基礎(chǔ)設(shè)施提出了更高要求,未來十年,算力的需求可能會有數(shù)萬倍的增長。但是相比英偉達(dá)、AMD等海外廠商,國產(chǎn)芯片的發(fā)展受到美國層層圍堵。
在芯片工藝受限的情況下,中國如何提升算力性能和規(guī)模?張平安表示,華為可以發(fā)揮“大雜燴”的優(yōu)勢——綜合在光通信、網(wǎng)絡(luò)、供電等多方面的技術(shù),以系統(tǒng)補(bǔ)單點(diǎn),以空間換算力,以帶寬換算力,以能源換算力,通過云上算力集群,獲得規(guī)模優(yōu)勢和提升性能。
今年4月,華為云發(fā)布了CloudMatrix384超節(jié)點(diǎn),將384顆昇騰NPU和192顆鯤鵬CPU,通過全新高速網(wǎng)絡(luò)MatrixLink全對等互聯(lián),形成一臺超級“AI服務(wù)器”,算力規(guī)模達(dá)到300 PFlops。此外,對于萬億、十萬億參數(shù)的大模型訓(xùn)練任務(wù),可以通過橫向擴(kuò)展方式,將432個(gè)超節(jié)點(diǎn)連在一起,組成一個(gè)16萬卡的AI集群。如果這個(gè)集群用于訓(xùn)練千億參數(shù)大模型,可以同時(shí)支持1300個(gè)。
在這次大會上,華為云宣布其Tokens服務(wù)接入CloudMatrix384超節(jié)點(diǎn),通過xDeepServe架構(gòu)創(chuàng)新,單芯片最高可實(shí)現(xiàn)2400TPS、50msTPOT的高吞吐、低時(shí)延,超過業(yè)界水平。
觀察者網(wǎng)從現(xiàn)場了解到,xDeepServe是以Transformerless的極致分離架構(gòu),把MoE大模型拆成可獨(dú)立伸縮的Attention、FFN、Exper三個(gè)微模塊,相當(dāng)于在一臺CloudMatrix384上把“大模型”拆成“積木”,并分派到不同的NPU上同步處理任務(wù)。之后,再用基于內(nèi)存語義的微秒級XCCL通信庫與FlowServe自研推理引擎,把它們重新拼成一個(gè)超高吞吐的LLM服務(wù)平臺,即Tokens的“超高速流水線”。通過xDeepServe不斷調(diào)優(yōu),最終實(shí)現(xiàn)了從非超節(jié)點(diǎn)單卡吞吐600tokens/s至超節(jié)點(diǎn)單卡吞吐2400tokens/s的提升。
“昇騰AI云服務(wù),我們可以稱之為國產(chǎn)的,我們不在意它是7納米、5納米還是10納米,我們在意的是這樣的AI云服務(wù),能夠?yàn)榭蛻籼峁┧懔Ψ?wù),提供Token服務(wù),來服務(wù)客戶的最終計(jì)算結(jié)果。很高興告訴大家,現(xiàn)在我們超節(jié)點(diǎn)的Token服務(wù),在50ms時(shí)延下,每卡可以生產(chǎn)出2400個(gè)Token,這個(gè)效率是H20的三倍。除盤古外,我們還支持主流的DeepSeek、Kimi等開源大模型?!睆埰桨苍诖髸媳硎?。
CloudMatrix384超節(jié)點(diǎn)
根據(jù)大會上的信息,目前華為云正圍繞貴安、烏蘭察布、和林格爾、蕪湖三大核心樞紐,打造“全國算力一張網(wǎng)”,其中在貴州已部署超40套CloudMatrix384超節(jié)點(diǎn)。相比去年同期,華為云整體算力規(guī)模增長接近250%,昇騰AI云服務(wù)客戶從從去年的321家增長到今年1714家,重大事故為零的記錄連續(xù)保持了756天。
與此同時(shí),華為云圍繞智能駕駛領(lǐng)域集中發(fā)布CloudVeo智能駕駛云服務(wù)等解決方案和成果,華為云貴安汽車專區(qū)正式上線,長安天樞智駕搭載華為云CloudMatrix 384超節(jié)點(diǎn)也同步亮相。
華為云透露,中國最大的智能駕駛(輔助)企業(yè)引望已經(jīng)跑在昇騰上。多個(gè)項(xiàng)目的實(shí)際測試結(jié)果顯示,在典型感知模型、E2E、VLA模型上,CloudMatrix 384超節(jié)點(diǎn)可以達(dá)到或者超過H1002.5-3倍。
就在這次大會前,華為云組織架構(gòu)調(diào)整引發(fā)諸多關(guān)注。市場傳言稱,華為云多個(gè)部門被裁撤整合。調(diào)整后,華為云將聚焦3+2+1業(yè)務(wù):3包括通算、智算、存儲;2包括AI PaaS、數(shù)據(jù)庫;1則主要為安全業(yè)務(wù)。
Canalys數(shù)據(jù)顯示,今年一季度,華為云在中國大陸云服務(wù)市場中排名第二,占據(jù)18%的份額,與阿里云33%的份額仍有差距。而阿里云AI相關(guān)工作負(fù)載已連續(xù)七個(gè)季度實(shí)現(xiàn)三位數(shù)增長,成為其云業(yè)務(wù)的核心引擎。
在分析人士看來,市場主流需求已從“上云”轉(zhuǎn)向“上AI”,客戶對AI的旺盛需求正重塑云計(jì)算應(yīng)用方式。華為云此次組織“陣痛”是一次必然的戰(zhàn)略抉擇,就是通過砍掉協(xié)同效應(yīng)弱、資源消耗大的外圍研發(fā),將所有力量都集中到能最大化“昇騰AI+盤古”組合優(yōu)勢的核心場景上。
這次大會上,華為副總裁、中國云業(yè)務(wù)部部長陳林也談到組織架構(gòu)調(diào)整一事。他表示,“原因很簡單,就是聚焦AI飽和投入。當(dāng)前是人工智能應(yīng)用行業(yè)落地的加速期,中國擁有千行萬業(yè)的業(yè)務(wù)場景,各行各業(yè)都在積極的擁抱AI,中國非常有機(jī)會在各行業(yè)構(gòu)筑起全球領(lǐng)先的優(yōu)勢。”
“我們希望大模型能在昇騰云上跑的更快更好?!睆埰桨惨蔡岬剑谡羝麢C(jī)發(fā)明的時(shí)候,人們曾經(jīng)嘗試著給三輪車裝上蒸汽機(jī),這讓火車的發(fā)明推遲了四十年,因此,在AI時(shí)代來臨的時(shí)候,要積極擁抱AI原生思維,用AI原生的思維來構(gòu)筑AI,圍繞AI重新構(gòu)建應(yīng)用、數(shù)據(jù)、流程、人員。
“今天是硅基輔助人來干活,AI是工具;未來AI可能會成為執(zhí)行任務(wù)的主體,人的任務(wù)就是管理AI,控制AI的開關(guān)。對于希望用AI構(gòu)筑領(lǐng)先優(yōu)勢的企業(yè)來說,只有通過AI原生思維來擁抱AI,才能充分發(fā)揮AI的潛力,提高效率,創(chuàng)新業(yè)務(wù)模式,抓住智能時(shí)代機(jī)遇,實(shí)現(xiàn)智能躍遷?!彼硎尽?
本文系觀察者網(wǎng)獨(dú)家稿件,未經(jīng)授權(quán),不得轉(zhuǎn)載。
- 責(zé)任編輯: 呂棟 
-
房東不得隨意減扣押金!租房新規(guī)下周一施行,專家解讀來了
2025-09-10 14:56 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
-
蘋果“搶跑”,手機(jī)廠商終于要倒逼運(yùn)營商淘汰SIM卡了?
2025-09-10 14:52 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
英偉達(dá):預(yù)計(jì)第三季度H20在華營收最高50億美元
2025-09-10 14:32 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
石破茂將在聯(lián)大發(fā)表二戰(zhàn)演講,有人竟急了:屈從中國
2025-09-10 14:29 日本 -
-
小城邯鄲打破全球紀(jì)錄,達(dá)美樂靠預(yù)制披薩“殺瘋了”?
2025-09-10 10:48 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
iPhone17“擠爆牙膏”,但沒有驚喜
2025-09-10 08:44 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
-
恒瑞醫(yī)藥再啟NewCo模式,心肌病藥10億美元“借船”出海
2025-09-09 19:30 觀網(wǎng)財(cái)經(jīng)-健康 -
昔日首富翻車曝光:給明星女友“內(nèi)幕”反虧500萬,雙雙被刑拘
2025-09-09 19:23 觀網(wǎng)財(cái)經(jīng)-健康 -
主要外賣平臺被約談
2025-09-09 17:14 反“內(nèi)卷”行動 -
中國首店大變樣,H&M不想再千篇一律了?
2025-09-09 17:10 觀網(wǎng)財(cái)經(jīng)-消費(fèi) -
六連投:京東在具身智能又落兩子
2025-09-09 17:01 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
-
擬收購子公司49%股權(quán),中芯國際復(fù)牌大跌超10%
2025-09-09 16:15 觀網(wǎng)財(cái)經(jīng)-科創(chuàng) -
進(jìn)軍本地生活服務(wù)?消息稱阿里將迎來重磅發(fā)布
2025-09-09 15:33 觀網(wǎng)財(cái)經(jīng)-互聯(lián)網(wǎng) -
法國品牌迪奧數(shù)據(jù)泄露,公安網(wǎng)安部門:予以行政處罰
2025-09-09 15:19 大公司 -
注冊資本207億,長江存儲三期來了
2025-09-09 14:37 觀網(wǎng)財(cái)經(jīng)-科創(chuàng)
相關(guān)推薦 -
-
最新聞 Hot
-
美媒挑事:巴基斯坦與中國很鐵,你細(xì)品…
-
“中方最嚴(yán)厲的公開回應(yīng)”
-
“挑戰(zhàn)中國主導(dǎo),美國把手伸向贊比亞”
-
“訓(xùn)練成本才這么點(diǎn)?美國同行陷入自我懷疑”
-
普京罕見透露前線俄軍人數(shù)
-
加拿大饞哭了:中國又從澳方買了,一買就是9船…
-
以防長威脅:胡塞,你的死期到了
-
主謀已落網(wǎng)
-
簽了!“中國發(fā)動機(jī)替代德國產(chǎn)品”
-
“對農(nóng)民來說,無異于千刀萬剮!好好和中國談吧”
-
印媒越吹越離譜:陣風(fēng)領(lǐng)先殲-35A...
-
白宮AI顧問急了:這正中華為下懷,居心何在?
-
“為跟中方談,特朗普拒批4億美元對臺軍援”
-
針對個(gè)別“反華”集會,韓總理緊急指令
-
日本空自一架搜救機(jī)降落時(shí)沖出跑道,暫無人員傷亡
-
獨(dú)山縣委書記李景寬任上被查
-