每日經濟新聞
要聞

每經網首頁 > 要聞 > 正文

華為芯片,大消息!

每日經濟新聞 2025-09-19 00:09:04

每經記者|王晶    每經編輯|金冥羽 魏文藝    

“算力的基礎是芯片,而昇騰芯片是華為整個AI戰略的基礎。”9月18日,在“華為全聯接大會2025”上,華為副董事長、輪值董事長徐直軍罕見地披露了關于昇騰芯片的演進和目標。

據徐直軍介紹,昇騰芯片會持續演進。“未來三年,華為規劃了三個系列的昇騰芯片,分別是950系列——包括950PR(2026年第一季度推出)和950DT(2026年第四季度推出)兩顆芯片,960(2027年第四季度推出)系列,以及970系列(2028年第四季度推出)。”

從發布節奏來看,昇騰芯片將進入一個快速迭代和性能持續飆升的周期。不過,由于受限于先進制程的獲取,華為單顆昇騰芯片的算力目前還難以直接與英偉達芯片競爭。為此,華為選擇了一條不同的技術路徑:通過“超節點+集群”的算力解決方案,將多顆芯片高效互聯,以集成的方式滿足持續增長的算力需求。

“由于美國制裁,我們不能產出最先進工藝制程的芯片,但我們基于過去三十多年構筑的聯接技術能力,使得我們能夠做到萬卡級的超節點,經營萬卡級的超節點,做到在世界上算力最強”徐直軍說道。

CFF20LXzkOwDicyD0kQRmTAAvGCQk1ytW74bypYN8fvYlPiclBR5gCFDa27dhflgN1fFJe6PgWkxTadV9J5QUFkw.jpg徐直軍 圖片來源:每經記者 王晶 攝

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

一年一迭代! 華為披露昇騰芯片三年演進路線圖

我們常聽說華為的麒麟芯片主要用于手機(CPU),而昇騰芯片則專注于數據中心、服務器、AI訓練平臺等專業領域(NPU),其主要職責是高效處理海量數據,并執行人工智能模型的“訓練”和“推理”任務。

2018年10月,華為正式發布首款采用華為自研達芬奇架構的AI芯片昇騰910與昇騰310。其中,昇騰310是SoC(系統級芯片)小芯片,和手機芯片差不多,只有指甲蓋大小;昇騰910是大芯片,和手掌心差不多大,主要面向云端高性能計算。2019年昇騰芯片正式投入商用,華為還同步推出了昇騰AI計算架構,包括昇騰處理器、昇騰AI加速模塊和昇騰AI開發環境,初步形成AI計算解決方案。

此后,由于眾所周知的原因,華為昇騰鮮少披露昇騰芯片進度。如今,徐直軍時隔六年再談芯片進展。從規劃上看,對于明年將落地的950系列,華為沒有選擇推出一顆“全能”芯片,而是計劃推出兩顆功能側重點不同的芯片。

其中,昇騰950PR專攻“Prefill”性能(AI推理過程中的關鍵階段),搭載自研HBM——HiBL 1.0,這是華為自研的高帶寬內存技術,可以理解為給芯片修了一條更寬、更快的“數據高速公路”,處理Prefill這種需要吞吐大量數據的任務,高速內存至關重要。而950DT則注重提升推理Decode(解碼)性能、訓練性能,并提升內存容量和帶寬。兩顆芯片分工協作,效率更高。

徐直軍稱:“昇騰960在算力、內存訪問帶寬、內存容量、互聯端口數等各種規格上相比昇騰950翻倍,大幅度提升訓練、推理等場景的性能,同時還支持華為自研的HiF4數據格式。這顆芯片將首先支持的產品形態是標卡和超節點服務器。昇騰970這顆芯片的一些規格還在討論中。總體方向是,在各項指標上大幅度升級,全面升級訓練和推理性能。目前的初步考慮是,相比昇騰960,其互聯帶寬等要全面翻倍,內存訪問帶寬至少增加1.5倍。”

可以看出,昇騰芯片將以幾乎一年一代、算力翻倍的速度持續推進

CFF20LXzkOwNfsay86cib4p0S2T0NfBIZicSMl7tYnKBaibmLibs8uIQI1mZYasibU5KFf6wlMM5EENdMic3ibFTHCmUw.png

超節點+集群:以架構創新突破算力瓶頸

如果說芯片迭代是基礎,那么超節點就是華為在算力戰場上“以架構創新打破制程封鎖”的戰略支點。它不再依賴于單芯片性能的極限突破,而是通過系統工程方法,將成千上萬顆芯片高效互聯,形成一個邏輯統一的超級計算機,從而實現整體算力的跨越式增長。

今年,華為發布了業界規模最大的超節點,即昇騰384超節點。華為將384顆昇騰AI芯片連接在一起組成集群,通過全對等高速互聯架構,基于系統工程方法,對計算、內存、通信的極致優化調度,可提供高達300PFLOPs的密集BF16算力,該性能表現接近英偉達GB200 NVL72系統的兩倍

“超節點在邏輯上是以一臺機器學習、思考、推理。”徐直軍說道。他還在大會上發布了更多的超節點和集成產品,比如Atlas 950 SuperPoD(基于昇騰950DT來打造)和Atlas 960 SuperPoD超節點,分別支持8192和15488張昇騰卡。

“Atlas950超節點至少在未來兩年都將是全球最強算力的超節點,也是全球最強算力的單體單元計算機。相比英偉達同樣在明年下半年上市的NVL144,Atlas950超節點卡的規模是它的56.8倍,總算力是它的6.7倍,內存容量是它的15倍,達到了1152TB。”徐直軍說道。

而基于超節點,華為還發布了超節點集群,分別是Atlas 950 SuperCluster和 Atlas 960 SuperCluster,算力規模分別超過50萬卡和達到百萬卡。

不過,如何將數千甚至上萬張芯片連接成一個高效的整體,是超節點技術面臨的核心挑戰,尤其是互聯技術方面。

徐直軍表示:“大規模超節點機柜多,柜間聯接距離長,當前電互聯和光互聯技術都不能滿足需求。另外,跨柜卡間互聯帶寬低,和超節點的需求差距達5倍。”

為此,華為通過系統性創新,在互聯協議的物理層、數據鏈路層、網絡層、傳輸層等都引入了高可靠機制,重新定義和設計了光器件、光模塊和互聯芯片,使光互聯的可靠性提升百倍、且互聯距離超過200米。同時,在大帶寬與時延上,依靠多端口聚合與高密封裝技術,以及平等架構和統一協議,實現了TB級的超大帶寬,2.1微秒的超低時延。華為還在大會上發布了面向超節點的互聯協議“靈衢”(UnifiedBus),可以把更多計算資源連接到一起。

這些技術上的突破令華為能夠將萬卡級芯片集成為一個整體,讓超節點像“一臺計算機”一樣工作、學習、思考、推理。

“超節點已經重新定義了AI基礎設施的范式。我們對于為人工智能的長期快速發展提供可持續且充裕的算力充滿信心,也值得大家期待。”徐直軍表示。

免責聲明:本文內容與數據僅供參考,不構成投資建議,使用前請核實。據此操作,風險自擔。

記者|王晶?

編輯|金冥羽 魏文藝?易啟江

校對|陳柯名

封面圖片來源:視覺中國

CFF20LXzkOyYmal29zn37N5Bg2NQ4tyN4ylvMFyM3VmF4x90Uj4cDmoEphibia4RN55ibIXmqU1Od9w2Q5nhA08lA.png

|每日經濟新聞 ?nbdnews? 原創文章|

未經許可禁止轉載、摘編、復制及鏡像等使用

如需轉載請與《每日經濟新聞》報社聯系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

免费阿v网站在线观看,九九国产精品视频久久,久热香蕉在线精品视频播放,欧美中文字幕乱码视频
日本午夜精品理论 | 亚洲精选AⅤ在线观看 | 精品女同一区二区三区免费站 | 中文字幕亚洲精品第十页 | 亚洲大乳高潮日本专区无需安装 | 在线一区二区三区免费视频 |