2025年阿里巴巴在人工智能芯片領域動作頻頻。從自主研發的平頭哥并行處理單元(PPU)正式落地,到以RISC-V為核心的長期架構規劃,再到與中國聯通的深度合作和與英偉達在物理AI層面的意外攜手,阿里正在以“兩條線”的方式推進其在AI產業鏈的布局。
通過孵化與自研建立國產算力的根基,試圖擺脫對海外供應鏈的依賴;依靠加大資本開支提升云計算和AI服務的整體競爭力,阿里在未來十年內構建算力自給體系的主動謀劃。
Part 1
孵化與自研:
從含光800到PPU
阿里在芯片領域的探索并非始于今日。2018年,因中興事件暴露了國內在芯片上的脆弱性,阿里成立了平頭哥半導體,作為其芯片研發的核心平臺。2019年,首款推理芯片含光800問世,主要應用于阿里內部數據中心。那一階段的芯片開發更多是為了驗證能力和滿足自身需求,并未承擔外部市場化任務。
真正的轉折點出現在2025年。阿里發布了全新的平頭哥PPU,這是一款面向大規模AI推理的專用加速器。其設計邏輯并非簡單追趕,而是直指英偉達在中國市場的留白區域。
在美國出口管制的限制下,H100、A100等先進芯片無法進入中國,H20成為可供選擇的最高端產品。
阿里PPU在規格上對標H20,例如配備96GB HBM2e顯存,互連帶寬達到700GB/s,功耗控制在400W,性能已達到中國市場的最高合規水平。與A800相比,PPU在內存和互連方面更具優勢。
PPU的生產完全由國內完成,據業內消息,芯片采用中芯國際的7nm工藝,整個制造鏈條高度本地化,在供應可控性上,阿里實現了從設計到制造的閉環,這種能力是戰略性的突破。
在成本維度上,阿里也展現了工程化的思路。PPU的物料清單成本比H20低約40%,從而使阿里云能夠將AI推理服務的價格降低一半。通過硬件到服務的聯動,阿里不僅控制了算力成本,還迅速形成了市場價格優勢。這是自研芯片與云業務一體化的直接收益。
阿里并未在軟件生態上貿然切割,而是采取兼容策略。PPU支持CUDA相關框架,使得客戶遷移成本最低。這種務實的兼容路線,既降低了推廣阻力,也體現出自研芯片要真正融入市場的現實考量。