華為晶片出差錯?DeepSeek新款AI模型為何延遲推出?

國產芯片之路顛簸?深度求索模型延遲揭示中國人工智能自主化困境

近期,一個消息在科技圈裡掀起不小的漣漪:中國備受矚目的人工智能新創公司深度求索(DeepSeek),原本預計要發布的最新人工智能模型,竟然因為在使用華為昇騰處理器進行模型訓練時遇到技術挑戰,而不得不推遲。這究竟是怎麼一回事?這起事件不只揭示了中國在推動人工智能本土化發展上所面臨的重重關卡,也牽動了全球科技巨頭的戰略佈局,甚至是中美之間科技競爭的敏感神經。

中國人工智能公司面臨的挑戰

今天,我們就要像一位導師一樣,帶著你一起深入剖析這起事件的來龍去脈,理解它背後所代表的國產芯片性能瓶頸、美國出口管制的影響,以及中國如何在重重壓力下,持續布局自己的人工智能算力基礎設施。你會看到,這不只是一件單一公司的技術問題,它其實是中國人工智能自主化進程的一個縮影。

  • 了解國產芯片在人工智能領域的應用現狀
  • 分析中美科技競爭對中國AI發展的影響
  • 探討中國企業如何應對技術與政策挑戰

深度求索的「芯」路歷程:從英偉達走到華為,為何絆倒?

讓我們從這起事件的主角——深度求索說起。這家公司在人工智能大模型領域可說是大有來頭,先前發布的R1模型就已經展現了不俗的實力。為了進一步發展,他們本來希望推出更先進的R2模型,而且更重要的是,他們決定將訓練工作從常用的英偉達圖形處理器(NVIDIA GPU)轉移到中國自家的華為昇騰處理器上。

這項轉變的背後,其實有著中國政府大力推動國產化的政策導向。我們都知道,近年來美國對中國在高科技領域的限制越來越多,尤其是像人工智能芯片這種戰略性物資。因此,北京當局積極鼓勵國內企業轉用本土芯片,希望擺脫對外部技術的依賴。深度求索作為一家新創公司,自然也感受到了這種壓力與期待。

深度求索公司使用華為昇騰處理器

然而,現實卻比想像中骨感。根據《金融時報》等媒體的報導,深度求索在將R2模型遷移到華為昇騰平台進行訓練時,遭遇了預期之外的技術故障。這裡我們要先搞懂一個概念:人工智能的發展主要分為兩個階段,一個是「訓練」,另一個是「推理」。

  • 訓練(Training): 就像是讓AI學生學習大量的知識。這需要極高的算力,而且對芯片的穩定性、互連效率和處理速度要求非常嚴苛。想像一下,你需要同時處理天文數字般的數據,建立複雜的模型。
  • 推理(Inference): 則是AI學生學成之後,應用知識來解決問題的過程。例如,你問AI一個問題,它給你答案,這就是推理。推理雖然也需要算力,但通常對芯片的壓力會比訓練小很多,更看重效率和成本。

深度求索碰到的問題,就發生在「訓練」這個環節。據悉,華為昇騰芯片在訓練大型模型時,其穩定性性能表現並不如預期,導致訓練進度緩慢,甚至出現錯誤。這迫使深度求索不得不採取一種折衷方案:他們最終決定,模型的「訓練」階段還是回到英偉達圖形處理器上進行,而「推理」階段則優先使用華為昇騰芯片。這種「訓練靠國外、推理用國產」的模式,雖然解決了燃眉之急,但也清楚地暴露了國產芯片在高端人工智能大模型訓練領域,與國際領先水平仍有差距的現實,也讓他們錯失了最新模型發布的市場時機。

深度求索模型訓練與推理使用的處理器比較
處理器類型 品牌 主要用途 優勢 劣勢
圖形處理器 英偉達 人工智能模型訓練 高性能,穩定性佳 依賴國外供應,受出口管制影響
昇騰處理器 華為 人工智能模型推理 支持本土化,成本較低 訓練性能不足,穩定性有待提升

美國芯片的制約:英偉達H20與中國市場的雙向考驗

深度求索之所以會冒險轉用華為昇騰,除了政策壓力,更直接的原因是來自美國對高端芯片的出口管制。你可能聽說過,美國政府為了限制中國的科技發展,不斷收緊對先進芯片及相關設備的出口許可。對於英偉達這樣的芯片巨頭來說,中國是個巨大的市場,但他們也不得不遵守美國的規定。

美國英偉達H20芯片

例如,英偉達為中國市場特別推出了效能被「閹割」過的H20芯片,以符合美國的出口限制。但即便如此,中國企業在採購這些芯片時,依然面臨重重阻礙。除了美國的出口許可條件嚴格之外,中國政府對這些「特供版」芯片的態度也顯得非常謹慎。

  • 出口管制限制了高端芯片的供應
  • 中國政府對外國技術的安全性存疑
  • 企業採購意願低迷,尋求本土替代方案

根據報導,像是中國科技巨頭騰訊字節跳動,在採購英偉達H20芯片時都顯得格外小心,甚至會壓低採購量。其中一個很重要的原因,就是中國監管部門對這些外國芯片可能存在的「後門」問題表示擔憂。你或許會問,什麼是「後門」?簡單來說,就是擔心這些芯片裡會不會被植入什麼程式碼或設計,導致信息安全上的隱憂,甚至可能被外部力量用於監控或干預。這種「安全質疑」的聲音,例如來自中共網信辦的約談,直接影響了中國企業的採購意願,也加速了他們尋求本土替代方案的步伐。這正是中美兩大國在人工智能領域,從技術到信任,全面競爭的寫照。

中美在人工智能芯片領域的競爭分析
競爭領域 美國優勢 中國挑戰 雙方策略
芯片設計與製造 先進技術,成熟市場 技術自主性不足,依賴進口 美國加強出口管制,中國推動國產化
技術創新 持續領先,投入巨大研發 研發資源有限,創新速度較慢 雙方加大研發投入,尋求技術突破
市場佔有率 全球市場份額高 市場份額逐步提升,但仍低於美國 中國企業積極擴展國內市場,減少對外依賴

中國人工智能算力基礎的本土化挑戰:記憶體瓶頸與「彎道超車」

除了芯片本身,還有一個關鍵組件對人工智能的發展至關重要,那就是高帶寬記憶體(High Bandwidth Memory, HBM)。想像一下,人工智能芯片就像一個超級聰明的廚師,而高帶寬記憶體就像是廚師旁邊擺放食材的桌子。如果桌子太小,廚師拿取食材(數據)的速度就會變慢,即使廚師再聰明,效率也會大打折扣。所以,HBM能夠提供極高的數據傳輸速度,是人工智能大模型訓練與推理不可或缺的「高速公路」。

然而,這塊領域目前幾乎被海外廠商壟斷,例如SK海力士三星電子美光科技。中國的國產HBM技術與國際領先水平存在較大差距,這無疑是中國在發展人工智能算力基礎上的一大瓶頸。這讓中國企業不得不尋求「彎道超車」的策略。

  • 國產HBM技術研發進展緩慢
  • 對海外高帶寬記憶體的依賴度高
  • 推動多元化供應鏈以分散風險

華為作為中國科技的領頭羊,深知單靠芯片本身的性能突破,短期內可能無法完全追上國際巨頭。因此,他們提出了獨特的「數學補物理、非摩爾補摩爾、群計算補單芯片」的創新路徑。這句話聽起來有點複雜,讓我們簡單解釋一下:

  • 數學補物理: 指的是透過優化演算法和軟體設計,來彌補硬體物理極限上的不足。
  • 非摩爾補摩爾: 摩爾定律(集成電路上可容納的電晶體數量每兩年翻一倍)正在放緩,華為尋求在非傳統摩爾定律的領域尋求創新,例如堆疊技術、架構優化等。
  • 群計算補單芯片: 這點尤為重要。既然單個國產芯片性能不如頂級英偉達芯片,那就集合大量的華為昇騰芯片,透過高效的「群計算」協同工作,來達到甚至超越單一高性能芯片的整體算力效果。這就像單個士兵打不過,就組織成一個訓練有素的部隊來打群架。華為甚至推出如CloudMatrix 384這樣的人工智能算力超節點,正是這種「群計算」理念的實踐,試圖在整體算力上實現「彎道超車」。這也解釋了為何深度求索會被鼓勵使用華為昇騰384超節點

    華為群計算策略與傳統單芯片策略比較
    策略類型 優勢 劣勢 應用案例
    群計算 提高整體算力,降低對單一芯片依賴 需要更複雜的協調與管理 華為CloudMatrix 384超節點
    單芯片 管理簡單,單點優化 性能受限,擴展性差 英偉達高性能GPU

    華為在人工智能推理領域的潛在突破:點亮自主化新曙光?

    儘管在訓練領域仍面臨挑戰,但華為人工智能推理領域的動作卻非常積極,甚至可能帶來突破性的進展。根據報導,華為預計將於近期發布在人工智能推理技術上的重大成果。這項突破的核心目標,就是降低對高帶寬記憶體的依賴,同時大幅提升國產人工智能大模型推理性能

    為什麼推理這麼重要?國際數據資訊(IDC)的研究顯示,未來人工智能伺服器的主要工作負載將會從訓練轉向推理。預計到2027年,用於推理的人工智能伺服器將佔到總量的72.6%。這意味著,如果你能讓人工智能模型更高效、更便宜地進行「應用」(推理),就能搶佔巨大的市場。

    • 推理效率提升有助於擴大AI應用範圍
    • 降低推理成本可增加企業競爭力
    • 高效推理技術是未來AI發展的關鍵

    華為在這方面已經取得了一些令人振奮的合作案例。例如,北京大學就與華為聯手,發布了「深度求索全棧開源推理方案」,成功在華為昇騰平台上實現了深度求索模型的高效推理。他們還開發了自研的SCOW算力平台系統和鶴思調度系統,這些都是為了更好地發揮國產芯片的潛力。

    華為推理技術的突破

    此外,科大訊飛華為的合作也展現了昇騰芯片在推理領域的實力。他們成功實現了MoE(Mixture of Experts)模型在國產算力上大規模的跨節點專家並行集群推理,不僅讓推理吞吐量提升了3.2倍,端到端時延也降低了50%。這就像是讓AI模型的反應速度變得更快、更流暢。這些例子都表明,即使在訓練環節仍有痛點,華為昇騰在「推理」這條賽道上,正快速完善著中國自己的人工智能推理生態

    人工智能模型推理性能提升策略
    策略 描述 預期效果 實施例子
    分布式推理 將推理任務分散到多個節點進行 提升吞吐量,降低時延 科大訊飛的MoE模型
    優化算法 通過算法優化提升推理效率 減少運算資源消耗,提高速度 華為的SCOW算力平台
    硬體加速 利用專用硬體加速推理過程 進一步提升推理性能 華為昇騰處理器

    結語:挑戰與希望並存的自主化之路

    深度求索模型發布的延遲,絕非單純的技術事件,它其實是中美科技競爭白熱化下,中國人工智能發展的一個縮影。我們看到了在高端芯片特別是訓練芯片的性能與供應鏈上,中國企業仍然面臨著嚴峻的挑戰。來自美國的出口管制和中國自身對外來技術的「安全質疑」,也迫使所有企業都必須審慎評估。

    然而,這並非沒有希望。在國家政策的強力引導下,中國正在持續推動本土化解決方案的研發與落地。華為等國內科技巨頭透過「群計算」的創新策略,以及在人工智能推理領域的積極突破,正試圖開闢一條新的道路,以降低對國外核心技術的依賴。尤其當人工智能的應用重心逐漸轉向推理時,這可能為中國人工智能的自主發展帶來新的曙光。

    這場科技競賽的最終勝負,將不只取決於單一芯片的性能,更將是技術創新、整體算力生態建設與複雜國際關係互動的結果。對於身處這個大時代的我們來說,理解這些變化,就是理解未來的關鍵。

    免責聲明: 本文僅為資訊性與教學性內容,旨在提供客觀知識分析,不包含任何投資建議。科技產業與地緣政治風險複雜多變,投資決策請務必自行評估,並尋求專業意見。

    常見問題(FAQ)

    Q:深度求索為何選擇轉用華為昇騰處理器訓練AI模型?

    A:主要是受中國政府推動國產化政策影響,旨在降低對外部技術的依賴,同時應對美國出口管制的挑戰。

    Q:華為昇騰處理器在AI推理領域有何突破?

    A:華為昇騰處理器在推理領域透過群計算和專用算力平台,大幅提升了推理性能和效率,降低了對高帶寬記憶體的依賴。

    Q:中國在高帶寬記憶體技術上面臨哪些挑戰?

    A:中國國產HBM技術與國際先進水平存在較大差距,主要被海外廠商如SK海力士、三星電子和美光科技壟斷,限制了AI算力基礎的發展。

Finews 編輯
Finews 編輯

台灣最好懂得財經新聞網,立志把艱澀的財經、科技新聞用最白話的方式說出來。

文章: 7395

發佈留言