作者|趙健

英偉達CEO黃仁勛正在試圖給行業建立一種印象——AI等於英偉達。

在AI大語言模型爆發的今天,要想完成對算力要求極高的AI訓練,英偉達針對人工智能的GPU芯片幾乎是唯一的選擇。

這種供需的極度不平衡讓英偉達的GPU一芯難求,就連OpenAI CEO山姆·奧爾特曼也在抱怨芯片短缺已經影響到瞭ChatGPT的發展。

黃仁勛對此一定喜聞樂見。2023年,在AI需求的推動下,英偉達的市值沖破萬億美元。

不過,有人正在試圖打破英偉達在人工智能領域“獨孤求敗”的狀態。

本周三,AMD(超威半導體)在其首次“人工智能與數據中心”產品發佈會上,正式發佈瞭年度旗艦芯片Instinct MI300,一款可以對標英偉達Grace Hopper系列的超級芯片。

Instinct MI300有兩個版本:MI300X僅有GPU,專為AI模型訓練設計,封裝瞭1530億顆晶體管;MI300A則是集多個CPU、GPU和高寬帶內存於一身的APU(AMD在2011年時提出的產品概念),封裝瞭1460億顆晶體管。

Instinct MI300的發佈意味著,英偉達不再是AI公司對算力的唯一選項。AMD確實也成功吸引到瞭一些AI明星獨角獸,比如Hugging Face,AMD將為其CPU、GPU和其他AI硬件優化模型。

Instinct MI300承載著AMD在人工智能領域的野心。AMD CEO蘇姿豐近期曾表示:“如果放眼五年,你會在 AMD 的每一款產品中看到人工智能,它將成為最大的增長動力。”

AMD是英偉達的老對手,兩者在GPU市場的競爭已經持續瞭17年,大部分時間都以英偉達的勝利而告終。

而這一次,已經在CPU市場證明過一次的AMD,能否把成功經驗復制到GPU市場?

01 AMD想要英偉達的AI皇冠

AMD是全球知名的老牌半導體公司,成立於1969年。在今年Gartner發佈的全球半導體公司的排名數據來看,AMD位列第七。

CPU是AMD的發傢業務。1981年AMD獲得瞭英特爾X86系列處理器的授權,在PC時代的紅利期一舉做到瞭行業第二,而這個行業老二,一做就做瞭幾十年。

在CPU之外,AMD又通過不停地並購,逐步建立起“CPU+GPU+DPU+FPGA”完整的芯片佈局。

其中比較重要的並購事件包括:

2006年7月,AMD斥資54億美元收購當時的GPU行業老二ATI,正式與英偉達展開GPU的競爭;

2022年2月,AMD斥資498億美元完成對FPGA廠商賽靈思的收購,加強在數據中心業務的佈局;

2022年4月,AMD宣佈以19億美元收購DPU芯片廠商Pensando,繼續擴大數據中心業務。

AMD的業務構成分為四大板塊:數據中心、客戶端、遊戲與嵌入式業務。

數據中心包含AMD所有的服務器相關的收入;客戶端收入主要涉及臺式機與個人電腦,曾經是AMD最核心的業務之一,現在收入占比已經不高;遊戲業務主要涉及GPU產品線,索尼、微軟是穩定的大客戶;嵌入式業務則主要來源於原賽靈思的業務。

隨著人工智能成為一種趨勢,數據中心成為各大雲巨頭高度重視、大力投入的業務,也是英偉達、英特爾與AMD的兵傢必爭之地。

在此前的2023年Q1財報會上,AMD強調AI為目前公司的第一戰略重點,AMD正致力於構建更加多元的AI產品矩陣。

而AMD的產品發佈會,就是首次以“人工智能與數據中心”為主題。蘇姿豐在發佈會上強調,在大型語言模型的推動下,人工智能的市場機會越來越大,到2027年市場潛力可能從目前的300億美元增加到約1500億美元。

AMD不想錯過這場AI盛宴,但英偉達是橫亙在眼前的不得不翻越的大山。

在最新一季的財報中,AMD的數據中心業務營收12.95億美元,同比上一季度的12.93億美元,基本沒有增長。反觀英偉達,今年第一季度的數據中心業務營收創歷史新高,同比增長14%至42.8億美元,是AMD的三倍多。

而根據量化對沖基金Khaveen Investments測算,英偉達數據中心GPU在2022年的市占率高達88%,AMD和英特爾瓜分剩下的部分。

雖然AMD是GPU市場的老玩傢,但其過去的GPU系列產品主要應用於圖像處理及AI推理領域,而對於並行計算要求更高的AI訓練卻入場較晚。

而Instinct MI300的發佈,意味著AMD試圖在AI訓練市場,改變英偉達一傢獨大的局面。

02 進軍AI訓練

Instinct MI300是第一款面向數據中心的高性能“APU”——一個由AMD獨創的概念。

2011年(AMD收購ATI的第五年),AMD在產品構想中以CPU和GPU分別類比人類左右腦,並基於此提出瞭“CPU+GPU”的異構產品策略,並將其命名為APU。

類比人腦,AMD認為左腦更像CPU,負責對信息的邏輯處理,如串行運算、數字和算術、分析思維、 理解、分類、整理等,而右腦更像GPU,負責並行計算、多模態、創造性思維和想象等。

圖片來自華泰研究

不過,2011年的AMD正處在“失去的十年”低谷期,無論是在CPU線還是GPU線,都沒能拿出足夠優秀的產品,APU的發展不盡如人意。

時間來到2020年3月,AMD發佈瞭新的微架構版本CDNA,專門針對數據中心的高性能計算、AI計算而設計。在此之前,AMD的GPU是用同一套架構同時解決遊戲與計算場景需求,自然不利於不同場景的優化。

Instinct系列產品,就是專為HPC高性能計算、AI計算而生的。而最新發佈的MI300,在規格及性能方面都全面追擊英偉達的Grace Hopper。

Instinct MI300采用瞭臺積電5nm工藝,有兩個不同的版本:MI300X僅有GPU,專為AI模型訓練設計,封裝瞭1530億顆晶體管;MI300A則是集多個CPU、GPU和高寬帶內存於一身的APU,封裝瞭1460億顆晶體管。

AMD聲稱Instinct MI300比上一代產品MI250的AI性能高8倍,它可以將ChatGPT和DALL-E等超大型AI模型的訓練時間從幾個月減少到幾周,從而節省數百萬美元的電費

AMD在發佈會現場演示瞭MI300x運行400億參數的Falcon模型,讓它寫瞭一首關於舊金山的詩。蘇姿豐表示:“模型對容量的要求越來越大,你實際上需要多個GPU來運行最新的大型語言模型。”她指出,隨著AMD芯片上內存的增加,開發人員將不需要那麼多GPU。

AMD尚未公佈MI300定價,但管理層在FY23Q1財報電話會中表示數據中心產品將延續往日的高性價比定價風格,重點先把市場打開。

AMD預計MI300將於今年底前推出,並將搭載於勞倫斯利弗莫爾國傢實驗室的百億級超級計算機EI Capitan及其他大型雲端客戶AI模型中。

大摩分析師Joseph Moore給出樂觀指引稱,AMD已看到來自客戶的“穩定訂單”,公司2024年的AI相關營收有望達到4億美元,最高甚至可能達到12億美元——這一預期是此前的12倍之多。

不過,盡管AMD幾乎是唯一一個有能力對英偉達帶來挑戰的公司,但這必然是一個非常艱難的過程。

03 英偉達的護城河

在AMD的產品發佈會之後,資本市場對此反響平平,AMD的股價下跌瞭3%以上,反而是英偉達的股價又上漲瞭3.9%,市值再次超過一萬億美元。

在投資人眼裡,AMD的年度芯片MI300似乎仍然難以撼動英偉達的根基。

比如,AMD沒有在發佈會上透露它的年度芯片獲得瞭哪些大客戶的支持。TIRIAS Research首席分析師凱文·克雷韋爾(Kevin Krewell)表示:“我認為,沒有(大客戶)表示將使用MI300X或MI300A,這可能會讓華爾街感到失望。他們希望AMD宣佈已經在某些設計方面取代瞭英偉達。”

目前透露的客戶僅有開源大模型獨角獸Hugging Face,以及更早之前透露的勞倫斯利弗莫爾國傢實驗室。但兩者與對數據中心芯片有更大需求的雲巨頭而言不在一個數量級。

從芯片本身的性能而言,雖然MI300在一些參數上超過瞭英偉達,比如晶體管數量要高於A100的540億個,但是英偉達可能很快就會通過產品的迭代來彌補。

實際上英偉達已經在這麼做瞭。5月29日,在AMD發佈會之前兩周,英偉達在COMPUTEX 2023展前發佈會上,正式發佈瞭全新的GH200 Grace Hopper超級芯片,擁有2000億個晶體管,比MI300還要高。

更重要的是,英偉達同時宣佈瞭谷歌、微軟和Meta將是首批采用這一超級芯片的大客戶。

除瞭產品本身過硬之外,英偉達另一個銅墻鐵壁一般的護城河,就是它的CUDA生態。

英偉達於2007年發佈CUDA生態系統。通過使用CUDA,開發者可以將英偉達的GPU用於通用的計算處理,而非僅限於圖形處理。

CUDA提供瞭一個直觀的編程接口,它允許開發者使用C,C++,Python,以及其他一些語言來編寫並行代碼。

AI大神吳恩達曾對此評價:“CUDA出現之前,全球能用GPU編程的可能不超過100人,有瞭CUDA之後使用GPU就變成瞭一件非常輕松的事情。”

AMD在2016年推出瞭ROCm,目標是去建立可替代CUDA的生態。2023年,CUDA的開發者已達400萬,包括Adobe等大型企業客戶。用戶越多,粘性越好,起步就晚的ROCm要想構建開發者生態還需要時間。

Moor Insights & Strategy分析師Anshel Sag表示:“盡管AMD在硬件性能方面具有競爭力,但人們仍然不相信AMD的軟件解決方案能與英偉達競爭。”

這是屬於英偉達的獨一無二的護城河。AMD要想打破,極具挑戰。

04 AMD的成功,可能難以復制

對於AMD來說,或許最不怕的就是面對挑戰。

從2006年到2016年,這是AMD“失去的十年”。這一時期,AMD的兩個最大的競爭對手英特爾和英偉達,正在摩爾定律的驅使下進行產品迭代。

英特爾踐行著“Tick-Tock鐘擺策略”,每兩年做一次大的產品迭代更新(一年工藝制程、一年微架構設計);英偉達則在黃仁勛提出的“黃氏定律”——顯卡每6個月性能提升一倍——的指引下,每半年將產品升級一次。

AMD沒能跟上兩個行業老大的產品更新節奏,公司發展一度瀕臨崩潰,直到2014年蘇姿豐作為AMD第五任CEO接手。

蘇姿豐剛接手的AMD是一個爛攤子,它的筆記本電腦市場被英特爾占據,新興的智能手機市場被英偉達、高通和三星瓜分,服務器市場份額也從原來的1/4縮水至僅2%。AMD不得不解雇瞭大約四分之一的員工,股價徘徊在2美元左右,分析師直稱“已無法投資”。

當時英特爾CEO柯再奇如此評價AMD:“這傢公司永遠不會再回來瞭,所以不要再介意把重點放在新的競爭對手高通身上瞭。”

但後來的故事大傢都知道瞭。在蘇姿豐的帶領下,AMD在CPU市場打瞭一場漂亮的翻身仗,不僅一步步蠶食瞭英特爾的市場份額,股價也在2022年2月歷史性地反超瞭英特爾。

AMD之所以能夠在CPU市場突圍,很重要的原因在於抓住瞭對手英特爾的戰略失誤。

在芯片制造這一環節,AMD與英特爾選擇瞭不同的路線。AMD在2009年剝離瞭旗下的芯片制造業務,合資成立瞭獨立的晶圓代工廠格芯,而自身隻專註於芯片設計(Fabless),這讓AMD可以選擇獨立的第三方晶圓代工廠(Foundry)。英特爾則從成立以來一直是集芯片設計與芯片制造於一身(IDM)。

在半導體產業發展的早期,像英特爾這樣高度垂直整合的IDM才是更主流的模式。AMD聯合創始人Jerry Sanders還說過一句名言:“有晶圓廠才是真男人(Real men have fabs)。”不過諷刺的是,AMD正是因為後來剝離瞭晶圓廠才有機會完成逆襲。

2014年之後,英特爾的芯片制程遭遇技術困難,10nm芯片(相當於臺積電7nm)良率不佳,導致原定於2016年下半年的10nm量產多次推遲,最終到2019年下半年才發佈。此前英特爾一直堅持的Tick-Tock策略也因制程技術原因而放棄。

英特爾創始人戈登摩爾提出瞭摩爾定律,但英特爾現在卻遭遇瞭“摩爾定律的詛咒”。這讓AMD抓住瞭反超的機會。

2018年,AMD先是與格芯合作,推出12nm制程的Zen+架構,首度在制程上超越瞭14nm的英特爾。隨後在2019年,AMD與臺積電合作,推出瞭7nm制程(相當於英特爾10nm)的Zen 2架構,領先英特爾。自此之後,英特爾一直在制程上落後AMD一拍,直到現在仍然沒有改善。

類似的“老二挑戰老大”的劇本似乎在重新上演,隻是戰場從CPU換成瞭GPU。雖然AMD還是“蘇媽”帶領的AMD,但黃仁勛帶領的英偉達,卻比當年的英特爾風頭更盛。

在矽谷,黃仁勛被稱為好鬥的男人,愛穿黑色皮衣,時刻做好反擊的準備,股價漲到100美元時還把英偉達logo文到胳膊上。

2016年黃仁勛還不把AMD放在眼裡,他直接評價說英偉達跟AMD是“9跟0”的差距。2019年初AMD搶在英偉達之前首發7nm顯卡,黃仁勛表面上似乎也毫不在意,直稱“這顯卡很一般”。

而AMD再一次用更好的產品向英偉達發起挑戰。一邊是躊躇滿志的AMD,一邊是獨孤求敗的英偉達,一場關於人工智能的GPU大戰,現在才剛剛開始。

點讚(0) 打賞

评论列表 共有 0 條評論

暫無評論

微信小程序

微信扫一扫體驗

立即
投稿

微信公眾賬號

微信扫一扫加關注

發表
評論
返回
頂部