作為算力基礎設施,競購英偉達高端顯卡芯片已經成瞭一種“搶跑遊戲”。而決定AI大模型創業公司成敗的要素之一,“就是你到底有沒有能力調動最起碼100張以上的英偉達顯卡。”一傢AI創業公司負責人對「市界」表示。

作者 | 董溫淑

編輯 | 李 原

運營 | 劉 珊

01.像賣愛馬仕一樣賣芯片

今年以來,大模型和AI 2.0既是最火熱的創富夢,也越來越成為一個昂貴的“權力的遊戲”。在技術、資本、人才等構建出的種種門檻中,還有一張重要的入場門票——你有沒有“門路”能搞到足夠的英偉達高端顯卡。

王非是華東地區一傢服務器定制企業的銷售部經理,他向「市界」描述瞭最近英偉達顯卡的緊俏程度:“需求太火爆,有些人從機房裡把芯片禁運政策生效前購買的A100 80GB拆出來倒賣。”這些舊芯片不隻沒有保修,相比於去年8月前後8萬多元的單價,價格還漲到瞭10萬多元。

即便已經舊貨拆賣、物盡其用,顯卡的供應還是嚴重不足。“需要拿現款去,對方才願意賣給你。”而相對顯存較小、訓練效率低的A100 40GB即便有全新的,也乏人問津。“詢價的多,成交的少。”

具體而言,這批搶手的顯卡指的是英偉達旗下的“Tesla”系列產品。在訓練AI大模型時,比傳統CPU更高效的GPU(圖形處理器,又稱顯示芯片),尤其是高端GPU一芯難求。

2020年和2022年,英偉達先後推出瞭A100芯片、H100芯片,其中A100顯卡又提供80GB、40GB兩個顯存版本,H100則提供80GB顯存。顯存越大,所能運行的神經網絡也就越大。

2022年9月開始,美國禁止英偉達等向中國出口高端GPU芯片。為應對禁運政策,英偉達又在2022年和2023年分別推出瞭特供中國版的顯卡A800和H800。

不過如今,在政策允許范圍內的A800芯片,在市場上也出現瞭供貨周期拉長、價格上浮的現象。王非透露:“在大模型火爆之前,A800大概兩周即可到貨。但現在我跟客戶保守估計要在8周內,即便是最樂觀的情況,也需要4-6周。”

供職於北京一傢顯卡分銷企業的郭麗婕對「市界」表示:現在公司的A800單卡報價為8.75萬元,已經超出瞭A800在2022年11月時8萬-8.5萬元的價格區間。而且,8.75萬元隻是實時報價,顯卡還有繼續漲價的趨勢。“我告訴客戶確定要瞭再找我聊,現在的庫存也不多。”

另一傢位於深圳的顯卡供應商,則給A800開出瞭8.95萬元的報價——更高的溢價意味著等待時間較短,需要大約兩周的貨期。

作為算力基礎設施,競購英偉達高端顯卡芯片已經成瞭一種“搶跑遊戲”。而決定AI創業公司成敗的要素之一,“就是你到底有沒有能力調動最起碼100張以上的英偉達顯卡。”一傢AI創業公司負責人對「市界」講到。

他透露:“在去年8月之前,通過國內正規渠道,還能買到A100顯卡,也可以采購海外版A100。在此之後,國內A100被切斷瞭貨源,從海外采購海關也不會放行。”

不過那些允許被特供中國的A800和H800芯片對於緊缺算力的AI中小公司而言,同樣是遙不可及。

王非透露:“一般來說英偉達的貨先到國內總代,再被我們這類廠傢分走,銷售給做AIGC項目的客戶。目前H800雖然已經發售,預計單卡售價會在20萬起,也沒有進入我們這一級市場。現在能拿到H800的,應該隻有阿裡雲、騰訊雲這種有資格從英偉達原廠直接采購的大廠商。”

在市場緊俏的背景下,H800等高端芯片已經提前被大廠包攬。目前,國內僅有騰訊雲官宣“用上”瞭H800。4月14日,騰訊雲發佈瞭基於H800的大規模算力集群,並將其定義為H800的“全國首發”。

據《晚點 LatePost》瞭解,字節今年向英偉達訂購瞭超過 10 億美元的 GPU,僅字節一傢公司今年的訂單可能已接近英偉達去年在中國銷售的商用 GPU 總和。大公司的合作方式主要是和英偉達原廠直接談采購,能否搶到卡,更多是看商業關系,比如以往是不是英偉達的大客戶。

而在龐大的需求面前,據傳英偉達甚至開始學起瞭愛馬仕,在購買搶手的 GPU 時,也需購買其它產品作為取得優先供應權的“配貨”。

在這場大模型研發競速賽中,相比超級大廠,更多小玩傢隻能先把名字寫進等待名單。而無論哪一方歷經蕩滌、最終勝出,作為算力供應者的英偉達都能穩拿訂單,笑到最後。

02.黃仁勛的運氣有多好?

在商界一直有一種說法:當淘金者蜂擁而至時,獲得財富就變成瞭小概率事件。最後掙到錢的,更可能是站在淘金者身邊“賣鏟子”的人。

一位科技賽道的投資人對「市界」回憶:在前幾年的AI行業資本寒冬中,“泡沫破滅時,投資人和企業突然意識到,(算法創業)成本極高,都是在虧錢,反而讓上遊賺錢瞭。”

而在AI這個近年來最大的科技風口面前,英偉達便是那個第一批站在上遊、得以幸運“起飛”的公司。

在今年5月舉辦的英偉達業績電話會上,英偉達創始人、總裁兼CEO黃仁勛直言:今年1月以來出現的新產品需求“不可思議地陡峭”,公司訂單“多到難以置信”。

不僅市場對英偉達產品瘋狂競逐,資本也展現出瞭慷慨的態度。5月30日,英偉達成為全球首傢市值突破萬億美元的芯片設計商。

(2015年至今英偉達股價走勢圖)

當有記者向黃仁勛提問:“(在新一輪AI浪潮中)英偉達獲得的豐厚回報是因為運氣,還是因為有先見之明?”黃仁勛並不諱言英偉達人氣暴漲的“運氣”成分:“我們隻是相信總有一天會有新的東西發生,其餘的需要一些偶然性。”

如今已經無人在意,短短一年之前,英偉達還陷在營收不及預期、股價滑坡的漩渦之中。如果沒有AIGC的“天降神力”,看上去這將是一個已發生過無數次的“商業先行者”遺憾折戟的故事。

過去數年間,英偉達的高端顯卡更多被用於PC遊戲和虛擬貨幣“挖礦”之上。疫情之下,受益於消費電子需求暴增,英偉達股價也隨之連番上漲。2021年,英偉達股價最高升至300多美元,創歷史高點。

但進入到瞭後疫情時代,隨著遊戲市場遇冷,疊加虛擬貨幣持續波動,2023財年的前三個季度中,英偉達營收連續下滑,凈利潤大幅縮水。與之相應的,公司股價在2022年8月,跌至瞭年內最低的每股108美元。與2021年高點相比,市值僅餘三分之一。

不過,到瞭2022年底,隨著ChatGPT橫空出世,英偉達一舉扭轉頹勢,成為瞭被全球追捧的明星。截至6月23日美股收盤,英偉達股價已升至422.90美元。

在英偉達一飛沖天的同時,人們開始追溯,這是否是一個關於決策者“深謀遠慮”的故事。而黃仁勛本人對此的定義是:“這不是先見之明。先見之明是加速計算。”

因為在某種程度上,用GPU訓練AI模型的歷史正是由英偉達開啟的。

2010年,據媒體報道,英偉達首席科學傢兼高級研究副總裁Bill Dally與其好友、全球AI領域權威學者吳恩達某天在咖啡店裡共進早餐。彼時,吳恩達正在谷歌進行AI研究,但在推進課題過程中遇到瞭算力不足問題。

如果想要補上吳恩達團隊面臨的算力缺口,谷歌需要新購置約1.6萬塊CPU(中央處理單元)。以英特爾在2010年發佈的服務器CPU產品至強X5680為例,後者當年的單價約為1666美元,1.6萬塊合計需要約2700萬美元。

這筆預算足夠讓吳恩達的研究胎死腹中。據數據分析機構“PitchBook”調研,2010年全球AI和機器學習領域獲得的風險投資還不足5億美元。

Bill Dally聽說瞭吳恩達的煩惱後,建議他用英偉達的GPU替代CPU來進行AI訓練。由於CPU采用串行計算方式,更擅長邏輯控制,但數據處理效率較低。而英偉達的GPU產品采用瞭其自研的並行計算架構“CUDA”,能夠將任務分解成若幹部分同時解決。最終,吳恩達團隊果然僅用48塊GPU並聯,就解決瞭問題。

在此之後,越來越多的研究團隊開始將英偉達芯片用於AI訓練使用。而黃仁勛也在看到AI市場的巨大機遇後,從2012年開始,將AI列為瞭重要的發展方向。

某種程度上,在10年前AI落地應用還是模糊一片的背景下,便在深度學習層面開始佈局,確實代表瞭黃仁勛的“先見之明”。

就職於矽谷某AI芯片獨角獸公司的Lee對「市界」講到:對芯片企業而言,在2012年投入深度學習的計算是一個非常難得的選擇。據他回憶:“2012年是大數據時代的巔峰,最賺錢的市場是互聯網數據庫、文件系統等等,做深度學習可以說是’冷板凳’。而且英偉達是圍繞著深度學習的主題進行全方位、點點滴滴的下註,包括完善語言設計、開發者工具等周邊軟件工具。”

03.國產GPU奮力追趕

對於英偉達的成功原因,黃仁勛曾這樣總結:“我們很早地,大約在10年前就發現,(AI)這種制作軟件的方式可以改變一切。我們從底層一直到頂層,從各個角度改變瞭公司。”

從2016年開始,英偉達旗下的加速計算GPU產品線(代號“Tesla”)開始專門針對AI訓練任務進行設計。這一年推出的芯片型號為P100,同時配備有英偉達新研發的高速互聯技術“NVLink”。而NVLink能夠允許CPU、GPU芯片間進行高速交互,進一步提升瞭運算效率。

從底層到頂層搭建起的軟硬件產品生態,也是英偉達在這輪AI風口,因其長期佈局和最大的確定性,得以受到資本熱捧的原因。但從市場、技術等角度考慮,英偉達當下構建的“算力帝國”也還遠遠談不上固若金湯。

根據2023財年財報顯示,中國是英偉達的第一大目標市場,英偉達在中國市場實現的營收占其全球市場營收的47%。而在政策限制下,英偉達難以向中國市場銷售A100、H100高端芯片,無疑將對其營收造成重擊。

黃仁勛個人,從不掩飾對於中國市場的期望。5月底他在接受《金融時報》采訪時,抱怨美國政府對於半導體技術的出口限制使得英偉達束手束腳,警告持續升級的中美芯片戰將令美國科技業面臨遭受“巨大損害”的風險。“如果失去瞭中國市場,我們並沒有應急計劃。因為世界上沒有其他中國,中國隻有一個。”

但在英偉達高端顯卡出口受阻的態勢下,許多中國客戶不得不轉向其他選擇。而細細數來,市場中英偉達的挑戰者並不少。

王非告訴「市界」:“我一些做AIGC項目的客戶選擇瞭海光的國產顯卡DCU Z100L。據我所知,海光的產品目前已經用到瞭多個國產大模型裡。”

另一位大模型應用層的創業者則透露,由於買不到A800,其所在的團隊緊急購置瞭一批英偉達的消費級顯卡GeForce RTX 4090,“未來會考慮其他選擇,或者更多配置雲計算資源”。

在供應端,天數智芯、摩爾線程等國產GPU廠商已經開始積極推動產品落地於大模型訓練領域。

6月10日,天數智芯對外宣佈,經過驗證,其研發的國內首款量產的通用GPU“天垓100”具備支持百億級參數大模型訓練的能力。據稱,在天垓100加速卡的算力集群支持下,北京智源研究院70億參數的“Aquila”語言基礎模型完成瞭參數優化工作。6月上旬,摩爾線程則宣佈其已經完成對智源研究院“悟道·天鷹”大模型的推理兼容適配,整個適配過程僅花費不到6小時時間。

除瞭國產GPU玩傢,“AI芯片第一股”寒武紀、阿裡巴巴旗下芯片企業“平頭哥”的產品同樣可以用於運行AI相關任務。

6月19日,“國產CPU第一股”龍芯中科在投資者交流平臺公開表示,其已完成通用GPU相關IP設計,預計第一個集成自研通用GPU核心的SOC芯片(系統級芯片)計劃於2024年Q1流片,在此基礎上將研制兼顧顯卡和計算加速卡功能的通用GPU芯片,計劃於2024年下半年流片。

服務器廠商南京坤前計算機的一位客戶經理總結道,在AIGC等大模型應用領域中,國產產品已經可以部分滿足客戶需求。他講道:“不僅是現在,在未來的一段時間內英偉達GPU供不應求也是可預見的,但我認為不必過於追求英偉達。隻要算力集群足夠大,國產卡也夠用,就算國產卡帶寬少一點,運算的時間多一點,起碼可以實現自主。”

此外,從6月上旬開始,市場便不斷傳出知名資管機構與大股東對英偉達的減持計劃。實際上,英偉達“算力帝國”的縫隙也已經開始顯現。

6月6日,背後站著老牌歐洲金融世傢羅斯柴爾德傢族、管理資產近900億美元的愛德蒙得洛希爾資產管理公司透露,已經將部分英偉達頭寸獲利瞭結。主要原因是:AI估值太高,越來越不確定。如果估值繼續上漲,機構會變得謹慎。知名投資估值專傢Aswath Damodaran也表示,賣掉瞭英偉達的股票,因為“這輪上漲太驚人”。

事實上,黃仁勛自己便可能是矽谷最具危機感的企業傢,他曾多次公開提到:“我一直認為我們距離倒閉隻有30天的時間。”最近,他也在采訪中表達瞭擔心:認為在英偉達因政策而“缺席”的這段時間,中國的GPU初創企業會很快追趕上來。

(文中王非、郭麗婕為化名)

點讚(0) 打賞

评论列表 共有 0 條評論

暫無評論

微信小程序

微信扫一扫體驗

立即
投稿

微信公眾賬號

微信扫一扫加關注

發表
評論
返回
頂部