英偉達已封神,中國GPU初創企業面對差距,如何破局?
“目前還沒有能和A100媲美的產品”
GPU從90年底起步,經歷了早期的創業潮到現如今的寡頭壟斷——英偉達和AMD。英偉達在海內的市場佔有率從2008年的不到50%上漲到2022年的90%以上。
“海內的一些大模型創業公司,練習的算力,市面上買不到英偉達A100或者H100,要麼就是國外的算力卡。受禁令影響,英偉達又針對中國市場推出A800和H800,但非常難買到,市場上需求量也很大。”一位大模型創業公司人士告訴《深網》。
國產GPU公司主要有兩大方向,一是面向圖形處理的GPU晶片,包括芯動科技、摩爾執行緒、景嘉微等;另一類是面向通用計算的GPGPU(資料中心主要用 GPU 做 AI 計算和高效能計算,不需要影象能力)晶片,廠商包括壁仞科技、沐曦、燧原科技等。
一款GPU要經歷設計、驗證、流片、回片後的功能和機能測試、送往客戶測試、根據反饋進行軟硬體調優、獲取訂單並交付工廠大規模出產的流程。進入2020年,一些國產GPU公司正式流片。
芯動科技在2021年的11月和2022年的8月,先後釋出了“風華1號”4K級多路伺服器GPU和“風華2號”4K級四屏桌面GPU。其成立於2006年,在計算、儲存、連線等三大核心領域都有深摯的技術積累,在高速介面IP和晶片定製領域屬於有影響力的企業,連續十多年都實現了盈利,在2020 年轉向 GPU領域。
2022年1月,沐曦整合首款採用7nm工藝的異構GPU產品已正式流片。2022年8,壁仞科技釋出了首款通用GPU晶片BR100。摩爾執行緒在研發14個月後,於2022年3月末釋出第一代產品,同年11月,摩爾執行緒推出了基於其自研MUSA架構的多功能GPU晶片MT-春曉,以及國潮顯示卡MTT S80、面向伺服器的MTT S3000加速卡。
但流片對國產GPU公司來講,只是萬里長征走完了其中的一部分。
“目前國產GPU的機能還沒有能和A100和H100、或者A800或者H800相媲美的產品。國產一些GPU公司也做出了在算力上達到了A100或者達到H100算力水平的產品,但紙面算力和實際應用中的有效算力是兩碼事。”芯動科技GPU資深架構師殷亞雲告訴《深網》。
從市場的角度看,英偉達晶片的數目也很難支撐現在海內那麼多的公司來做大模型。王小川在4月公佈創業時表示,北京已有20-30家大模型創業公司。緊接著,商湯、第四正規化、科大訊飛等公司接踵推出大模型。
大模型創業潮也直接帶動了芯片價格的上漲。A100價格也從2022年12月開始上漲,目前每片晶片售價超過1.5萬美元。據《深網》瞭解,英偉達針對中國市場推出的特供版GPU晶片——A800,其每秒資料傳輸速率只有A100的三分之二,但其價格也已經漲到10萬元。
這些都為英偉達的硬體業務創造了海量訂單。據5月24日英偉2023財年第一季度財報,其收入達到71.92億美元,同比增長84%,淨利潤為27.13億美元,同比增長109%。其中,資料中心業務收入為42.8億美元,同比增長79%,環比增長18%,創下歷史新高。
國產替換下國產GPU的機會
“我們做晶片投資比較早,早些年我們並不太看GPU、CPU這種比較大的數字晶片,由於那時仍是一個全球化的市場,海內的產品很難去替換國外的產品。”晶片領域資深投資人Bob告訴《深網》。
在過去的十多年裡,中國有過院校、國資主導的晶片投資和創業,多集中在藍芽、WiFi 晶片、MP3 主控晶片等領域。而在GPU領域,分為傳統國產GPU,代表是景嘉微、中船重工709所、中船重工716所等,二是以芯動科技、摩爾執行緒、壁仞科技、沐曦為代表的GPU新勢力。
2020 年 5 月後,跟著美國對華為禁令進級,本來最有但願的海思 GPU 尚未流片就陷入停滯。國產替換的大背景下,GPU領域的創業公司的創業機會變得明朗起來。
國產GPU公司感觸感染到了資本的熱情。從2020年開始,GPU便成為海內晶片領域“最吸金”的賽道之一,融資總額已超過200億元。據統計,僅2020—2021年,通用GPU領域就有近20起融資事件發生。
2020 年 6 到 8 月,剛剛成立半年的壁仞科技密集表露了 3 輪大額融資,投資方包括啟明創投、IDG、高瓴、華登國際、中芯聚源等。壁仞密集融資的那一時期,英偉達中國區前負責人張建中創立摩爾執行緒,AMD 中國前圖形研發高階總監陳維良創立沐曦。
GPU新勢力的融資速度堪稱光速,摩爾成立不到 100 天,於 2021 年 2 月獲得了數十億元的 Pre-A 輪融資。截止2021年年底,這三家主要的 GPU 創業公司合計融資約 100 億元人民幣,其中壁仞融資超過 47 億元;壁仞、摩爾的估值迫臨 200 億元。
一些成立更早的GPU公司也在這一時期獲得了融資。2017 年成立的登臨科技,在 2020 年公佈獲得天使輪融資。
毋庸置疑,資本在GPU領域的熱情與國產替換相關,究竟有投資機構已經在半導體領域跑了出來。2018和2019年的中美貿易戰,整個全球化的市場被撕裂,晶片領域的國產替換成為剛需,一些晶片投資人看到了機會。
“元禾璞華就做得很成功,當時元禾璞華出手投了一批有規模的上市公司。”晶片投資人Bob透露。
但同時,“部門GPU企業透過大量融資,催生了大量的泡沫,給投資人以極高的期待,瘋狂燒投資人的錢,甚至用投資人的錢來補貼銷售,形成負毛利的產品,製造巨大的財務風險,這是需要非常警惕。”一位晶片領域不願具名的投資人告訴《深網》,“這種狀況假如持續下去,假如不尊重GPU產品規律,不能實現產品的正向銷售形成正向毛利,想要用擊鼓傳花的方式透過資本來催肥,這樣的企業一定是會暴雷的。”
“遇上A100/H100或要五到十年”
“從晶片設計的角度,海內跟國外仍舊有較大的差距,但差距沒有想象中那麼大。”芯動科技GPU資深架構師殷亞雲告訴《深網》,包括圖形顯示卡GPU和不帶圖形的GPGPU,並不存在特別大的技術門檻跨不過去的狀況,難的是,應用生態和架構迭代,從而晉升相容性和有效算力。”
為什麼國產GUP未來幾年內很難遇上英偉達?
“英偉達的競爭力在CUDA架構,CUDA供應鏈在整個行業裡面的滲透率都比較高。”雲岫資本晶片投資人嚴家呈告訴《深網》。
2006年,英偉達推出了 CUDA(Compute Unified Device Architecture,一種平行計算同一計算架構),CUDA的泛起,成就了現如今英偉達的市值巔峰。
目前,CUDA 擁有超過 400 萬開發人員,超過 3000 個應用程式,歷史上 CUDA 下載量達到 4000 萬,僅在前一年就達到了2500 萬。此外,已有 15000 家初創公司建立在英偉達的平臺上,全球有 40000 家大型企業正在使用加速計算。
現如今,CUDA 已成為一種 AI 基礎設施。對海內GPU公司來說,追趕英偉達難以逾越的是軟體壁壘。
在CUDA之前,英偉達的GPU只在螢幕上負責影象渲染設計。而CUDA不僅可以呼叫GPU計算,還可以呼叫GPU硬體加速,讓GPU擁有了解決複雜計算題目的能力;此外,CUDA不需要複雜的程式設計和調優,可以匡助客戶為不同的任務對處理器進行程式設計。
CUDA降低了GPU的使用難度。除了常見的PC機,無人車、機器人和VR頭盔等多種熱點的裝置都有GPU;而CUDA推出後很長一段時間內,只有英偉達的GPU能快速處理各種複雜的AI任務。
GPU 與 CUDA 相結合已經改變了 AI 行業的遊戲規則。如今,很多深度學習框架,包括 Caffe2、Chainer、Keras、MATLAB、MXNet、PyTorch、Theano和 Torch,都依靠 CUDA 提供 GPU 支援。
CUDA是在英偉達的軟硬體基礎上誕生的,受很強的專利保護,對海內的GPU公司來說,顯然短期內不可能建立起一個軟體生態,有些GPU公司選擇的路徑是在編譯器、資料庫層與 CUDA 做相容,但實際的相容效果並不盡如人意。
“沒有大量應用,國產GPU生態無從談起。生態是應用出來的,海內有足夠多的GPU場景應用,只要我們瞄準細分的應用領域,堅持商用路線,一個領域一個領域地去攻,我們一定可以產生國產GPU生態。”殷亞雲以為。
“國產GPU公司要追趕上A100或者H100,未來5年內是比較難的,未來10年內肯定有機會,未來15年肯定追得上。”一位GPU從業者告訴《深網》,“至少海內的企業在奮起直追,也有一定的後發優勢,只有腳踏實地去做,總會縮短和最進步前輩水平的差距。”
“大模型需求創造市場機遇”
中國 GPU 市場,大客戶是網際網路大廠,然後是自動駕駛公司和三大運營商等。
市場上一份流傳的“阿里AI專家交流紀要”顯示:阿里雲至少有上萬片的A100,整體能達到10萬片。阿里雲今年晶片採購量約1萬枚,其中6000枚是H800;百度年初下單3000臺 8卡的A800伺服器,共2.4萬張卡,預計全年百度會有A800和H800共5萬枚的需求。
“對網際網路大廠來說,穩定性肯定是第一位的,他們也會少量採購國產GPU晶片。”一位晶片投資領域人士告訴《深網》。
據稱,阿里雲也會採購國產晶片,例如寒武紀MLU370,機能是A100的60-70%。今年阿里雲對寒武紀MLU370的採購量大約在2000張,主要用於CV(計算機視覺)等領域小模型的練習或推理上。
此外,大部分企業採購GPU時更看重的是使用體驗,市場仍需要國產GPU公司去開拓。
“我曾跟海內的一家比較大的手機廠商交流過,從品牌來講,他們本身就不如蘋果和華為,假如手機的晶片再換成國產晶片,就更拼不過其競爭對手了。”晶片領域的投資人李晨告訴《深網》。
“國產GPU在設計製造維度沒題目,由於缺乏下游大客戶的支援,導致提高非常緩慢。”投資人Bob告訴《深網》。對國產GPU新勢力來講,其成立之初,都是想對標英偉達的,現在看來路還比較漫長。
但這並不意味著國產GPU毫無機會。
“我們已經在在測試一款國產GPU,即使機能上輕微弱點,但價格比英偉達優惠太多了。”一家雲遊戲公司人士告訴《深網》。
GPU領域從業者張思遠以為,目前國產GPU領域比較優秀的兩家公司是芯動科技和摩爾執行緒,他們的策略略有不同。芯動科技更側重在雲端等相對固定的場景,去迭代技術和生態,產品成熟後再逐步擴大應用場景。而摩爾執行緒看起來更側重遊戲顯示卡場景。
“例如,已有17年曆史的芯動科技擁有全套高速介面IP, 以及進步前輩工藝SoC體系架構和GPU核心創新能力,目前全球有近百家客戶,授權逾80億顆高階SoC晶片進入規模量產,成功率100%。”張思遠以為,做GPU, 芯動像英偉達一樣具備全套自研IP和深摯積累,迭代GPU的本錢上風顯著。目前風華GPU已經進入批次商用。
“有一件事情是確定的,就是未來5-10年,我們國產GPU的增速比擬於過去5-10年,增速一定是更快的。一是GPU這塊已經有自己的產品了,二是練習AI大模型的A800和H800也缺貨,海內的大模型練習缺基礎設施,這個動力會一直驅動著。”投資人嚴家呈表示。
對於樞紐的GPU生態而言,國家的產業政策上可能會去做一些攙扶,精英創業者都會想著在這個領域如何發力,這對國產GPU公司來說,去打造自己的生態會是一個非常有利的因素,而工業聯動天然會帶動國產GPU生態的發展。
中國是全球GPU第二大應用市場,正如黃仁勳在演講中提到的,“在中國如今假如你想跨入晶片工業創業,你會選擇進入哪個方向?GPU恰是可能的選擇”。對於國產GPU企業來說,需要長期的技術積累,透過不斷地應用迭代,實現規模商用,堅持十年坐冷板凳的精神,才有實現突破的但願。
(文中張靜、李晨、張思遠為化名。)