雲啟合夥人陳昱:80分的模型沒有壁壘,95分的模型需要工程創新能力

首頁 > 科技

雲啟合夥人陳昱:80分的模型沒有壁壘,95分的模型需要工程創新能力

來源:美劇去哪看 釋出時間:2023-05-29 10:36

文|周小燕

在ChatGPT成為“全民應用”的半年時間內,跟著入場做大模型的角色增多,關於大模型創業風口的爭議點已發生了一輪轉變:從討論大模型是否為大廠專屬,轉而關注大模型創業的核心壁壘,在此背景之下,創業公司的競爭力在哪裡?VC的投資策略需要做哪些調整?

騰訊科技“AI未來指北”系列,本期專訪海內大模型獨角獸公司MiniMax背後早期投資方雲啟合夥人陳昱,對以上題目進行探討,核心觀點:

  • 1大模型時代下,未來的應用也有一個“二八定律”,大約有80%會是現在的應用接入大模型後的「升級版」,有20%是基於大模型的新能力開發出的新應用。
  • 2各行各業的整體格式都不會由於大模型而發生大的改變,即便大模型改變了應用進口,也不會對貿易格式的本身產生大的改動,它只是一個體驗進級。AI原生應用的機會可能在:跨境電商、面向開發者的AI解決方案(AI for Developers)、私有化部署和AI安全。
  • 3許多人以為模型層面的創業機會比較小,可能資料層面的創業機會比較多,但實在市場並不缺資料,公然的資料許多都還沒有用好,ChatGPT的資料也只更新到2021年9月,對私有資料的考慮可以靠後,先把公有資料用好。並且資料的獨特性本身比資料量更重要,真正擁有自己獨特私有資料並能轉化商業價值的公司幾乎很少甚至是沒有的。
  • 4一個模型做到80分可能不算擁有壁壘,但假如能做到95分,肯定是一種壁壘。固然海內各種公司都在做模型,但真正能全面碾壓GPT-4的還沒有泛起,由於它的核心壁壘是工程上的最佳化,而這是Open AI沒有公然的“秘密”。
  • 5國內外大模型投資策略的差異源自於專案退出途徑。在國外,投資人願意投資單點技術創新類的專案,此類專案能透過併購退出。反觀海內,因為併購案例稀少,投資機構更願意在終極能上市退出的大idea上下注。

雲啟合夥人陳昱

以下為訪談全文:

騰訊科技:ChatGPT讓大模型賽道的創業和投資變得很熱鬧,雲啟重點投資了哪些專案?當時做投資決策背後有哪些考量?

陳昱:ChatGPT在半年前進入大眾視線,我們大約在18個月之前投資了一款主打社交聊天軟體的多模態企業MiniMax,MiniMax以多模態大模型研發為主,有三種模態基礎架構:文字到視覺(text to visual)、文字到語音(text to audio)、文字到文字(text to text),基於大模型的主要產品是智慧對話機器人Glow,目前有五百萬使用者,並且也開放了API介面,與WPS等眾多企業合作。

我們的決議計劃邏輯主要是賭團隊和技術大方向。早在2021年1月份,我們就開始接觸MiniMax創始團隊,彼時他們還沒決定正式出來創業。當時GPT-2和GPT-3也已經出生避世,只是不像ChatGPT做得這麼好。到2021年底,團隊以為時機成熟,MiniMax正式成立,我們便投了天使輪。

MiniMax的起點是但願沿著通用人工智慧的方向做產品,底層是多模態大模型,這個設法和我們不謀而合,我們當時正好也在思索通用大模型這件事情。

具象地說,通用人工智慧相當於復刻一個數字人腦,人類擁有自由的思維、能夠透過學習推理出新的知識,通用人工智慧也應該能像人類一樣思索,它能夠完成多工操縱,即便面對沒見過的東西,也能給出一個謎底。

我們已經投資了MiniMax,並且聊過市面上大部分的模型創業公司,在這波潮流熱起來之後,至少在基建層目前不需要再投第二家大模型公司了,投資重心會轉移到應用層,重點關注能夠利用大模型特性做應用的專案。同時我們也會關注Open AI以外會有什麼新的技術泛起,但願能投資一些更具備創新性的東西。

騰訊科技:有一種說法以為,未來所有工業都值得用大模型重新做一遍,許多行業可能會利用大模型做進級,好比美團、淘寶這些生意是不是都能用大模型做一遍?創業公司有沒有機會為這些大公司的改變提供更多匡助?

陳昱:大模型時代下,未來的應用也有一個“二八定律”,大約有80%會是現在的應用接入大模型後的「升級版」,有20%是基於大模型的新能力開發出的新應用。

大模型是不是合用於所有行業,現在還沒有定論,第一個挑戰就是海內還沒有成熟的中文大語言模型可用,光這一步的最佳化就需要很多年時間。現在也不能確定海內哪一個模型使用體驗更強,由於使用的感覺非常主觀,並且每個模型都有自己擅長的地方,到最後仍是看綜合使用者體驗。

假如中文大語言模型發展得很成熟了,這波工業進級肯定也會先從網際網路行業開始,然後再逐漸過渡到傳統行業,這個過程可能也會持續5-8年時間。

未來大模型可能會變成所有應用的進口,舉例來說,現在大家買東西要上美團APP或者小程式,未來可能直接對大模型說幫我買一個東西,就完成了整個購買操縱動作,就沒有類似美團這種一級進口了,它的APP或小程式反而變成二級進口。未來,跟著人機互動方式的改變,這些都是很可能會發生的。

但這些改變之前也被嘗試過,好比蘋果Siri、各種智慧音箱都嘗試做這樣的場景改變,也鬧出過許多笑話,可能就是由於語言模型還不夠好,影響使用者的使用體驗,假如花一樣的時間但體驗不好,使用者就不會再用它了。

再看創業公司在這波工業進級中的機會,我以為各行各業的整體格式都不會由於大模型而發生大的改變,好比外賣行業原先就只有美團和餓了麼,本來也沒有創業公司存在,即便大模型改變了應用進口,也不會對貿易格式的本身產生大的改動,它只是一個體驗進級。

騰訊科技:如果說80%的存量應用可能會在接入大模型後做進級,那麼你提及的20%基於大模型開發出的新應用就相當於增量市場的機會,你以為這類AI原生應用會優先產生在哪些場景?從雲啟已經投資的專案中看,哪些屬於這20%的增量機會?

陳昱:先回答後一個題目,大家可能存在一個誤區,似乎今天投資了以後明天就能看到結果,這是不可能的事情。一個創業公司真正能夠做出東西、讓大家看到結果,至少要等18-24個月,一週能做出來的東西沒有壁壘和想象力,我們會關注更實際的東西。

從我們投資的案例來看,由於我們一般都在非常早期的階段進行投資,整體專案本身發展都還處於很早期,所以也很難判定這20%的原生應用是否已經做到。即便是MiniMax這樣已經能看出潛力的企業,回溯對它的投資歷程,實在我們在投資之前也觀察了近一年的時間。

再回到關於AI原生應用的機會猜測上,我以為AI原生應用的探尋挖寶過程,就像以往西部牛仔的淘金歷程一樣,需要敢於探險,這波的機會可能在這幾個地方:

第一,跨境電商,由於涉及多語言(multilingual)交流;

第二、面向開發者的AI解決方案(AI for Developers),匡助程式設計師寫程式碼或者檢查錯誤和安全漏洞;

第三、私有化部署,企業客戶會有個性化模型和資料安全方面的需求;

第四、AI安全,大模型的廣泛應用會帶來一系列安全題目,譬如模型天生的內容造成的虛假資訊傳播,還有針對模型進行提示詞注入攻擊(prompt injection)導致企業內部資訊洩漏等。

騰訊科技:在大模型帶來的機會中,高效利用有限資料的能力,好比資料標註、資料提煉等,以及利用私有資料做垂直模型,是否是創業公司潛伏的增長點?對投資人來說機會點在哪裡?

陳昱:前陣子谷歌內部洩露一份檔案,谷歌內部一名研究員以為Open AI沒有護城河,裡面也提到你可以透過一個開源模型做fine tuning得到一個80分的模型,但是它和GPT-4這樣95分的模型仍是有很大的差距。

固然創業者透過開源可以將做模型的本錢極度降低,但不意味著他們能做出95分的模型,而95分的模型會吃掉大部分的市場。這裡可以類比歷史上的谷歌,剛開始搜尋引擎市場也百花齊放,但最後90%以上的市場佔有率都在谷歌身上,所以當一個東西被做到極致之後,沒有多少終端消費者會願意使用非主流的產品。

在這樣的情況下,許多人以為模型層面的創業機會比較小,可能資料層面的創業機會比較多,但我以為市場並不缺資料,公然的資料大家都還沒有用好,ChatGPT和GPT-4的資料也只更新到2021年9月,對私有資料的考慮可以靠後,先把公有資料用好。

至於怎麼用好這塊資料,就要各顯神通了,這就需要團隊精益求精演算法、改進工程能力,本質上仍是看人。在軟體科技立異領域,我們一直誇大要投“智慧”並且“有野心”的“年輕人”,由於技術每年都會更新迭代,年輕人跟進的速度最快。

對於投資擁有自己獨特私有資料的垂直模型,我們持儲存立場。我們在研究機器學習的時候也能瞭解到,資料的獨特性本身比資料量更重要,但我以為真正擁有自己獨特私有資料的公司幾乎很少甚至是沒有的,而當通用大模型的練習資料裡某領域的資料足夠多的時候,垂直模型的表現不一定會比通用大模型好。

舉個例子,好比某教育類上市公司表露自己有許多私有的試卷資料,但實際上用公共網路上已有的試卷資料就能練習出不錯的結果,並不需要上市公司提供的私有資料。許多公司擁有的所謂私有資料實在沒有想象中的那麼重要,真正有價值的私有資料是獨特的資料,而且不需要許多的量就能做出不錯的效果,而這類獨特資料其實太少了,專有獨特的資料公司在整個市場可能都找不出幾家,即便有了這類資料,也不代表就能利用好它們或讓其產生商業價值,這幾個前提一卡,就會發現沒什麼專案可以投資。

此外,即便沒有大模型,類似智慧製造這些傳統行業也會擁有自己的資料,但假如在大模型泛起之前並沒有利用好這些資料,有了大模型後也不一定能明顯晉升資料利用效率,假如它們真的有投資價值,在大模型泛起之前應該已經被大家看到了。

騰訊科技:一方面,按照你的說法,模型的泛起並不會晉升擁有私有資料的公司的壁壘;另一方面,做大模型似乎並不難,在ChatGPT剛火的時候,行業預設大模型是大廠專屬,但從最近三個月的情況來看,越來越多的非大廠出品的大模型也泛起了。在這樣的背景下,是否可以以為大模型創業的門檻本身就不穩固?投資人是否需要重新評估投資機會?

陳昱:關於模型壁壘的題目,需要分層看待。一個模型做到80分可能不算擁有壁壘,但假如能做到95分,那肯定是一種壁壘。

固然海內各種公司都在做模型,但真正能全面碾壓GPT-4的還沒有泛起,由於它的核心壁壘是工程上的最佳化,即團隊對工程細節的反覆打磨,並且不僅僅是一兩個地方的最佳化,可能涉及50個甚至100個子工程的最佳化,而這是Open AI沒有公然的“秘密”,需要技術團隊自己在立異的過程中反覆試水調優,很難產生能被海內公司鑑戒的方法論,它是一項工程立異,而非技術創新。

在GPT-3.5及之前,Open AI仍是比較開放的,他們會在論文裡仔細地描述自己做了什麼,發展到GPT-4階段就開始“語焉不詳”了,外界只能靠預測或者找Open AI裡面的人去聊的方式,來了解一二,但團隊裡的人也不能洩露公司的秘密,對於外界來說這就像一個令人琢磨不透的黑匣子。

我曾經在谷歌擔任工程師,谷歌的搜尋引擎質量非常好,它的壁壘也在於工程最佳化。15年前谷歌就有超過200個工程師全職做搜尋質量的改進工作。每個工程師都會以不同的方式去最佳化搜尋引擎,透過A/B測試的方式,決定某項改進工作是否能終極釋出,這樣做的結果是量變引起質變,每年數百項的改進極大的進步了搜尋質量,但在這中間沒有任何一個人知道全景是怎麼樣的。

在這樣的背景下,假如總結對這類專案的投資判定尺度,我以為有這幾點:

第一,團隊成員至少長期耕耘在這個領域;

第二,要有很強的工程立異和實踐能力;

第三,做這類創業非常燒顯示卡、燒算力,這就要求團隊有很強的融資能力,否則很難上牌桌。

騰訊科技:海內大模型如雨後春筍湧現,對比國內外大模型,可以看出國外代表性的ChatGPT目前走的是to C訂閱模式,海內模型許多接入到工業層面。從投資角度看,大模型國內外投資方法和風格有哪些不同?國外AI發展的經驗比我們快,有沒有可以copy to China的東西?

陳昱:從國內外模型的差異來看,目前核心仍是技術的差異,第一梯隊的OpenAI GPT-4、第二梯隊的谷歌PaLM 2,還有從Open AI離職出來創業的Anthropic,他們都做得非常好,假如做測評的話,會發現中外模型之間的差異主要在技術層面。

另外,固然國外目前主流大模型ChatGPT是to C的訂閱付費模式,但不代表國外沒有做to B,他們的模型應用也是百花齊放的,但國外做to C的一個上風是他們使用者付費意願強,好比Midjourney團隊只有11個人,但是卻有1億美金的收入,這在海內是難以想象的。

從投資角度來看:

第一,在國外我們更願意投資單點技術創新類的專案,在海內的話許多投資機構會設想專案idea能不能做到IPO;

第二,從投資人的經驗來看,國內外各有擅長的東西,國外軟體做得普遍比海內好,海內偏硬體的東西做得比國外好。所以海內的投資機會更偏向機器人、電動車這類硬體的出海,由於它們利用了海內供應鏈上風將生產成本降到很低。假如在AI層面做到80分,再和硬體結合起來,產品的競爭力就很強了。我們看好通用人形機器人,它會是大模型和機器人的結合。

騰訊科技:為什麼國內外大模型投資策略會產生這樣的差異?

陳昱:國內外大模型投資策略的差異源自於專案退出途徑。在國外,投資單點技術創新類的專案能透過併購退出。反觀海內,因為併購案例稀少,投資機構更願意在終極能上市退出的大idea上下注。

不同的投資人可能有不同的風格,對於偏早期的投資人而言,投資就是投“變數”,假如一個專案缺乏未來想象空間,我們就不會投;假如它只是停留在想象力層面,團隊沒有落地能力和堅定信奉,我們也不會投。大模型才剛剛開始,能到上市階段至少是好幾年之後的事情,假如要投資“確定性”,可能就要等到專案上市前一兩年再投進去,這可能不是早期基金的風格。

另一方面,大家確實會考慮宏觀環境,好比當下大家投資硬科技專案會相對多一些,模式和軟體類的偏少一些,但大家的思路和設法是沒有變的,仍是跟隨變數、投資想象空間大的東西,並不斷關注技術帶來的工業變革。

可能這幾年受大環境的影響,許多人非常思慮退出題目,我以為不用過於憂慮,好比美元基金可以透過中外合資或QFLP投資專案,並且退出途徑也是比較多元的,港股也是其中一個選擇。

我們是比較早期的基金,許多專案都會經由多輪融資,在這中間也能實現適度退出,所以我們目前的投資都保持著自己的節奏。

騰訊科技:Open AI做出來的ChatGPT,算是近幾年國外單點技術創新的代表性案例,能否猜測Open AI的下一個樞紐變化節點?

陳昱:Open AI可能確實有“後招”:

第一,大語言模型未來會往多模態方向發展。“多模態”不僅體現在“輸入”,“輸出”也可以是文字、影象或影片;

第二,未來生成式AI的輸出結果可能從二維影象變成三維模型。OpenAI 近日對外發布前提天生模型 Shap-E,它可以用來天生3D資產。Shap-E 可以天生隱含函式的引數,這些函式可以被渲染成紋理網格或神經輻射場(NeRF),從而可以天生多功能的、現實的3D資產。

騰訊科技:最後,回到海內看AI管理,最近網信辦也頒佈了關於大模型相關的資料管理辦法,中國的生成式AI應該如何準確地應對監管法規?

陳昱:以前純靠人工去做監管,現在可能需要用模型去監管模型,由於模型天生的內容數目巨大,且輕易以假亂真,監管部門需要思索如何更好的利用技術來規範行業。此外,模型本身是有價值觀的,企業在練習模型的時候,就得對練習資料做仔細的篩選和清洗,並使之與準確的價值觀對齊。OpenAI在這方面下了很大的功夫,值得海內企業學習。

文|周小燕

在ChatGPT成為“全民應用”的半年時間內,跟著入場做大模型的角色增多,關於大模型創業風口的爭議點已發生了一輪轉變:從討論大模型是否為大廠專屬,轉而關注大模型創業的核心壁壘,在此背景之下,創業公司的競爭力在哪裡?VC的投資策略需要做哪些調整?

騰訊科技“AI未來指北”系列,本期專訪海內大模型獨角獸公司MiniMax背後早期投資方雲啟合夥人陳昱,對以上題目進行探討,核心觀點:

  • 1大模型時代下,未來的應用也有一個“二八定律”,大約有80%會是現在的應用接入大模型後的「升級版」,有20%是基於大模型的新能力開發出的新應用。
  • 2各行各業的整體格式都不會由於大模型而發生大的改變,即便大模型改變了應用進口,也不會對貿易格式的本身產生大的改動,它只是一個體驗進級。AI原生應用的機會可能在:跨境電商、面向開發者的AI解決方案(AI for Developers)、私有化部署和AI安全。
  • 3許多人以為模型層面的創業機會比較小,可能資料層面的創業機會比較多,但實在市場並不缺資料,公然的資料許多都還沒有用好,ChatGPT的資料也只更新到2021年9月,對私有資料的考慮可以靠後,先把公有資料用好。並且資料的獨特性本身比資料量更重要,真正擁有自己獨特私有資料並能轉化商業價值的公司幾乎很少甚至是沒有的。
  • 4一個模型做到80分可能不算擁有壁壘,但假如能做到95分,肯定是一種壁壘。固然海內各種公司都在做模型,但真正能全面碾壓GPT-4的還沒有泛起,由於它的核心壁壘是工程上的最佳化,而這是Open AI沒有公然的“秘密”。
  • 5國內外大模型投資策略的差異源自於專案退出途徑。在國外,投資人願意投資單點技術創新類的專案,此類專案能透過併購退出。反觀海內,因為併購案例稀少,投資機構更願意在終極能上市退出的大idea上下注。

文|周小燕

在ChatGPT成為“全民應用”的半年時間內,跟著入場做大模型的角色增多,關於大模型創業風口的爭議點已發生了一輪轉變:從討論大模型是否為大廠專屬,轉而關注大模型創業的核心壁壘,在此背景之下,創業公司的競爭力在哪裡?VC的投資策略需要做哪些調整?

騰訊科技“AI未來指北”系列,本期專訪海內大模型獨角獸公司MiniMax背後早期投資方雲啟合夥人陳昱,對以上題目進行探討,核心觀點:

  • 1大模型時代下,未來的應用也有一個“二八定律”,大約有80%會是現在的應用接入大模型後的「升級版」,有20%是基於大模型的新能力開發出的新應用。
  • 2各行各業的整體格式都不會由於大模型而發生大的改變,即便大模型改變了應用進口,也不會對貿易格式的本身產生大的改動,它只是一個體驗進級。AI原生應用的機會可能在:跨境電商、面向開發者的AI解決方案(AI for Developers)、私有化部署和AI安全。
  • 3許多人以為模型層面的創業機會比較小,可能資料層面的創業機會比較多,但實在市場並不缺資料,公然的資料許多都還沒有用好,ChatGPT的資料也只更新到2021年9月,對私有資料的考慮可以靠後,先把公有資料用好。並且資料的獨特性本身比資料量更重要,真正擁有自己獨特私有資料並能轉化商業價值的公司幾乎很少甚至是沒有的。
  • 4一個模型做到80分可能不算擁有壁壘,但假如能做到95分,肯定是一種壁壘。固然海內各種公司都在做模型,但真正能全面碾壓GPT-4的還沒有泛起,由於它的核心壁壘是工程上的最佳化,而這是Open AI沒有公然的“秘密”。
  • 5國內外大模型投資策略的差異源自於專案退出途徑。在國外,投資人願意投資單點技術創新類的專案,此類專案能透過併購退出。反觀海內,因為併購案例稀少,投資機構更願意在終極能上市退出的大idea上下注。

文|周小燕

在ChatGPT成為“全民應用”的半年時間內,跟著入場做大模型的角色增多,關於大模型創業風口的爭議點已發生了一輪轉變:從討論大模型是否為大廠專屬,轉而關注大模型創業的核心壁壘,在此背景之下,創業公司的競爭力在哪裡?VC的投資策略需要做哪些調整?

騰訊科技“AI未來指北”系列,本期專訪海內大模型獨角獸公司MiniMax背後早期投資方雲啟合夥人陳昱,對以上題目進行探討,核心觀點:

  • 1大模型時代下,未來的應用也有一個“二八定律”,大約有80%會是現在的應用接入大模型後的「升級版」,有20%是基於大模型的新能力開發出的新應用。
  • 2各行各業的整體格式都不會由於大模型而發生大的改變,即便大模型改變了應用進口,也不會對貿易格式的本身產生大的改動,它只是一個體驗進級。AI原生應用的機會可能在:跨境電商、面向開發者的AI解決方案(AI for Developers)、私有化部署和AI安全。
  • 3許多人以為模型層面的創業機會比較小,可能資料層面的創業機會比較多,但實在市場並不缺資料,公然的資料許多都還沒有用好,ChatGPT的資料也只更新到2021年9月,對私有資料的考慮可以靠後,先把公有資料用好。並且資料的獨特性本身比資料量更重要,真正擁有自己獨特私有資料並能轉化商業價值的公司幾乎很少甚至是沒有的。
  • 4一個模型做到80分可能不算擁有壁壘,但假如能做到95分,肯定是一種壁壘。固然海內各種公司都在做模型,但真正能全面碾壓GPT-4的還沒有泛起,由於它的核心壁壘是工程上的最佳化,而這是Open AI沒有公然的“秘密”。
  • 5國內外大模型投資策略的差異源自於專案退出途徑。在國外,投資人願意投資單點技術創新類的專案,此類專案能透過併購退出。反觀海內,因為併購案例稀少,投資機構更願意在終極能上市退出的大idea上下注。

上一篇:好心房東將手... 下一篇:深港通是什麼
猜你喜歡
熱門閱讀
同類推薦