ChatGPT火了,中國人工智慧圈有點上火

首頁 > 科技

ChatGPT火了,中國人工智慧圈有點上火

來源:甲殼蟲 釋出時間:2023-02-07 12:10

本文來自微信公眾號:數智前線(ID:szqx1991),作者:趙豔秋 徐鑫,編輯:周路平,題圖來自:視覺中國

春節前,人工智慧組織OpenAI推出的大模型ChatGPT,在國內業界引起了不小的轟動。

一名AI從業者告訴數智前線,人工智慧每五六年都有一波浪潮,上一波AlphaGO讓大家震撼,這一波就是ChatGPT。但這兩次大家的心態迥然不同,當谷歌的AI下棋戰勝圍棋世界冠軍時,大家當新聞看,但這一次許多人是從消費者的角度來體驗它。一個月裡,全世界100萬用戶在使用和體驗它,這是非常顛覆性的體驗。這也是AI第一次大規模的自傳播。

數智前線獲悉,除了感嘆於ChatGPT的驚豔體驗外,國內業界也在迅速反思和行動:我們的差距在哪裡?我們將如何正視和改進不足?哪些是中國從業者的機會?

一名從業人士告訴數智前線,ChatGPT出現後,行業重新變得熱鬧而有活力,前幾年青黃不接、垂頭喪氣的局面一掃而空。

一、中美差距究竟有多大

在ChatGPT推出後,一位百度資深人士告訴數智前線,他“沒有興趣”談論ChatGPT,言語之間,五味雜陳。一位人工智慧企業創始人稱,面對ChatGPT的驚豔表現,心癢癢也迷茫,失眠了。他坦承,從模型的規模到效果,差距還比較遠。

有人用同樣的問題向國內某廠商的大模型和ChatGPT同時發問,ChatGPT從回答的邏輯性和完整度上都遠超國內大模型,國內大模型的答案帶有明顯的拼湊感,夾雜著不少主題之外的胡編內容。而且,在回覆速度上,ChatGPT也領先一截。

從事數字人研發的特看科技CEO樂乘認為,目前全球還沒有能跟ChatGPT抗衡的大模型,業界共識是差距在兩年以上。國內先不談彎道超車,趁早追趕反而是更重要的。

雖然一些人工智慧資深人士認為,在ChatGPT所涉及的技術上,中美是“平級”的,但華為諾亞方舟實驗室語音語義首席科學家劉群,在黃大年茶思屋的討論中坦承,中國在技術上仍是有差距的。其中一個是基礎模型本身的差距,雖然我們訓練了很多萬億模型或者是幾千億的模型,但訓練的充分程度,是遠遠不夠的。“我估計到現在為止,沒有哪個模型能吃GPT那麼多資料。”

清華大學計算機科學與技術系長聘副教授黃民烈提到,在GPT-3之後,OpenAI所有的模型都沒有開源,但它提供了API呼叫。在這個過程中,它幹了一件事,就是建立起了真實的使用者呼叫和模型迭代之間的飛輪,它非常重視真實世界資料的呼叫,以及這些資料對模型的迭代。當然,在此過程中,它也養活了美國一大幫創業公司,建立了一個生態。

“你看我們國內的大模型研究,是A公司訓練了一個,B公司也訓練了一個,打個廣告就完了,模型開源,你愛用不用。至少目前還沒看到一家比較好的公司,把資料和模型的飛輪完整轉起來。所以,我覺得這是我們趕超ChatGPT的難點。”一位業內人士坦言。

除此之外,業界人士都提到了算力問題。由於GPU晶片等問題,在一定程度上,國內算力已被洽談了。即使國內頭部公司,從算力上跟谷歌等相比,差距也是比較顯著的。

從資料質量來說,整個網際網路的中文資料質量,相比於英文仍是有明顯差距。“我們可能要想辦法,做中英文不同語言之間的資料互補。”有業內人士稱。

此外,幾乎所有受訪人士都提到了OpenAI這家人工智慧組織,所體現的純碎創新精神和長期主義。“其實從原理和方法看,他們所做的東西業界都是瞭解的,倒沒有說什麼是美國做得了、我們做不了的。”雲知聲董事長梁家恩對數智前線說,但像OpenAI和DeepMind,他們可能是業界唯二的兩家機構,無論在創新性、投入、決心,仍是在頂尖人才儲備上,都是一如既往堅持的。“我們看到的是成功,但裡面可能已經有很多失敗的嘗試。”

有資深AI從業者認為,在看不到前景和沒有顯著效果的階段,OpenAI非常堅定地做了投入,相反國內傾向於在技術出現突破後,快速追隨。“國內大家第一步想的是,我們現在怎麼用起來,但在不能用的時候,人家就在長期投入。”

“這件事實在是值得我們學習的,我們真的需要有足夠多的錢,有這麼一幫熱血的人才,能夠在一個方向上這樣持續積累發力,我覺得這是一個非常必要的條件。”黃民烈稱。

最近一段時間,業界也在討論中國企業能否超越。容聯雲AI研究院院長劉傑告訴數智前線,圍繞業務,尤其是國內的場景,是有超越機會的。在區域性應用中開始超越,這也是業界的共識。

二、對中國人工智慧界有何啟發

ChatGPT是一種大模型。在它推出之前,國內外實際上已有不少大模型。相比其他大模型,它有了業界意料之外的突破,也給國內業界帶來啟發。

第一,ChatGPT有一個非常強大的技術底座,也就是InstructGPT模型。但這個模型的論文剛發出來時,沒有引起特別大的反響,大家覺得也就是 OpenAI的一篇論文而已。

梁家恩也告訴數智前線,此前,GPT與BERT模型路線一直在競爭,2018年時BERT模型先贏了,但GPT模型路線一直沒放棄,模型引數和資料規模越做越大,最終結合人工反饋增強學習(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路線。因此,業內公司正在關注投入更大精力到GPT模型路線上,技術路線交替競爭,在業內是常態。

第二,ChatGPT引入了強化學習機制。容聯雲劉傑告訴數智前線,ChatGPT不僅僅像以前的大模型,利用了沒有人工標註的資料去學習,還在新版本上引入了人工標註的資料,透過人類的反饋,有針對性地進行最佳化。“這是ChatGPT一個重要的進展,給了我們很大的啟發。”

“這是它核心的一點。”華為終端雲服務搜尋與地圖BU總裁趙世奇稱,“今天,我們的模型越來越大,它就像一股洪荒之力,有人會害怕未來它會不會控制人類?但引入了這種強化學習機制後,就相當於給洪荒之力一個引導,讓大模型的產出朝著可控的方向走,生成符合預期的結果。”比如,你去問它一些倫理安全的敏感話題,它都能答得很好。

這裡的難度是建立怎樣的強化學習機制。此前,在下圍棋的AI中,強化學習是用勝負做反饋。但對於ChatGPT如此開放的系統,是沒有明確的反饋機制的。黃民烈稱,過去大家也嘗試了強化學習機制,但很多都不太成功。ChatGPT在這件事上取得了突破。

第三,它在資料質量和多樣性上非常講究。OpenAI僱傭了一個數十人的資料團隊,其實ChatGPT強化學習的資料量並不大,但對資料多樣性、標註體系都有精巧的設計,讓資料發揮出了強大的作用。業內認為,這確實是值得我們借鑑的地方。

當然,ChatGPT也有明顯的不足。大家公認的,是它善於一本正經地胡說八道。劉傑告訴數智前線,ChatGPT是一個黑盒計算,當下在內容的可信性和可控性上有一定侷限。“我們要給它足夠正確的知識,再引入知識圖譜這類知識管理和資訊注入技術,還要限定它的資料範圍和應用場景,使得它生成的內容更為可靠,這是我們在做的。”

ChatGPT在AI的技術路線和訓練方式上的變革,讓人關注它對產業帶來的改變。特看科技CEO樂乘預計,很多單點環節裡,用不用大模型會有天地之別。沒用大模型,只基於自己上一代小模型做產品的企業,跟應用了大模型且還做了業務垂直化的公司,將無法競爭。

多名創業者談及,這兩年創業市場垂頭喪氣,所有人都在探尋能夠大幅度提升生產力的技術是什麼。“ChatGPT其實提供了一種新的正規化。垂頭喪氣、青黃不接的狀態可能會成為過去。這個領域出幾家千億級別的公司是完全有可能的。”樂乘說。

三、中國企業的動作

ChatGPT推出後,很多人在講谷歌、百度的焦慮。但大多數中國業內人士認為,目前ChatGPT仍是一個對AI技術正規化的探索,它並不能代替搜尋。ChatGPT當下一個很大的弊端是無法實時獲取網際網路資訊。由於它只是一個端到端的生成模型,能夠自我構造虛假答案,這些都是它替代搜尋的障礙。而如果以目前每一條几美分的成本來看,它會讓商業搜尋引擎公司入不敷出。

它作為搜尋引擎的補充是有機會的,因為搜尋引擎也講求“所問即所答”,但這還有一個發展過程。

劉傑認為,ChatGPT主要的產業化路徑,目前可能性比較大的首先仍是在C端。由於ChatGPT展現出的大模型的創造性,以及對長篇上下文的理解能力,它可能會聚焦於一些開放性、創意性和通用性的任務上。

不外,中國企業在行業市場的探索已經開啟。比如,在智慧客服領域,雲蝠智慧CEO魏佳星告訴數智前線,上個月他們在一些場景嘗試引入ChatGPT來做外呼的Demo測試,呼叫ChatGPT來回復客戶的問題。

“在智慧客服領域應用這項技術,核心點在大模型的NLP(自然語言處理)能力和此前企業裡已有的NLP之間怎麼結合。”魏佳星說。例如幫助順豐去做回訪的快遞通知體系,是基於幾個標準動作而進行,在這個封閉條件下應該優先企業已有的技術,滿足客戶當下的核心需求。

在這個需求之外,此前智慧客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,語料資訊不充分時,AI沒辦法對問題做出反應,ChatGPT大模型能夠補全這方面的能力。魏佳星反饋,雲蝠智慧外呼的Demo測試效果較好。在其他行業裡這項技術可能仍處於娛樂狀態,但在智慧客服領域,ChatGPT已具備商用潛力。

從事通訊及數字化服務的上市企業容聯雲,從2021年圍繞著人機智慧對話,做核心技術和產品研發,比如智慧客服。目前,在研發與ChatGPT類似的人工智慧內容生成產品。

但就模型的規模,劉傑有不同的看法。“ChatGPT的優勢是它的大帶來的,但在應用落地上,由於它過大,也帶來了挑戰和侷限。”他告訴數智前線,“脫離場景去談大和小是沒有意義的。在特定應用場景、特定條件約束下、在特定的資料上,去訓練規模適宜的模型,是我們努力的目標。”

劉傑還稱,AI是一個鏈條比較長的產品技術,如果沒有建立一個好的反饋機制,在部署運營階段,從最前線發現的問題,就很難有效定位解決,所以要讓模型去持續成長和最佳化,“它不是靜態的,不是交付了就不再管它。”

雲知聲梁家恩告訴數智前線,他們一直緊密親密跟進業內最前沿的演算法,是最早把BERT和GPT2模型方法用到實際業務系統的團隊之一,“現在相當於是把基於BERT的技術框架做個升級,目前已納入雲知聲今年的技術升級目標規劃中。”梁家恩說,ChatGPT的優勢是意圖理解、上下文對話管理和高質量內容生成,技術升級後,預計會帶來顯著的體驗提升。

與其他企業一樣,雲知聲的目標是先走通,之後在既有的業務比如在IoT智慧語音互動對話,以及醫療行業應用中落地。梁家恩也提到了模型的規模問題,考慮商業化成本,實用模型的引數目最終可能要壓到10億量級。

商湯科技數字文娛事業部總經理欒青告訴數智前線,團隊更多是利用GPT等生成式內容進行短影片等創作,讓大家在創作的過程當中,把生產效率提升,“這是我們的核心點”。同時,商湯已訓練了超過300億量級超大基模型。

出門問問創始人李志飛則告訴數智前線,出門問問從2019年底開始做生成式應用,2020年GPT-3出來後一直在跟蹤大模型。目前發力的一個行業應用是寫文案。

某遊戲人工智慧的資深開發者告訴數智前線,這項技術在遊戲的使用者互動環節和製作環節能看到應用前景。比如使用者和NPC(一種角色)互動對話時呼叫,由於ChatGPT對自然語言的優秀理解能力,使用者和NPC互動的開放效能大幅提升。另外在製作環節裡,應用ChatGPT,可透過關鍵詞生成故事線,能給策劃在劇情走向設計時提供參考。

另外,在數字人領域,特看科技CEO樂乘告訴數智前線,大模型讓數字人的內容生產和互動方式發生了變化。

在沒有引入大模型之前,數字人說話和行動基本要靠真人行為去驅動。有了大模型之後,內容的輸出可以透過大模型來完成。以直播帶貨為例,數字人公司先給本地生活、知識付費和直播商家等建立一個數字人的虛擬主播形象,而後可以將大模型接入,讓大模型輔助撰寫數字人直播帶貨的話術和指令碼,“未來在我們關注的泛生活和電商賽道,可能有30%內容能夠透過大模型生成來完成。”樂乘說。

四、ChatGPT在行業落地難

不外,業界資深人士提出,當下ChatGPT在行業裡要真正落地還面臨困難。

“商業模型上跑不通。”魏佳星對數智前線說。ChatGPT目前呼叫一次的費用在幾美分,智慧客服一天的問答場景,通常可能要呼叫幾十萬次。“我們一通電話收費才1.2毛,利潤可能也就2分錢,現在的成本使得它根本跑不起來。“魏佳星認為,當這項產品的呼叫成本降到1分錢時,行業裡可能就會大範圍使用起來。

遊戲行業的開發者們也坦言,呼叫ChatGPT的成本和它當下所帶來的回報可能並不成正比。幾美分只是呼叫費用,還不算運營費用。“沒有一個老闆能接受,NPC回覆一句話要花掉幾毛錢,即使它說得再好。”而使用者的遊戲體驗是個系統工程,文字互動只是其中的一環。當下即使有廠商願意不顧高成本使用ChatGPT,最終的使用者體驗也依然可能無法有質的飛躍。

在遊戲製作環節,ChatGPT可能也只能作為策劃和遊戲設計環節的參考,“乍看中規中矩要素齊全,但細品會發現缺少靈魂,在觀念性的創造上仍有待提升”。

不外,樂乘對ChatGPT的成本問題相對樂觀。OpenAI公司自己也是初創團隊,沒有那麼有錢。隨著競爭加劇,大模型會像水電煤一樣,是大家都用得起的狀態。

刨除成本考量,在對企業的落地中,ChatGPT這類大模型,也有典型的問題。

容聯雲劉傑舉例,首先,很多客戶有私有化部署要求,但這些模型非常大,對資源要求高,當前不太可能實現私有化部署。其次,這些大模型在一些特定行業或特定任務上,專業性是欠缺的,需要去適配。

而對於ChatGPT這類非開源的大模型應用來說,對它在下游任務上的微調,如何兼顧成本、靈活性和資料隱私則是一個關鍵問題。這些問題也造成,這種模型還沒有走到服務企業級客戶,尤其是大型企業客戶那一步。

除此之外,現在人工智慧技術都在與企業的核心業務流程做深度融合,而像ChatGPT這個基於大模型的應用服務,更像一個獨立的外掛,如何深度繫結,這也成為企業使用它的一個待解決問題。

業界人士期望ChatGPT未來在商業模式上有更好的呈現方式。目前ChatGPT對外提供的API還非常單一,影響了應用。

五、創業公司會被ChatGPT吞噬嗎

大家在期待OpenAI的下一個版本。GPT-3大模型釋出於2020年, ChatGPT則基於它的改進版本建立。此前盛傳,GPT-4將於今年一季度或下半年推出,不過OpenAI的執行長 Sam Altman在1月份回應,沒有具體的時間表。

一些創業者已經開始關注到,隨著大模型被越來越多地應用,細分賽道的創業公司在大模型的強大推力加持下,如何尋找自己的生存空間。

它涉及到兩點,首先是如何深化對垂直行業的認知,真正把大模型融入到企業的創新業務流中。特看科技樂乘認為,垂直行業的小模型,考驗的是創業公司對垂直行業的know-how。創業公司需要基於對行業的認知深度,採集足夠多的場景資料,並基於這些細分資料更好服務使用者。使用者越多,反饋越多,最終形成資料反饋的閉環。

創業公司在小模型的競爭終局比拼的是,誰家的小模型跟業務結合得緊,且能解決好跟大模型結合的問題。

另一點是,大模型被充分使用、喂得很肥後,是否會成為最強大的AI,最終吞噬細分賽道上小創業公司的發展空間。

海外初創公司Jasper的命運頗能反映這種境況。Jasper是一家基於GPT-3大模型來生成營銷文案的AI服務商,去年10月它宣佈以15億美元的估值獲得1.25億美元A輪融資。一個月後,基於GPT-3改進版本搭建的ChatGPT大火,智慧程度更泛化的ChatGPT徹底蓋過了Jasper的風頭。

“對創業者而言,在充分利用已有大模型的情況下,也要儘可能要把小模型的閉環資料保護好。”特看科技樂乘說,這也是他們公司未來會重點攻克的方向。

不外,當下底層大模型還在高速迭代階段,行業內都在等 GPT-4 出來。樂乘認為,從GPT-3到GPT-4的變遷,很像移動網際網路早期 iPhone 1和 iPhone4 階段iOS的升級速度,它的發展速度也許會超出大家的認知。

一些人士猜測, GPT-4將在多模態上有進展,也就是會引入影片、音訊等。國內某遊戲人工智慧的資深開發則告訴數智前線,他們關注的是下一代的大模型能不能在理解上下文上有突破。“如果大模型能讓人工智慧打贏辯論賽,那麼它的能力就算是有質的突破了。”

“短期內可能大家會高估這個東西,但長期可能有很多人會低估這個東西。”這名遊戲AI資深開發評價。

本文來自微信公眾號:數智前線(ID:szqx1991),作者:趙豔秋 徐鑫,編輯:周路平

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯絡hezuo@huxiu.com

如對本稿件有異議或投訴,請聯絡tougao@huxiu.com

End

想漲知識 關注虎嗅影片號!

本文來自微信公眾號:數智前線(ID:szqx1991),作者:趙豔秋 徐鑫,編輯:周路平,題圖來自:視覺中國

春節前,人工智慧組織OpenAI推出的大模型ChatGPT,在國內業界引起了不小的轟動。

一名AI從業者告訴數智前線,人工智慧每五六年都有一波浪潮,上一波AlphaGO讓大家震撼,這一波就是ChatGPT。但這兩次大家的心態迥然不同,當谷歌的AI下棋戰勝圍棋世界冠軍時,大家當新聞看,但這一次許多人是從消費者的角度來體驗它。一個月裡,全世界100萬用戶在使用和體驗它,這是非常顛覆性的體驗。這也是AI第一次大規模的自傳播。

數智前線獲悉,除了感嘆於ChatGPT的驚豔體驗外,國內業界也在迅速反思和行動:我們的差距在哪裡?我們將如何正視和改進不足?哪些是中國從業者的機會?

一名從業人士告訴數智前線,ChatGPT出現後,行業重新變得熱鬧而有活力,前幾年青黃不接、垂頭喪氣的局面一掃而空。

一、中美差距究竟有多大

在ChatGPT推出後,一位百度資深人士告訴數智前線,他“沒有興趣”談論ChatGPT,言語之間,五味雜陳。一位人工智慧企業創始人稱,面對ChatGPT的驚豔表現,心癢癢也迷茫,失眠了。他坦承,從模型的規模到效果,差距還比較遠。

有人用同樣的問題向國內某廠商的大模型和ChatGPT同時發問,ChatGPT從回答的邏輯性和完整度上都遠超國內大模型,國內大模型的答案帶有明顯的拼湊感,夾雜著不少主題之外的胡編內容。而且,在回覆速度上,ChatGPT也領先一截。

從事數字人研發的特看科技CEO樂乘認為,目前全球還沒有能跟ChatGPT抗衡的大模型,業界共識是差距在兩年以上。國內先不談彎道超車,趁早追趕反而是更重要的。

雖然一些人工智慧資深人士認為,在ChatGPT所涉及的技術上,中美是“平級”的,但華為諾亞方舟實驗室語音語義首席科學家劉群,在黃大年茶思屋的討論中坦承,中國在技術上仍是有差距的。其中一個是基礎模型本身的差距,雖然我們訓練了很多萬億模型或者是幾千億的模型,但訓練的充分程度,是遠遠不夠的。“我估計到現在為止,沒有哪個模型能吃GPT那麼多資料。”

清華大學計算機科學與技術系長聘副教授黃民烈提到,在GPT-3之後,OpenAI所有的模型都沒有開源,但它提供了API呼叫。在這個過程中,它幹了一件事,就是建立起了真實的使用者呼叫和模型迭代之間的飛輪,它非常重視真實世界資料的呼叫,以及這些資料對模型的迭代。當然,在此過程中,它也養活了美國一大幫創業公司,建立了一個生態。

“你看我們國內的大模型研究,是A公司訓練了一個,B公司也訓練了一個,打個廣告就完了,模型開源,你愛用不用。至少目前還沒看到一家比較好的公司,把資料和模型的飛輪完整轉起來。所以,我覺得這是我們趕超ChatGPT的難點。”一位業內人士坦言。

除此之外,業界人士都提到了算力問題。由於GPU晶片等問題,在一定程度上,國內算力已被洽談了。即使國內頭部公司,從算力上跟谷歌等相比,差距也是比較顯著的。

從資料質量來說,整個網際網路的中文資料質量,相比於英文仍是有明顯差距。“我們可能要想辦法,做中英文不同語言之間的資料互補。”有業內人士稱。

此外,幾乎所有受訪人士都提到了OpenAI這家人工智慧組織,所體現的純碎創新精神和長期主義。“其實從原理和方法看,他們所做的東西業界都是瞭解的,倒沒有說什麼是美國做得了、我們做不了的。”雲知聲董事長梁家恩對數智前線說,但像OpenAI和DeepMind,他們可能是業界唯二的兩家機構,無論在創新性、投入、決心,仍是在頂尖人才儲備上,都是一如既往堅持的。“我們看到的是成功,但裡面可能已經有很多失敗的嘗試。”

有資深AI從業者認為,在看不到前景和沒有顯著效果的階段,OpenAI非常堅定地做了投入,相反國內傾向於在技術出現突破後,快速追隨。“國內大家第一步想的是,我們現在怎麼用起來,但在不能用的時候,人家就在長期投入。”

“這件事實在是值得我們學習的,我們真的需要有足夠多的錢,有這麼一幫熱血的人才,能夠在一個方向上這樣持續積累發力,我覺得這是一個非常必要的條件。”黃民烈稱。

最近一段時間,業界也在討論中國企業能否超越。容聯雲AI研究院院長劉傑告訴數智前線,圍繞業務,尤其是國內的場景,是有超越機會的。在區域性應用中開始超越,這也是業界的共識。

二、對中國人工智慧界有何啟發

ChatGPT是一種大模型。在它推出之前,國內外實際上已有不少大模型。相比其他大模型,它有了業界意料之外的突破,也給國內業界帶來啟發。

第一,ChatGPT有一個非常強大的技術底座,也就是InstructGPT模型。但這個模型的論文剛發出來時,沒有引起特別大的反響,大家覺得也就是 OpenAI的一篇論文而已。

梁家恩也告訴數智前線,此前,GPT與BERT模型路線一直在競爭,2018年時BERT模型先贏了,但GPT模型路線一直沒放棄,模型引數和資料規模越做越大,最終結合人工反饋增強學習(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路線。因此,業內公司正在關注投入更大精力到GPT模型路線上,技術路線交替競爭,在業內是常態。

第二,ChatGPT引入了強化學習機制。容聯雲劉傑告訴數智前線,ChatGPT不僅僅像以前的大模型,利用了沒有人工標註的資料去學習,還在新版本上引入了人工標註的資料,透過人類的反饋,有針對性地進行最佳化。“這是ChatGPT一個重要的進展,給了我們很大的啟發。”

“這是它核心的一點。”華為終端雲服務搜尋與地圖BU總裁趙世奇稱,“今天,我們的模型越來越大,它就像一股洪荒之力,有人會害怕未來它會不會控制人類?但引入了這種強化學習機制後,就相當於給洪荒之力一個引導,讓大模型的產出朝著可控的方向走,生成符合預期的結果。”比如,你去問它一些倫理安全的敏感話題,它都能答得很好。

這裡的難度是建立怎樣的強化學習機制。此前,在下圍棋的AI中,強化學習是用勝負做反饋。但對於ChatGPT如此開放的系統,是沒有明確的反饋機制的。黃民烈稱,過去大家也嘗試了強化學習機制,但很多都不太成功。ChatGPT在這件事上取得了突破。

第三,它在資料質量和多樣性上非常講究。OpenAI僱傭了一個數十人的資料團隊,其實ChatGPT強化學習的資料量並不大,但對資料多樣性、標註體系都有精巧的設計,讓資料發揮出了強大的作用。業內認為,這確實是值得我們借鑑的地方。

當然,ChatGPT也有明顯的不足。大家公認的,是它善於一本正經地胡說八道。劉傑告訴數智前線,ChatGPT是一個黑盒計算,當下在內容的可信性和可控性上有一定侷限。“我們要給它足夠正確的知識,再引入知識圖譜這類知識管理和資訊注入技術,還要限定它的資料範圍和應用場景,使得它生成的內容更為可靠,這是我們在做的。”

ChatGPT在AI的技術路線和訓練方式上的變革,讓人關注它對產業帶來的改變。特看科技CEO樂乘預計,很多單點環節裡,用不用大模型會有天地之別。沒用大模型,只基於自己上一代小模型做產品的企業,跟應用了大模型且還做了業務垂直化的公司,將無法競爭。

多名創業者談及,這兩年創業市場垂頭喪氣,所有人都在探尋能夠大幅度提升生產力的技術是什麼。“ChatGPT其實提供了一種新的正規化。垂頭喪氣、青黃不接的狀態可能會成為過去。這個領域出幾家千億級別的公司是完全有可能的。”樂乘說。

三、中國企業的動作

ChatGPT推出後,很多人在講谷歌、百度的焦慮。但大多數中國業內人士認為,目前ChatGPT仍是一個對AI技術正規化的探索,它並不能代替搜尋。ChatGPT當下一個很大的弊端是無法實時獲取網際網路資訊。由於它只是一個端到端的生成模型,能夠自我構造虛假答案,這些都是它替代搜尋的障礙。而如果以目前每一條几美分的成本來看,它會讓商業搜尋引擎公司入不敷出。

它作為搜尋引擎的補充是有機會的,因為搜尋引擎也講求“所問即所答”,但這還有一個發展過程。

劉傑認為,ChatGPT主要的產業化路徑,目前可能性比較大的首先仍是在C端。由於ChatGPT展現出的大模型的創造性,以及對長篇上下文的理解能力,它可能會聚焦於一些開放性、創意性和通用性的任務上。

不外,中國企業在行業市場的探索已經開啟。比如,在智慧客服領域,雲蝠智慧CEO魏佳星告訴數智前線,上個月他們在一些場景嘗試引入ChatGPT來做外呼的Demo測試,呼叫ChatGPT來回復客戶的問題。

“在智慧客服領域應用這項技術,核心點在大模型的NLP(自然語言處理)能力和此前企業裡已有的NLP之間怎麼結合。”魏佳星說。例如幫助順豐去做回訪的快遞通知體系,是基於幾個標準動作而進行,在這個封閉條件下應該優先企業已有的技術,滿足客戶當下的核心需求。

在這個需求之外,此前智慧客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,語料資訊不充分時,AI沒辦法對問題做出反應,ChatGPT大模型能夠補全這方面的能力。魏佳星反饋,雲蝠智慧外呼的Demo測試效果較好。在其他行業裡這項技術可能仍處於娛樂狀態,但在智慧客服領域,ChatGPT已具備商用潛力。

從事通訊及數字化服務的上市企業容聯雲,從2021年圍繞著人機智慧對話,做核心技術和產品研發,比如智慧客服。目前,在研發與ChatGPT類似的人工智慧內容生成產品。

但就模型的規模,劉傑有不同的看法。“ChatGPT的優勢是它的大帶來的,但在應用落地上,由於它過大,也帶來了挑戰和侷限。”他告訴數智前線,“脫離場景去談大和小是沒有意義的。在特定應用場景、特定條件約束下、在特定的資料上,去訓練規模適宜的模型,是我們努力的目標。”

劉傑還稱,AI是一個鏈條比較長的產品技術,如果沒有建立一個好的反饋機制,在部署運營階段,從最前線發現的問題,就很難有效定位解決,所以要讓模型去持續成長和最佳化,“它不是靜態的,不是交付了就不再管它。”

雲知聲梁家恩告訴數智前線,他們一直緊密親密跟進業內最前沿的演算法,是最早把BERT和GPT2模型方法用到實際業務系統的團隊之一,“現在相當於是把基於BERT的技術框架做個升級,目前已納入雲知聲今年的技術升級目標規劃中。”梁家恩說,ChatGPT的優勢是意圖理解、上下文對話管理和高質量內容生成,技術升級後,預計會帶來顯著的體驗提升。

與其他企業一樣,雲知聲的目標是先走通,之後在既有的業務比如在IoT智慧語音互動對話,以及醫療行業應用中落地。梁家恩也提到了模型的規模問題,考慮商業化成本,實用模型的引數目最終可能要壓到10億量級。

商湯科技數字文娛事業部總經理欒青告訴數智前線,團隊更多是利用GPT等生成式內容進行短影片等創作,讓大家在創作的過程當中,把生產效率提升,“這是我們的核心點”。同時,商湯已訓練了超過300億量級超大基模型。

出門問問創始人李志飛則告訴數智前線,出門問問從2019年底開始做生成式應用,2020年GPT-3出來後一直在跟蹤大模型。目前發力的一個行業應用是寫文案。

某遊戲人工智慧的資深開發者告訴數智前線,這項技術在遊戲的使用者互動環節和製作環節能看到應用前景。比如使用者和NPC(一種角色)互動對話時呼叫,由於ChatGPT對自然語言的優秀理解能力,使用者和NPC互動的開放效能大幅提升。另外在製作環節裡,應用ChatGPT,可透過關鍵詞生成故事線,能給策劃在劇情走向設計時提供參考。

另外,在數字人領域,特看科技CEO樂乘告訴數智前線,大模型讓數字人的內容生產和互動方式發生了變化。

在沒有引入大模型之前,數字人說話和行動基本要靠真人行為去驅動。有了大模型之後,內容的輸出可以透過大模型來完成。以直播帶貨為例,數字人公司先給本地生活、知識付費和直播商家等建立一個數字人的虛擬主播形象,而後可以將大模型接入,讓大模型輔助撰寫數字人直播帶貨的話術和指令碼,“未來在我們關注的泛生活和電商賽道,可能有30%內容能夠透過大模型生成來完成。”樂乘說。

四、ChatGPT在行業落地難

不外,業界資深人士提出,當下ChatGPT在行業裡要真正落地還面臨困難。

“商業模型上跑不通。”魏佳星對數智前線說。ChatGPT目前呼叫一次的費用在幾美分,智慧客服一天的問答場景,通常可能要呼叫幾十萬次。“我們一通電話收費才1.2毛,利潤可能也就2分錢,現在的成本使得它根本跑不起來。“魏佳星認為,當這項產品的呼叫成本降到1分錢時,行業裡可能就會大範圍使用起來。

遊戲行業的開發者們也坦言,呼叫ChatGPT的成本和它當下所帶來的回報可能並不成正比。幾美分只是呼叫費用,還不算運營費用。“沒有一個老闆能接受,NPC回覆一句話要花掉幾毛錢,即使它說得再好。”而使用者的遊戲體驗是個系統工程,文字互動只是其中的一環。當下即使有廠商願意不顧高成本使用ChatGPT,最終的使用者體驗也依然可能無法有質的飛躍。

在遊戲製作環節,ChatGPT可能也只能作為策劃和遊戲設計環節的參考,“乍看中規中矩要素齊全,但細品會發現缺少靈魂,在觀念性的創造上仍有待提升”。

不外,樂乘對ChatGPT的成本問題相對樂觀。OpenAI公司自己也是初創團隊,沒有那麼有錢。隨著競爭加劇,大模型會像水電煤一樣,是大家都用得起的狀態。

刨除成本考量,在對企業的落地中,ChatGPT這類大模型,也有典型的問題。

容聯雲劉傑舉例,首先,很多客戶有私有化部署要求,但這些模型非常大,對資源要求高,當前不太可能實現私有化部署。其次,這些大模型在一些特定行業或特定任務上,專業性是欠缺的,需要去適配。

而對於ChatGPT這類非開源的大模型應用來說,對它在下游任務上的微調,如何兼顧成本、靈活性和資料隱私則是一個關鍵問題。這些問題也造成,這種模型還沒有走到服務企業級客戶,尤其是大型企業客戶那一步。

除此之外,現在人工智慧技術都在與企業的核心業務流程做深度融合,而像ChatGPT這個基於大模型的應用服務,更像一個獨立的外掛,如何深度繫結,這也成為企業使用它的一個待解決問題。

業界人士期望ChatGPT未來在商業模式上有更好的呈現方式。目前ChatGPT對外提供的API還非常單一,影響了應用。

五、創業公司會被ChatGPT吞噬嗎

大家在期待OpenAI的下一個版本。GPT-3大模型釋出於2020年, ChatGPT則基於它的改進版本建立。此前盛傳,GPT-4將於今年一季度或下半年推出,不過OpenAI的執行長 Sam Altman在1月份回應,沒有具體的時間表。

一些創業者已經開始關注到,隨著大模型被越來越多地應用,細分賽道的創業公司在大模型的強大推力加持下,如何尋找自己的生存空間。

它涉及到兩點,首先是如何深化對垂直行業的認知,真正把大模型融入到企業的創新業務流中。特看科技樂乘認為,垂直行業的小模型,考驗的是創業公司對垂直行業的know-how。創業公司需要基於對行業的認知深度,採集足夠多的場景資料,並基於這些細分資料更好服務使用者。使用者越多,反饋越多,最終形成資料反饋的閉環。

創業公司在小模型的競爭終局比拼的是,誰家的小模型跟業務結合得緊,且能解決好跟大模型結合的問題。

另一點是,大模型被充分使用、喂得很肥後,是否會成為最強大的AI,最終吞噬細分賽道上小創業公司的發展空間。

海外初創公司Jasper的命運頗能反映這種境況。Jasper是一家基於GPT-3大模型來生成營銷文案的AI服務商,去年10月它宣佈以15億美元的估值獲得1.25億美元A輪融資。一個月後,基於GPT-3改進版本搭建的ChatGPT大火,智慧程度更泛化的ChatGPT徹底蓋過了Jasper的風頭。

“對創業者而言,在充分利用已有大模型的情況下,也要儘可能要把小模型的閉環資料保護好。”特看科技樂乘說,這也是他們公司未來會重點攻克的方向。

不外,當下底層大模型還在高速迭代階段,行業內都在等 GPT-4 出來。樂乘認為,從GPT-3到GPT-4的變遷,很像移動網際網路早期 iPhone 1和 iPhone4 階段iOS的升級速度,它的發展速度也許會超出大家的認知。

一些人士猜測, GPT-4將在多模態上有進展,也就是會引入影片、音訊等。國內某遊戲人工智慧的資深開發則告訴數智前線,他們關注的是下一代的大模型能不能在理解上下文上有突破。“如果大模型能讓人工智慧打贏辯論賽,那麼它的能力就算是有質的突破了。”

“短期內可能大家會高估這個東西,但長期可能有很多人會低估這個東西。”這名遊戲AI資深開發評價。

本文來自微信公眾號:數智前線(ID:szqx1991),作者:趙豔秋 徐鑫,編輯:周路平

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯絡hezuo@huxiu.com

如對本稿件有異議或投訴,請聯絡tougao@huxiu.com

End

想漲知識 關注虎嗅影片號!

本文來自微信公眾號:數智前線(ID:szqx1991),作者:趙豔秋 徐鑫,編輯:周路平,題圖來自:視覺中國

春節前,人工智慧組織OpenAI推出的大模型ChatGPT,在國內業界引起了不小的轟動。

一名AI從業者告訴數智前線,人工智慧每五六年都有一波浪潮,上一波AlphaGO讓大家震撼,這一波就是ChatGPT。但這兩次大家的心態迥然不同,當谷歌的AI下棋戰勝圍棋世界冠軍時,大家當新聞看,但這一次許多人是從消費者的角度來體驗它。一個月裡,全世界100萬用戶在使用和體驗它,這是非常顛覆性的體驗。這也是AI第一次大規模的自傳播。

數智前線獲悉,除了感嘆於ChatGPT的驚豔體驗外,國內業界也在迅速反思和行動:我們的差距在哪裡?我們將如何正視和改進不足?哪些是中國從業者的機會?

一名從業人士告訴數智前線,ChatGPT出現後,行業重新變得熱鬧而有活力,前幾年青黃不接、垂頭喪氣的局面一掃而空。

一、中美差距究竟有多大

在ChatGPT推出後,一位百度資深人士告訴數智前線,他“沒有興趣”談論ChatGPT,言語之間,五味雜陳。一位人工智慧企業創始人稱,面對ChatGPT的驚豔表現,心癢癢也迷茫,失眠了。他坦承,從模型的規模到效果,差距還比較遠。

有人用同樣的問題向國內某廠商的大模型和ChatGPT同時發問,ChatGPT從回答的邏輯性和完整度上都遠超國內大模型,國內大模型的答案帶有明顯的拼湊感,夾雜著不少主題之外的胡編內容。而且,在回覆速度上,ChatGPT也領先一截。

從事數字人研發的特看科技CEO樂乘認為,目前全球還沒有能跟ChatGPT抗衡的大模型,業界共識是差距在兩年以上。國內先不談彎道超車,趁早追趕反而是更重要的。

雖然一些人工智慧資深人士認為,在ChatGPT所涉及的技術上,中美是“平級”的,但華為諾亞方舟實驗室語音語義首席科學家劉群,在黃大年茶思屋的討論中坦承,中國在技術上仍是有差距的。其中一個是基礎模型本身的差距,雖然我們訓練了很多萬億模型或者是幾千億的模型,但訓練的充分程度,是遠遠不夠的。“我估計到現在為止,沒有哪個模型能吃GPT那麼多資料。”

清華大學計算機科學與技術系長聘副教授黃民烈提到,在GPT-3之後,OpenAI所有的模型都沒有開源,但它提供了API呼叫。在這個過程中,它幹了一件事,就是建立起了真實的使用者呼叫和模型迭代之間的飛輪,它非常重視真實世界資料的呼叫,以及這些資料對模型的迭代。當然,在此過程中,它也養活了美國一大幫創業公司,建立了一個生態。

“你看我們國內的大模型研究,是A公司訓練了一個,B公司也訓練了一個,打個廣告就完了,模型開源,你愛用不用。至少目前還沒看到一家比較好的公司,把資料和模型的飛輪完整轉起來。所以,我覺得這是我們趕超ChatGPT的難點。”一位業內人士坦言。

除此之外,業界人士都提到了算力問題。由於GPU晶片等問題,在一定程度上,國內算力已被洽談了。即使國內頭部公司,從算力上跟谷歌等相比,差距也是比較顯著的。

從資料質量來說,整個網際網路的中文資料質量,相比於英文仍是有明顯差距。“我們可能要想辦法,做中英文不同語言之間的資料互補。”有業內人士稱。

此外,幾乎所有受訪人士都提到了OpenAI這家人工智慧組織,所體現的純碎創新精神和長期主義。“其實從原理和方法看,他們所做的東西業界都是瞭解的,倒沒有說什麼是美國做得了、我們做不了的。”雲知聲董事長梁家恩對數智前線說,但像OpenAI和DeepMind,他們可能是業界唯二的兩家機構,無論在創新性、投入、決心,仍是在頂尖人才儲備上,都是一如既往堅持的。“我們看到的是成功,但裡面可能已經有很多失敗的嘗試。”

有資深AI從業者認為,在看不到前景和沒有顯著效果的階段,OpenAI非常堅定地做了投入,相反國內傾向於在技術出現突破後,快速追隨。“國內大家第一步想的是,我們現在怎麼用起來,但在不能用的時候,人家就在長期投入。”

“這件事實在是值得我們學習的,我們真的需要有足夠多的錢,有這麼一幫熱血的人才,能夠在一個方向上這樣持續積累發力,我覺得這是一個非常必要的條件。”黃民烈稱。

最近一段時間,業界也在討論中國企業能否超越。容聯雲AI研究院院長劉傑告訴數智前線,圍繞業務,尤其是國內的場景,是有超越機會的。在區域性應用中開始超越,這也是業界的共識。

二、對中國人工智慧界有何啟發

ChatGPT是一種大模型。在它推出之前,國內外實際上已有不少大模型。相比其他大模型,它有了業界意料之外的突破,也給國內業界帶來啟發。

第一,ChatGPT有一個非常強大的技術底座,也就是InstructGPT模型。但這個模型的論文剛發出來時,沒有引起特別大的反響,大家覺得也就是 OpenAI的一篇論文而已。

梁家恩也告訴數智前線,此前,GPT與BERT模型路線一直在競爭,2018年時BERT模型先贏了,但GPT模型路線一直沒放棄,模型引數和資料規模越做越大,最終結合人工反饋增強學習(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路線。因此,業內公司正在關注投入更大精力到GPT模型路線上,技術路線交替競爭,在業內是常態。

第二,ChatGPT引入了強化學習機制。容聯雲劉傑告訴數智前線,ChatGPT不僅僅像以前的大模型,利用了沒有人工標註的資料去學習,還在新版本上引入了人工標註的資料,透過人類的反饋,有針對性地進行最佳化。“這是ChatGPT一個重要的進展,給了我們很大的啟發。”

“這是它核心的一點。”華為終端雲服務搜尋與地圖BU總裁趙世奇稱,“今天,我們的模型越來越大,它就像一股洪荒之力,有人會害怕未來它會不會控制人類?但引入了這種強化學習機制後,就相當於給洪荒之力一個引導,讓大模型的產出朝著可控的方向走,生成符合預期的結果。”比如,你去問它一些倫理安全的敏感話題,它都能答得很好。

這裡的難度是建立怎樣的強化學習機制。此前,在下圍棋的AI中,強化學習是用勝負做反饋。但對於ChatGPT如此開放的系統,是沒有明確的反饋機制的。黃民烈稱,過去大家也嘗試了強化學習機制,但很多都不太成功。ChatGPT在這件事上取得了突破。

第三,它在資料質量和多樣性上非常講究。OpenAI僱傭了一個數十人的資料團隊,其實ChatGPT強化學習的資料量並不大,但對資料多樣性、標註體系都有精巧的設計,讓資料發揮出了強大的作用。業內認為,這確實是值得我們借鑑的地方。

當然,ChatGPT也有明顯的不足。大家公認的,是它善於一本正經地胡說八道。劉傑告訴數智前線,ChatGPT是一個黑盒計算,當下在內容的可信性和可控性上有一定侷限。“我們要給它足夠正確的知識,再引入知識圖譜這類知識管理和資訊注入技術,還要限定它的資料範圍和應用場景,使得它生成的內容更為可靠,這是我們在做的。”

ChatGPT在AI的技術路線和訓練方式上的變革,讓人關注它對產業帶來的改變。特看科技CEO樂乘預計,很多單點環節裡,用不用大模型會有天地之別。沒用大模型,只基於自己上一代小模型做產品的企業,跟應用了大模型且還做了業務垂直化的公司,將無法競爭。

多名創業者談及,這兩年創業市場垂頭喪氣,所有人都在探尋能夠大幅度提升生產力的技術是什麼。“ChatGPT其實提供了一種新的正規化。垂頭喪氣、青黃不接的狀態可能會成為過去。這個領域出幾家千億級別的公司是完全有可能的。”樂乘說。

三、中國企業的動作

ChatGPT推出後,很多人在講谷歌、百度的焦慮。但大多數中國業內人士認為,目前ChatGPT仍是一個對AI技術正規化的探索,它並不能代替搜尋。ChatGPT當下一個很大的弊端是無法實時獲取網際網路資訊。由於它只是一個端到端的生成模型,能夠自我構造虛假答案,這些都是它替代搜尋的障礙。而如果以目前每一條几美分的成本來看,它會讓商業搜尋引擎公司入不敷出。

它作為搜尋引擎的補充是有機會的,因為搜尋引擎也講求“所問即所答”,但這還有一個發展過程。

劉傑認為,ChatGPT主要的產業化路徑,目前可能性比較大的首先仍是在C端。由於ChatGPT展現出的大模型的創造性,以及對長篇上下文的理解能力,它可能會聚焦於一些開放性、創意性和通用性的任務上。

不外,中國企業在行業市場的探索已經開啟。比如,在智慧客服領域,雲蝠智慧CEO魏佳星告訴數智前線,上個月他們在一些場景嘗試引入ChatGPT來做外呼的Demo測試,呼叫ChatGPT來回復客戶的問題。

“在智慧客服領域應用這項技術,核心點在大模型的NLP(自然語言處理)能力和此前企業裡已有的NLP之間怎麼結合。”魏佳星說。例如幫助順豐去做回訪的快遞通知體系,是基於幾個標準動作而進行,在這個封閉條件下應該優先企業已有的技術,滿足客戶當下的核心需求。

在這個需求之外,此前智慧客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,語料資訊不充分時,AI沒辦法對問題做出反應,ChatGPT大模型能夠補全這方面的能力。魏佳星反饋,雲蝠智慧外呼的Demo測試效果較好。在其他行業裡這項技術可能仍處於娛樂狀態,但在智慧客服領域,ChatGPT已具備商用潛力。

從事通訊及數字化服務的上市企業容聯雲,從2021年圍繞著人機智慧對話,做核心技術和產品研發,比如智慧客服。目前,在研發與ChatGPT類似的人工智慧內容生成產品。

但就模型的規模,劉傑有不同的看法。“ChatGPT的優勢是它的大帶來的,但在應用落地上,由於它過大,也帶來了挑戰和侷限。”他告訴數智前線,“脫離場景去談大和小是沒有意義的。在特定應用場景、特定條件約束下、在特定的資料上,去訓練規模適宜的模型,是我們努力的目標。”

劉傑還稱,AI是一個鏈條比較長的產品技術,如果沒有建立一個好的反饋機制,在部署運營階段,從最前線發現的問題,就很難有效定位解決,所以要讓模型去持續成長和最佳化,“它不是靜態的,不是交付了就不再管它。”

雲知聲梁家恩告訴數智前線,他們一直緊密親密跟進業內最前沿的演算法,是最早把BERT和GPT2模型方法用到實際業務系統的團隊之一,“現在相當於是把基於BERT的技術框架做個升級,目前已納入雲知聲今年的技術升級目標規劃中。”梁家恩說,ChatGPT的優勢是意圖理解、上下文對話管理和高質量內容生成,技術升級後,預計會帶來顯著的體驗提升。

與其他企業一樣,雲知聲的目標是先走通,之後在既有的業務比如在IoT智慧語音互動對話,以及醫療行業應用中落地。梁家恩也提到了模型的規模問題,考慮商業化成本,實用模型的引數目最終可能要壓到10億量級。

商湯科技數字文娛事業部總經理欒青告訴數智前線,團隊更多是利用GPT等生成式內容進行短影片等創作,讓大家在創作的過程當中,把生產效率提升,“這是我們的核心點”。同時,商湯已訓練了超過300億量級超大基模型。

出門問問創始人李志飛則告訴數智前線,出門問問從2019年底開始做生成式應用,2020年GPT-3出來後一直在跟蹤大模型。目前發力的一個行業應用是寫文案。

某遊戲人工智慧的資深開發者告訴數智前線,這項技術在遊戲的使用者互動環節和製作環節能看到應用前景。比如使用者和NPC(一種角色)互動對話時呼叫,由於ChatGPT對自然語言的優秀理解能力,使用者和NPC互動的開放效能大幅提升。另外在製作環節裡,應用ChatGPT,可透過關鍵詞生成故事線,能給策劃在劇情走向設計時提供參考。

另外,在數字人領域,特看科技CEO樂乘告訴數智前線,大模型讓數字人的內容生產和互動方式發生了變化。

在沒有引入大模型之前,數字人說話和行動基本要靠真人行為去驅動。有了大模型之後,內容的輸出可以透過大模型來完成。以直播帶貨為例,數字人公司先給本地生活、知識付費和直播商家等建立一個數字人的虛擬主播形象,而後可以將大模型接入,讓大模型輔助撰寫數字人直播帶貨的話術和指令碼,“未來在我們關注的泛生活和電商賽道,可能有30%內容能夠透過大模型生成來完成。”樂乘說。

四、ChatGPT在行業落地難

不外,業界資深人士提出,當下ChatGPT在行業裡要真正落地還面臨困難。

“商業模型上跑不通。”魏佳星對數智前線說。ChatGPT目前呼叫一次的費用在幾美分,智慧客服一天的問答場景,通常可能要呼叫幾十萬次。“我們一通電話收費才1.2毛,利潤可能也就2分錢,現在的成本使得它根本跑不起來。“魏佳星認為,當這項產品的呼叫成本降到1分錢時,行業裡可能就會大範圍使用起來。

遊戲行業的開發者們也坦言,呼叫ChatGPT的成本和它當下所帶來的回報可能並不成正比。幾美分只是呼叫費用,還不算運營費用。“沒有一個老闆能接受,NPC回覆一句話要花掉幾毛錢,即使它說得再好。”而使用者的遊戲體驗是個系統工程,文字互動只是其中的一環。當下即使有廠商願意不顧高成本使用ChatGPT,最終的使用者體驗也依然可能無法有質的飛躍。

在遊戲製作環節,ChatGPT可能也只能作為策劃和遊戲設計環節的參考,“乍看中規中矩要素齊全,但細品會發現缺少靈魂,在觀念性的創造上仍有待提升”。

不外,樂乘對ChatGPT的成本問題相對樂觀。OpenAI公司自己也是初創團隊,沒有那麼有錢。隨著競爭加劇,大模型會像水電煤一樣,是大家都用得起的狀態。

刨除成本考量,在對企業的落地中,ChatGPT這類大模型,也有典型的問題。

容聯雲劉傑舉例,首先,很多客戶有私有化部署要求,但這些模型非常大,對資源要求高,當前不太可能實現私有化部署。其次,這些大模型在一些特定行業或特定任務上,專業性是欠缺的,需要去適配。

而對於ChatGPT這類非開源的大模型應用來說,對它在下游任務上的微調,如何兼顧成本、靈活性和資料隱私則是一個關鍵問題。這些問題也造成,這種模型還沒有走到服務企業級客戶,尤其是大型企業客戶那一步。

除此之外,現在人工智慧技術都在與企業的核心業務流程做深度融合,而像ChatGPT這個基於大模型的應用服務,更像一個獨立的外掛,如何深度繫結,這也成為企業使用它的一個待解決問題。

業界人士期望ChatGPT未來在商業模式上有更好的呈現方式。目前ChatGPT對外提供的API還非常單一,影響了應用。

五、創業公司會被ChatGPT吞噬嗎

大家在期待OpenAI的下一個版本。GPT-3大模型釋出於2020年, ChatGPT則基於它的改進版本建立。此前盛傳,GPT-4將於今年一季度或下半年推出,不過OpenAI的執行長 Sam Altman在1月份回應,沒有具體的時間表。

一些創業者已經開始關注到,隨著大模型被越來越多地應用,細分賽道的創業公司在大模型的強大推力加持下,如何尋找自己的生存空間。

它涉及到兩點,首先是如何深化對垂直行業的認知,真正把大模型融入到企業的創新業務流中。特看科技樂乘認為,垂直行業的小模型,考驗的是創業公司對垂直行業的know-how。創業公司需要基於對行業的認知深度,採集足夠多的場景資料,並基於這些細分資料更好服務使用者。使用者越多,反饋越多,最終形成資料反饋的閉環。

創業公司在小模型的競爭終局比拼的是,誰家的小模型跟業務結合得緊,且能解決好跟大模型結合的問題。

另一點是,大模型被充分使用、喂得很肥後,是否會成為最強大的AI,最終吞噬細分賽道上小創業公司的發展空間。

海外初創公司Jasper的命運頗能反映這種境況。Jasper是一家基於GPT-3大模型來生成營銷文案的AI服務商,去年10月它宣佈以15億美元的估值獲得1.25億美元A輪融資。一個月後,基於GPT-3改進版本搭建的ChatGPT大火,智慧程度更泛化的ChatGPT徹底蓋過了Jasper的風頭。

“對創業者而言,在充分利用已有大模型的情況下,也要儘可能要把小模型的閉環資料保護好。”特看科技樂乘說,這也是他們公司未來會重點攻克的方向。

不外,當下底層大模型還在高速迭代階段,行業內都在等 GPT-4 出來。樂乘認為,從GPT-3到GPT-4的變遷,很像移動網際網路早期 iPhone 1和 iPhone4 階段iOS的升級速度,它的發展速度也許會超出大家的認知。

一些人士猜測, GPT-4將在多模態上有進展,也就是會引入影片、音訊等。國內某遊戲人工智慧的資深開發則告訴數智前線,他們關注的是下一代的大模型能不能在理解上下文上有突破。“如果大模型能讓人工智慧打贏辯論賽,那麼它的能力就算是有質的突破了。”

“短期內可能大家會高估這個東西,但長期可能有很多人會低估這個東西。”這名遊戲AI資深開發評價。

本文來自微信公眾號:數智前線(ID:szqx1991),作者:趙豔秋 徐鑫,編輯:周路平

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯絡hezuo@huxiu.com

如對本稿件有異議或投訴,請聯絡tougao@huxiu.com

End

想漲知識 關注虎嗅影片號!

本文來自微信公眾號:數智前線(ID:szqx1991),作者:趙豔秋 徐鑫,編輯:周路平,題圖來自:視覺中國

春節前,人工智慧組織OpenAI推出的大模型ChatGPT,在國內業界引起了不小的轟動。

一名AI從業者告訴數智前線,人工智慧每五六年都有一波浪潮,上一波AlphaGO讓大家震撼,這一波就是ChatGPT。但這兩次大家的心態迥然不同,當谷歌的AI下棋戰勝圍棋世界冠軍時,大家當新聞看,但這一次許多人是從消費者的角度來體驗它。一個月裡,全世界100萬用戶在使用和體驗它,這是非常顛覆性的體驗。這也是AI第一次大規模的自傳播。

數智前線獲悉,除了感嘆於ChatGPT的驚豔體驗外,國內業界也在迅速反思和行動:我們的差距在哪裡?我們將如何正視和改進不足?哪些是中國從業者的機會?

一名從業人士告訴數智前線,ChatGPT出現後,行業重新變得熱鬧而有活力,前幾年青黃不接、垂頭喪氣的局面一掃而空。

一、中美差距究竟有多大

在ChatGPT推出後,一位百度資深人士告訴數智前線,他“沒有興趣”談論ChatGPT,言語之間,五味雜陳。一位人工智慧企業創始人稱,面對ChatGPT的驚豔表現,心癢癢也迷茫,失眠了。他坦承,從模型的規模到效果,差距還比較遠。

有人用同樣的問題向國內某廠商的大模型和ChatGPT同時發問,ChatGPT從回答的邏輯性和完整度上都遠超國內大模型,國內大模型的答案帶有明顯的拼湊感,夾雜著不少主題之外的胡編內容。而且,在回覆速度上,ChatGPT也領先一截。

從事數字人研發的特看科技CEO樂乘認為,目前全球還沒有能跟ChatGPT抗衡的大模型,業界共識是差距在兩年以上。國內先不談彎道超車,趁早追趕反而是更重要的。

雖然一些人工智慧資深人士認為,在ChatGPT所涉及的技術上,中美是“平級”的,但華為諾亞方舟實驗室語音語義首席科學家劉群,在黃大年茶思屋的討論中坦承,中國在技術上仍是有差距的。其中一個是基礎模型本身的差距,雖然我們訓練了很多萬億模型或者是幾千億的模型,但訓練的充分程度,是遠遠不夠的。“我估計到現在為止,沒有哪個模型能吃GPT那麼多資料。”

清華大學計算機科學與技術系長聘副教授黃民烈提到,在GPT-3之後,OpenAI所有的模型都沒有開源,但它提供了API呼叫。在這個過程中,它幹了一件事,就是建立起了真實的使用者呼叫和模型迭代之間的飛輪,它非常重視真實世界資料的呼叫,以及這些資料對模型的迭代。當然,在此過程中,它也養活了美國一大幫創業公司,建立了一個生態。

“你看我們國內的大模型研究,是A公司訓練了一個,B公司也訓練了一個,打個廣告就完了,模型開源,你愛用不用。至少目前還沒看到一家比較好的公司,把資料和模型的飛輪完整轉起來。所以,我覺得這是我們趕超ChatGPT的難點。”一位業內人士坦言。

除此之外,業界人士都提到了算力問題。由於GPU晶片等問題,在一定程度上,國內算力已被洽談了。即使國內頭部公司,從算力上跟谷歌等相比,差距也是比較顯著的。

從資料質量來說,整個網際網路的中文資料質量,相比於英文仍是有明顯差距。“我們可能要想辦法,做中英文不同語言之間的資料互補。”有業內人士稱。

此外,幾乎所有受訪人士都提到了OpenAI這家人工智慧組織,所體現的純碎創新精神和長期主義。“其實從原理和方法看,他們所做的東西業界都是瞭解的,倒沒有說什麼是美國做得了、我們做不了的。”雲知聲董事長梁家恩對數智前線說,但像OpenAI和DeepMind,他們可能是業界唯二的兩家機構,無論在創新性、投入、決心,仍是在頂尖人才儲備上,都是一如既往堅持的。“我們看到的是成功,但裡面可能已經有很多失敗的嘗試。”

有資深AI從業者認為,在看不到前景和沒有顯著效果的階段,OpenAI非常堅定地做了投入,相反國內傾向於在技術出現突破後,快速追隨。“國內大家第一步想的是,我們現在怎麼用起來,但在不能用的時候,人家就在長期投入。”

“這件事實在是值得我們學習的,我們真的需要有足夠多的錢,有這麼一幫熱血的人才,能夠在一個方向上這樣持續積累發力,我覺得這是一個非常必要的條件。”黃民烈稱。

最近一段時間,業界也在討論中國企業能否超越。容聯雲AI研究院院長劉傑告訴數智前線,圍繞業務,尤其是國內的場景,是有超越機會的。在區域性應用中開始超越,這也是業界的共識。

二、對中國人工智慧界有何啟發

ChatGPT是一種大模型。在它推出之前,國內外實際上已有不少大模型。相比其他大模型,它有了業界意料之外的突破,也給國內業界帶來啟發。

第一,ChatGPT有一個非常強大的技術底座,也就是InstructGPT模型。但這個模型的論文剛發出來時,沒有引起特別大的反響,大家覺得也就是 OpenAI的一篇論文而已。

梁家恩也告訴數智前線,此前,GPT與BERT模型路線一直在競爭,2018年時BERT模型先贏了,但GPT模型路線一直沒放棄,模型引數和資料規模越做越大,最終結合人工反饋增強學習(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路線。因此,業內公司正在關注投入更大精力到GPT模型路線上,技術路線交替競爭,在業內是常態。

第二,ChatGPT引入了強化學習機制。容聯雲劉傑告訴數智前線,ChatGPT不僅僅像以前的大模型,利用了沒有人工標註的資料去學習,還在新版本上引入了人工標註的資料,透過人類的反饋,有針對性地進行最佳化。“這是ChatGPT一個重要的進展,給了我們很大的啟發。”

“這是它核心的一點。”華為終端雲服務搜尋與地圖BU總裁趙世奇稱,“今天,我們的模型越來越大,它就像一股洪荒之力,有人會害怕未來它會不會控制人類?但引入了這種強化學習機制後,就相當於給洪荒之力一個引導,讓大模型的產出朝著可控的方向走,生成符合預期的結果。”比如,你去問它一些倫理安全的敏感話題,它都能答得很好。

這裡的難度是建立怎樣的強化學習機制。此前,在下圍棋的AI中,強化學習是用勝負做反饋。但對於ChatGPT如此開放的系統,是沒有明確的反饋機制的。黃民烈稱,過去大家也嘗試了強化學習機制,但很多都不太成功。ChatGPT在這件事上取得了突破。

第三,它在資料質量和多樣性上非常講究。OpenAI僱傭了一個數十人的資料團隊,其實ChatGPT強化學習的資料量並不大,但對資料多樣性、標註體系都有精巧的設計,讓資料發揮出了強大的作用。業內認為,這確實是值得我們借鑑的地方。

當然,ChatGPT也有明顯的不足。大家公認的,是它善於一本正經地胡說八道。劉傑告訴數智前線,ChatGPT是一個黑盒計算,當下在內容的可信性和可控性上有一定侷限。“我們要給它足夠正確的知識,再引入知識圖譜這類知識管理和資訊注入技術,還要限定它的資料範圍和應用場景,使得它生成的內容更為可靠,這是我們在做的。”

ChatGPT在AI的技術路線和訓練方式上的變革,讓人關注它對產業帶來的改變。特看科技CEO樂乘預計,很多單點環節裡,用不用大模型會有天地之別。沒用大模型,只基於自己上一代小模型做產品的企業,跟應用了大模型且還做了業務垂直化的公司,將無法競爭。

多名創業者談及,這兩年創業市場垂頭喪氣,所有人都在探尋能夠大幅度提升生產力的技術是什麼。“ChatGPT其實提供了一種新的正規化。垂頭喪氣、青黃不接的狀態可能會成為過去。這個領域出幾家千億級別的公司是完全有可能的。”樂乘說。

三、中國企業的動作

ChatGPT推出後,很多人在講谷歌、百度的焦慮。但大多數中國業內人士認為,目前ChatGPT仍是一個對AI技術正規化的探索,它並不能代替搜尋。ChatGPT當下一個很大的弊端是無法實時獲取網際網路資訊。由於它只是一個端到端的生成模型,能夠自我構造虛假答案,這些都是它替代搜尋的障礙。而如果以目前每一條几美分的成本來看,它會讓商業搜尋引擎公司入不敷出。

它作為搜尋引擎的補充是有機會的,因為搜尋引擎也講求“所問即所答”,但這還有一個發展過程。

劉傑認為,ChatGPT主要的產業化路徑,目前可能性比較大的首先仍是在C端。由於ChatGPT展現出的大模型的創造性,以及對長篇上下文的理解能力,它可能會聚焦於一些開放性、創意性和通用性的任務上。

不外,中國企業在行業市場的探索已經開啟。比如,在智慧客服領域,雲蝠智慧CEO魏佳星告訴數智前線,上個月他們在一些場景嘗試引入ChatGPT來做外呼的Demo測試,呼叫ChatGPT來回復客戶的問題。

“在智慧客服領域應用這項技術,核心點在大模型的NLP(自然語言處理)能力和此前企業裡已有的NLP之間怎麼結合。”魏佳星說。例如幫助順豐去做回訪的快遞通知體系,是基於幾個標準動作而進行,在這個封閉條件下應該優先企業已有的技術,滿足客戶當下的核心需求。

在這個需求之外,此前智慧客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,語料資訊不充分時,AI沒辦法對問題做出反應,ChatGPT大模型能夠補全這方面的能力。魏佳星反饋,雲蝠智慧外呼的Demo測試效果較好。在其他行業裡這項技術可能仍處於娛樂狀態,但在智慧客服領域,ChatGPT已具備商用潛力。

從事通訊及數字化服務的上市企業容聯雲,從2021年圍繞著人機智慧對話,做核心技術和產品研發,比如智慧客服。目前,在研發與ChatGPT類似的人工智慧內容生成產品。

但就模型的規模,劉傑有不同的看法。“ChatGPT的優勢是它的大帶來的,但在應用落地上,由於它過大,也帶來了挑戰和侷限。”他告訴數智前線,“脫離場景去談大和小是沒有意義的。在特定應用場景、特定條件約束下、在特定的資料上,去訓練規模適宜的模型,是我們努力的目標。”

劉傑還稱,AI是一個鏈條比較長的產品技術,如果沒有建立一個好的反饋機制,在部署運營階段,從最前線發現的問題,就很難有效定位解決,所以要讓模型去持續成長和最佳化,“它不是靜態的,不是交付了就不再管它。”

雲知聲梁家恩告訴數智前線,他們一直緊密親密跟進業內最前沿的演算法,是最早把BERT和GPT2模型方法用到實際業務系統的團隊之一,“現在相當於是把基於BERT的技術框架做個升級,目前已納入雲知聲今年的技術升級目標規劃中。”梁家恩說,ChatGPT的優勢是意圖理解、上下文對話管理和高質量內容生成,技術升級後,預計會帶來顯著的體驗提升。

與其他企業一樣,雲知聲的目標是先走通,之後在既有的業務比如在IoT智慧語音互動對話,以及醫療行業應用中落地。梁家恩也提到了模型的規模問題,考慮商業化成本,實用模型的引數目最終可能要壓到10億量級。

商湯科技數字文娛事業部總經理欒青告訴數智前線,團隊更多是利用GPT等生成式內容進行短影片等創作,讓大家在創作的過程當中,把生產效率提升,“這是我們的核心點”。同時,商湯已訓練了超過300億量級超大基模型。

出門問問創始人李志飛則告訴數智前線,出門問問從2019年底開始做生成式應用,2020年GPT-3出來後一直在跟蹤大模型。目前發力的一個行業應用是寫文案。

某遊戲人工智慧的資深開發者告訴數智前線,這項技術在遊戲的使用者互動環節和製作環節能看到應用前景。比如使用者和NPC(一種角色)互動對話時呼叫,由於ChatGPT對自然語言的優秀理解能力,使用者和NPC互動的開放效能大幅提升。另外在製作環節裡,應用ChatGPT,可透過關鍵詞生成故事線,能給策劃在劇情走向設計時提供參考。

另外,在數字人領域,特看科技CEO樂乘告訴數智前線,大模型讓數字人的內容生產和互動方式發生了變化。

在沒有引入大模型之前,數字人說話和行動基本要靠真人行為去驅動。有了大模型之後,內容的輸出可以透過大模型來完成。以直播帶貨為例,數字人公司先給本地生活、知識付費和直播商家等建立一個數字人的虛擬主播形象,而後可以將大模型接入,讓大模型輔助撰寫數字人直播帶貨的話術和指令碼,“未來在我們關注的泛生活和電商賽道,可能有30%內容能夠透過大模型生成來完成。”樂乘說。

四、ChatGPT在行業落地難

不外,業界資深人士提出,當下ChatGPT在行業裡要真正落地還面臨困難。

“商業模型上跑不通。”魏佳星對數智前線說。ChatGPT目前呼叫一次的費用在幾美分,智慧客服一天的問答場景,通常可能要呼叫幾十萬次。“我們一通電話收費才1.2毛,利潤可能也就2分錢,現在的成本使得它根本跑不起來。“魏佳星認為,當這項產品的呼叫成本降到1分錢時,行業裡可能就會大範圍使用起來。

遊戲行業的開發者們也坦言,呼叫ChatGPT的成本和它當下所帶來的回報可能並不成正比。幾美分只是呼叫費用,還不算運營費用。“沒有一個老闆能接受,NPC回覆一句話要花掉幾毛錢,即使它說得再好。”而使用者的遊戲體驗是個系統工程,文字互動只是其中的一環。當下即使有廠商願意不顧高成本使用ChatGPT,最終的使用者體驗也依然可能無法有質的飛躍。

在遊戲製作環節,ChatGPT可能也只能作為策劃和遊戲設計環節的參考,“乍看中規中矩要素齊全,但細品會發現缺少靈魂,在觀念性的創造上仍有待提升”。

不外,樂乘對ChatGPT的成本問題相對樂觀。OpenAI公司自己也是初創團隊,沒有那麼有錢。隨著競爭加劇,大模型會像水電煤一樣,是大家都用得起的狀態。

刨除成本考量,在對企業的落地中,ChatGPT這類大模型,也有典型的問題。

容聯雲劉傑舉例,首先,很多客戶有私有化部署要求,但這些模型非常大,對資源要求高,當前不太可能實現私有化部署。其次,這些大模型在一些特定行業或特定任務上,專業性是欠缺的,需要去適配。

而對於ChatGPT這類非開源的大模型應用來說,對它在下游任務上的微調,如何兼顧成本、靈活性和資料隱私則是一個關鍵問題。這些問題也造成,這種模型還沒有走到服務企業級客戶,尤其是大型企業客戶那一步。

除此之外,現在人工智慧技術都在與企業的核心業務流程做深度融合,而像ChatGPT這個基於大模型的應用服務,更像一個獨立的外掛,如何深度繫結,這也成為企業使用它的一個待解決問題。

業界人士期望ChatGPT未來在商業模式上有更好的呈現方式。目前ChatGPT對外提供的API還非常單一,影響了應用。

五、創業公司會被ChatGPT吞噬嗎

大家在期待OpenAI的下一個版本。GPT-3大模型釋出於2020年, ChatGPT則基於它的改進版本建立。此前盛傳,GPT-4將於今年一季度或下半年推出,不過OpenAI的執行長 Sam Altman在1月份回應,沒有具體的時間表。

一些創業者已經開始關注到,隨著大模型被越來越多地應用,細分賽道的創業公司在大模型的強大推力加持下,如何尋找自己的生存空間。

它涉及到兩點,首先是如何深化對垂直行業的認知,真正把大模型融入到企業的創新業務流中。特看科技樂乘認為,垂直行業的小模型,考驗的是創業公司對垂直行業的know-how。創業公司需要基於對行業的認知深度,採集足夠多的場景資料,並基於這些細分資料更好服務使用者。使用者越多,反饋越多,最終形成資料反饋的閉環。

創業公司在小模型的競爭終局比拼的是,誰家的小模型跟業務結合得緊,且能解決好跟大模型結合的問題。

另一點是,大模型被充分使用、喂得很肥後,是否會成為最強大的AI,最終吞噬細分賽道上小創業公司的發展空間。

海外初創公司Jasper的命運頗能反映這種境況。Jasper是一家基於GPT-3大模型來生成營銷文案的AI服務商,去年10月它宣佈以15億美元的估值獲得1.25億美元A輪融資。一個月後,基於GPT-3改進版本搭建的ChatGPT大火,智慧程度更泛化的ChatGPT徹底蓋過了Jasper的風頭。

“對創業者而言,在充分利用已有大模型的情況下,也要儘可能要把小模型的閉環資料保護好。”特看科技樂乘說,這也是他們公司未來會重點攻克的方向。

不外,當下底層大模型還在高速迭代階段,行業內都在等 GPT-4 出來。樂乘認為,從GPT-3到GPT-4的變遷,很像移動網際網路早期 iPhone 1和 iPhone4 階段iOS的升級速度,它的發展速度也許會超出大家的認知。

一些人士猜測, GPT-4將在多模態上有進展,也就是會引入影片、音訊等。國內某遊戲人工智慧的資深開發則告訴數智前線,他們關注的是下一代的大模型能不能在理解上下文上有突破。“如果大模型能讓人工智慧打贏辯論賽,那麼它的能力就算是有質的突破了。”

“短期內可能大家會高估這個東西,但長期可能有很多人會低估這個東西。”這名遊戲AI資深開發評價。

本文來自微信公眾號:數智前線(ID:szqx1991),作者:趙豔秋 徐鑫,編輯:周路平

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯絡hezuo@huxiu.com

如對本稿件有異議或投訴,請聯絡tougao@huxiu.com

End

想漲知識 關注虎嗅影片號!

本文來自微信公眾號:數智前線(ID:szqx1991),作者:趙豔秋 徐鑫,編輯:周路平,題圖來自:視覺中國

春節前,人工智慧組織OpenAI推出的大模型ChatGPT,在國內業界引起了不小的轟動。

一名AI從業者告訴數智前線,人工智慧每五六年都有一波浪潮,上一波AlphaGO讓大家震撼,這一波就是ChatGPT。但這兩次大家的心態迥然不同,當谷歌的AI下棋戰勝圍棋世界冠軍時,大家當新聞看,但這一次許多人是從消費者的角度來體驗它。一個月裡,全世界100萬用戶在使用和體驗它,這是非常顛覆性的體驗。這也是AI第一次大規模的自傳播。

數智前線獲悉,除了感嘆於ChatGPT的驚豔體驗外,國內業界也在迅速反思和行動:我們的差距在哪裡?我們將如何正視和改進不足?哪些是中國從業者的機會?

一名從業人士告訴數智前線,ChatGPT出現後,行業重新變得熱鬧而有活力,前幾年青黃不接、垂頭喪氣的局面一掃而空。

一、中美差距究竟有多大

在ChatGPT推出後,一位百度資深人士告訴數智前線,他“沒有興趣”談論ChatGPT,言語之間,五味雜陳。一位人工智慧企業創始人稱,面對ChatGPT的驚豔表現,心癢癢也迷茫,失眠了。他坦承,從模型的規模到效果,差距還比較遠。

有人用同樣的問題向國內某廠商的大模型和ChatGPT同時發問,ChatGPT從回答的邏輯性和完整度上都遠超國內大模型,國內大模型的答案帶有明顯的拼湊感,夾雜著不少主題之外的胡編內容。而且,在回覆速度上,ChatGPT也領先一截。

從事數字人研發的特看科技CEO樂乘認為,目前全球還沒有能跟ChatGPT抗衡的大模型,業界共識是差距在兩年以上。國內先不談彎道超車,趁早追趕反而是更重要的。

雖然一些人工智慧資深人士認為,在ChatGPT所涉及的技術上,中美是“平級”的,但華為諾亞方舟實驗室語音語義首席科學家劉群,在黃大年茶思屋的討論中坦承,中國在技術上仍是有差距的。其中一個是基礎模型本身的差距,雖然我們訓練了很多萬億模型或者是幾千億的模型,但訓練的充分程度,是遠遠不夠的。“我估計到現在為止,沒有哪個模型能吃GPT那麼多資料。”

清華大學計算機科學與技術系長聘副教授黃民烈提到,在GPT-3之後,OpenAI所有的模型都沒有開源,但它提供了API呼叫。在這個過程中,它幹了一件事,就是建立起了真實的使用者呼叫和模型迭代之間的飛輪,它非常重視真實世界資料的呼叫,以及這些資料對模型的迭代。當然,在此過程中,它也養活了美國一大幫創業公司,建立了一個生態。

“你看我們國內的大模型研究,是A公司訓練了一個,B公司也訓練了一個,打個廣告就完了,模型開源,你愛用不用。至少目前還沒看到一家比較好的公司,把資料和模型的飛輪完整轉起來。所以,我覺得這是我們趕超ChatGPT的難點。”一位業內人士坦言。

除此之外,業界人士都提到了算力問題。由於GPU晶片等問題,在一定程度上,國內算力已被洽談了。即使國內頭部公司,從算力上跟谷歌等相比,差距也是比較顯著的。

從資料質量來說,整個網際網路的中文資料質量,相比於英文仍是有明顯差距。“我們可能要想辦法,做中英文不同語言之間的資料互補。”有業內人士稱。

此外,幾乎所有受訪人士都提到了OpenAI這家人工智慧組織,所體現的純碎創新精神和長期主義。“其實從原理和方法看,他們所做的東西業界都是瞭解的,倒沒有說什麼是美國做得了、我們做不了的。”雲知聲董事長梁家恩對數智前線說,但像OpenAI和DeepMind,他們可能是業界唯二的兩家機構,無論在創新性、投入、決心,仍是在頂尖人才儲備上,都是一如既往堅持的。“我們看到的是成功,但裡面可能已經有很多失敗的嘗試。”

有資深AI從業者認為,在看不到前景和沒有顯著效果的階段,OpenAI非常堅定地做了投入,相反國內傾向於在技術出現突破後,快速追隨。“國內大家第一步想的是,我們現在怎麼用起來,但在不能用的時候,人家就在長期投入。”

“這件事實在是值得我們學習的,我們真的需要有足夠多的錢,有這麼一幫熱血的人才,能夠在一個方向上這樣持續積累發力,我覺得這是一個非常必要的條件。”黃民烈稱。

最近一段時間,業界也在討論中國企業能否超越。容聯雲AI研究院院長劉傑告訴數智前線,圍繞業務,尤其是國內的場景,是有超越機會的。在區域性應用中開始超越,這也是業界的共識。

二、對中國人工智慧界有何啟發

ChatGPT是一種大模型。在它推出之前,國內外實際上已有不少大模型。相比其他大模型,它有了業界意料之外的突破,也給國內業界帶來啟發。

第一,ChatGPT有一個非常強大的技術底座,也就是InstructGPT模型。但這個模型的論文剛發出來時,沒有引起特別大的反響,大家覺得也就是 OpenAI的一篇論文而已。

梁家恩也告訴數智前線,此前,GPT與BERT模型路線一直在競爭,2018年時BERT模型先贏了,但GPT模型路線一直沒放棄,模型引數和資料規模越做越大,最終結合人工反饋增強學習(RLHF),在ChatGPT上取得了重大突破,效果上反超了BERT模型路線。因此,業內公司正在關注投入更大精力到GPT模型路線上,技術路線交替競爭,在業內是常態。

第二,ChatGPT引入了強化學習機制。容聯雲劉傑告訴數智前線,ChatGPT不僅僅像以前的大模型,利用了沒有人工標註的資料去學習,還在新版本上引入了人工標註的資料,透過人類的反饋,有針對性地進行最佳化。“這是ChatGPT一個重要的進展,給了我們很大的啟發。”

“這是它核心的一點。”華為終端雲服務搜尋與地圖BU總裁趙世奇稱,“今天,我們的模型越來越大,它就像一股洪荒之力,有人會害怕未來它會不會控制人類?但引入了這種強化學習機制後,就相當於給洪荒之力一個引導,讓大模型的產出朝著可控的方向走,生成符合預期的結果。”比如,你去問它一些倫理安全的敏感話題,它都能答得很好。

這裡的難度是建立怎樣的強化學習機制。此前,在下圍棋的AI中,強化學習是用勝負做反饋。但對於ChatGPT如此開放的系統,是沒有明確的反饋機制的。黃民烈稱,過去大家也嘗試了強化學習機制,但很多都不太成功。ChatGPT在這件事上取得了突破。

第三,它在資料質量和多樣性上非常講究。OpenAI僱傭了一個數十人的資料團隊,其實ChatGPT強化學習的資料量並不大,但對資料多樣性、標註體系都有精巧的設計,讓資料發揮出了強大的作用。業內認為,這確實是值得我們借鑑的地方。

當然,ChatGPT也有明顯的不足。大家公認的,是它善於一本正經地胡說八道。劉傑告訴數智前線,ChatGPT是一個黑盒計算,當下在內容的可信性和可控性上有一定侷限。“我們要給它足夠正確的知識,再引入知識圖譜這類知識管理和資訊注入技術,還要限定它的資料範圍和應用場景,使得它生成的內容更為可靠,這是我們在做的。”

ChatGPT在AI的技術路線和訓練方式上的變革,讓人關注它對產業帶來的改變。特看科技CEO樂乘預計,很多單點環節裡,用不用大模型會有天地之別。沒用大模型,只基於自己上一代小模型做產品的企業,跟應用了大模型且還做了業務垂直化的公司,將無法競爭。

多名創業者談及,這兩年創業市場垂頭喪氣,所有人都在探尋能夠大幅度提升生產力的技術是什麼。“ChatGPT其實提供了一種新的正規化。垂頭喪氣、青黃不接的狀態可能會成為過去。這個領域出幾家千億級別的公司是完全有可能的。”樂乘說。

三、中國企業的動作

ChatGPT推出後,很多人在講谷歌、百度的焦慮。但大多數中國業內人士認為,目前ChatGPT仍是一個對AI技術正規化的探索,它並不能代替搜尋。ChatGPT當下一個很大的弊端是無法實時獲取網際網路資訊。由於它只是一個端到端的生成模型,能夠自我構造虛假答案,這些都是它替代搜尋的障礙。而如果以目前每一條几美分的成本來看,它會讓商業搜尋引擎公司入不敷出。

它作為搜尋引擎的補充是有機會的,因為搜尋引擎也講求“所問即所答”,但這還有一個發展過程。

劉傑認為,ChatGPT主要的產業化路徑,目前可能性比較大的首先仍是在C端。由於ChatGPT展現出的大模型的創造性,以及對長篇上下文的理解能力,它可能會聚焦於一些開放性、創意性和通用性的任務上。

不外,中國企業在行業市場的探索已經開啟。比如,在智慧客服領域,雲蝠智慧CEO魏佳星告訴數智前線,上個月他們在一些場景嘗試引入ChatGPT來做外呼的Demo測試,呼叫ChatGPT來回復客戶的問題。

“在智慧客服領域應用這項技術,核心點在大模型的NLP(自然語言處理)能力和此前企業裡已有的NLP之間怎麼結合。”魏佳星說。例如幫助順豐去做回訪的快遞通知體系,是基於幾個標準動作而進行,在這個封閉條件下應該優先企業已有的技術,滿足客戶當下的核心需求。

在這個需求之外,此前智慧客服中的AI工具,在泛化能力和通用性方面存在一定的缺陷,語料資訊不充分時,AI沒辦法對問題做出反應,ChatGPT大模型能夠補全這方面的能力。魏佳星反饋,雲蝠智慧外呼的Demo測試效果較好。在其他行業裡這項技術可能仍處於娛樂狀態,但在智慧客服領域,ChatGPT已具備商用潛力。

從事通訊及數字化服務的上市企業容聯雲,從2021年圍繞著人機智慧對話,做核心技術和產品研發,比如智慧客服。目前,在研發與ChatGPT類似的人工智慧內容生成產品。

但就模型的規模,劉傑有不同的看法。“ChatGPT的優勢是它的大帶來的,但在應用落地上,由於它過大,也帶來了挑戰和侷限。”他告訴數智前線,“脫離場景去談大和小是沒有意義的。在特定應用場景、特定條件約束下、在特定的資料上,去訓練規模適宜的模型,是我們努力的目標。”

劉傑還稱,AI是一個鏈條比較長的產品技術,如果沒有建立一個好的反饋機制,在部署運營階段,從最前線發現的問題,就很難有效定位解決,所以要讓模型去持續成長和最佳化,“它不是靜態的,不是交付了就不再管它。”

雲知聲梁家恩告訴數智前線,他們一直緊密親密跟進業內最前沿的演算法,是最早把BERT和GPT2模型方法用到實際業務系統的團隊之一,“現在相當於是把基於BERT的技術框架做個升級,目前已納入雲知聲今年的技術升級目標規劃中。”梁家恩說,ChatGPT的優勢是意圖理解、上下文對話管理和高質量內容生成,技術升級後,預計會帶來顯著的體驗提升。

與其他企業一樣,雲知聲的目標是先走通,之後在既有的業務比如在IoT智慧語音互動對話,以及醫療行業應用中落地。梁家恩也提到了模型的規模問題,考慮商業化成本,實用模型的引數目最終可能要壓到10億量級。

商湯科技數字文娛事業部總經理欒青告訴數智前線,團隊更多是利用GPT等生成式內容進行短影片等創作,讓大家在創作的過程當中,把生產效率提升,“這是我們的核心點”。同時,商湯已訓練了超過300億量級超大基模型。

出門問問創始人李志飛則告訴數智前線,出門問問從2019年底開始做生成式應用,2020年GPT-3出來後一直在跟蹤大模型。目前發力的一個行業應用是寫文案。

某遊戲人工智慧的資深開發者告訴數智前線,這項技術在遊戲的使用者互動環節和製作環節能看到應用前景。比如使用者和NPC(一種角色)互動對話時呼叫,由於ChatGPT對自然語言的優秀理解能力,使用者和NPC互動的開放效能大幅提升。另外在製作環節裡,應用ChatGPT,可透過關鍵詞生成故事線,能給策劃在劇情走向設計時提供參考。

另外,在數字人領域,特看科技CEO樂乘告訴數智前線,大模型讓數字人的內容生產和互動方式發生了變化。

在沒有引入大模型之前,數字人說話和行動基本要靠真人行為去驅動。有了大模型之後,內容的輸出可以透過大模型來完成。以直播帶貨為例,數字人公司先給本地生活、知識付費和直播商家等建立一個數字人的虛擬主播形象,而後可以將大模型接入,讓大模型輔助撰寫數字人直播帶貨的話術和指令碼,“未來在我們關注的泛生活和電商賽道,可能有30%內容能夠透過大模型生成來完成。”樂乘說。

四、ChatGPT在行業落地難

不外,業界資深人士提出,當下ChatGPT在行業裡要真正落地還面臨困難。

“商業模型上跑不通。”魏佳星對數智前線說。ChatGPT目前呼叫一次的費用在幾美分,智慧客服一天的問答場景,通常可能要呼叫幾十萬次。“我們一通電話收費才1.2毛,利潤可能也就2分錢,現在的成本使得它根本跑不起來。“魏佳星認為,當這項產品的呼叫成本降到1分錢時,行業裡可能就會大範圍使用起來。

遊戲行業的開發者們也坦言,呼叫ChatGPT的成本和它當下所帶來的回報可能並不成正比。幾美分只是呼叫費用,還不算運營費用。“沒有一個老闆能接受,NPC回覆一句話要花掉幾毛錢,即使它說得再好。”而使用者的遊戲體驗是個系統工程,文字互動只是其中的一環。當下即使有廠商願意不顧高成本使用ChatGPT,最終的使用者體驗也依然可能無法有質的飛躍。

在遊戲製作環節,ChatGPT可能也只能作為策劃和遊戲設計環節的參考,“乍看中規中矩要素齊全,但細品會發現缺少靈魂,在觀念性的創造上仍有待提升”。

不外,樂乘對ChatGPT的成本問題相對樂觀。OpenAI公司自己也是初創團隊,沒有那麼有錢。隨著競爭加劇,大模型會像水電煤一樣,是大家都用得起的狀態。

刨除成本考量,在對企業的落地中,ChatGPT這類大模型,也有典型的問題。

容聯雲劉傑舉例,首先,很多客戶有私有化部署要求,但這些模型非常大,對資源要求高,當前不太可能實現私有化部署。其次,這些大模型在一些特定行業或特定任務上,專業性是欠缺的,需要去適配。

而對於ChatGPT這類非開源的大模型應用來說,對它在下游任務上的微調,如何兼顧成本、靈活性和資料隱私則是一個關鍵問題。這些問題也造成,這種模型還沒有走到服務企業級客戶,尤其是大型企業客戶那一步。

除此之外,現在人工智慧技術都在與企業的核心業務流程做深度融合,而像ChatGPT這個基於大模型的應用服務,更像一個獨立的外掛,如何深度繫結,這也成為企業使用它的一個待解決問題。

業界人士期望ChatGPT未來在商業模式上有更好的呈現方式。目前ChatGPT對外提供的API還非常單一,影響了應用。

五、創業公司會被ChatGPT吞噬嗎

大家在期待OpenAI的下一個版本。GPT-3大模型釋出於2020年, ChatGPT則基於它的改進版本建立。此前盛傳,GPT-4將於今年一季度或下半年推出,不過OpenAI的執行長 Sam Altman在1月份回應,沒有具體的時間表。

一些創業者已經開始關注到,隨著大模型被越來越多地應用,細分賽道的創業公司在大模型的強大推力加持下,如何尋找自己的生存空間。

它涉及到兩點,首先是如何深化對垂直行業的認知,真正把大模型融入到企業的創新業務流中。特看科技樂乘認為,垂直行業的小模型,考驗的是創業公司對垂直行業的know-how。創業公司需要基於對行業的認知深度,採集足夠多的場景資料,並基於這些細分資料更好服務使用者。使用者越多,反饋越多,最終形成資料反饋的閉環。

創業公司在小模型的競爭終局比拼的是,誰家的小模型跟業務結合得緊,且能解決好跟大模型結合的問題。

另一點是,大模型被充分使用、喂得很肥後,是否會成為最強大的AI,最終吞噬細分賽道上小創業公司的發展空間。

海外初創公司Jasper的命運頗能反映這種境況。Jasper是一家基於GPT-3大模型來生成營銷文案的AI服務商,去年10月它宣佈以15億美元的估值獲得1.25億美元A輪融資。一個月後,基於GPT-3改進版本搭建的ChatGPT大火,智慧程度更泛化的ChatGPT徹底蓋過了Jasper的風頭。

“對創業者而言,在充分利用已有大模型的情況下,也要儘可能要把小模型的閉環資料保護好。”特看科技樂乘說,這也是他們公司未來會重點攻克的方向。

不外,當下底層大模型還在高速迭代階段,行業內都在等 GPT-4 出來。樂乘認為,從GPT-3到GPT-4的變遷,很像移動網際網路早期 iPhone 1和 iPhone4 階段iOS的升級速度,它的發展速度也許會超出大家的認知。

一些人士猜測, GPT-4將在多模態上有進展,也就是會引入影片、音訊等。國內某遊戲人工智慧的資深開發則告訴數智前線,他們關注的是下一代的大模型能不能在理解上下文上有突破。“如果大模型能讓人工智慧打贏辯論賽,那麼它的能力就算是有質的突破了。”

“短期內可能大家會高估這個東西,但長期可能有很多人會低估這個東西。”這名遊戲AI資深開發評價。

本文來自微信公眾號:數智前線(ID:szqx1991),作者:趙豔秋 徐鑫,編輯:周路平

本內容為作者獨立觀點,不代表虎嗅立場。未經允許不得轉載,授權事宜請聯絡hezuo@huxiu.com

如對本稿件有異議或投訴,請聯絡tougao@huxiu.com

End

想漲知識 關注虎嗅影片號!

上一篇:女子銀行存5... 下一篇:抖音超市,無...
猜你喜歡
熱門閱讀
同類推薦