一家自然語言處理AI公司的末世之舞:倒在GPT大模型的狂潮到來前

首頁 > 科技

一家自然語言處理AI公司的末世之舞:倒在GPT大模型的狂潮到來前

來源:每天一首音樂 釋出時間:2023-03-22 16:20

作者油醋

郵箱zhuzheng@pingwest.com

李開復,貫穿了中國上一整個AI創業時代的舊人與導師,近日在朋友圈官宣了一個“切身籌組”的新AI專案決定。在敘述中,這將是一家由技術願景驅動,具有卓越中國工程底蘊的創新企業。而中文版ChatGPT、圖文AIGC和類微軟Copilot類的產品,只是起點。

他給這次全新的出山創業設定了一個概念——AI 2.0。言下之意,新的時代轟轟烈烈,但AI 1.0的故事已到了要被歸檔的時候。

李開復所說的AI 1.0是從2015年開始的。彼時深度學習的技術演進變成CV(計算機視覺)和NLP(自然語言處理)等領域新的場景,進而成為一股在湧動了幾年的AI投資狂熱。那時的國內投資圈開始高談“做時間的朋友”。那時作為投資人的李開復和他創辦的創新工場,也曾經在國內NLP領域找到一個很有潛力的標的。

2016年,騰訊做出對標AlphaGO的“絕藝”,AI Lab中騰訊歷史上最年輕的T4級技術專家吳悅決定離開公司,創立了一家主攻NLP的人工智慧公司,取名追一科技。隔年創新工場領投了追一科技的B輪融資,李開復認定這會是一家估值100億美元的“超級獨角獸”。

現在看上去,這最終不是一個美滿故事。

圖源:追一科技官網

時至今日,這家公司仍然被放置在創新工場官網中人工智慧領域投資的顯眼位置。但追一科技沒有成為獨角獸,卻只是中國NLP初創公司的一個發展樣本。

國內NLP領域的創業者,在那個與OpenAI出現的相同年代,沒辦法做時間的朋友。他們耽擱不起,在拿到第一筆錢之前就要奮力的尋找商業化方向,然後在脆弱的場景裡去打一場場零碎的仗。而追一科技在度過了最初幾年甜蜜的成長期後,商業化的緊迫與技術研發的旁落開始鉗制住這家明星公司的發展。

在人們渴想著進入李開復所說的2.0之前,可能更重要的是知道中國的這些AI公司在1.0時代是如何最終走向失落的,而那些糾結,掙扎和大起大落,在追一這家公司的故事裡都能找到。

中國NLP的黃金期

現在蘇劍林仍然每日進出追一科技所在的南山科技園,做自己的研究,積累一些專利。這是這位在NLP領域頗有聲望的演算法工程師與他供職的公司追一科技之間僅有的聯絡。一位員工說,蘇劍林現在更像是公司挽留住的一塊技術招牌,卻不再與公司商業化層面的演算法研發發生交集。

2019年末開始的一場傷筋動骨之後,許多像蘇劍林一樣的演算法核心骨幹離開了追一科技。自那之後,這家公司逐漸沉默寡言,隨著AI領域的重歸沉寂一起遠離了大眾視線。最近與追一科技有關的訊息,是去年年中一場“斷網裁員”的鬧劇。

這是一場極不體面的裁員。

一位產品線的被裁員工在脈脈上表示,從被通知居家辦公,到企業微信不能登陸然後被通知裁員只有兩天。而最初“遣散”回家的由頭,只是下班前後一場被通知的“網路故障”。一位被裁掉的員工說,仲裁的隊伍排到了今年2月之後。

這家現在看來籍籍無名的公司的落寞,裹挾在整個網際網路科技行業下行和疫情的大背景裡,並不張揚。

但七年前追一科技最初在深圳創立的時候是另一番景象。

2016年人工智慧第一次撞開現實之門,所有人都在討論贏了李世石的AlphaGo,討論AlphaGo背後的DeepMind。這將人工智慧領域推進風口,中國人工智慧產業規模在那一年第一次突破100億元,2017年全球範圍內AI領域共有152億美元的投資,其中接近一半都投向了中國公司。

這背後是深度學習的勝利,這種訓練能力也早已浸入NLP領域的研究。隨著谷歌團隊在2013年提出NLP工具Word2Vec,深度學習與自然語言處理的結合開始被推向高潮,然後研究者們開始在機器翻譯、問答系統、領域看到NLP技術落地的希望。

2016年,華為諾亞方舟實驗室已經有了一個完全基於深度學習模型實現的單輪對話系統;騰訊在時年4月成立了AI Lab,其中NLP列於四個主要的研究方向之一。2017年,馬雲、馬化騰和李彥宏,時隔四年重聚深圳。這個迅速聚攏著中國科技頂尖人才的地方,人工智慧的浪潮正像城市裡的鹹溼海風一樣燥熱。

圖源:介面新聞

那幾年是國內NLP領域最適合創業的時候。

主導微軟小冰進入日本市場的簡仁賢在2015年回國創立竹間科技;在NLP及深度學習領域引用量最高的博士生李紀為在2017年從斯坦福回國創立香儂科技。而作為專案負責人領導騰訊AI Lab內圍棋AI對標專案“絕藝”的吳悅,則在2016年決定與幾位核心演算法骨幹從騰訊大樓走出,轉身成為咬著下一個“超級獨角獸”金湯匙的創業團隊。

那時候的追一科技精神奕奕,明星團隊的背景在前,背後是KOL加持,資金環抱。

聯合創始人中除了吳悅,CTO劉雲峰同樣曾是位於騰訊技術頂端的T4級專家。過往曾擔任騰訊技術職發會技術研究通道負責人。另一位汶林丁此前的身份是騰訊搜尋部門產品技術總監。唯一一位市場背景的的聯合創始人胡曉,曾是騰訊市場總監,負責過北京奧運會官方網站、搜狗輸入法等產品的市場推廣。

已經在人工智慧領域有了曠視這樣明星專案的李開復與創新工場,急切尋找一個NLP領域的標的,2017 年11月2日,創新工場領投了追一科技一筆2060萬美元的B輪融資,並且在兩年後跟進到C輪。

幾個月後李開復從達沃斯飛去追一科技所在的深圳辦公室,直言在看了NLP領域的20多家公司後認定“追一科技絕對是全球最好的NLP公司”。李開復在追一科技身上看到了一箇中美兩國2000萬客服的人力替代機會,並且相信這道口子下面是一個宏大的企業服務市場。

李開復並沒有看錯。2017年前後,整個智慧客服行業基於深度學習領域的進展開始洗牌,很早就開始NLP演算法研究的追一科技在這時候切入市場,很快找到了滴滴這樣的大客戶,隨後是攜程、小米、美團。2018年追一科技拿下了與招商銀行在智慧服務方面的戰略合作,隨後金融企業開始成為追一科技主要追求的服務物件。

但幾乎同時,這家AI初創公司的底層演算法研究開始陷入停滯。

一場飲鳩止渴,彷彿從第一次見到水源就開始了。

“無法迭代”的困境

中國NLP領域的商業化前景落在這樣一個真空地帶:它不夠獨立,又不夠賺錢。

相比CV領域有安防這樣堅固場景的技術領域,機器翻譯和語聊機器人已經是NLP技術最鮮明的標籤。不夠獨立的場景意味著NLP技術在其中只能作為一種解決方案或者原子化能力鑲嵌在一個更大的系統裡。當商業化的壓力驅趕著NLP初創公司去靠近技術迭代滯後,卻環境複雜的B端大客戶時,這種被動的依附方式逐漸成為問題。

追一科技在2018年決定切進金融業,後者毛利率高,系統更新迭代極度保守,也因此是最有AI化動力的行業之一。對於追一科技來說,這是一條能在初期很快實現商業化的道路,但對立面是,金融業——包括幾乎所有的傳統大B企業——給一家AI公司留出的空間,是一個對技術並不敏感,同質化競爭激烈卻薄利的軟體服務市場。

追一科技曾經拿到超過五成頭部銀行和A級券商公司的佔比,但這些企業對核心資料的流動極為嚴謹,為了完成系統搭建,追一科技的團隊往往需要跑到對方公司內部去完成軟體交付。追一科技很難拿到垂直領域表層以下的有效資料,只是一個在局內的“局外人”。

圖源:每日經濟新聞

大量專案制的客戶訂單都有著各自不同的定製化需求,追一科技的人手和精力被極大牽扯在軟體搭建和交付流程中。相比標準化軟體產品,專案制的客戶接受度更高,但專案制的代價是這些工程化經驗相互獨立,無法複用到自己的主線產品上。

繁瑣的專案工程和缺失的資料,追一科技開始陷入一個只有演算法模型而無法迭代的困境裡。

前追一科技的產品經理克依表示,公司早期曾組建了大資料組,為了對資料的進一步挖掘和畫像生成做研究。但由於沒有資料,無法對影象和深層次資訊做進一步挖掘,這個組在2018年解散。

無法以資料推動演算法模型的迭代,對話機器人就只能停留在智慧客服這樣的淺薄場景上。2018年,谷歌開源了基於 Transformer的BERT模型,一年後整個國內智慧客服行業的產品基本都是以谷歌BERT模型為架構再做改造。“技術上已經沒有代際差”,此前曾在研發組的孫小小表示。

資料困境與商業化上的疲憊,進而轉變成追一科技內部對於底層演算法研發的保守態度。

由於CTO劉雲峰以及整個創始人團隊的技術背景,追一科技在早期對於做基礎演算法研究的優先順序甚至是高於商業化的。演算法團隊最多時曾擴充到近50人規模。但一些很早就開始的底層演算法研發專案,比如NLtoSPL、知識圖譜,最終都沒有落地。其中NLtoSPL專案從最初就從未有過產品雛形,並在2020年停掉了內部研發。

“大量人力耗在多個產品的同時運營以及大量企業定製化專案上,沒有多餘人手來做一個沒有專案的新自研產品了。”克依在談到公司的技術停滯時表示。

新的演算法模型也不能輕易迭代進正在執行的企業服務能力中。首先,企業並沒有強烈的迭代意願,特別是金融業的客戶,系統保持長期穩定的優先順序高於對效率的追求。並且對於追一科技來說,新的底層演算法模型也意味著需要新的架構來適配。彼時的工程團隊陷在大量需要持續運維的專案裡,沒有搭建新架構的餘力。

在這個對技術並不敏感的企業服務市場裡,工程化能力的優先順序是遠高於底層演算法能力的,但追一科技的工程化能力在頻密的定製化需求中並未建立起來。最初在演算法上使用的深度學習加搜尋的模型原先是追一科技的技術優勢,但這種模型在整個體積上來講較重,跑起來出現問題時,對問題的定位和調整都更加複雜。並行專案多了,最初的優勢變成了劣勢。

去企業客戶現場修復已經上線系統的BUG,老產品重構後的保障和響應,這些事都在分散工程部本該用在產品架構最佳化上的精力。一個惡性迴圈中,好的軟體工程體系從未建立起來,換新模型的事也一拖再拖。

2019年追一科技的員工數量達到頂峰的500人以上。從外界看來,這是一家三年裡一直在順利拿錢,迅速擴充產品線和團隊體量的成長型公司。但當時這家AI公司的龐大團隊裡,有將近一半的員工歸屬軟體和交付團隊,並且一位已從追一科技離職的NLP演算法工程師表示,公司來自智慧客服這個單一場景的收入幾乎佔到總營收的九成以上。

公司的演算法團隊則在行業技術層面被拉平的時候,逐漸被擺到一個無法進入現實產品的真空位置。領導NLtoSPL研發專案的楊雪峰在2020年初離開了追一科技,加入騰訊基礎研究擔任組長。

“研發的人走了,留下一個程式碼庫。”

這是追一科技曾經很多未能落地的研發專案的現狀。

崩壞2019

2019年一級市場AI投資熱的退潮,成了追一科技的分水嶺。

獵豹全球智庫顯示,這一年中國AI企業的融資金額由1484億元下跌到千億規模之下,下降幅度34.8%,融資數量則從737下降到431起。習慣了短平快投資的VC們開始清醒,人工智慧領域的回報週期比想象中漫長的多,在看不到堅固場景之前,創業型AI公司的商業變現模式脆弱不堪。

李開復在這年說人工智慧已經到了大幅融入傳統公司的階段。就在他丟擲這個判斷的前個星期,一筆創新工場參與跟投的4100萬美元融資剛剛灌入追一科技。事後看來,那是創新工場最後一次投資追一科技。

圖源:介面新聞

曾經NLP中最被看好的智慧客服市場在2019年後迅速落入一場高度同質化的競爭,市面上的所有解決方案之間已不存在護城河,轉入拼服務與價格戰的境地。

從追一科技內部來看,日子從2019年下半年開始明顯變得艱難。競爭對手開始變多,並且不乏在投入上勝過追一的競爭者。一些交付人員開始感覺專案越來越少,客戶的復購率降低。

此時的追一從單純的產品技術角度,已經沒有太多優勢。一個象徵性的事情是,滴滴在決定自研智慧客服後,在2019年結束了與追一科技3年的合作。

“2018年時,當時華東區域一個月投8次標能中7次,有那麼點無往而不利的感覺。到了2019年下半年,銷售人員已經不得不去問內部要更多資源投入來增加贏的籌碼。”從2017年開始就進入了追一科技的嚴力表示。

他透露,當時投資人為追一科技設定了幾乎年均翻倍的合同額以及確認收入等關鍵商業化數字的增長目標,這個盲目設下的目標在遇到阻力時變成了內部各部門間的業務扯皮。

“交付部門不認同銷售團隊為了搶到客戶而在產品需求上做了太多定製化的讓步,更偏向做通用型產品的產品團隊則不能不為了很多繁瑣的需求偏離自己主要的研究方向,開發部門的前後端工程師或者測試人員則忙於救火各種併發專案的Bug或者功能設計,諸如此類”,嚴力表示。

吳悅曾提到創業之初的擔憂,“我一直焦慮的事情是公司到底能不能持續快速增長。要怎麼拓展客戶,技術能不能在市場上領先,團隊規模擴大的時候,企業文化會不會崩盤,職員會不會流失。”這些擔憂在2019之後一件件成為現實。

2020年初,開發以及交付兩個關鍵部門的負責人離開了追一。包括銷售部門和解決方案的老大,以及那時候兩個拳頭產品的產品經理。一些員工回憶稱。

演算法團隊則開始從50多人向維持基礎能力的十幾人規模精簡。核心演算法工程師中裡除了迴歸大廠的楊雪峰,包括徐易楠以及另一位演算法leader劉峰也在2020年上半年選擇離開。

遲疑不決

2016年的那波AI熱潮終結在2020年,現在的追一科技在幾波大的裁員之後,重新迴歸到200多人的規模。

ChatGPT橫空出世刺激了幾乎國內所有NPL領域的參與者,吳悅發了一條很長的的朋友圈來談ChatGPT。他在總結出的觀點裡說,“ChatGPT是想象力、產品力、工程力融合的勝利......並且得益於一批綜合能力非常強,且不為五斗米折腰的牛人,以及非常不差錢的創新氛圍和經濟環境基礎”。

言語之中,有些羨慕。

而追一最初成立的時候,曾考慮過是做對話機器人仍是做搜尋,或者是走NLP的研究路線。巧合的是,OpenAI在創立初期也有過類似的三個選擇:硬體形態的物理機器人實體,遊戲人工智慧,或是語言模型。

在最初看起來相似的路線抉擇面前,OpenA在幾次嘗試後最終將重心放在了大模型上,而需要在一個更短期限內報答投資者的吳悅則選擇了靠近場景。

“非常不差錢的創新氛圍和經濟環境基礎”。這大概是2015年成立的OpenAI與2016年前後在國內冒出來的的NLP初創公司之間最大的不同。追一科技最初咬著的這柄金湯匙,是有倒計時的。

一份中國網際網路週刊與eNet研究院釋出的2019中國人工智慧100人榜單裡,吳悅入選並且排名靠前。同樣在榜單裡的有做推薦演算法的張一鳴和彼時還在螞蟻金服的胡曉明,有剛從百度遺憾出走的陸奇,也有獵豹移動的傅盛和曾被估到3000億美元身價而現在市值不到70億人民幣的格靈深瞳趙勇。

上一篇:商轉公對公積... 下一篇:谷歌版ChatGP...
猜你喜歡
熱門閱讀
同類推薦