阿里360月之暗面角逐長文字 記者實測國內大模型長文字哪家強

首頁 > 科技

阿里360月之暗面角逐長文字 記者實測國內大模型長文字哪家強

來源:變廢為寶 釋出時間:2024-03-26 19:43

阿里360月之暗面角逐長文字 記者實測國內大模型長文字哪家強

大模型應用Kimi智慧助手火了,隨之“Kimi概念股”華策影視在3月20日至22日連續三天20%的漲停板。訊息面上,其運營公司月之暗面3月18日宣佈Kimi長上下文視窗技術突破至200萬字。

但200萬字並非大語言模型的極限。3月22日,阿里雲旗下的通義千問宣佈“重磅升級”,向所有人免費開放1000萬字的長文件處理功能。3月23日凌晨,360智腦也宣佈繼2月29日360AI瀏覽器開放100萬字長文字閱讀功能之後,500萬字長文字處理功能也即將入駐。

巨頭鏖戰為何選擇長文字,大模型長文字能力靠的是什麼?3月24日至26日,新京報貝殼財經記者採訪了多位大模型行業從業人員、學者,瞭解到大模型要實現長文字功能在演算法和算力上都面臨著挑戰,但在上線長文字功能上,透過調優演算法或者透過算力“大力出奇跡”甚至使用RAG(檢索增強生成技術,是對大型語言模型輸出進行最佳化的方法,使其能夠在生成響應之前引用訓練資料來源之外的知識庫),都可以打造出該體驗。

因此,貝殼財經記者對目前支援上傳文件分析的大模型進行了實測,包括Kimi、智譜清言、通義千問、文心一言、訊飛星火和360瀏覽器AI助手,發現目前雖然許多大模型都能夠分析文件,但生成的內容質量良莠不齊,上傳檔案大小或上傳檔案格式也存在限制。

為何選擇長文字?長是否可保證“精”?

實際上,各個大模型對長文字的爭奪很早就開始了。百川智慧、零一萬物等都曾以長文字領先業界為其宣傳噱頭,“可以上傳一部《三體》(第一部20萬字)”“可上傳《百年孤獨》(近30萬字)”。

不過,在實際應用上因長文字等功能率先在關注度上“脫穎而出”的還是月之暗面旗下的Kimi智慧助手。根據七麥資料,該APP在效率(免費榜)排名從1月14日的436名提升至3月19日的11名。2月份訪問量達到近300萬次,流量增長104.99%。分別位列AI產品國內總榜Top3和全球增速榜Top1。其還引發了“Kimi概念股”的走紅。

對於長文字功能,月之暗面CEO楊植麟很早就提出了自己的設想,“通往通用人工智慧(AGI)的話,無損的長上下文將會是一個很關鍵的基礎技術。歷史上所有的模型架構演進,本質上都是在提升有效的、無損的上下文長度。上下文長度可能存在摩爾定律,但需要同時最佳化長度和無失真壓縮水平兩個指標,才是有意義的規模化 。”

在他看來,長文字作為月之暗面“登月”的第一步,是新的計算機記憶體,很本質,個性化並非透過微調實現,上下文定義了個性化過程。楊植麟還認為,大模型的馬拉松剛開始,接下來會有更多差異化。

對於長文字功能,中國人民大學高瓴人工智慧學院長聘副教授,曾主導研發演算法生成人類史上第一本人工智慧詩集《陽光失了玻璃窗》的宋睿華告訴貝殼財經記者,長視窗在計算效率上有一些挑戰,但技術進步也不是線性的,月之暗面解決掉一些效能上的問題,確實可以一下子做到很長。另外,和它專注做長視窗有關,其他一些模型可能覺得那麼長沒有太多需求。

不過,隨著Kimi的持續火爆,越來越多的大模型也開始了長文字領域的“軍備競賽”:3月18日至23日,Kimi和通義千問、360AI瀏覽器先後宣佈將支援200萬、1000萬以及500萬字的長文字功能。其中,Kimi和360AI瀏覽器的相關功能處於內測和“即將推出”狀態,而通義千問已經可以直接支援1000萬字的文件上傳了。

對此,新京報貝殼財經記者將一部400萬字左右的網路小說《詭秘之主》TXT文件上傳至了通義千問,並對其提出了問題,通義千問很快做出了回覆,不過其內容並非百分之百準確,如其在回答中搞混了該小說中“途徑”和“序列”的區別,不過對於一些重點問題還是給出了正確的回答。

在通義千問中上傳400萬字文件後對其提問的回答結果截圖。

而記者將同樣的文件上傳至Kimi智慧助手和360AI瀏覽器,則發現該文件字數超過了Kimi的字數限制,Kimi只能閱讀前4%的內容,不過其回答得更加詳細。而360AI瀏覽器則不支援上傳TXT或Word格式,只支援上傳PDF格式。

Kimi智慧助手閱讀部分文件後,對提問結果的回答截圖。

3月24日,某大模型廠商研究機構負責人告訴新京報貝殼財經記者,長文字的挑戰在演算法上主要是要加大訓練引數規模的問題,大模型的本質是算機率,長文字的學習主要依靠對複雜文字的機率模型變化,所以為了保證效率演算法調優是關鍵,當然如果演算法搞不定也可依靠算力大力出奇跡,因此大廠透過“堆資源”的方式很快就能挑戰Kimi的長文字功能。

有AI大模型的使用者表示,長文字功能在許多場景都極具吸引力,如從冗長的公司財報中找到有價值的資訊、上傳自己撰寫的小說尋求修改意見、總結會議紀要內容等,但對於一些對內容準確度要求高的工作,大模型還只能起到輔助作用,畢竟由於AI生成本身的“幻覺”問題,難保不會出現資料錯誤,因此還需要人最後再檢查一遍。

實測長文字能力總結書籍、財報各有千秋 遺忘問題難解

貝殼財經記者發現,目前大多數大模型已經支援文字上傳功能,例如對於12萬字左右的PDF格式《中國移動有限公司2023年年度報告》,文心一言、360AI瀏覽器、Kimi、訊飛星火均可以進行分析,而智譜清言可以上傳但顯示“本次回答已被終止”,通義千問也可以上傳但顯示“由於當前的互動模式限制,我無法直接訪問或解析PDF檔案內容。”

記者橫向比較財報分析內容發現,當要求“根據財報文件分析中國移動業績情況,以及其營收的主要增長點”時,大部分模型都給出了最重要的營收和淨利潤資料,不過在分析營收增長點時,不同的大模型側重點也不同,如Kimi側重於個人市場、家庭市場、政企市場的營收,文心一言和訊飛星火均側重於無線上網業務、有線寬頻業務的營收,360則泛泛提到了營收正在增長。

文心一言對《中國移動有限公司2023年年度報告》的分析結果截圖。

Kimi對《中國移動有限公司2023年年度報告》的分析結果截圖。

360AI瀏覽器對《中國移動有限公司2023年年度報告》的分析結果截圖。

上一篇:再次掉頭向下... 下一篇:構建商顯產業...
猜你喜歡
熱門閱讀
同類推薦