大模型時代,騰訊雲“複製”騰訊|WAIC2023

首頁 > 科技

大模型時代,騰訊雲“複製”騰訊|WAIC2023

來源:一路凱伴 釋出時間:2023-07-14 11:21

文|郝鑫

編|劉雨琦

剛過去的WAIC(世界人工智慧大會)儼然成為了大模型廠商的成果彙報大會。

百度文心大模型進級到3.5版本,練習速度晉升2倍,推理速度晉升30倍;華為雲釋出盤古大模型3.0,包含L0基礎大模型、L1行業大模型和L2場景模型;阿里雲釋出AI繪畫創作模型通義萬相;騰訊雲MaaS底座、行業大模型場景全面進級;商湯“日日新”大模型進級,金融、醫療等行業場景落地已超20個。

大模型走過從無到有,在當下的階段,即使是站在統一起跑線的廠商,也走上了不同的分叉路:有人做通用大模型,有人做行業大模型;有人在為大模型的安全執行保駕護航,有人在提供造大模型的工具。

7月7日,在中國信通院釋出的《2023大模型和AIGC工業圖譜》中,將大模型和AIGC產業鏈上下游分成了行業應用、產品服務、模型與工具和基礎層四個主要部門。

(圖源:中國通訊院)

從圖上看,大模型就像造屋子,很難有一家企業完成所有環節。也就是說,猶如網際網路的大航海時代一般,大模型生態建設,所有人都有機會。

正如騰訊雲副總裁、騰訊雲智慧負責人、優圖實驗室負責人吳運聲告訴光錐智慧:“大模型時代,開放是非常重要的特點。大模型要結合行業落地,需要花費大量的本錢,在這種情況下,要想施展最大的價值,只有開放,透過讓各行各業的專家、各類角色的職員加入進來,才能讓整個生態體系更健康,從而產生更多的可能性。”

發展的同時,問題也在逐漸暴露出來。相較於國外成熟的大模型市場,中國到現在還未構建起完整的大模型產業鏈,在底層的資料、晶片、計算能力存在欠缺,在模型練習、部署等環節還十分薄弱。

針對大模型產業鏈存在的痛點,騰訊雲MaaS大模型精選商店進級技術底座,釋出向量資料庫和星脈網路,立異行業大模型的應用場景。

追本溯源,可以看出騰訊延續網際網路時代的思路,騰訊雲依然不做通用大模型,要繼承做工具箱和聯結器。

Always工具箱和聯結器

據光錐智慧瞭解到,早在6月19日,騰訊雲就宣佈了行業大模型技術解決方案。該方案依託騰訊雲TI平臺打造行業大模型精選商店,為客戶提供MaaS一站式服務,客戶只需要加入自己獨佔的場景資料,就可以快速天生專屬模型,結合實際業務場景需求,開發低成本、高可用的智慧應用和服務。

騰訊雲MaaS大模型商店重點凸起了兩個特點,一是精專,二是靈活。

“精專”主要體現在對行業模型的練習上,騰訊雲在其技術底座就內建了金融、政務、文旅、傳媒、教育等多個行業大模型,這意味著從預練習時期開始,大模型便明確了方向,開始與行業經驗結合。

打個比方,就比如大學生一入學就被分到了不同的專業,之後在此基礎上繼承研究生、博士深造。騰訊雲的思路也是如斯,把練習的資料先在行業大模型中磨礪一遍,然後再結合企業的私有資料,精調後天生企業專屬模型。可以說,行業認知貫串了模型練習、推理、部署的全過程,由此來晉升行業場景的應用能力。

“靈活”主要體現在企業調取、使用模型能力、工具上。網際網路時代,馬化騰曾將騰訊的角色定位為“工具箱”,在大模型時代,騰訊雲TI平臺的角色有著異曲同工之處。

工具鏈決定著企業能不能把大模型能力和自己的業務、產品相結合,為此,騰訊雲提供了包括資料標註、練習、評估、測試和部署等大模型工具箱和配套服務。企業可以在本地按需選用和組合工具,在保障安全的條件下進行私有化資料練習,還可根據業務場景需求,按需定製不同引數、規格的模型服務。

以前,騰訊連線了B端商家和C端使用者,現在騰訊雲也將這種能力復刻到大模型商店。工具組合形成的工具鏈還只是平臺中的一環,連線起企業產品和大模型;另一條主線——資料(私有+公有),則串連起了大模型、企業、工業和使用者。

行業應用是出發點,也是終點,正如吳運聲所言,“不管是什麼樣的技術,我們最根本的起點,仍是要解決實際的問題。”

大模型加速器

如何在大模型賽道上找到合適自己的節奏,騰訊雲好像已經摸到了脈路。

騰訊團體高階執行副總裁、雲與聰明工業事業群CEO湯道生曾表示:“樞紐仍是要把底層的演算法、算力和資料紮紮實實做好,而且更樞紐的是場景落地。”

延續著這樣的思路,騰訊雲一手抓底層演算法、算力和資料,一手落地場景,MaaS大模型商店實現了全面的進級。

(拍攝:光錐智慧)

在技術底座環節,騰訊雲聚焦一個“快”字,釋出了星脈網路和向量資料庫,為大模型安上了“風火輪”。

大模型進入萬億引數時代,單體伺服器算力有限,需要將大量伺服器透過高效能網路相連,打造大規模算力叢集。

基於此,騰訊雲透過對處理器、網路架構和儲存機能的全面最佳化,攻克下了大叢集場景下算力損耗問題,正式釋出新一代HCC(High-Performance Computing Cluster)高效能計算叢集。

該叢集採用騰訊雲星星海自研伺服器,搭載英偉達最新代次H800 GPU,能晉升40%的GPU利用率,節省30%-60%的模型練習本錢,為AI大模型帶來10倍通訊機能晉升。基於騰訊雲新一代算力叢集HCC,可支援10萬卡的超大計算規模。

據騰訊雲透露,騰訊雲新一代叢集的算力機能較前代晉升高達3倍,是海內機能最強的大模型計算叢集。

高效能計算群是一種底座能力,其技術的應用體現了透過技術手段的降本增效。

首先,比擬於大量分散的計算機,高效能計算叢集可以降低硬體本錢和運維本錢,同時利便集中管理。其次,它可以晉升計算、搜尋的效率。提供分散式的計算能力,為向量資料庫提供支援;還能進行復雜的科學計算和建模,這也是騰訊雲“AI for Science”能迅速在天文、甲骨文考釋取得成果的原因。

在大模型練習過程中,湯道生談起過資料質量的問題,他表示:“目前通用大模型一般都是基於廣泛的公然文獻與網路資訊來練習的,網上的資訊可能有錯誤、有謠言、有偏見,很多專業知識與行業資料積累不足,導致模型的行業針對性與精準度不夠,資料噪音過大。”

資料對大模型練習的意義不問可知,當前,除了資料噪聲過大,還存在資料處理、資料更新、資料安全等眾多問題。

此外,大模型還存在一個致命的缺點——沒有長期記憶,C端對話場景還可以重新提問,但應用在行業,就可能造成系統崩潰。

OpenAI 很早就意識到這個問題,透過與Zilliz、Pinecone、Weaviate等向量資料庫公司合作,為ChatGPT配置上了“外接快取”,向量資料庫+大模型也被稱之為“黃金搭檔”。

國外向量資料庫大熱帶動了海內廠商加速,騰訊雲也遇上了第一波,釋出了海內首個AI 原生向量資料庫。

針對大模型場景,它在接入層、計算層、儲存層實現了全面AI化:

在接入層,智慧化支援自然語言文字的直接檢索;

在計算層,透過AI運算元替換企業尋找/調優AI演算法,將接入工期從一個月縮短到3天;

在儲存層,融合智慧壓縮演算法,把向量儲存本錢降低50%。

企業資料接入需要分為三步,分別為文字切分、向量化以及匯入。以前,這三步分別由不同的公司來做,因此週期被拉得無窮長,而騰訊雲將三步化作一步,直接實現了一站式接入,效率晉升了10倍。

不外,從引數來看,目前騰訊雲向量資料庫機能依舊在低階的階段。

舉個例子,騰訊雲向量資料庫最高支援10億級向量檢索規模,並將延遲控制在毫秒級。作為對比Milvus最大能支援560億向量檢索規模,支援每秒進行上百萬的向量相似性搜尋。

但10億級也可以說是向量資料庫的入門級引數。Pinecone 官方demo 表明其可以在 10 億條向量中實時搜尋;Weaviate演算法可支援十億量級的向量索引。

工欲善其事,必先利其器。從最底層一步步砸實技術,看似騰訊雲走了一條慢路,但小布快走,實現快速迭代後,帶動的將是整個生態系統的晉升。

50個場景,騰訊雲批次著陸

場景一直是騰訊所誇大的產品文化,即做一個產品或者上線一個功能,首先考慮的是,能不能找到場景,找到使用者。

同樣切入MaaS,站在新的起跑線上,騰訊雲透過沉澱的行業Konw-how,瞄準企業應用剛需,推進大模型應用落地,將場景作為練習大模型的磨刀石。

“大模型雖好,但用起來仍是有很高的門檻。尤其對一些傳統領域企業而言,通用大模型無法精準適配、達到降本增效的預期。企業需要的,是在實際場景中真正解決某個問題,而不是在100個場景中解決了70%-80%的問題。”吳運聲道。

騰訊雲以為,大模型不只是少數人的遊戲,把大模型從“通才”轉變為“專才”,對企業來說或許是一個可行的路徑。騰訊雲在其中承擔的角色,就是要將門檻打下來,提供一條龍服務,匡助企業跳過模型練習、部署的“冷啟動”階段。

據光錐智慧瞭解,基於騰訊在網際網路行業的長期沉澱,騰訊雲已聯合金融、文旅、政務、傳媒、教育等十多個行業頭部客戶,共同打造了超過50個行業大模型解決方案,這些都是騰訊 CSIG 的重點服務行業。

上一篇:網路匿名制之... 下一篇:利用Docker容...
猜你喜歡
熱門閱讀
同類推薦