大模型時代，騰訊雲“複製”騰訊

大模型時代，騰訊雲“複製”騰訊｜WAIC2023

來源：一路凱伴釋出時間：2023-07-14 11:21

文｜郝鑫

編｜劉雨琦

剛過去的WAIC（世界人工智慧大會）儼然成為了大模型廠商的成果彙報大會。

百度文心大模型進級到3.5版本，練習速度晉升2倍，推理速度晉升30倍；華為雲釋出盤古大模型3.0，包含L0基礎大模型、L1行業大模型和L2場景模型；阿里雲釋出AI繪畫創作模型通義萬相；騰訊雲MaaS底座、行業大模型場景全面進級；商湯“日日新”大模型進級，金融、醫療等行業場景落地已超20個。

大模型走過從無到有，在當下的階段，即使是站在統一起跑線的廠商，也走上了不同的分叉路：有人做通用大模型，有人做行業大模型；有人在為大模型的安全執行保駕護航，有人在提供造大模型的工具。

7月7日，在中國信通院釋出的《2023大模型和AIGC工業圖譜》中，將大模型和AIGC產業鏈上下游分成了行業應用、產品服務、模型與工具和基礎層四個主要部門。

（圖源：中國通訊院）

從圖上看，大模型就像造屋子，很難有一家企業完成所有環節。也就是說，猶如網際網路的大航海時代一般，大模型生態建設，所有人都有機會。

正如騰訊雲副總裁、騰訊雲智慧負責人、優圖實驗室負責人吳運聲告訴光錐智慧：“大模型時代，開放是非常重要的特點。大模型要結合行業落地，需要花費大量的本錢，在這種情況下，要想施展最大的價值，只有開放，透過讓各行各業的專家、各類角色的職員加入進來，才能讓整個生態體系更健康，從而產生更多的可能性。”

發展的同時，問題也在逐漸暴露出來。相較於國外成熟的大模型市場，中國到現在還未構建起完整的大模型產業鏈，在底層的資料、晶片、計算能力存在欠缺，在模型練習、部署等環節還十分薄弱。

針對大模型產業鏈存在的痛點，騰訊雲MaaS大模型精選商店進級技術底座，釋出向量資料庫和星脈網路，立異行業大模型的應用場景。

追本溯源，可以看出騰訊延續網際網路時代的思路，騰訊雲依然不做通用大模型，要繼承做工具箱和聯結器。

Always工具箱和聯結器

據光錐智慧瞭解到，早在6月19日，騰訊雲就宣佈了行業大模型技術解決方案。該方案依託騰訊雲TI平臺打造行業大模型精選商店，為客戶提供MaaS一站式服務，客戶只需要加入自己獨佔的場景資料，就可以快速天生專屬模型，結合實際業務場景需求，開發低成本、高可用的智慧應用和服務。

騰訊雲MaaS大模型商店重點凸起了兩個特點，一是精專，二是靈活。

“精專”主要體現在對行業模型的練習上，騰訊雲在其技術底座就內建了金融、政務、文旅、傳媒、教育等多個行業大模型，這意味著從預練習時期開始，大模型便明確了方向，開始與行業經驗結合。

打個比方，就比如大學生一入學就被分到了不同的專業，之後在此基礎上繼承研究生、博士深造。騰訊雲的思路也是如斯，把練習的資料先在行業大模型中磨礪一遍，然後再結合企業的私有資料，精調後天生企業專屬模型。可以說，行業認知貫串了模型練習、推理、部署的全過程，由此來晉升行業場景的應用能力。

“靈活”主要體現在企業調取、使用模型能力、工具上。網際網路時代，馬化騰曾將騰訊的角色定位為“工具箱”，在大模型時代，騰訊雲TI平臺的角色有著異曲同工之處。

工具鏈決定著企業能不能把大模型能力和自己的業務、產品相結合，為此，騰訊雲提供了包括資料標註、練習、評估、測試和部署等大模型工具箱和配套服務。企業可以在本地按需選用和組合工具，在保障安全的條件下進行私有化資料練習，還可根據業務場景需求，按需定製不同引數、規格的模型服務。

以前，騰訊連線了B端商家和C端使用者，現在騰訊雲也將這種能力復刻到大模型商店。工具組合形成的工具鏈還只是平臺中的一環，連線起企業產品和大模型；另一條主線——資料（私有+公有），則串連起了大模型、企業、工業和使用者。

行業應用是出發點，也是終點，正如吳運聲所言，“不管是什麼樣的技術，我們最根本的起點，仍是要解決實際的問題。”

大模型加速器

如何在大模型賽道上找到合適自己的節奏，騰訊雲好像已經摸到了脈路。

騰訊團體高階執行副總裁、雲與聰明工業事業群CEO湯道生曾表示：“樞紐仍是要把底層的演算法、算力和資料紮紮實實做好，而且更樞紐的是場景落地。”

延續著這樣的思路，騰訊雲一手抓底層演算法、算力和資料，一手落地場景，MaaS大模型商店實現了全面的進級。

（拍攝：光錐智慧）

在技術底座環節，騰訊雲聚焦一個“快”字，釋出了星脈網路和向量資料庫，為大模型安上了“風火輪”。

大模型進入萬億引數時代，單體伺服器算力有限，需要將大量伺服器透過高效能網路相連，打造大規模算力叢集。

基於此，騰訊雲透過對處理器、網路架構和儲存機能的全面最佳化，攻克下了大叢集場景下算力損耗問題，正式釋出新一代HCC（High-Performance Computing Cluster）高效能計算叢集。

該叢集採用騰訊雲星星海自研伺服器，搭載英偉達最新代次H800 GPU，能晉升40%的GPU利用率，節省30%-60%的模型練習本錢，為AI大模型帶來10倍通訊機能晉升。基於騰訊雲新一代算力叢集HCC，可支援10萬卡的超大計算規模。

據騰訊雲透露，騰訊雲新一代叢集的算力機能較前代晉升高達3倍，是海內機能最強的大模型計算叢集。

高效能計算群是一種底座能力，其技術的應用體現了透過技術手段的降本增效。

首先，比擬於大量分散的計算機，高效能計算叢集可以降低硬體本錢和運維本錢，同時利便集中管理。其次，它可以晉升計算、搜尋的效率。提供分散式的計算能力，為向量資料庫提供支援；還能進行復雜的科學計算和建模，這也是騰訊雲“AI for Science”能迅速在天文、甲骨文考釋取得成果的原因。

在大模型練習過程中，湯道生談起過資料質量的問題，他表示：“目前通用大模型一般都是基於廣泛的公然文獻與網路資訊來練習的，網上的資訊可能有錯誤、有謠言、有偏見，很多專業知識與行業資料積累不足，導致模型的行業針對性與精準度不夠，資料噪音過大。”

資料對大模型練習的意義不問可知，當前，除了資料噪聲過大，還存在資料處理、資料更新、資料安全等眾多問題。

此外，大模型還存在一個致命的缺點——沒有長期記憶，C端對話場景還可以重新提問，但應用在行業，就可能造成系統崩潰。

OpenAI 很早就意識到這個問題，透過與Zilliz、Pinecone、Weaviate等向量資料庫公司合作，為ChatGPT配置上了“外接快取”，向量資料庫+大模型也被稱之為“黃金搭檔”。

國外向量資料庫大熱帶動了海內廠商加速，騰訊雲也遇上了第一波，釋出了海內首個AI 原生向量資料庫。

針對大模型場景，它在接入層、計算層、儲存層實現了全面AI化：

在接入層，智慧化支援自然語言文字的直接檢索；

在計算層，透過AI運算元替換企業尋找/調優AI演算法，將接入工期從一個月縮短到3天；

在儲存層，融合智慧壓縮演算法，把向量儲存本錢降低50%。

企業資料接入需要分為三步，分別為文字切分、向量化以及匯入。以前，這三步分別由不同的公司來做，因此週期被拉得無窮長，而騰訊雲將三步化作一步，直接實現了一站式接入，效率晉升了10倍。

不外，從引數來看，目前騰訊雲向量資料庫機能依舊在低階的階段。

舉個例子，騰訊雲向量資料庫最高支援10億級向量檢索規模，並將延遲控制在毫秒級。作為對比Milvus最大能支援560億向量檢索規模，支援每秒進行上百萬的向量相似性搜尋。

但10億級也可以說是向量資料庫的入門級引數。Pinecone 官方demo 表明其可以在 10 億條向量中實時搜尋；Weaviate演算法可支援十億量級的向量索引。

工欲善其事，必先利其器。從最底層一步步砸實技術，看似騰訊雲走了一條慢路，但小布快走，實現快速迭代後，帶動的將是整個生態系統的晉升。

50個場景，騰訊雲批次著陸

場景一直是騰訊所誇大的產品文化，即做一個產品或者上線一個功能，首先考慮的是，能不能找到場景，找到使用者。

同樣切入MaaS，站在新的起跑線上，騰訊雲透過沉澱的行業Konw-how，瞄準企業應用剛需，推進大模型應用落地，將場景作為練習大模型的磨刀石。

“大模型雖好，但用起來仍是有很高的門檻。尤其對一些傳統領域企業而言，通用大模型無法精準適配、達到降本增效的預期。企業需要的，是在實際場景中真正解決某個問題，而不是在100個場景中解決了70%-80%的問題。”吳運聲道。

騰訊雲以為，大模型不只是少數人的遊戲，把大模型從“通才”轉變為“專才”，對企業來說或許是一個可行的路徑。騰訊雲在其中承擔的角色，就是要將門檻打下來，提供一條龍服務，匡助企業跳過模型練習、部署的“冷啟動”階段。

據光錐智慧瞭解，基於騰訊在網際網路行業的長期沉澱，騰訊雲已聯合金融、文旅、政務、傳媒、教育等十多個行業頭部客戶，共同打造了超過50個行業大模型解決方案，這些都是騰訊 CSIG 的重點服務行業。

上一篇：網路匿名制之... 下一篇：利用Docker容...