參戰萬億MoE模型!上海大模型獨角獸出手,騰訊阿里米哈遊參投

首頁 > 科技

參戰萬億MoE模型!上海大模型獨角獸出手,騰訊阿里米哈遊參投

來源:喜劇西西 釋出時間:2024-04-19 09:58

編輯 | ZeR0

智東西4月17日訊息,本日,上海多模態大模型獨角獸MiniMax正式推出abab 6.5系列模型,包含abab 6.5和abab 6.5s兩個模型。

MiniMax成立於2023年1月,是當前國內估值最高的大模型公司之一。今年3月,MiniMax完成阿里參投的新一輪融資,投後估值超過25億美元。此前米哈遊、騰訊均有投資MiniMax。

在MoE尚未成為行業共識時,MiniMax已經押注MoE路線,今年1月釋出其首款基於MoE架構的abab 6,並在過去3個月潛心研發出效能更強的萬億引數MoE模型abab 6.5,在核心能力測試中接近GPT-4、Claude 3 Opus、Gemini 1.5 Pro等頂尖大語言模型。

標註星號的是MiniMax呼叫API測試得到的結果,其餘分數來自對應的技術報告。

abab 6.5和abab 6.5s採用相同的訓練技術、資料,支援200k tokens上下文長度。abab 6.5s更高效,1秒能處理近3萬字的文字。

MiniMax在200k tokens內進行了業界常用的“大海撈針”測試。在891次測試中,abab 6.5均能正確回答。

MiniMax團隊稱找到了越來越多加速實現Scaling Laws的途徑,包括改進模型架構、重構資料pipeline、訓練演算法及並行訓練策略最佳化等。今天釋出的abab 6.5和abab 6.5s是其加速Scaling Laws過程的階段性成果。

abab 6.5系列模型會動彈更新到MiniMax旗下的產品中,包括生產力產品海螺AI和MiniMax開放平臺上。

編輯 | ZeR0

智東西4月17日訊息,本日,上海多模態大模型獨角獸MiniMax正式推出abab 6.5系列模型,包含abab 6.5和abab 6.5s兩個模型。

MiniMax成立於2023年1月,是當前國內估值最高的大模型公司之一。今年3月,MiniMax完成阿里參投的新一輪融資,投後估值超過25億美元。此前米哈遊、騰訊均有投資MiniMax。

在MoE尚未成為行業共識時,MiniMax已經押注MoE路線,今年1月釋出其首款基於MoE架構的abab 6,並在過去3個月潛心研發出效能更強的萬億引數MoE模型abab 6.5,在核心能力測試中接近GPT-4、Claude 3 Opus、Gemini 1.5 Pro等頂尖大語言模型。

編輯 | ZeR0

智東西4月17日訊息,本日,上海多模態大模型獨角獸MiniMax正式推出abab 6.5系列模型,包含abab 6.5和abab 6.5s兩個模型。

MiniMax成立於2023年1月,是當前國內估值最高的大模型公司之一。今年3月,MiniMax完成阿里參投的新一輪融資,投後估值超過25億美元。此前米哈遊、騰訊均有投資MiniMax。

在MoE尚未成為行業共識時,MiniMax已經押注MoE路線,今年1月釋出其首款基於MoE架構的abab 6,並在過去3個月潛心研發出效能更強的萬億引數MoE模型abab 6.5,在核心能力測試中接近GPT-4、Claude 3 Opus、Gemini 1.5 Pro等頂尖大語言模型。

編輯 | ZeR0

智東西4月17日訊息,本日,上海多模態大模型獨角獸MiniMax正式推出abab 6.5系列模型,包含abab 6.5和abab 6.5s兩個模型。

MiniMax成立於2023年1月,是當前國內估值最高的大模型公司之一。今年3月,MiniMax完成阿里參投的新一輪融資,投後估值超過25億美元。此前米哈遊、騰訊均有投資MiniMax。

在MoE尚未成為行業共識時,MiniMax已經押注MoE路線,今年1月釋出其首款基於MoE架構的abab 6,並在過去3個月潛心研發出效能更強的萬億引數MoE模型abab 6.5,在核心能力測試中接近GPT-4、Claude 3 Opus、Gemini 1.5 Pro等頂尖大語言模型。

上一篇:近期眼睛莫名... 下一篇:女子深夜分手...
猜你喜歡
熱門閱讀
同類推薦