崑崙萬維:中國首個音樂SOTA模型天工SkyMusic音樂大模型開啟公測

首頁 > 科技

崑崙萬維:中國首個音樂SOTA模型天工SkyMusic音樂大模型開啟公測

來源:變廢為寶 釋出時間:2024-04-19 08:36

IT之家 4 月 17 日訊息,崑崙萬維本日宣佈,天工 3.0 大模型效能提升顯著,旗下的天工 SkyMusic 音樂大模型也在今日面向全社會開放公測。

天工 3.0 擁有 4000 億引數,超越了 3140 億引數的 Grok-1,是全球最大的開源 MoE 大模型。天工 3.0 在語義理解、邏輯推理、通用性、泛化性、不確定性知識、學習能力等領域效能提升顯著,數學 / 推理 / 程式碼 / 文創能力提升超過 30%。天工 3.0 新增了多輪搜尋與綜合工具呼叫、圖表繪製、研究模式、增強模式、改圖擴圖等多項 AI 能力。

▲ 天工 3.0 模型引數超越 Grok-1

天工 3.0 旗下的天工 SkyMusic 音樂大模型也在今日面向全社會開放公測。崑崙萬維表示天工 SkyMusic 在人聲 & BGM 音質、人聲自然度、發音可懂度等領域“顯著”領先對手,綜合性能超越 Suno V3,取得音樂大模型 SOTA(State of the art model,即在當前研究中表現最好的模型)。

天工 SkyMusic 採用音樂音訊領域類 Sora 模型架構,Large-scale Transformer 負責譜曲,來學習 Music Patches 的上下文依賴關係,同時完成音樂可控性,Diffusion Transformer 負責演唱,透過 LDM 讓 Music Patches 被還原成高質量音訊,使其能夠支援生成 80 秒 44100Hz 取樣率雙聲道立體聲歌曲

▲ 天工 SkyMusic AI 音樂大模型技術架構

據介紹,天工 SkyMusic 具備以下特點:

IT之家從公開資料獲悉,崑崙萬維是中國網際網路平臺出海企業,深耕海外市場十餘載,業務覆蓋包括資訊分發、社交、 娛樂、元宇宙、遊戲及 AIGC 等多個領域,旗下包括 AGI 與 AIGC 、海外資訊分發與元宇宙、投資等三大業務板塊,市場遍及中國、東南亞、非洲、中東、北美、南美、歐洲等地。截至目前,全球平均月活躍使用者近 4 億,海外收入佔比達 84%。

IT之家 4 月 17 日訊息,崑崙萬維本日宣佈,天工 3.0 大模型效能提升顯著,旗下的天工 SkyMusic 音樂大模型也在今日面向全社會開放公測。

天工 3.0 擁有 4000 億引數,超越了 3140 億引數的 Grok-1,是全球最大的開源 MoE 大模型。天工 3.0 在語義理解、邏輯推理、通用性、泛化性、不確定性知識、學習能力等領域效能提升顯著,數學 / 推理 / 程式碼 / 文創能力提升超過 30%。天工 3.0 新增了多輪搜尋與綜合工具呼叫、圖表繪製、研究模式、增強模式、改圖擴圖等多項 AI 能力。

▲ 天工 3.0 模型引數超越 Grok-1

天工 3.0 旗下的天工 SkyMusic 音樂大模型也在今日面向全社會開放公測。崑崙萬維表示天工 SkyMusic 在人聲 & BGM 音質、人聲自然度、發音可懂度等領域“顯著”領先對手,綜合性能超越 Suno V3,取得音樂大模型 SOTA(State of the art model,即在當前研究中表現最好的模型)。

IT之家 4 月 17 日訊息,崑崙萬維本日宣佈,天工 3.0 大模型效能提升顯著,旗下的天工 SkyMusic 音樂大模型也在今日面向全社會開放公測。

天工 3.0 擁有 4000 億引數,超越了 3140 億引數的 Grok-1,是全球最大的開源 MoE 大模型。天工 3.0 在語義理解、邏輯推理、通用性、泛化性、不確定性知識、學習能力等領域效能提升顯著,數學 / 推理 / 程式碼 / 文創能力提升超過 30%。天工 3.0 新增了多輪搜尋與綜合工具呼叫、圖表繪製、研究模式、增強模式、改圖擴圖等多項 AI 能力。

▲ 天工 3.0 模型引數超越 Grok-1

天工 3.0 旗下的天工 SkyMusic 音樂大模型也在今日面向全社會開放公測。崑崙萬維表示天工 SkyMusic 在人聲 & BGM 音質、人聲自然度、發音可懂度等領域“顯著”領先對手,綜合性能超越 Suno V3,取得音樂大模型 SOTA(State of the art model,即在當前研究中表現最好的模型)。

上一篇:小米集團副董... 下一篇:首銷破紀錄,...
猜你喜歡
熱門閱讀
同類推薦