零一萬物API正式上線：支援輸入30萬漢字，看不懂《百年孤獨》的人有救了

來源：讀職場釋出時間：2024-03-14 17:04

零一萬物API正式上線：支援輸入30萬漢字，看不懂《百年孤獨》的人有救了

機器之心報道

作者：蛋醬、杜偉

2024 年，大模型領域的一個趨勢越來越清晰：重視最佳化，面向應用。

在去年的百模大戰中，科技巨頭、創業力量你追我趕，將大模型技術捲到了一個新的高度。有了強大的模型之後，更重要的是將這些能力輸出到現實中的應用場景，提升使用者體驗、構建生態。

正因此，大模型廠商們或是開源，或是推出模型 API，都是希望讓成果為開發者所用，以此為基礎設施構建起繁榮的大模型生態。

國內的大模型獨角獸公司零一萬物，也在今天正式釋出了 Yi 大模型 API 開放平臺。

零一萬物 API 開放平臺連結：https://platform.lingyiwanwu.com/

此次 API 開放平臺提供以下模型：

Yi-34B-Chat-0205：支援通用聊天、問答、對話、寫作、翻譯等功能。

Yi-34B-Chat-200K：200K 上下文，多文件閱讀理解、超長知識庫構建小能手。

Yi-VL-Plus: 多模態模型，支援文字、視覺多模態輸入，中文圖表體驗超過 GPT-4V。

實際上，在半個月前，零一萬物已經啟動了 Yi-34B-Chat-0205 和 Yi-34B-Chat-200K 兩個模型的邀測，很多開發者早就上手體驗過一波了。

我們圍觀了一下，發現了幾個亮點：

首先，200K 上下文確實強。就拿專業書翻譯這件事來說吧，前 HuggingFace 員工、Transformer 核心貢獻者 Stas Bekman 寫過一本名為《機器學習工程》的電子書。呼叫 Yi-34B-Chat-200K 之後，知乎知名技術作者「蘇洋」一天之內就完成了長達 264 頁的書籍翻譯工作。

圖源：使用零一萬物 200K 模型和 Dify 快速搭建模型應用 https://zhuanlan.zhihu.com/p/686774859

其次，在 Yi-34B-Chat-0205、Yi-34B-Chat-200K 之外，零一萬物開放平臺此次同期上新全新的多模態大模型 Yi-VL-Plus。

Yi-VL-Plus 支援文字、視覺多模態輸入，面向實際場景大幅增強。多位使用者反饋：「中文體驗超過 GPT-4V。」

GPT-4V 連招牌都沒看明白。

此外，零一萬物 Yi 大模型 API 開放平臺和 OpenAI API 是相容的，遷移方案時的體驗應該也非常絲滑。

當然，Yi 大模型 API 到底能不能與 GPT-4 Turbo、Gemini 1.5、Claude 3 這些模型的表現一較高下，還需要更多開發者一起考察。

Yi 大模型 API 名額目前限量開放，零一萬物會為新使用者免費贈送 60 元，感興趣的開發者不妨申請體驗一下。

200K 上下文的大模型，有多能打？

在此前的內測中，最令人印象深刻的不外乎具有超長上下文視窗的 Yi-34B-Chat-200K。

對於大模型的落地應用，上下文視窗是一項非常關鍵的因素。過去一年裡，各家大模型的上下文視窗都在飛速擴充套件：OpenAI 把 GPT-4 的 32K 直接提到 GPT-4 Turbo 的 128K。谷歌的 Gemini 1.0 還是 32K，Gemini 1.5 Pro 馬上就升級到了 100 萬 Token。

前不久，Claude 3 將大模型 API 的上下文長度紀錄一下提到了 200K，還宣稱有能力開放 100 萬 Token 的上下文輸入（儘管目前僅限特定客戶）。

要完成更復雜的現實任務，模型需要能夠處理長篇的上下文。更廣闊的上下文視窗能顯著提升模型的理解深度，在生成內容或解答問題時實現更高的準確性和相關性。這是因為模型能夠「回憶」並參照較長的文字歷史，面對長文章、書籍的章節、複雜對話或其他需長期累積上下文的情境時，這種能力格外關鍵。

Yi-34B-Chat-200K 能夠處理大約 30 萬個中英文字元。我們可以拿文學類書籍來類比，32K 就像是一篇 2 萬字的短篇小說（比如《潛伏》原著），128K 大概是一部中篇小說的體量（比如《人間失格》），而 200K 則相當於《呼嘯山莊》、《百年孤獨》、《駱駝祥子》這類長篇著作了。

以下是 Yi-34B-Chat-200K 對經典文學作品《呼嘯山莊》的歸納總結，這部作品中文字數約 30 萬字，人物關係錯綜複雜，但 Yi-34B-Chat-200K 仍能精準地梳理和總結出人物之間的關係。

從行業應用的角度看，Yi-34B-Chat-200K 適合用於多篇文件內容理解、海量資料分析挖掘和跨領域知識融合等，為各行各業應用提供了便利。金融分析師可以用它快速閱讀報告並預測市場趨勢、律師可以用它精準解讀法律條文、科研人員可以用它高效提取論文要點等，應用場景非常廣泛。

有開發者對比了 Yi-34B-Chat-200K 和某同類模型，從下圖我們能看出，對於「請在 18 萬字報告中找到地緣政治風險」這一 Prompt，Yi-34B-Chat-200K 給出了正確答案「英國脫歐導致索尼總部搬遷，導致索尼歐洲業務連續性受影響」，而另外一個模型則表示「無地緣政治風險」，未能完成任務。

在另一項任務中，開發者要求某個大模型幫忙「撰寫文獻綜述」，結果，交上來的活只幹了一半：

上一篇：歐洲議會批准... 下一篇：哪個銀行的信...