零一萬物API正式上線:支援輸入30萬漢字,看不懂《百年孤獨》的人有救了

首頁 > 科技

零一萬物API正式上線:支援輸入30萬漢字,看不懂《百年孤獨》的人有救了

來源:讀職場 釋出時間:2024-03-14 17:04

零一萬物API正式上線:支援輸入30萬漢字,看不懂《百年孤獨》的人有救了

機器之心報道

作者:蛋醬、杜偉

2024 年,大模型領域的一個趨勢越來越清晰:重視最佳化,面向應用。

在去年的百模大戰中,科技巨頭、創業力量你追我趕,將大模型技術捲到了一個新的高度。有了強大的模型之後,更重要的是將這些能力輸出到現實中的應用場景,提升使用者體驗、構建生態。

正因此,大模型廠商們或是開源,或是推出模型 API,都是希望讓成果為開發者所用,以此為基礎設施構建起繁榮的大模型生態。

國內的大模型獨角獸公司零一萬物,也在今天正式釋出了 Yi 大模型 API 開放平臺。

零一萬物 API 開放平臺連結:https://platform.lingyiwanwu.com/

此次 API 開放平臺提供以下模型:

Yi-34B-Chat-0205:支援通用聊天、問答、對話、寫作、翻譯等功能。

Yi-34B-Chat-200K:200K 上下文,多文件閱讀理解、超長知識庫構建小能手。

Yi-VL-Plus: 多模態模型,支援文字、視覺多模態輸入,中文圖表體驗超過 GPT-4V。

實際上,在半個月前,零一萬物已經啟動了 Yi-34B-Chat-0205 和 Yi-34B-Chat-200K 兩個模型的邀測,很多開發者早就上手體驗過一波了。

我們圍觀了一下,發現了幾個亮點:

首先,200K 上下文確實強。就拿專業書翻譯這件事來說吧,前 HuggingFace 員工、Transformer 核心貢獻者 Stas Bekman 寫過一本名為《機器學習工程》的電子書。呼叫 Yi-34B-Chat-200K 之後,知乎知名技術作者「蘇洋」一天之內就完成了長達 264 頁的書籍翻譯工作。

圖源:使用零一萬物 200K 模型和 Dify 快速搭建模型應用 https://zhuanlan.zhihu.com/p/686774859

其次,在 Yi-34B-Chat-0205、Yi-34B-Chat-200K 之外,零一萬物開放平臺此次同期上新全新的多模態大模型 Yi-VL-Plus

Yi-VL-Plus 支援文字、視覺多模態輸入,面向實際場景大幅增強。多位使用者反饋:「中文體驗超過 GPT-4V。」

GPT-4V 連招牌都沒看明白。

此外,零一萬物 Yi 大模型 API 開放平臺和 OpenAI API 是相容的,遷移方案時的體驗應該也非常絲滑。

當然,Yi 大模型 API 到底能不能與 GPT-4 Turbo、Gemini 1.5、Claude 3 這些模型的表現一較高下,還需要更多開發者一起考察。

Yi 大模型 API 名額目前限量開放,零一萬物會為新使用者免費贈送 60 元,感興趣的開發者不妨申請體驗一下。

200K 上下文的大模型,有多能打?

在此前的內測中,最令人印象深刻的不外乎具有超長上下文視窗的 Yi-34B-Chat-200K。

對於大模型的落地應用,上下文視窗是一項非常關鍵的因素。過去一年裡,各家大模型的上下文視窗都在飛速擴充套件:OpenAI 把 GPT-4 的 32K 直接提到 GPT-4 Turbo 的 128K。谷歌的 Gemini 1.0 還是 32K,Gemini 1.5 Pro 馬上就升級到了 100 萬 Token。

前不久,Claude 3 將大模型 API 的上下文長度紀錄一下提到了 200K,還宣稱有能力開放 100 萬 Token 的上下文輸入(儘管目前僅限特定客戶)。

要完成更復雜的現實任務,模型需要能夠處理長篇的上下文。更廣闊的上下文視窗能顯著提升模型的理解深度,在生成內容或解答問題時實現更高的準確性和相關性。這是因為模型能夠「回憶」並參照較長的文字歷史,面對長文章、書籍的章節、複雜對話或其他需長期累積上下文的情境時,這種能力格外關鍵。

Yi-34B-Chat-200K 能夠處理大約 30 萬個中英文字元。我們可以拿文學類書籍來類比,32K 就像是一篇 2 萬字的短篇小說(比如《潛伏》原著),128K 大概是一部中篇小說的體量(比如《人間失格》),而 200K 則相當於《呼嘯山莊》、《百年孤獨》、《駱駝祥子》這類長篇著作了。

以下是 Yi-34B-Chat-200K 對經典文學作品《呼嘯山莊》的歸納總結,這部作品中文字數約 30 萬字,人物關係錯綜複雜,但 Yi-34B-Chat-200K 仍能精準地梳理和總結出人物之間的關係。

從行業應用的角度看,Yi-34B-Chat-200K 適合用於多篇文件內容理解、海量資料分析挖掘和跨領域知識融合等,為各行各業應用提供了便利。金融分析師可以用它快速閱讀報告並預測市場趨勢、律師可以用它精準解讀法律條文、科研人員可以用它高效提取論文要點等,應用場景非常廣泛。

有開發者對比了 Yi-34B-Chat-200K 和某同類模型,從下圖我們能看出,對於「請在 18 萬字報告中找到地緣政治風險」這一 Prompt,Yi-34B-Chat-200K 給出了正確答案「英國脫歐導致索尼總部搬遷,導致索尼歐洲業務連續性受影響」,而另外一個模型則表示「無地緣政治風險」,未能完成任務。

在另一項任務中,開發者要求某個大模型幫忙「撰寫文獻綜述」,結果,交上來的活只幹了一半:

上一篇:歐洲議會批准... 下一篇:哪個銀行的信...
猜你喜歡
熱門閱讀
同類推薦