微軟前全球副總裁入局AGI:左手效率神器、右手AI開放世界

首頁 > 科技

微軟前全球副總裁入局AGI:左手效率神器、右手AI開放世界

來源:尋美食 釋出時間:2024-04-13 01:24

作者 | 三北編輯 | 漠影

大模型進入創業爆發期,來自全球大廠的離職AI大牛成為一大主力軍,近期圈內熱門的階躍星辰是一個典型代表。

成立於2023年4月的階躍星辰,是由原微軟全球副總裁、微軟亞洲網際網路工程院首席科學家姜大昕創辦的通用大模型創業公司。

這是一個“臥虎藏龍”的團隊:創始人、CEO姜大昕是自然語言處理領域的全球著名專家,也是階躍星辰的演算法負責人;系統負責人朱亦博曾在谷歌、位元組和微軟等公司就職,擁有多次單叢集萬卡以上的系統建設與管理實踐經驗;資料負責人焦斌星此前擔任微軟必應引擎核心搜尋團隊負責人,負責利用資料探勘和NLP演算法最佳化索引和搜尋質量……基於這樣的團隊背景,階躍星辰僅花了一年時間就憋出“大招”。

今年3月23日,階躍星辰推出Step系列通用大模型,打響國產玩家進擊萬億引數規模通用大模型的響亮一槍。

同時,階躍星辰的兩款C端產品——效率工具“躍問”和AI開放世界平臺“冒泡鴨”已經全面開放,在巨頭雲集的“百模大戰”中撕開一道新口子。

創業一年來,階躍星辰對大模型產業有什麼獨到見解?其推出的大模型的實際體驗效果如何?智東西來與讀者一起一探究竟。

躍問體驗地址:https://stepchat.cn/chats/new

冒泡鴨體驗地址:https://maopaoya.com/discover

一、微軟大牛下場創業,“鐵人四項”進擊AGI

按照階躍星辰的理念,大模型的演化路徑會經歷“從各模態獨立發展、到融合統一、再到主動探索物理世界”的三個階段。

姜大昕在此前的媒體溝通會上表示,階躍星辰正處在多種模態走向融合的第二階段。

姜大昕認為,多模理解和生成的統一是通向AGI的必經之路。原因有兩個:第一,多模理解是多模生成的堅實基礎。Sora在影片生成領域的驚豔表現,正是因為OpenAI有非常出色的多模理解模型GPT-4V。第二,多模理解做得好,也證明了模型在LLM方面的能力優秀。正如GPT-4V的基礎是GPT-4。

Scaling law是階躍星辰在追逐AGI路上與多模態齊頭並進的方向,為此其提出“鐵人四項”,算力、系統、資料和演算法四大要素缺一不可。

在姜大昕看來,能夠自己從頭訓練千億引數模型已經是個不低的門檻,而在千億之後,每增長一個數量級,面臨的挑戰卻是幾十倍的增長。

因此,能否對這四大要素進行綜合佈局,非常考驗一家創業公司的能力,也決定了這家公司能走多遠。

▲階躍星辰創始人姜大昕在講解攀登Scaling law所需的要素

二、左手效率神器、右手開放世界平臺,實測兩款AI產品

基於多模態和Scaling law兩大路線,階躍星辰推出了Step系列大模型。

Step-1千億引數語言大模型於2023年8月底訓練完成。經過充分準備,Step-1大模型的進展非常快,用時2個月一次性訓練成功,綜合性能超過GPT-3.5。

Step-1V千億引數多模態大模型於2023年11月訓練完成。Step-1V在多個主流評測集上效能指標比肩GPT-4V。特別是在多模理解能力上達到全球領先水平。Step-1V大模型可以精準描述和理解影象中的文字、資料、圖表等資訊,並根據影象資訊實現內容創作、邏輯推理、資料分析等多項任務。

Step-2萬億引數語言大模型採用MoE架構,每Token啟用兩千億以上引數,聚焦模型深度智慧水平的探索,綜合體感對標GPT-4,目前已釋出預覽版。

圍繞Step-1和Step-1V千億引數大模型,階躍星辰的產品和生態已經初步打磨成熟。

以躍問為例,其在影象理解、內容創作、邏輯推理、指令跟隨等方面的能力,使其成為一個出色的“個人效率助手”。

比如,當智東西發給躍問一篇報道連結,躍問立馬為我提煉了報道中的關鍵資料和資訊點。

當智東西給它一張關於“A公司營業收入與毛利、淨利”的統計圖,並要求其“將圖中的內容轉成表格形式,並計算每年淨利增長率”。躍問迅速生成了表格,並算出了9.54%、2.72%兩個圖中沒有直接給出的答案,體現了強大讀圖、數學、組建聯動能力。

上一篇:打造一流營商... 下一篇:小紅書釋出“...
猜你喜歡
熱門閱讀
同類推薦