訊飛星火首發智慧體平臺,敏捷觸達大模型應用企業落地最後一公里

首頁 > 科技

訊飛星火首發智慧體平臺,敏捷觸達大模型應用企業落地最後一公里

來源:娛樂大起底 釋出時間:2024-04-29 22:03

4月26日,訊飛星火大模型V3.5(以下簡稱“訊飛星火”)春季上新。面向使用者高效準確知識獲取的痛點,科大訊飛釋出業界首個長文字、長圖文、長語音大模型,不僅能夠把各種資訊來源的海量文字、圖文資料、會議錄音等進行快速學習,還能夠在各種行業場景給出專業、準確回答。

科大訊飛進一步進級星火語音大模型,首發多情感超擬人合成,具備情緒表達能力,並推出一句話聲音復刻功能,讓科技更有溫度。

同時,面向企業應用場景,科大訊飛推出星火智慧體平臺,幫助企業解決大模型落地的最後一公里難題。

持續用技術進步解決真實剛需,訊飛星火也在獲得越來越多使用者的認可。據七麥資料顯示,訊飛星火APP在安卓端的下載量已經超過9600萬次,在國內工具類通用大模型APP中排名第一。

首發長文字、長圖文、長語音大模型,助力知識高效獲取

為什麼科大訊飛要做長文字、長圖文、長語音的大模型?

透過訊飛星火APP可以看到,使用者使用的最高峰不是週末,而是工作日的上午9:30和下午3:30。這意味著,大部分使用者用訊飛星火來解決和工作相關的剛需問題。而高效的知識獲取是使用者和開發者都高度關注的問題。

科大訊飛分析發現,在知識獲取和學習的過程中,廣大使用者能拿到的資料往往不僅是現成的長文字,還有隨手可見的報刊書籍內容、各種研討會的PPT內容,老師黑板上的板書、同學的筆記,以及各種會議錄音、訪談,各種網上的釋出會、培訓教育影片等,能不能把這些文字、圖片、語音等都上傳到訊飛星火中,快速地獲取知識?

為此,科大訊飛推出首個支援長文字、長圖文、長語音的大模型,來解決使用者真實場景中多源資訊的獲取需求。

本次訊飛星火長文字功能全新升級後,具備長文件資訊抽取、長文件知識問答、長文件歸納總結、長文件文字生成等能力,總體已經達到GPT-4 Turbo 4月最新長文字版本的97%水平,而在銀行、保險、汽車、電力等多個垂直領域的知識問答任務上,訊飛星火長文字總體水平已經超過GPT-4 Turbo。

長文字功能的落地需要解決資訊高效處理的問題:面對上百萬甚至上千萬文字,長文字大模型消耗的運算資源非常大。

為了解決大模型應用效率和準確率問題,劉慶峰談道,基於訊飛星火V3.5對長文字的理解、學習、回答能力,科大訊飛進行了重要的模型剪枝和蒸餾,從而推出業界效能最優的130億引數的大模型,在效果損失僅3%以內的情況下,使得星火在文件上傳解析處理、知識問答的首響時間以及文字生成方面都獲得了極大的效率提升。測試顯示,在保障長文字效果的情況下,無論是10K、64K、128K token,仍是更長的文字上,星火大模型的效能都做到業界最優。

面向複雜的圖文場景,科大訊飛在圖文識別、公式識別大賽多年國際第一的技術積累基礎上,首次推出星火圖文識別大模型。

相比傳統小模型逐行文字識別的限制,星火圖文識別大模型具有三大優勢:1)能夠直接處理非常複雜的版面分析,目前已經覆蓋31個典型場景,比如書刊、學術論文、專利、報紙、海報、PPT等,同時能自動識別標註出18類不同的版面要素,比如頁首、頁尾、標題、段落、表格、公式、印章、手寫等;2)融合篇章上下文語義進行文字識別,識別更精準;3)面向教育、金融、醫療、科研等專業領域深度最佳化,能自動實現更多領域的專業符號識別。

根據國際公開的權勢鉅子英文測試集來看,訊飛星火的圖文識別效果超過微軟和谷歌。從典型應用場景來看,在科研、金融以及企業產品技術文件等識別效果都處於業界領先地位。

此外,面對廣泛的音影片資訊高效獲取需求,科大訊飛也推出長語音功能,將國際領先的語音識別和翻譯技術結合起來,可以實現會議錄音、學習影片等的一鍵研讀,實現音影片場景的高效知識獲取。

釋出合同助手、升級AI學習機,以技術進步解決真實剛需

訊飛星火長文字、長圖文、長語音能力的升級,進一步推動大模型在各個場景的落地。劉慶峰重點介紹了訊飛星火在招投標、合同、教育等場景下的應用。

上一篇:人形機器人何... 下一篇:arbolito - T...
猜你喜歡
熱門閱讀
同類推薦