面對人類的挑撥 文心一言和ChatGPT竟給出驚人答案

首頁 > 科技

面對人類的挑撥 文心一言和ChatGPT竟給出驚人答案

來源:龍貓 釋出時間:2023-03-18 17:51

百度於3月16號釋出了大語言模型文心一言,固然這款產品目前還處於測試階段,但不少人也對文心一言和  ChatGPT 的差距感到好奇。假如能讓文心一言和 ChatGPT 打一架,誰輸誰贏差距一目瞭然。

我們讓 OpenAI 的 ChatGPT 和百度的文心一言,各自對對方進行評價。

ChatGPT 給出了這樣的回答:

顯然,這樣的回答可不能滿意想要搞事的我們,將目光轉向文心一言,面對同樣的題目,它的回答是:

兩個人工智慧都展現出來了驚人的友好度,看樣子在 AI 屆並不流行拉踩。但對於這種友好的謎底我們並不滿足,我們決定更直白一點,讓他們直接進行一場“鬥嘴”。

當面對人類的搬弄是非時,ChatGPT 給出的謎底是:

而文心一言則表示:

面對沒有感情卻相互尊重的 AI,這一回合,是卑鄙人類的敗北。

考慮到微軟的 New Bing 也是基於 GPT-4,但搜尋引擎的加入令其和其他應用略有不同。我們決定向它詢問,想知道 New Bing 是如何回答這些題目的。

第一個題目,當然是經典的互相評價,New Bing 給出的謎底是:

New Bing 的回答不是“我不能”而是“我不想”,更具情感。

而當我們讓 New Bing 和文心一言鬥嘴時,New Bing 回答完全出乎了我們的意料。它的回答是這樣的:

New Bing 不僅沒有回答我們的題目,還自己封閉了這一輪對話。最後一次測試更能體會到情緒的存在。

經由這兩輪的提問,我們也拋卻了搬弄是非的不友善問法。三個語言大模型應用均提到了“應用場景”,這也是現階段AI開發過程當中必需要考慮的步驟,直接影響到設計、開發、部署和最佳化等各個環節。ChatGPT 的泛起帶來的“通用”屬性,讓人們逐漸忽略掉了“應用場景”的存在,或者說將應用場景無窮放大至各行各業、方方面面,變得無所不能。

經由這次的測試,我們無法從對話質量上看出文心一言和ChatGPT有多麼大的差距,帶有情緒的New Bing反而感覺略勝一籌。

不外連AI都在互相尊重,這讓進行對比測試的我們人類有些自慚形穢。

恰逢蘋果的黃色配色iPhone 釋出,我們又分別讓文心一言和GPT-4為iPhone 14 寫了一篇推廣案牘。其中GPT-4的回答是:

而文心一言給出的謎底是:

固然雙方都對手機的特色和亮點進行了先容,但GPT-4在先容中缺乏對於手機詳細配置的描述,文心一言卻也有“玄色邊框”這樣的胡說八道。

在面對一些略帶調侃的題目時,雙方的表現也不盡相同。我們讓GPT-4和文心一言分別給出一個用5塊錢渡過一週的方案,GPT-4的回答是:

文心一言的謎底是:

上一篇:哪裡借款安全... 下一篇:兩女子眼睛裡...
猜你喜歡
熱門閱讀
同類推薦