首位AI工程師上線!透過面試搶程式設計師飯碗,華人創始團隊手握10塊IOI金牌

首頁 > 科技

首位AI工程師上線!透過面試搶程式設計師飯碗,華人創始團隊手握10塊IOI金牌

來源:靜默如初 釋出時間:2024-03-13 16:56

首位AI工程師上線!透過面試搶程式設計師飯碗,華人創始團隊手握10塊IOI金牌

機器之心報道

機器之心編輯部

前段時間,英偉達 CEO 黃院士發出驚人言論:「都別學程式設計了,以後交給 AI 就行了,以後人人都是軟體工程師。」當時還有很多人反對,說「AI 永遠不會取代程式設計師。」沒想到,首個人工智慧軟體工程師 Devin 一發布,程式設計師的飯碗可能真要被 AI 端走了。

在 SWE-Bench 基礎測試中,無需人類協助,Devin 就可以解決 13.86% 的問題。而目前的 SOTA 模型,在沒有人類幫忙的情況下,只能完成 1.96% 的任務。

僅從評測結果看,Devin 解決真實世界軟體問題的能力要遠好於當前的 GPT-4 和 Claude 等模型。

官方發的推特說,Devin 不僅通過了一家業內領先的人工智慧公司的面試,在自由職業平臺 Upwork 上也能成功接單,完成單主要求的工作。也就是說,Devin 不僅是橫掃基礎測試的「做題家」,在就業市場裡也有人為它的工作能力買賬。

難道繼 Sora 讓「現實世界」不存在了之後,Devin 也要讓「軟體工程」不存在了嗎?

Devin 現在還未對外開放,但已經有開發人員和產品人員用上了。測試過的網友表示,以前一直用人工智慧輔助編碼,但一直失敗。直到昨天,他給 Devin 了一個簡單的 HTML 頁面,讓它提取選擇器,這個 GPT-4-turbo 、Claude、Groq 、LLama2 都沒完成的任務,Devin 只用了大約 10 秒就搞定了。

源自 https://news.ycombinator.com/item?id=39679787

Devin 的評論區的畫風,也是哀嚎一片:

當然,對這種說法,也有網友並不買賬,認為這是誇大宣傳。

所以,這位來搶程式設計師「飯碗」的 AI 軟體工程師的本事到底有多大呢?

首位 AI 軟體工程師

真要搶程式設計師飯碗?

要知道,雖然現在市面上的一系列大模型都有程式設計能力,但大多數都採用了單行程式碼補全或者單個函式生成的方式。想生成完整的程式,還需要設計 prompt 逐步「調教」。

而對 Devin 來說,你只需要向它提要求,坐等其成就可以了。

Devin 配備了包括 shell、程式碼編輯器和瀏覽器在內的常見開發工具,這些都在一個沙盒化的計算環境中 —— 這些都是人類軟體工程師完成工作所需的一切。

根據自然語言提示自動寫程式碼、生成完整的程式並上線只是 Devin 的基操,它可以自動規劃並執行需要數千個決策的複雜任務。

例如請它在幾個不同的 API 上對 Llama 的表現進行基礎測試,它首先制定了一個逐步解決問題的計劃:

上一篇:信用卡沒有逾... 下一篇:Firebender -...
猜你喜歡
熱門閱讀
同類推薦