陳根:Bing搶先ChatGPT釋出的識圖功能

首頁 > 科技

陳根:Bing搶先ChatGPT釋出的識圖功能

來源:NG影片 釋出時間:2023-06-19 11:20

文/陳根

微軟靜靜上新了。日前,有網友發現自己的Bing Chat賬號新增了一個上傳圖片的進口。根據使用者上傳的圖片,Bing Chat就能識圖回答問題。

早在3月份,OpenAI在釋出GPT-4時,特別提出了GPT-4較GPT-3.5最大的亮點是影象輸入功能,即GPT-4支援圖片輸入,可以看懂梗圖、看懂物理題,還能看懂論文。不外當時,該多模態功能尚處於研究預覽階段,還不能公然。

如今,微軟好像要搶先ChatGPT一步釋出識圖功能。在上個月Bing的大更新日誌中,微軟就提到了會為使用GPT-4模型的Bing Chat加入多模態支援。

那麼,“長了眼睛”的Bing Chat到底是怎麼樣的呢?

首先,針對看梗圖功能,Bing Chat根據網友上傳的一幅關於機器學習的梗圖漫畫,或者一張在汽車上燙衣服的梗圖,就能正確地答出圖中的內容和笑點,基本上可以說是Get到了點位。其次,在識圖精確度的評測方面,網友上傳了《任天堂大亂鬥》遊戲的角色圖,同一張圖上有排列著非常多的角色,Bing Chat對其進行了逐一辨認後,從12個角色中認出了7個。結果而論,Bing Chat在二次元問題上還有待進一步晉升。再者,在根據手繪圖程式設計網頁方面,Bing Chat對於網友給出的手畫“試題”,基本能夠搭出網頁的雛形。

在大語言模型進級的過程中,在文字理解和表達能力的基礎上,學習了視覺識別後的Bing Chat將具有更多的功能,給人類的使用帶來更大的利便。而曾經一些難以用語言表達的內容,現在都可以透過圖片進行解決。甚至,具備了影象識別功能的AI還可以在教育、醫療等領域施展更大的作用和價值。好比,在教育領域,Bing Chat 將可以擔任一個初高中乃至大學老師的角色,匡助學生解答覆雜的數理化問題。這將在很大程度上解決教育資源不均衡的問題。在醫療領域,使用者還可以用它做基礎的醫療診斷,節約就醫所需要的金錢和時間。AI應用在社會餬口中的價值將由此得到最大化的實現。

由Bing Chat帶來的遠景功能,無疑令人興奮的。但是,從目前的小範圍測試功能到完全向公家開放識圖功能,確保公家不會由於誤信Bing Chat的回答而泛起安全問題,微軟還需要做大量的限制和除錯,可謂任重道遠。

文/陳根

微軟靜靜上新了。日前,有網友發現自己的Bing Chat賬號新增了一個上傳圖片的進口。根據使用者上傳的圖片,Bing Chat就能識圖回答問題。

早在3月份,OpenAI在釋出GPT-4時,特別提出了GPT-4較GPT-3.5最大的亮點是影象輸入功能,即GPT-4支援圖片輸入,可以看懂梗圖、看懂物理題,還能看懂論文。不外當時,該多模態功能尚處於研究預覽階段,還不能公然。

如今,微軟好像要搶先ChatGPT一步釋出識圖功能。在上個月Bing的大更新日誌中,微軟就提到了會為使用GPT-4模型的Bing Chat加入多模態支援。

那麼,“長了眼睛”的Bing Chat到底是怎麼樣的呢?

首先,針對看梗圖功能,Bing Chat根據網友上傳的一幅關於機器學習的梗圖漫畫,或者一張在汽車上燙衣服的梗圖,就能正確地答出圖中的內容和笑點,基本上可以說是Get到了點位。其次,在識圖精確度的評測方面,網友上傳了《任天堂大亂鬥》遊戲的角色圖,同一張圖上有排列著非常多的角色,Bing Chat對其進行了逐一辨認後,從12個角色中認出了7個。結果而論,Bing Chat在二次元問題上還有待進一步晉升。再者,在根據手繪圖程式設計網頁方面,Bing Chat對於網友給出的手畫“試題”,基本能夠搭出網頁的雛形。

在大語言模型進級的過程中,在文字理解和表達能力的基礎上,學習了視覺識別後的Bing Chat將具有更多的功能,給人類的使用帶來更大的利便。而曾經一些難以用語言表達的內容,現在都可以透過圖片進行解決。甚至,具備了影象識別功能的AI還可以在教育、醫療等領域施展更大的作用和價值。好比,在教育領域,Bing Chat 將可以擔任一個初高中乃至大學老師的角色,匡助學生解答覆雜的數理化問題。這將在很大程度上解決教育資源不均衡的問題。在醫療領域,使用者還可以用它做基礎的醫療診斷,節約就醫所需要的金錢和時間。AI應用在社會餬口中的價值將由此得到最大化的實現。

由Bing Chat帶來的遠景功能,無疑令人興奮的。但是,從目前的小範圍測試功能到完全向公家開放識圖功能,確保公家不會由於誤信Bing Chat的回答而泛起安全問題,微軟還需要做大量的限制和除錯,可謂任重道遠。

文/陳根

微軟靜靜上新了。日前,有網友發現自己的Bing Chat賬號新增了一個上傳圖片的進口。根據使用者上傳的圖片,Bing Chat就能識圖回答問題。

早在3月份,OpenAI在釋出GPT-4時,特別提出了GPT-4較GPT-3.5最大的亮點是影象輸入功能,即GPT-4支援圖片輸入,可以看懂梗圖、看懂物理題,還能看懂論文。不外當時,該多模態功能尚處於研究預覽階段,還不能公然。

如今,微軟好像要搶先ChatGPT一步釋出識圖功能。在上個月Bing的大更新日誌中,微軟就提到了會為使用GPT-4模型的Bing Chat加入多模態支援。

那麼,“長了眼睛”的Bing Chat到底是怎麼樣的呢?

首先,針對看梗圖功能,Bing Chat根據網友上傳的一幅關於機器學習的梗圖漫畫,或者一張在汽車上燙衣服的梗圖,就能正確地答出圖中的內容和笑點,基本上可以說是Get到了點位。其次,在識圖精確度的評測方面,網友上傳了《任天堂大亂鬥》遊戲的角色圖,同一張圖上有排列著非常多的角色,Bing Chat對其進行了逐一辨認後,從12個角色中認出了7個。結果而論,Bing Chat在二次元問題上還有待進一步晉升。再者,在根據手繪圖程式設計網頁方面,Bing Chat對於網友給出的手畫“試題”,基本能夠搭出網頁的雛形。

在大語言模型進級的過程中,在文字理解和表達能力的基礎上,學習了視覺識別後的Bing Chat將具有更多的功能,給人類的使用帶來更大的利便。而曾經一些難以用語言表達的內容,現在都可以透過圖片進行解決。甚至,具備了影象識別功能的AI還可以在教育、醫療等領域施展更大的作用和價值。好比,在教育領域,Bing Chat 將可以擔任一個初高中乃至大學老師的角色,匡助學生解答覆雜的數理化問題。這將在很大程度上解決教育資源不均衡的問題。在醫療領域,使用者還可以用它做基礎的醫療診斷,節約就醫所需要的金錢和時間。AI應用在社會餬口中的價值將由此得到最大化的實現。

由Bing Chat帶來的遠景功能,無疑令人興奮的。但是,從目前的小範圍測試功能到完全向公家開放識圖功能,確保公家不會由於誤信Bing Chat的回答而泛起安全問題,微軟還需要做大量的限制和除錯,可謂任重道遠。

文/陳根

微軟靜靜上新了。日前,有網友發現自己的Bing Chat賬號新增了一個上傳圖片的進口。根據使用者上傳的圖片,Bing Chat就能識圖回答問題。

早在3月份,OpenAI在釋出GPT-4時,特別提出了GPT-4較GPT-3.5最大的亮點是影象輸入功能,即GPT-4支援圖片輸入,可以看懂梗圖、看懂物理題,還能看懂論文。不外當時,該多模態功能尚處於研究預覽階段,還不能公然。

如今,微軟好像要搶先ChatGPT一步釋出識圖功能。在上個月Bing的大更新日誌中,微軟就提到了會為使用GPT-4模型的Bing Chat加入多模態支援。

那麼,“長了眼睛”的Bing Chat到底是怎麼樣的呢?

首先,針對看梗圖功能,Bing Chat根據網友上傳的一幅關於機器學習的梗圖漫畫,或者一張在汽車上燙衣服的梗圖,就能正確地答出圖中的內容和笑點,基本上可以說是Get到了點位。其次,在識圖精確度的評測方面,網友上傳了《任天堂大亂鬥》遊戲的角色圖,同一張圖上有排列著非常多的角色,Bing Chat對其進行了逐一辨認後,從12個角色中認出了7個。結果而論,Bing Chat在二次元問題上還有待進一步晉升。再者,在根據手繪圖程式設計網頁方面,Bing Chat對於網友給出的手畫“試題”,基本能夠搭出網頁的雛形。

在大語言模型進級的過程中,在文字理解和表達能力的基礎上,學習了視覺識別後的Bing Chat將具有更多的功能,給人類的使用帶來更大的利便。而曾經一些難以用語言表達的內容,現在都可以透過圖片進行解決。甚至,具備了影象識別功能的AI還可以在教育、醫療等領域施展更大的作用和價值。好比,在教育領域,Bing Chat 將可以擔任一個初高中乃至大學老師的角色,匡助學生解答覆雜的數理化問題。這將在很大程度上解決教育資源不均衡的問題。在醫療領域,使用者還可以用它做基礎的醫療診斷,節約就醫所需要的金錢和時間。AI應用在社會餬口中的價值將由此得到最大化的實現。

由Bing Chat帶來的遠景功能,無疑令人興奮的。但是,從目前的小範圍測試功能到完全向公家開放識圖功能,確保公家不會由於誤信Bing Chat的回答而泛起安全問題,微軟還需要做大量的限制和除錯,可謂任重道遠。

文/陳根

微軟靜靜上新了。日前,有網友發現自己的Bing Chat賬號新增了一個上傳圖片的進口。根據使用者上傳的圖片,Bing Chat就能識圖回答問題。

早在3月份,OpenAI在釋出GPT-4時,特別提出了GPT-4較GPT-3.5最大的亮點是影象輸入功能,即GPT-4支援圖片輸入,可以看懂梗圖、看懂物理題,還能看懂論文。不外當時,該多模態功能尚處於研究預覽階段,還不能公然。

如今,微軟好像要搶先ChatGPT一步釋出識圖功能。在上個月Bing的大更新日誌中,微軟就提到了會為使用GPT-4模型的Bing Chat加入多模態支援。

那麼,“長了眼睛”的Bing Chat到底是怎麼樣的呢?

首先,針對看梗圖功能,Bing Chat根據網友上傳的一幅關於機器學習的梗圖漫畫,或者一張在汽車上燙衣服的梗圖,就能正確地答出圖中的內容和笑點,基本上可以說是Get到了點位。其次,在識圖精確度的評測方面,網友上傳了《任天堂大亂鬥》遊戲的角色圖,同一張圖上有排列著非常多的角色,Bing Chat對其進行了逐一辨認後,從12個角色中認出了7個。結果而論,Bing Chat在二次元問題上還有待進一步晉升。再者,在根據手繪圖程式設計網頁方面,Bing Chat對於網友給出的手畫“試題”,基本能夠搭出網頁的雛形。

在大語言模型進級的過程中,在文字理解和表達能力的基礎上,學習了視覺識別後的Bing Chat將具有更多的功能,給人類的使用帶來更大的利便。而曾經一些難以用語言表達的內容,現在都可以透過圖片進行解決。甚至,具備了影象識別功能的AI還可以在教育、醫療等領域施展更大的作用和價值。好比,在教育領域,Bing Chat 將可以擔任一個初高中乃至大學老師的角色,匡助學生解答覆雜的數理化問題。這將在很大程度上解決教育資源不均衡的問題。在醫療領域,使用者還可以用它做基礎的醫療診斷,節約就醫所需要的金錢和時間。AI應用在社會餬口中的價值將由此得到最大化的實現。

由Bing Chat帶來的遠景功能,無疑令人興奮的。但是,從目前的小範圍測試功能到完全向公家開放識圖功能,確保公家不會由於誤信Bing Chat的回答而泛起安全問題,微軟還需要做大量的限制和除錯,可謂任重道遠。

上一篇:銀行存款準備... 下一篇:浙江膠輥廠家...
猜你喜歡
熱門閱讀
同類推薦