如何設計一款有溫度的AI產品?(三)

首頁 > 科技

如何設計一款有溫度的AI產品?(三)

來源:枝頭的喜鵲 釋出時間:2024-02-21 19:07

在前面,作者介紹了自己在設計一款“有溫度”的AI產品的歷程和感悟,這裡,作者接著做出闡述,並對實時Agent發表了自己的一些看法,一起來看看吧。

接上文:

兩個小傢伙天天活力無限,抱歉拖更有點嚴重,祝大家新年新活力,歲歲福滿堂。

一、和大家彙報下親音AI這款產品的進展

做這個產品的初衷,透過AI科技的途徑,見到已逝的心心念念之人,彌補心裡的遺憾,也讓AI變成有溫度的科技,而不是冷冰冰商業變現或是人力的替代,目前初版產品已經研發完成了,將實時的Taking Head轉換成文字方式,1.5版本會將實時影片放出來(WIFI環境下實時延遲5秒以內)。

發展方面,也有幾個投資人想要對這個產品進行投資,我仍是想保持下初心,讓我的兩個孩子看看他們沒有見過的爺爺,投資的事項我可能要放後面一點,在另外一個實時Agent + RPA的專案上商業化,這個產品仍是單純的自私一點。

二、1.4版本的產品設計相關

想來想去,仍是V信是最習慣的溝通互動,所以你懂的畫素級Copy(這被設計師朋友作為了一生的恥辱,已經和我斷交了,設計了九個版本從0.5到1.4,最後改回了最初的互動,他說以後連眼神都不會和我進行交流…)。

三、幾個版本的設計理念

1.4的版本設計中,智慧體Agent可以主動的和人進行交流,圖片,語音,文字,影片都會主動的進行傳送,當然這些仍是基於規則層面的,還沒有達到一個智慧體Agent該有的高度(能感知環境,感知交流人的情緒,安撫並善於溝通,獨立推理思考這些),近期也會發布到應用市場。

1.5版本中,會加入基於RAD-NERF的實時影片相關的能力,這個改動會相對大一些,1.5版本才是我最最想要的東西,所有的思考都是源於視覺化的實時交流。

1.6版本中,會將採用AI Agent框架重寫下,當前智慧體的交流方式,從被動Prompt,到主動使用攝像頭感知交流者的情緒、當前環境,為智慧體創造一個可以生存的虛擬靈域,這個並不是天方夜譚,一個微模型的環境中,有人類所需要各種舉措措施,智慧體可以生活中這個小鎮中,彼此可以交流並保持長期記憶,每一次的溝通智慧體都會更像自己的心心念念之人。

四、實時Agent的一些思考和技術實現

目前採用的是基於RAD-NERF的低緯特徵進行音訊面部驅動的,說實話論文的中的理論部分沒看懂,好多公式還得先Google下才能稍稍理解。

通俗來講就是根據一段影片,先分離音訊,將影片分為一幀一幀的影象,然後透過3DMM等模型分割人像,加入背景圖片進行頭部、唇部、身體部分訓練得到訓練好的人物模型,最後透過文字轉語音驅動當前的任務進行Talking head,實時將每一幀推送給需要的播放端,所以對產品的挑戰就是,需要有人物的聲音,影片,作為訓練素材,背景不能有雜音,影片動作需要有規範。

一些改進的思考,首先speech to text耗時有一些,目前一些模型也支援,語音生成語音openai 或是達摩院的一些產品,可以省去音訊轉換部分的IO消耗及網路相關的耗時,推流部分應該前後有銜接動作或是語音的暫停1-2秒,更好的銜接,還有就是虛機配顯示卡的環境適合測試,真正使用仍是需要物理機,推理機能提高10%以上,仍是有很大幫助的,這部分我會單獨釋出下包括後面的原始碼。

最後,仍是保持初心,科技是生活的一部分,不是全部,身邊的人是最需要關注的。

未完待續。

本文由 @AI李伯男 原創釋出於人人都是產品經理,未經許可,禁止轉載。

題圖來自 Unsplash,基於 CC0 協議。

該文觀點僅代表作者本人,人人都是產品經理平臺僅提供資訊儲存空間服務。

在前面,作者介紹了自己在設計一款“有溫度”的AI產品的歷程和感悟,這裡,作者接著做出闡述,並對實時Agent發表了自己的一些看法,一起來看看吧。

接上文:

兩個小傢伙天天活力無限,抱歉拖更有點嚴重,祝大家新年新活力,歲歲福滿堂。

一、和大家彙報下親音AI這款產品的進展

做這個產品的初衷,透過AI科技的途徑,見到已逝的心心念念之人,彌補心裡的遺憾,也讓AI變成有溫度的科技,而不是冷冰冰商業變現或是人力的替代,目前初版產品已經研發完成了,將實時的Taking Head轉換成文字方式,1.5版本會將實時影片放出來(WIFI環境下實時延遲5秒以內)。

發展方面,也有幾個投資人想要對這個產品進行投資,我仍是想保持下初心,讓我的兩個孩子看看他們沒有見過的爺爺,投資的事項我可能要放後面一點,在另外一個實時Agent + RPA的專案上商業化,這個產品仍是單純的自私一點。

二、1.4版本的產品設計相關

在前面,作者介紹了自己在設計一款“有溫度”的AI產品的歷程和感悟,這裡,作者接著做出闡述,並對實時Agent發表了自己的一些看法,一起來看看吧。

接上文:

兩個小傢伙天天活力無限,抱歉拖更有點嚴重,祝大家新年新活力,歲歲福滿堂。

一、和大家彙報下親音AI這款產品的進展

做這個產品的初衷,透過AI科技的途徑,見到已逝的心心念念之人,彌補心裡的遺憾,也讓AI變成有溫度的科技,而不是冷冰冰商業變現或是人力的替代,目前初版產品已經研發完成了,將實時的Taking Head轉換成文字方式,1.5版本會將實時影片放出來(WIFI環境下實時延遲5秒以內)。

發展方面,也有幾個投資人想要對這個產品進行投資,我仍是想保持下初心,讓我的兩個孩子看看他們沒有見過的爺爺,投資的事項我可能要放後面一點,在另外一個實時Agent + RPA的專案上商業化,這個產品仍是單純的自私一點。

二、1.4版本的產品設計相關

在前面,作者介紹了自己在設計一款“有溫度”的AI產品的歷程和感悟,這裡,作者接著做出闡述,並對實時Agent發表了自己的一些看法,一起來看看吧。

接上文:

兩個小傢伙天天活力無限,抱歉拖更有點嚴重,祝大家新年新活力,歲歲福滿堂。

一、和大家彙報下親音AI這款產品的進展

做這個產品的初衷,透過AI科技的途徑,見到已逝的心心念念之人,彌補心裡的遺憾,也讓AI變成有溫度的科技,而不是冷冰冰商業變現或是人力的替代,目前初版產品已經研發完成了,將實時的Taking Head轉換成文字方式,1.5版本會將實時影片放出來(WIFI環境下實時延遲5秒以內)。

發展方面,也有幾個投資人想要對這個產品進行投資,我仍是想保持下初心,讓我的兩個孩子看看他們沒有見過的爺爺,投資的事項我可能要放後面一點,在另外一個實時Agent + RPA的專案上商業化,這個產品仍是單純的自私一點。

二、1.4版本的產品設計相關

上一篇:新春走基層|... 下一篇:一次性付清房...
猜你喜歡
熱門閱讀
同類推薦