LiarLiar.ai 是一項突破性的 AI 虛假檢測技術,將心理學方法與先進的計算機視覺相結合,旨在實時辨別真實性並識別潛在的欺騙行為。
VoxelGPT 是一個針對 FiftyOne 的開源外掛,將您的自然語言提示轉化為組織和探索影象、影片和三維點雲資料的操作。
Meta AI 最近釋出了一種新的 AI 模型,名為 Segment Anything Model (SAM)。這個模型能夠在任何影象中“剪下”出任何物件,只需單擊一次。
近日,Hugging Face 釋出了一種新的模型,名為 SegGPT,該模型可以透過上下文推斷執行影象或影片中的任意分割任務,例如物件例項、物品、部分、輪廓和文字等,只需要一個單一的模型。這種模型的訓練資料來自多個數據集,包括 COCO、ADE20K、Cityscapes 和 TextVQA 等。在測試中,SegGPT 透過在推理時利用上下文資訊,取得了一系列顯著的成果。
最近,研究人員透過一項名為 SceneDreamer 的新方法,實現了從 2D 影象集合生成無限制 3D 場景,該方法能夠跨不同風格合成多樣化的景觀,具有 3D 一致性、明確的深度和自由相機軌跡。
DINOv2 是一個基於 PyTorch 實現的無監督學習演算法,用於學習穩健的視覺特徵。該演算法在沒有使用任何標籤或註釋的情況下,對包含 142M 張影象的資料集進行了預訓練。DINOv2 模型產生的視覺特徵具有高效能和穩健性,並且可以直接與簡單的分類器(例如線性層)結合使用,用於各種計算機視覺任務,而無需進行微調。
Mini GPT-4 是一個基於 PyTorch 實現的小型自然語言處理模型,使用類似於 GPT-3 的架構,但引數數量只有 GPT-3 的一小部分。Mini GPT-4 在多個自然語言處理任務上表現出色,包括語言建模、文字生成和問答系統等。
近日,來自 CVPR 2023 的一組研究人員釋出了他們的最新研究成果——SadTalker。這是一種學習逼真的三維運動係數,為風格化音訊驅動的單張影象說話人動畫提供支援的技術。