✍️ Gate 廣場「創作者認證激勵計劃」進行中!
我們歡迎優質創作者積極創作,申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵!
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟:
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面,等待審核
讓優質內容被更多人看到,一起共建創作者社區!
活動詳情:https://www.gate.com/announcements/article/47889
Netflix 公布 VOID:一個用於物理一致性視頻物體移除的開源框架
簡介
Netflix 已發布 VOID,這是一個開源的 AI 框架,能在移除影片中的物體的同時保留逼真的物理互動,提供了比傳統修補(inpainting)工具更進階的選擇,適用於專業影片製作。
從歷史上看,從場景中移除物體一直很簡單,但確保移除後環境能夠真實地運作,卻帶來了重大挑戰。舉例來說,刪除正拿著吉他的人的同時,樂器可能會以不自然的方式懸在空中;而從泳池中移除一名潛水員,則可能導致水面沒有受到影響。以往的視覺特效團隊通常會手動修正這些問題,這是耗時的流程,單一鏡頭可能需要數天到數週。
VOID(Video Object and Interaction Deletion 的縮寫)意在解決這些複雜情況。不同於傳統方法僅僅填補缺失像素,該系統會在物體移除後,預測場景中符合物理一致性的結果
它運用多種技術的組合來達成目標。Google 的 Gemini 會分析場景,以辨識刪除後會受到影響的區域,而 Meta 的 SAM2 則會分割出需要移除的物體。這些輸出會被編碼成 quadmask(一個四值地圖),用來指示要刪除哪些區域、哪些區域彼此重疊、哪些區域受到物理影響,以及哪些區域保持不變。建立在 Alibaba 的 CogVideoX 之上的影片擴散模型,會以物理上可信的方式重建場景。可選的第二次處理會套用光流(optical flow),用以修正初次重建造成的任何變形。
在影片製作中示範符合物理一致性的物體移除
VOID 的示範呈現出令人印象深刻的成果:移除握持者後,氣球能自然上升;刪除與之無關的積木後,積木能維持穩定;而當人物被抹除後,泳池表面不受影響。在一項包含 25 位參與者的人類偏好研究中,VOID 以 64.8% 的時間獲得偏好,表現優於 Runway(一個領先的商業替代方案),其僅達到 18.4%。