TikTok 的 Boximator 將影片合成技術推向新高度

字節跳動旗下的 TikTok 推出 Boximator,這是一款突破性的人工智能工具,以前所未有的動作控制能力革新了影片合成技術,為創作者提供了新的方式來實現他們的願景。

Mona Jones
更新時間:2024年08月06日
目錄

    介紹 Boximator:AI 影片合成的遊戲規則改變者

    在 AI 驅動的影片創作領域取得重大進展,ByteDanceTikTok 的母公司)推出了 Boximator – 一款革命性工具,承諾將改變影片合成的格局。這項創新技術解決了 AI 生成媒體中最持久的挑戰之一:對物體運動和軌跡的精確控制。

    TikTok's Boximator

    Boximator 如何運作

    Boximator 通過直觀的框限制引入了影片操作的新方法。以下是它的運作方式:

     Boximator AI

    1.框限制用戶可以使用兩種類型的框來定義物體並控制它們在幀之間的移動:

    • 硬框:代表關鍵幀中物體及其精確位置/形狀
    • 軟框:定義實體可以隨時間靈活移動的寬鬆區域

    2.運動推斷在沒有用戶定義框的幀中,Boximator 智能地推斷近似運動路徑,使用算法生成的軟框作為指導。

    3.物體追蹤每個框都與唯一的物體 ID 相關聯,允許多個物體隨時間單獨追蹤和操作。

    4.插值和約束放鬆這些技術用於實現可控yet自然的動畫效果,在靈活性和穩定性之間取得平衡。

    AI video synthesis

    自監督預訓練:成功的關鍵

    Boximator 的效果源於其創新的自監督預訓練方法:

    • 模型在每一幀中生成物體周圍的可見邊界框。
    • 這將複雜任務分解為更簡單的子任務:分別檢測物體和控制框的運動。
    • 預訓練完成後,生成的框被移除,留下強大的空間-時間推理能力,專為運動控制而調整。

    motion control

    Boximator 與現有方法的比較

    Boximator 相比之前的運動控制方法有幾個優勢:

    Boximator vs. Existing Methods

    1.視覺基礎:使用視覺基礎的框進行物體選擇和運動控制,避免了冗長的文本描述需求。

    2.最先進的性能:在實證研究中達到優越的影片質量分數,超越了兩個基礎模型。

    3.增強用戶體驗:用戶評估顯示,相比基礎模型產生的結果,用戶更偏好 Boximator 生成的結果。

    4.多功能性:作為現有影片生成器模型(如 PixelDance 和 ModelScope)的插件,保留了它們的功能,同時增加了前所未有的控制能力。

    對創作者和 AI 行業的影響

    Boximator 的推出標誌著 AI 驅動的影片創作工具演進的重要里程碑。它的潛在應用跨越多個行業:

    • 內容創作:賦予創作者對影片元素精確控制的能力,實現更複雜和視覺吸引力的內容。
    • 電影和動畫:為電影和動畫行業的分鏡和預視化提供新的可能性。
    • 市場營銷和廣告:能夠為營銷活動創建高度定制和吸引人的影片內容。
    • 教育:促進動態教育內容的製作,精確控制視覺元素。

     generative AI

    隨著 AI 持續重塑創意領域,像 Boximator 這樣的工具將在民主化高質量影片製作中發揮關鍵作用。以前所未有的精確度和便利性操縱和控制運動的能力,為創意和表達開闢了新的途徑。

    對於那些有興趣站在 AI 進步前沿並探索像 Boximator 這樣尖端工具的人,請訪問 AIPURE 以獲取有關最新 AI 技術及其在各行業應用的更多信息。

    輕鬆找到最適合您的AI 工具
    立即查詢
    產品資訊完整
    多元選擇
    豐富詳盡