安定した動画拡散がやってきた! 普通の人が大ヒット作を作ろうとすぐそこまで来ています

著者: シャオ・ヤン

テクノロジーの継続的な進歩に伴い、AIの分野では大きなブレークスルーがありました。 特に画像生成の分野では、AIがここまでできることは想像を超えています。 おそらくほんの1年前までは、多くの人、特に一部のプロの実務家は、まだ「要素をつなぎ合わせる必要がある」、「廃棄物率が高すぎる」、「完成品を直接使用できない」などの分野でAIペインティングの印象を持っていましたが、今では、高品質のAI描画ソフトウェアのパフォーマンスが、あなたの本来の認知を完全に覆す可能性があります。

Stable Diffusionはその最たる例です。 Stable Diffusionで完成したAI描画は、人体の姿勢や絵の重なりを正確に表現できるだけでなく、複雑な立体構造を持ち、ユーザーは画像の細部を調整することができます。

今日、Stable Diffusionの公式Stability AIはさらに進化しました。 AIペインティングの分野に秀でているだけでなく、強力な3D合成機能を備えているだけでなく、ビデオ制作に大きな変化をもたらすことができるStable Video Diffusionも発売しました。 つまり、その登場によって動画撮影の敷居が大幅に下がり、一般の人でも簡単に大ヒット作を撮影できるようになりました。

**安定したビデオ拡散とは何ですか?

Stable Video Diffusionは、現実のシーンと仮想オブジェクトを完全にブレンドして非常にリアルな効果を得ることができる高度なビデオ合成技術です。 この手法は、映画制作、ゲーム開発、広告クリエイティビティなど、多くの分野に適用できるため、ビデオ制作により多くの可能性と創造性をもたらします。

従来のビデオ合成技術と比較して、Stable Video Diffusionの最大の利点は、明らかに手頃な価格であることです。 まず「Wumart」についてお話ししましょう、というのも、AIソフト自体がディープラーニングの手法を使って大量のデータを学習させ、合成された映像をよりリアルで自然なものにしているのです。 同時に、このAI技術は、オブジェクトの質感、光と影などの細部の完璧な復元も実現でき、非常にリアルであると言えます。 「安価」といえば、これまで多くの人手や物的資源を要していた映像制作が、今ではStable Video Diffusionだけで済むようになり、コストが大幅に削減されるようになったのかもしれません。

Stable Video Diffusionのもう一つの重要な特徴は、3Dで合成できることです。 このテクノロジーにより、プロデューサーは、現実世界のオブジェクトを仮想セットに移動したり、複数の仮想オブジェクトを組み合わせたりするなど、魔法のようなシーンや効果を作成できます。 これにより、映画制作のクリエイティブな空間と可能性が広がります。

映画制作やゲーム開発に加えて、Stable Video Diffusionはクリエイティブな世界で重要な役割を果たす可能性を秘めています。 広告主は、このテクノロジーを使用して、消費者の注意を引くさまざまなユニークなシーンや効果を作成できます。

**3D合成が注目され、ネチズンは「進歩が速すぎる!」と言っています。

Stable Video Diffusionの公式サイトでStability AIが表示した情報によると、新しいSVD(略称)はテキストからビデオ、画像からビデオへの生成をサポートし、単一の視点から複数のビューへのオブジェクトの変換をサポートし、誰もが期待する3D合成です。

Stable Video Diffusionはこれまで基本モデルしかリリースしていませんが、外部から広く注目され、賞賛されており、ネットユーザーからは概して「進歩が速すぎる」と言われました。 公式には、「Stable Diffusionと同様のエコシステムを拡大し、構築し続ける計画が進行中」です。 しかし、公式にリリースされたデモについては、多くのネチズンはそれが素晴らしいとは思っておらず、光と影が間違っている、フレーム間のちらつきがあるなどの欠陥があるとさえ考えています。

以下は公式デモですので、ご自身で感じてみましょう。

現在、Stable Video Diffusionの紙コードウェイトが発売されています。 イントロダクションによると、SVDはStable Diffusion 2.1をベースとしており、約6億サンプルの動画データセットを使って基本モデルの事前学習を行うとのこと。 マルチビューデータセットの微調整による単一の画像からのマルチビュー合成など、さまざまなダウンストリームタスクに簡単に適応できます。

なお、Stability AIは、Stable Video Diffusionは研究に限定されており、実用的または商業的な用途には適していないと公式に述べている。 したがって、大規模に適用される条件はまだありません。 しかし、公式のウェイティングリスト登録が開始されたため、私たち一般の白人もこの技術を使用して、「ワンクリックブロックバスター」の中毒を乗り越えることができます。

**動画生成が大爆発の到来を告げた、最終的な勝者は誰になるのか?

近年、映像生成の分野は、さまざまな優れた製品が登場し、100の学派が争う「乱闘」の状況に直面しています。

以前は、PikaLabs が開発した Wensheng ビデオ AI がありました。

その後、Moonvalleyは「史上最強の動画生成AI」と評される独自のタイトルをローンチしました。

最近、Gen-2では「ポイントして描く」ことが簡単にできる「モーションブラシ」機能が導入されました。

Stable Video Diffusionの見事な外観と相まって、AIビデオ生成の分野での競争は非常に激しく、誰もが本格的であり、誰が最終的な勝者になるかを言うことは難しいと予測できます。

動画生成の分野は、生成AI技術の傘下にあります。 AI技術の継続的な発展に伴い、生成AI産業は徐々に台頭しています。 現在、業界は急速な発展の段階にあり、市場規模は拡大しており、今後も急速な成長率を維持すると予想されます。 市場調査機関によると、業界の市場規模は2029年までに100億ドルに達すると予想されています。

大きくて、目に見えて美味しいケーキです。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
0/400
コメントなし