「AI Sora」の魅力的な世界について

「AI Sora」の魅力的な世界について

みなさんこんにちは、GMOリサーチ&AIでエンジニアとして働いているプジャと申します。

今回のブログでは「AI Sora」について紹介したいと思います。

きっかけは弟との何気ない会話から始まりました。
ある日私たちは、バイラル・ビデオ (Viral Video) について話していました。その動画では、YouTuberが完璧な発音と豊富な語彙で流暢な日本語を話しているように見えたのですが、詳しく調べてみると、その動画は与えられたコンテキストに基づいて生成されたものであることがわかりました。
こちらがその動画です。

この驚異的な発見に興味を惹かれたので、AIが生成したコンテンツの世界に踏み込んでみたところ、「AI Sora」 という魅力的な技術と出会いました。この出会いがOpenAIの面白いところを知るきっかけになるなんて、思ってもみませんでした。この動画はAI Soraによって作られていますが、ここでは別のOpenAIアプリがテキストを音声に変換するために使用されています。正直恐ろしいくらいの技術だなと思いましたが、同時に素晴らしさも感じました。

AI Soraとは?

Soraは、OpenAIが発表した新しい動画生成AIで、テキストプロンプトを入力するだけで、最大1分間の高品質な動画を生成できるものです。たとえば、「巨大な犬を崇拝している猫の群れ」というプロンプトを入力するだけで、その説明に合った動画が表示されます。
Soraは大々的なアナウンスや広告なしに一気に有名になったため、もしソーシャルメディアや専門のコンピュータフォーラムに常にアクセスしていなければ、Soraの急速な台頭に気づかなかったかもしれません。

OpenAIが公開した複数のサンプル動画の中には、Soraが非常にリアルな動画を制作しているものが多く含まれており、これらの動画では鏡に映る映像や液体の正確な動き、そして降る雪の粒子までもが再現されています。

Ref : https://www.sciencefocus.com/future-technology/openai-sora

AI Soraの使い方

AI Soraは書かれた指示をリアルなビデオに変換します。これは、テキストから画像を作成するAIに似ていますが、GPTなどの高度な言語モデルを使用しています。

Soraにリクエストを送ると、それを静止画だけでなく、ダイナミックな動画に変更してくれます。この能力は、幅広い種類の動画を含む大規模なトレーニングデータベースから生まれており、その知識を使って、Soraは動きや背景、ビジュアルを理解して、リアルな感覚のビデオを作ることができます。

例えば
プロンプト例: 公園でチェスをしている猿
上記のテキストは AI モデルに変換され、動画が生成されます。

AI Soraの特徴

急速に変化する人工知能の世界で、「Sora」という驚くべき新しいイノベーションが注目を集めていますが、この進歩は人工知能が現実世界を理解し、再現する能力において大きな前進と言えます。

また、たくさんの研究と取り組みを経て、Soraには他のAIとは違う特別な能力が加えられました。ここからは、Soraの独自の機能と、それがどんな産業でどのように活用されるかについてみていきます。

リアルで忠実度の高いビデオ生成

Soraは、ユーザーの指示に忠実且つビジュアル品質の高い動画を1分まで作ることができます。古いモデルだと長い動画や複雑なシーンの作成が難しい場合もありますが、Soraはユーザーの希望にあった、明確で魅力的なコンテンツを作ることに優れています。これは、高品質のビデオを迅速に作成したいと考えている映画制作者、マーケティング担当者、コンテンツ作成者にとって大きな進歩です。

プロンプトの例:グレンフィンナン・ヴァイアダクトは、イギリス・スコットランドにある歴史的な鉄道橋で、マライグとフォート・ウィリアムの町を結ぶウェスト・ハイランド線を横断しています。蒸気機関車が橋を出発してアーチで覆われたヴァイアダクトを渡る姿は見応えがあります。景色は豊かな緑と岩山に点在し、列車の旅に美しい背景を提供しています。空は青く、太陽が輝いており、この壮大なスポットを探索するには美しい日です。

教育

教育の分野では、テキストを生き生きとしたビデオに変えるというSoraの能力が、学習や教育に革新をもたらす可能性があります。たとえば、歴史の授業では、教師の説明に基づいたアニメーションビデオで、ローマ帝国の崩壊や独立宣言の署名などを生徒が見ることができるでしょう。これらの没入型体験は、学生が複雑なトピックをより良く理解し覚えるのに役立ち、学習をより対話的で楽しくすることができます。

マーケティングや広告

Soraの能力は、マーケティングや広告業界に大きな助けとなることが予想されます。Soraはターゲットとなる視聴者を、迅速かつ効果的に引き付けるビデオを作成できるため、より良い方法でブランドと顧客がつながることができます。

例えば、シンプルなテキストリクエストから、ブランドを魅力的に映す映像で商品を売り出すことを考えてみて下さい。Soraを使えば、大きなマーケティング予算のない中小企業も、人々の注意や興味を引く素晴らしいビデオを作ることができます。例えば、洋服ブランドの広告を作成したい場合は、次のようなプロンプトでリクエストします。

プロンプト: スタイリッシュな女性が、暖かく輝くネオンとアニメーションの街の看板で満たされた東京の通りを歩いています。彼女は黒い革のジャケット、赤い長いドレス、黒いブーツを着ており、黒い財布を持っています。彼女はサングラスと赤い口紅をつけています。彼女は自信を持って何気なく歩いています。通りは湿っていて反射しており、色とりどりの光の鏡効果を生み出しています。多くの歩行者が歩き回っています。

非営利団体

ある非営利団体が、気候変動について情報を広めようとしていると考えてみましょう。Soraを利用すれば、最新の科学を用いて、気候変動が将来世界のさまざまな地域にどのように影響を与えるかを示す力強いビデオを作成することができます。これは、組織のメッセージを際立たせ、気候変動に関する複雑なデータを理解しやすくし、人々が気候変動に関する関心を持ちやすくなる可能性があります。

AI Soraの限界

技術面

1.ビデオの長さと複雑さ
現時点では、Soraはユーザーの指示に従い、最大1分の良質なビデオを作成することができますが、この時間制限により、長いビデオや詳細なビデオの作成が困難になる可能性があります。

2.物理法則と現実感の再現
Soraは、複雑な物理演算や完全なリアリズムを表現するのに苦戦しています。
リアルなシーンを作成できる一方で、AIによって作られたコンテンツであることがわかる細かな部分に気づく人もいるので、これがリアルな教育シミュレーションやプロの映像制作において問題となることがあります。

3.編集上の課題
Soraが作った動画の編集はとても大変です。小さな変更でさえ、新しいビデオ全体を作成する必要があります。これにはとても時間がかかり、ビデオの一貫性が損なわれる可能性があるため、正確な編集が必要なユーザーにとっては困難な場合があります。

倫理性

1.悪用と詐欺
Soraが悪用され、偽物や有害なコンテンツが作成されるリスクがあります。テキストからリアルなビデオを作成することにより、ディープフェイクや虚偽の情報、プライバシー侵害や知的財産権を侵害するコンテンツが作成される可能性があります。

2.偏見と公平性
Soraは他のAIと同様に、トレーニングデータに偏りがある可能性があります。これは、Soraが作成するコンテンツが特定の人やグループを不当に表現する可能性があることを意味しています。公正かつ責任を持ってSoraを使用するためには、これらの偏りを取り除くことが重要となります。

AI Soraの未来

将来の機能と計画

OpenAIはSoraについて、今後の展望をあまり明らかにしていません。しかし、過去の実績から考えると、コミュニティを巻き込みながらサービスを向上させてきたことから、将来のSoraのバージョンでは、より長いビデオ作成、よりリアルな外観、複雑な状況への対応強化が見込まれます。これらの変更はユーザーフィードバックやAI技術の新たな発見によってもたらされる可能性があります。

専門家の予測

AIの専門家たちは、Soraや同様の技術が、人間と機械の作成したコンテンツを見分けるのを難しくすると予測しています。Soraの進化により、より詳細で感情豊かなビデオが生まれ、創造性とコミュニケーションの境界が広がると期待されています。AI専門家のMatt Wolfeは、YouTube動画の中で次のように述べています。

“Sora is the most insane AI text to video model anybody has ever seen.”
Soraはこれまで誰もが見たことのない最も驚くべきAIテキストからビデオに変換するモデルです。

AI 分野とその先への影響

Soraの改善は多くの分野に大きな影響を与えることが考えられます。クリエイティブな世界では、より多くの人が優れたビデオを作成できるようになり、クリエイターにとって平等な競争機会が提供されます。また、教育分野では、Soraが学習をより楽しく、リアルにする可能性があります。しかし、これらの変化には、フェイクニュース、プライバシー、オンラインでの人々の表現に関連する重要な倫理的問題がもたらされます。

どこでAI Soraを活用するか?

AI Soral は、日常生活のどこで活用できるのか考えました。

これは専門的なコミュニケーションをするときです。なぜなら、プロフェッショナルなコミュニケーションにおいては、特定のアイデアを効果的に伝えたり視覚化するのが難しいことがあるからです。AI Soraは、そんなときに最適なツールです。

例えば、私が説明をそのままプロンプトに入力すれば、私の考え方をビデオで表現してくれます。これにより、複雑なアイデアを視覚的に表現でき、説明がよりわかりやすくて理解しやすいものになります。また、このテキストからビデオへ変換できるプレゼンテーションツールは、複雑な考えを視覚的に表現してくれるので、理解を促すことにとても役立ちます。個人レベルでは、いつかAI Soraを使って自分の物語を語り、魅力的なビデオを作成してみたいと考えています。
仕事でもプライベートでも、AI Soraの機能はコミュニケーションと理解を向上させるための貴重なツールになると思っています。
※現時点では一般利用は出来ず、まだテスト段階だそうです。

OpenAI の CEO である Sam Altman 氏は、AI Sora を使用してプロンプトから生成されたビデオを頻繁に投稿しています。 AI Sora を使用して投稿された動画のリストを以下に貼っておきます。

https://seo.ai/blog/openai-sora-examples

結論

この記事では、テキストをビデオに変換するAIの大きな可能性と課題を紹介しました。

SoraはAIの進化の速さを示し、未来では誰もが簡単に素晴らしいビデオを作成できる時代が迫っていることがうかがえます。

AIが進化し続ける中、私たちは希望を持ちながらも慎重でいる必要があります。これらの技術は私たちの創造性や学び方、お互いとのコミュニケーション方法のあり方を変える可能性があります。情報収集し、倫理について考えることができるのであれば、Soraのようなツールは生活や社会をもっとよくすることができるでしょう!

読んでいただきありがとうございました!

【参考文献】

  1. https://arvin.chat/blog/sora-ai/
  2. https://www.sciencefocus.com/future-technology/openai-sora
  3. https://daily.dev/blog/sora-by-openai-is-it-a-game-changer-for-ai-generated-videos
  4. https://www.saasgenius.com/blog-business/the-ultimate-guide-to-sora/

前の記事
«
次の記事
»

技術カテゴリの最新記事