2024年2月16日、かつてChatGPTで一夜にして有名になったOpenAIが、世界を驚かせるSora(ソラ)を発表した。ソラは入力されたテキストからビデオを生成できるAIモデルです。SoraはOpenAIのウェブサイトの「Research」メニューから見つけることができます。
Soraのウェブサイトで公開されているビデオは、実写のものと区別がつかないほどで、指示に完全に従って生成されています。記述が詳細であればあるほど、生成されるコンテンツのリアリティは高くなります。顔のシミまでクリアに生成でき、美的感覚や撮影角度、色調も自然です。
以下はSoraで生成される動画からのスクリーンショットです。
英語:
Prompt: A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. She wears a black leather jacket, a long red dress, and black boots, and carries a black purse. She wears sunglasses and red lipstick. She walks confidently and casually. The street is damp and reflective, creating a mirror effect of the colorful lights. Many pedestrians walk about.
日本語:
プロンプト :暖かく光るネオンとアニメーションの街の看板で埋め尽くされた東京の通りを、スタイリッシュな女性が歩いている。黒のレザージャケットに赤いロングドレス、黒のブーツを履き、黒い財布を持っている。サングラスをかけ、赤い口紅を塗っている。彼女は自信に満ち、さりげなく歩いている。通りは湿っていて反射し、色とりどりのライトの鏡のような効果を生み出している。多くの歩行者が歩いている。
英語:
Prompt: Animated scene features a close-up of a short fluffy monster kneeling beside a melting red candle. The art style is 3D and realistic, with a focus on lighting and texture. The mood of the painting is one of wonder and curiosity, as the monster gazes at the flame with wide eyes and open mouth. Its pose and expression convey a sense of innocence and playfulness, as if it is exploring the world around it for the first time. The use of warm colors and dramatic lighting further enhances the cozy atmosphere of the image.
日本語:
プロンプト アニメーションのシーンは、溶けた赤いろうそくのそばにひざまずく、背の低いふわふわしたモンスターのアップです。画風は3Dでリアル、照明とテクスチャーに重点を置いている。絵の雰囲気は驚きと好奇心のひとつで、モンスターは大きな目と口を開けて炎を見つめている。そのポーズと表情は、まるで初めて周囲の世界を探検しているかのような無邪気さと遊び心を感じさせる。暖色系の色使いとドラマチックな照明が、画像の居心地のよい雰囲気をさらに高めている。
英語:
Prompt: This close-up shot of a Victoria crowned pigeon showcases its striking blue plumage and red chest. Its crest is made of delicate, lacy feathers, while its eye is a striking red color. The bird’s head is tilted slightly to the side, giving the impression of it looking regal and majestic. The background is blurred, drawing attention to the bird’s striking appearance.
日本語:
プロンプト ビクトリア・クラウンド・ハトのクローズアップ・ショットは、その印象的な青い羽毛と赤い胸が目を引く。紋章は繊細でレースのような羽でできており、目は印象的な赤色をしている。鳥の頭は少し横に傾いており、堂々とした印象を与えている。背景はぼかされており、この鳥の印象的な姿に注目が集まっている。
現在のところ、ソラは一般公開されておらず、部分的なテスト段階です。生成されるビデオの長さは1分程度と短い。
このモデルにはまだ改善の余地があり、複雑な場面での物理現象のシミュレーションは正確だが、因果関係の理解が難しい場合があります。例えば、パンを一口噛んだ後でも、そのパンに噛み跡がないことがあります。
セキュリティの面でも改善中で、誤解を招くコンテンツの検出ツールなどが開発されています。テキスト分類器によって、違法コンテンツ、極端な暴力、未成年に不適切なコンテンツ、著名人の肖像権、知的財産権などへの配慮がなされます。
Soraの誕生で影響を受ける職業はどのようなものがあるだろうか。
- エンターテイメント業界(アニメ、映画):テキストから直接ビデオが生成できるため、低コストのアニメや映画制作が可能になります。現在の映画制作費や俳優ギャラが高いことを考えると、個人でも映画制作できるようになるメリットが大きい。複雑な制作工程や高額な制作費を省くことができます。完全に代替するには時間がかかると思われ、従来の手法とAIを組み合わせるアプローチが現実的です。例えば戦争シーンや特殊効果をAIで生成するなど。
- 広告業界:テキストからビデオ生成が可能なら、広告制作コストが大幅に下がり、広告効果の向上が期待できます。
- 教育業界:プラスの影響が期待できる。難解な内容をビデオで直感的に理解させられるためだ。特に医学分野では専門知識がなくても手術の内容が理解できるようになる。手術シミュレーションの効率化などにつながります。
- 小売業界:AIビデオはオンライン・ショッピング体験を向上させることができます。バーチャル試着室を利用することで、小売業者は消費者に購入前の商品理解を深め、返品を減らし、利用者の満足度を高めることができます。
- セキュリティーと監視:AIビデオ技術は、ビデオ監視やセキュリティーシステムに利用すれば、 モニターが異常な行動や出来事を自動的に検知し、セキュリティを向上させ、人的ミスを減らすのに役立つかもしれません。その他、さまざまな業界への影響が考えられます。
Soraは最先端のAIモデルであり、AI技術の適用範囲はますます広がっています。これまでのコンピュータは人間の脳を上回る計算能力と効率性を持っていたが、専門的なプログラムで結果を生成していました。一方AIには常識的な間違いはあるものの、学習能力を持ち、自然言語で指示を出せば対応するコンテンツを生成できるようになってきました。
AI技術はたびたび衝撃的な成果を上げていますが、従来の職業を完全に置き換えるにはまだ時間がかかりそうです。同時に、新たな職業も生まれてくるだろう。
コメント