2026.03.09 | テクノロジー

LumaのAIエージェント「Luma Agents」が変える制作の流れ

AIは文章や画像を作るツールとして広く使われるようになりましたが、最近は仕事の進め方そのものを担う存在へと変わりつつあります。AI動画生成スタートアップLumaが発表した「Luma Agents」は、テキスト・画像・動画・音声を横断して制作を行うAIエージェントです。制作の現場では、AIをどう使うかという考え方そのものが変わる可能性も指摘されています。本記事では、この仕組みの特徴と、これまでのAIツールとの違いを整理します。

Lumaが発表した「Luma Agents」とは何か

Lumaが発表した「Luma Agents」は、テキスト、画像、動画、音声を横断して扱うクリエイティブ向けのAIエージェントです。広告やマーケティングの制作では、コピー、ビジュアル、映像、音声といった複数の素材を組み合わせながら一つの表現を作っていきます。Luma Agentsは、そうした工程を分断せず、まとめて扱う前提で設計されています。土台になっているのは、Lumaの「Unified Intelligence」モデル群です。最初のモデルである「Uni-1」は、音声、動画、画像、言語、空間理解のデータで訓練されていると、CEO兼共同創業者のAmit Jain氏は説明しています。空間理解とは、物の位置関係や奥行き、光の当たり方のような情報を把握する力です。文章だけ、画像だけではなく、異なる種類の情報をまとめて扱える点がこのモデルの軸になっています。

Jain氏はUni-1について、「言語で考え、ピクセルで描く」と説明しました。ピクセルとはデジタル画像を構成する最小単位です。つまり、文章として理解した内容を、画像として表現する方向にまでつなげようとしているわけです。
加えて、Luma AgentsはLumaの技術だけで閉じた仕組みではありません。英文では、Lumaの「Ray 3.14」に加え、Googleの「Veo 3」「Nano Banana Pro」、ByteDanceの「Seedream」、ElevenLabsの音声モデルと連携しながら動くと説明されています。さらにJain氏は、制作に使う素材や共同作業の流れ、試行の履歴をまたいで文脈を保てる点も特徴として挙げています。ここまで見ると、単体の生成ツールというより、制作全体をつなぐための土台として位置づけられていることがわかります。では、その違いは実際の使い方にどう表れるのでしょうか。

プロンプトを打つAIから「仕事を進めるAI」へ

いま多くの人が使っているAIは、指示を出して結果を見て、また指示を足して修正する、という流れが基本です。画像生成でも文章生成でも、狙った形に近づけるには何度もプロンプトを書き直す必要があります。Jain氏が指摘しているのもまさにそこで、現状は「大量のモデルがあり、それぞれにどう指示するかを学ばなければならない状態」だというわけです。
Luma Agentsが目指しているのは、そこから一段進んだ使い方です。人が一つずつ細かく指示するのではなく、AIが複数の案をまとめて出し、その方向を会話しながら絞っていく。しかも、出した結果を見直し、修正し、さらに整える流れまで含めて動かす設計になっています。Jain氏は、この「自分の出力を評価して直す力」が、コーディングAIで役立っているのと同じ種類の重要さを持つと説明しています。

デモでは、約200語のブリーフと口紅の画像を入力すると、広告案が複数生成されたとされています。作られたのは単なる一枚絵ではなく、ロケーション、モデル、色使いまで含めた提案です。さらに別の事例では、年間1500万ドル規模の広告キャンペーンをもとに、各国向けの広告を40時間未満、2万ドル未満で制作し、社内の品質基準と正確性チェックも通過したとJain氏は述べています。
Jain氏はこの考え方を建築家にたとえています。建物を設計するとき、線を引くだけでなく、空間の広がりや光の入り方、人がそこでどう過ごすかまで同時に考えます。Lumaが示しているのは、それに近い形でAIが制作全体を扱う方向です。Luma AgentsはすでにAPIで公開されていますが、利用は段階的に広げる方針とされています。制作の現場でAIがどこまで工程を担うようになるのか、その変化が試される段階に入ってきたと言えそうです。

まとめ

いかがだったでしょうか?
Lumaが発表した「Luma Agents」は、文章や画像を個別に作るAIではなく、制作の流れそのものを扱うAIエージェントとして紹介されています。複数の素材をまたぎながら案を作り、見直し、整えていく工程まで含めて設計されている点が特徴です。今回の発表からは、AIが単なる道具として使われる段階から、制作の工程に関わる存在へと広がりつつある様子がうかがえます。今後、実際の制作現場でどのように活用されていくのかにも注目が集まりそうです。