OpenAIが新モデルGPT-5.6を発表 3モデルの特徴と価格を解説
OpenAIが新しいAIモデルファミリー「GPT‑5.6」を発表しました。ラインナップはフラッグシップの「Sol」、バランス型の「Terra」、低コストの「Luna」の3種類です。現在は一部のパートナー企業への限定公開中ですが、数週間以内に一般公開が予定されています。性能・安全対策・価格について詳しく解説します。
ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
GPT‑5.6とは何か——3つのモデルと、限定公開の経緯
GPT‑5.6シリーズは、フラッグシップの「Sol」、日常業務向けのバランス型「Terra」、高速・低コストの「Luna」という3つのモデルで構成されています。TerraはGPT‑5.5と同等の性能を半額で利用でき、Lunaは最低コストで高い能力を発揮します。
Solはこれまでで最も強固な安全スタック(安全対策の仕組み)とともに提供されます。高リスク活動・不正なサイバーリクエスト・繰り返しの悪用に対する保護が強化され、数週間にわたる脆弱性の発見、システムへの負荷試験、現実の攻撃への耐性強化が行われました。
OpenAIは幅広いアクセスを重視しており、数週間以内の一般公開を目指していますが、現在は「限定プレビュー」として、米国政府と情報共有済みの一部のパートナー企業のみに提供されています。

公開に先立ちモデルの能力を政府に事前共有しており、政府の要請を受けて段階的な公開を開始。プレビュー期間中もパートナーとの連携を継続しながら、一般公開に向けた準備が進められています。
OpenAI自身は「このような政府関与のプロセスが長期的な標準になるべきではない」と明言しており、今回の措置はあくまで一時的なものと位置づけています。ユーザー・開発者・企業・防衛担当者・国際パートナーにとって必要なツールへのアクセスが妨げられることを懸念しているためです。現在はサイバー関連の政策フレームワーク策定と、将来のモデル公開に向けた再現可能なプロセスの整備に向けた政府との協議が続いています。
段階的かつ慎重なプロセスではありますが、AIリリースの新しい標準を模索する動きとして、今後の展開が気になるところです。
では実際に、性能面ではどのような成果が示されているのでしょうか。
GPT‑5.6の実力

GPT‑5.6 Solはこれまでで最も高い性能を持つモデルです。コーディング・生物学・サイバーセキュリティにおける能力向上は、3つの分野ごとに実施されたベンチマーク(モデルの能力を測る評価指標)によって示されています。
GPT‑5.6ではSolの思考時間を最大化する新しい推論レベル「max」が導入されたほか、複数のAIエージェント(自律的に動くAIの作業単位)を並列で動かし、単一モデルでは対応が難しかった複雑な長期作業を処理する「ultra」モードも新たに加わっています。
コーディング分野では、計画立案・反復作業・複数ツールの連携を要するコマンドライン作業を評価する「Terminal‑Bench 2.1」において、Solが最高スコアを記録しました。
単純な命令を実行するだけでなく、複数のステップにわたる複雑な作業を自律的に遂行する能力が評価されています。
生物学分野では、長期にわたるゲノム解析や定量的な生物学的分析を評価する「GeneBench v1」で、GPT‑5.5を上回る成績を達成しました。使用するトークン数(処理するテキストの量)もGPT‑5.5より少なく、効率と成果を同時に改善しています。
サイバーセキュリティ分野では、脆弱性(システムの弱点)の調査と悪用を評価する「ExploitBench」において、GPT‑5.6 SolはMythos Previewと同水準の成績を、出力トークン数を約3分の1に抑えながら達成しています。「ExploitGym」はUC Berkeleyの研究者がOpenAIなどと共同で開発したベンチマークで、Sol・Terra・Lunaすべてのモデルが推論を深めるほどサイバー能力が向上することが確認されました。こうした高い能力を安全に運用するための対策も、今回の発表の重要なポイントとなっています。
多層防御の仕組みと、価格・提供スケジュール
GPT‑5.6は能力の向上に応じた安全対策とともに開発されました。OpenAIは、Solが脆弱性の発見・修正の支援には優れている一方、エンドツーエンド攻撃(一連の手順を踏んだ本格的な攻撃)を完全に自律実行する能力はないと説明しています。ChromiumとFirefoxの評価では、バグや攻撃の構成要素を特定したものの、機能する完全な攻撃チェーンの自律生成には至りませんでした。
安全対策はモデルごとに構成を変えた多層的な仕組みになっています。モデル自体がジェイルブレイク(安全対策を意図的に回避しようとする操作)や意図を偽った要求を拒否するよう訓練され、出力生成中はリアルタイムの検知システムが動作します。高リスクと判断された場合は生成を一時停止し、別の推論モデルが内容を審査します。

問題があれば出力はユーザーに届く前にブロックされ、複数の会話をまたいだ行動パターンの分析により、悪意ある利用と正当なセキュリティ調査を区別しています。
堅牢性をさらに高めるため、A100 GPU換算で70万時間以上を投入した自動レッドチーム(安全対策の弱点を探す模擬攻撃)も実施されました。多くの文脈で通用する「汎用ジェイルブレイク」の発見に注力し、人手では網羅しきれない攻撃パターンを検証しています。外部の専門家による人的レッドチームも並行して実施されており、プレビュー期間中も継続されます。
価格は100万トークン(AIが処理するテキストの単位)あたり、Solが入力5ドル・出力30ドル、Terraが入力2.50ドル・出力15ドル、Lunaが入力1ドル・出力6ドルです。Sol・Terra・Lunaの名称は今後も継続して使用される予定で、それぞれが独自のペースで性能を高めていく設計です。プロンプトキャッシング(一度処理したテキストを再利用してAPIコストを抑える機能)の仕組みも刷新され、より予測可能な料金体系となっています。
提供スケジュールについては、数週間以内の一般公開が予定されています。7月にはCerebras社との連携により、GPT‑5.6 Solを最大毎秒750トークンという高速処理で利用できるサービスが開始予定です。当初は一部の顧客に限定されますが、容量の拡大に合わせて順次拡大される予定です。
自動・人的レッドチームを組み合わせた多層的な検証体制は、能力向上と安全確保を並走させる上での現実的なアプローチとして参考になります。
まとめ

いかがだったでしょうか?
GPT‑5.6シリーズは、Sol・Terra・Lunaという3つのモデルで性能・コスト・速度のバランスを選べる構成となっており、コーディングから生物学、サイバーセキュリティまで幅広い分野で従来モデルを上回る成績を示しています。強力な能力と多層的な安全対策を両立させている点も、今回の注目点のひとつです。現時点では限定公開中ですが、数週間以内に一般提供が開始される予定です。高い能力と多層的な安全対策を両立させたGPT‑5.6が、一般公開後にどう活用されていくか注目です。