
OpenAIが新しいAIコーディングモデル「GPT-5.1-Codex-Max」を発表しました。このモデルは24時間以上も自律的に作業を続け、プロジェクト全体のリファクタリングまで実行できる能力を持っています。従来のモデルと何が違うのか、そしてどのような技術的ブレークスルーが実現したのかを詳しく見ていきましょう。
ARCHETYP Staffingでは現在クリエイターを募集しています。
エンジニア、デザイナー、ディレクター以外に、生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
ボタンから募集中の求人一覧ページに移動できます。
数百万トークンを扱う「圧縮技術」の衝撃

GPT-5.1-Codex-Maxは、長時間にわたる詳細な作業のために構築されています。このモデルの最大の特徴は、「compaction(圧縮)」と呼ばれる技術にあり、複数のコンテキストウィンドウにわたって動作するようにネイティブに訓練された、OpenAI初のモデルです。
コンテキストウィンドウとは、AIモデルが一度に処理できる情報量の上限を指します。従来のモデルでは、この上限に達すると作業が中断されてしまうため、大規模なプロジェクトのリファクタリングや長時間のデバッグセッションを完遂することが困難でした。GPT-5.1-Codex-Maxは、この圧縮技術によって履歴を整理しながら重要なコンテキストを保持し続けることができます。単一のタスクで数百万トークンにわたって一貫した作業が可能になったことで、プロジェクト規模のリファクタリングや数時間にわたるエージェントループが現実のものとなりました。Codexアプリケーションでは、GPT-5.1-Codex-Maxがコンテキストウィンドウの制限に近づくと自動的にセッションを圧縮し、新しいコンテキストウィンドウを確保します。そしてタスクが完了するまで、このプロセスを繰り返すのです。
特筆すべきは、OpenAIの内部評価において、このモデルが24時間以上にわたってタスクに取り組む様子が観察されていることです。実装を粘り強く繰り返し、テストの失敗を修正し、最終的に成功した結果を提供する──この能力は、より汎用的で信頼性の高いAIシステムへの道のりにおける基礎となるものです。そして、この技術的基盤があるからこそ、次に紹介するコスト効率の改善も実現されています。
コスト効率と速度の大幅改善

GPT-5.1-Codex-Maxは、ソフトウェアエンジニアリング、数学、研究などのエージェントタスクで訓練された基盤推論モデルのアップデート版をベースに構築されています。このモデルの注目点は、より効果的な推論によってトークン効率が大幅に改善されていることです。トークンとはAIモデルが処理する情報の単位であり、使用するトークン数が少ないほどコストが削減されます。SWE-bench Verifiedという評価基準において、GPT-5.1-Codex-Maxは「medium」推論努力レベルで、同じレベルのGPT-5.1-Codexよりも優れた性能を発揮しながら、思考トークンを30%削減しています。OpenAIによれば、このトークン効率の改善が開発者にとっての実際のコスト削減につながるとのことです。
OpenAIによれば、GPT-5.1-Codex-Maxは、GPT-5.1-Codexと同様の機能性と美しさを持つ高品質なフロントエンドデザインを、はるかに低コストで生成することができるとのことです。さらに、レイテンシーに敏感でないタスク向けには、新しい「Extra High(xhigh)」推論努力レベルも導入されました。これはより長い時間考えることでより良い回答を得るためのオプションですが、OpenAIはほとんどのタスクでは日常的な使用としてmediumレベルを推奨しています。
このモデルは、プルリクエスト作成、コードレビュー、フロントエンドコーディング、Q&Aなどの実際のソフトウェアエンジニアリングタスクで訓練されています。ベンチマークでの性能向上は実際の使用における改善も伴っており、多くの最先端コーディング評価において以前のモデルを上回る性能を発揮しています。
しかし、能力が向上すればするほど、安全性への配慮もまた重要になってきます。
サイバーセキュリティ能力と安全性への取り組み

高度な能力を持つAIモデルには、常に安全性という課題がつきまといます。GPT-5.1-Codex-Maxは、長期的な推論能力を持つがゆえに、サイバーセキュリティの分野でも改善された結果を提供しています。OpenAIの準備態勢フレームワークにおいて、このモデルはサイバーセキュリティの「High」能力には到達していませんが、これまでに展開した中で最も高いサイバーセキュリティ能力を持つモデルです。
サイバーセキュリティ能力は防御と攻撃の両方に使用できるため、OpenAIは慎重なアプローチを取っています。実際の使用から学び、安全対策を更新し、自動化された脆弱性スキャンや修復支援などの重要な防御ツールを維持する──これが反復的な展開アプローチの基本です。「High」能力に備えるための措置を講じながら、Aardvarkのようなプログラムを通じて防御側がこれらの能力から恩恵を受けられるよう取り組んでいます。
GPT-5-Codexのローンチ時から、OpenAIは悪意ある活動を検出して阻止するために専用の監視を実装してきました。現時点では大規模な悪用の増加は観察されていませんが、高度な能力に対する追加の緩和策を準備しています。実際、OpenAIのチームはすでにモデルを悪用しようとするサイバー作戦を阻止した実績があります。
Codexの安全設計も注目に値します。デフォルトで安全なサンドボックス内で実行され、ファイルの書き込みはワークスペースに限定され、開発者が有効にしない限りネットワークアクセスは無効です。インターネットやWeb検索を有効にすると信頼できないコンテンツからのプロンプトインジェクションリスクが生じる可能性があるため、OpenAIは制限アクセスモードを推奨しています。
長時間実行タスクの能力が向上するにつれて、開発者によるレビューの重要性も増しています。Codexはターミナルログを生成し、ツール呼び出しとテスト結果を引用することで開発者のレビューを支援します。ただし、OpenAIはCodexを人間によるレビューの代替ではなく、追加のレビュアーとして扱うべきだと強調しています。
高度な能力と安全性の両立──これがGPT-5.1-Codex-Maxの目指す姿です。
まとめ

いかがだったでしょうか?
GPT-5.1-Codex-Maxは、長期的なコーディングタスクの維持、複雑なワークフローの管理、そして少ないトークンでの高品質な実装の生成という、これまで困難だった課題を次々と解決しています。本日より、ChatGPT Plus、Pro、Business、Edu、EnterpriseプランでCodexにおいて利用可能となり、CLI、IDE拡張機能、クラウド、コードレビューで使用できます。GPT-5.1-Codexに代わるデフォルトモデルとして、新たなスタンダードとなります。OpenAI社内では、エンジニアの95%が毎週Codexを使用し、導入以降プルリクエストの送信数が約70%増加したという驚くべき実績が報告されています。AIエージェントの可能性がさらに広がる今、このモデルが開発現場にどのような変化をもたらすのか、大いに期待が高まります。
ARCHETYP Staffingではクリエイターを募集しています!
私たちはお客様の課題を解決するweb制作会社です。現在webサイト制作以外にも、動画編集者や生成AI人材など幅広い職種を募集していますのでぜひチェックしてみてください!
また、アーキタイプではスタッフ1人1人が「AI脳を持ったクリエイター集団」としてこれからもクライアントへのサービス向上を図り、事業会社の生成AI利活用の支援及び、業界全体の生成AIリテラシー向上に貢献していきます。
生成AIの活用方法がわからない、セミナーを開催してほしい、業務を効率化させたいなどご相談ベースからお気軽にお問い合わせください!
ボタンから募集中の求人一覧ページに移動できます。



