OpenAIは9月15日、コーディングエージェント「Codex」の大型アップデートを発表しました。目玉は、エンジニア実務に特化して再訓練した「GPT-5-Codex」の投入です。短い対話での“ペアプロ”から、数時間に及ぶ大規模リファクタやバグ修正までを自律的にこなし、社内評価では7時間超の連続作業でテスト失敗を自分で直しながら完了させたといいます。軽いタスクでは思考を切り詰めて俊敏に、難題では推論を長く走らせる“可変思考”を採用。ログ分析では、最も軽い10%のやり取りでGPT-5比93.7%少ないトークン消費、逆に最も重い10%では2倍思考する、といった使い分けが示されました。SWE-bench Verifiedの報告も全500課題に拡張されています。
製品としてのCodexも“開発現場の動線”に合わせて再設計されました。4月のCLI、5月のWeb版を経て、いまはChatGPTアカウントでターミナル/IDE/Web/GitHub/iOSを一体化。CLIはTo-Do管理やWeb検索、MCP連携の精度が向上し、ツール呼び出しや差分表示のUIも整理。承認モードは「読み取り専用」「自動」「フルアクセス」の3段に単純化され、長時間セッション用に会話状態の圧縮も可能になりました。
IDE連携では、VS CodeやCursorなどでCodexを横に置いて編集・プレビューしつつ、クラウドタスクへシームレスに委任できます。開いているファイルや選択コードなどローカル文脈を拾うため、プロンプトは短くても意図が通りやすい設計です。モデルはスイッチャーからGPT-5-Codexに切替え、推論量もLow/Medium/Highで調整可能。WindowsはWSL推奨のベータ扱いです。
クラウド側は“速さ”と“見える化”を強化。コンテナキャッシュで新規タスクやフォローアップの中央値完了時間を90%短縮し、セットアップスクリプトの自動検出・実行で環境構築もセルフサービス化。フロントエンドでは、設計画像を入力にして自分でブラウザを立ち上げ、出来栄えをスクショでPRに添付する流れまで自動化します。
コードレビュー機能は、静的解析の域を超えた“実行型”です。PRの意図と差分を突き合わせ、依存関係をたどってコードとテストを走らせて検証。GitHubでドラフトからReadyに変わると自動レビューを投下し、「@codex review for security」のように観点指定も可能です。社内では既に大半のPRをCodexが査読し、ヒトの注意を本当に重要な指摘へ集中させているといいます。
安全設計は“デフォルト強め”。ローカルとクラウドの双方で既定はネットワーク遮断・ワークスペース内限定のサンドボックス。必要に応じて許可制で権限を広げ、クラウドは信頼ドメインの許可リスト運用に対応。CLI/IDEでも承認ポリシーを細かく選べます(危険な“フルアクセス”は非推奨)。運用ガイドでは、VCS前提のブランチ運用やパッチ適用を推奨し、PR監査の実務と噛み合わせる前提が丁寧に整理されています。
導入はシンプルです。npmやHomebrewでCLIを入れ、codexで起動。ChatGPTのPlus/Pro/Business/Edu/Enterpriseいずれかの席があれば、追加契約なしで一定枠を使えます。IDE拡張はMarketplaceから導入してサインイン。クラウドのコードレビューは設定で有効化すれば、対象リポに自動でレビューが走ります。
総じて今回のアップデートは、Codexを「チャットするAI」から「任せて動くチームメイト」へ押し上げるものです。素早い相棒として寄り添い、重作業では腰を据えて任せられる──その両立が、日々の開発速度と安心感を同時に高めます。現場ではまず、バグ修正やテスト増補、UI微修正の“短距離走”をCodexに委任し、運用ガードレールを整えたうえで、段階的に大規模リファクタや継続的レビューへ広げるのが良さそうです。