名古屋ではたらく社長のITニュースポッドキャスト

Ep.626 OpenAI「AgentKit」発表──設計・埋め込み・評価・微調整まで“業務エージェント”を一気通貫(2025年10月9日配信)


Listen Later

10月6日、OpenAIが「AgentKit」を発表しました。これまで分断していたオーケストレーション、コネクタ管理、評価環境、フロント実装を一つに束ね、企業や開発者が“実運用前提のエージェント”を短期間で作って回せるようにする――そんな狙いです。発表では、Responses APIとAgents SDKの流れを継ぎ、Klarnaのサポート自動化やClayの営業エージェントなど、実案件の加速例も示されました。


中心となる「Agent Builder」は、業務フローをキャンバス上で設計し、プレビュー実行やインラインでの評価設定、フルのバージョニングまで備えます。法務・現場・開発が同じ画面で合意しながら反復できるため、エージェント導入の“合意形成の詰まり”を減らせる設計です。RampやLINEヤフー(LY Corporation)が数時間で初号エージェントを立ち上げたという証言も紹介されました。


プロダクトへの埋め込みは「ChatKit」が受け持ちます。ストリーミング、スレッド管理、“考え中”の見せ方まで含めた会話UIを短時間で組み込め、テーマやブランドに合わせたカスタマイズも容易。社内ナレッジ支援から顧客対応、オンボーディングまで幅広い用途で、HubSpotやCanvaの採用例が言及されました。


企業導入で鍵となるのが「Connector Registry」。ChatGPTとAPIの両方で使うデータソースやツール接続を、管理者が一元ガバナンスできる仕立てです。標準コネクタに加え、MCPによる外部ツールもまとめて可視化・統制でき、誤接続や権限逸脱の抑止に効きます。


信頼性の底上げには「Evals」が拡張されました。データセット起点の評価作成、ワークフロー全体を踏査するトレース採点、注釈に基づく自動プロンプト最適化、そして他社モデルの横並び評価まで。評価面の“作って回す”を内製化しやすくするアップデートで、実際に導入企業で開発時間短縮や精度向上の例が出始めています。


さらに推論モデルの“実地適性”を磨くために、強化学習ベースの「RFT」も位置付けが明確になりました。o4-miniで一般提供、GPT-5はプライベートβで、ツールの呼び時を学ばせる“カスタムツールコール”や、現場に即した“カスタムグレーダー”が追加。評価指標と微調整が一体化し、業務要件に沿った振る舞いを段階的に獲得させやすくなります。


安全面では、オープンソースの「Guardrails」をBuilderやSDKと併用可能です。プロンプトインジェクション検知、PII検出、ハルシネーション検出、Jailbreak検知などをパイプラインで差し込み、Python/TypeScriptのクライアントを“差し替えるだけ”で自動検証を走らせられます。


提供形態は段階的。ChatKitと新しいEvals機能は一般提供、Agent Builderはβ、Connector Registryは一部のAPI/ChatGPT Enterprise/Edu顧客にGlobal Admin Console経由でβ開始。いずれも標準のAPIモデル料金に含まれ、今後はChatGPT側にスタンドアロンのWorkflows APIとエージェント配備オプションも追加予定としています。


総じて、設計→埋め込み→評価→微調整→配備の鎖が一本化され、IT部門は“ガバナンスを効かせたまま早く回す”現実解を得た格好です。日本勢の事例も芽を出しており、社内のデータ接続と評価基準を先に整えた会社ほど、AgentKitの効果を大きく引き出せるはずです。

...more
View all episodesView all episodes
Download on the App Store

名古屋ではたらく社長のITニュースポッドキャストBy ikuo suzuki