
Sign up to save your podcasts
Or


DeepMindが公開した「SIMA 2」は、従来の“指示に従うゲームAI”から一歩進み、ユーザーの高レベル目標を理解し、自分で手順を組み立て、対話で意図を説明しながら行動できるエージェントです。中核にGeminiを組み込み、画面を見てキーボードとマウスで操作する人間流のインターフェースを維持したまま、推論と行動計画の質を引き上げました。学習は人手のデモ動画+言語ラベルに、Geminiが生成したラベルも混ぜて行う構成で、エージェントは「これから何をして、なぜそうするのか」を言語で語れるようになっています。
今回の肝は“汎化”です。SIMA 2は学習していないMineDojoやASKAでも、指示の意味を環境に即して解釈し、目的達成のための操作列を自力で組み立てます。例えば、あるゲームで覚えた“採掘”の概念を別のゲームの“収穫”に読み替えるといった抽象度の高い転用が可能になり、人間プレイヤーに近い成功率へと接近しました。さらにGenie 3が即席で生成した“初めて見る”世界でも、方角をつかみ、指示に沿って合理的に行動できることが示されています。
“自己改善”も新要素です。SIMA 2は人手データで初期化した後は、自分で目標を立ててプレイし、Geminiが与えるタスクと推定報酬を手がかりに経験を貯め、失敗した課題にも世代を重ねて再挑戦します。この経験バンクを元に次世代エージェントを再訓練するループが回り、追加の人手データなしに技能を伸ばせることが確認されました。研究チームは、こうした“開かれた学習”が将来の汎用ロボットにもつながると位置づけています。
提供形態は慎重です。SIMA 2は研究限定のプレビューとして、学術機関とゲーム開発者の小規模枠に先行公開。長期かつ多段の課題や、コンテキスト記憶の短さ、キーボード/マウスでの精密操作などは依然として難所であり、責任ある開発体制のもとで検証を進めるとしています。一般向けのゲーム用ツールではなく、あくまで“実世界のエンボディドAI”への踏み台――という距離感も強調されました。
産業の視点では、商用ゲーム各社との連携が効いています。No Man’s Sky、Valheim、Goat Simulator 3、Space Engineersなど多様な物理や操作の“癖”を持つ作品群で鍛えることで、単一環境に最適化した“賢さ”から脱し、未知の世界でも破綻しにくい行動戦略を身につける設計です。ワールドモデルGenie 3との組み合わせは、実機ロボットを大量に回さずに“多世界での反復練習”を回せるため、開発サイクルの短縮と安全性の両立が期待できます。
By ikuo suzukiDeepMindが公開した「SIMA 2」は、従来の“指示に従うゲームAI”から一歩進み、ユーザーの高レベル目標を理解し、自分で手順を組み立て、対話で意図を説明しながら行動できるエージェントです。中核にGeminiを組み込み、画面を見てキーボードとマウスで操作する人間流のインターフェースを維持したまま、推論と行動計画の質を引き上げました。学習は人手のデモ動画+言語ラベルに、Geminiが生成したラベルも混ぜて行う構成で、エージェントは「これから何をして、なぜそうするのか」を言語で語れるようになっています。
今回の肝は“汎化”です。SIMA 2は学習していないMineDojoやASKAでも、指示の意味を環境に即して解釈し、目的達成のための操作列を自力で組み立てます。例えば、あるゲームで覚えた“採掘”の概念を別のゲームの“収穫”に読み替えるといった抽象度の高い転用が可能になり、人間プレイヤーに近い成功率へと接近しました。さらにGenie 3が即席で生成した“初めて見る”世界でも、方角をつかみ、指示に沿って合理的に行動できることが示されています。
“自己改善”も新要素です。SIMA 2は人手データで初期化した後は、自分で目標を立ててプレイし、Geminiが与えるタスクと推定報酬を手がかりに経験を貯め、失敗した課題にも世代を重ねて再挑戦します。この経験バンクを元に次世代エージェントを再訓練するループが回り、追加の人手データなしに技能を伸ばせることが確認されました。研究チームは、こうした“開かれた学習”が将来の汎用ロボットにもつながると位置づけています。
提供形態は慎重です。SIMA 2は研究限定のプレビューとして、学術機関とゲーム開発者の小規模枠に先行公開。長期かつ多段の課題や、コンテキスト記憶の短さ、キーボード/マウスでの精密操作などは依然として難所であり、責任ある開発体制のもとで検証を進めるとしています。一般向けのゲーム用ツールではなく、あくまで“実世界のエンボディドAI”への踏み台――という距離感も強調されました。
産業の視点では、商用ゲーム各社との連携が効いています。No Man’s Sky、Valheim、Goat Simulator 3、Space Engineersなど多様な物理や操作の“癖”を持つ作品群で鍛えることで、単一環境に最適化した“賢さ”から脱し、未知の世界でも破綻しにくい行動戦略を身につける設計です。ワールドモデルGenie 3との組み合わせは、実機ロボットを大量に回さずに“多世界での反復練習”を回せるため、開発サイクルの短縮と安全性の両立が期待できます。