
Sign up to save your podcasts
Or


9月19日、xAIが新モデル「Grok 4 Fast」を発表しました。特徴は“フロンティア級の推論”を“軽い計算”で実現する設計です。2Mトークンの長大コンテキスト、WebとXに跨る高速検索、そして長考(reasoning)と短答(non-reasoning)を同じ重みで切り替える統合アーキテクチャを採用。社内評価ではGrok 4に比べ平均40%少ない“思考トークン”で同等性能に到達し、同等性能を買うコストは最大98%下がると説明しています。
検索系の実力も前に出ました。独自のツール使用RLで“いつコード実行やブラウズを呼ぶべきか”を学習し、BrowseCompやXの内部ベンチでGrok 4を上回るスコアを記録。公開系でも、LMArenaのSearch Arenaでgrok-4-fast-searchがElo 1163で首位(9月18日更新)とされ、実利用に近い検索・要約の強さが示されました。
“コスパ”の裏付けとして、xAIは独立系サイトArtificial Analysisのインデックスで「価格対知能の最先端」と触れています(Grok 4 Fastの位置づけ)。この主張自体はxAIの発表に基づくもので、指標の定義や比較条件は今後も検証が必要ですが、価格表を見る限り“Fast”系は入力$0.20/出力$0.50(/100万トークン、128k超は倍額)、2Mコンテキスト&4MTPMで提供され、従来のGrok 4(入力$3/出力$15)より大幅に廉価です。
提供形態は2系統。grok-4-fast-reasoningとgrok-4-fast-non-reasoningをAPIで公開し、開発者は“テスト時計算量”を用途に合わせて可変化できます。一般ユーザー向けにはgrok.comやiOS/Androidの「Fast/Auto」モードで順次適用。難問はAutoでFastを呼び、平易な問い合わせは短答でサッと返す――そんな“賢い燃費”を前提にしたUIです。
総じて、Grok 4 Fastは“速く・長く・安く・ほどよく考える”を一枚で満たす実装です。検索と推論が地続きになるほど、企業利用ではRAGの根幹コストやレイテンシが効いてきます。まずは社内FAQや調査タスクでFast系を当て、重い思考が要る箇所だけreasoningを厚めに――そんな配分が現実的です。公開アリーナや独立ベンチの継続データを横目に、実務での“速度×費用×品質”の最適点を探るフェーズに入りました。
By ikuo suzuki9月19日、xAIが新モデル「Grok 4 Fast」を発表しました。特徴は“フロンティア級の推論”を“軽い計算”で実現する設計です。2Mトークンの長大コンテキスト、WebとXに跨る高速検索、そして長考(reasoning)と短答(non-reasoning)を同じ重みで切り替える統合アーキテクチャを採用。社内評価ではGrok 4に比べ平均40%少ない“思考トークン”で同等性能に到達し、同等性能を買うコストは最大98%下がると説明しています。
検索系の実力も前に出ました。独自のツール使用RLで“いつコード実行やブラウズを呼ぶべきか”を学習し、BrowseCompやXの内部ベンチでGrok 4を上回るスコアを記録。公開系でも、LMArenaのSearch Arenaでgrok-4-fast-searchがElo 1163で首位(9月18日更新)とされ、実利用に近い検索・要約の強さが示されました。
“コスパ”の裏付けとして、xAIは独立系サイトArtificial Analysisのインデックスで「価格対知能の最先端」と触れています(Grok 4 Fastの位置づけ)。この主張自体はxAIの発表に基づくもので、指標の定義や比較条件は今後も検証が必要ですが、価格表を見る限り“Fast”系は入力$0.20/出力$0.50(/100万トークン、128k超は倍額)、2Mコンテキスト&4MTPMで提供され、従来のGrok 4(入力$3/出力$15)より大幅に廉価です。
提供形態は2系統。grok-4-fast-reasoningとgrok-4-fast-non-reasoningをAPIで公開し、開発者は“テスト時計算量”を用途に合わせて可変化できます。一般ユーザー向けにはgrok.comやiOS/Androidの「Fast/Auto」モードで順次適用。難問はAutoでFastを呼び、平易な問い合わせは短答でサッと返す――そんな“賢い燃費”を前提にしたUIです。
総じて、Grok 4 Fastは“速く・長く・安く・ほどよく考える”を一枚で満たす実装です。検索と推論が地続きになるほど、企業利用ではRAGの根幹コストやレイテンシが効いてきます。まずは社内FAQや調査タスクでFast系を当て、重い思考が要る箇所だけreasoningを厚めに――そんな配分が現実的です。公開アリーナや独立ベンチの継続データを横目に、実務での“速度×費用×品質”の最適点を探るフェーズに入りました。