2025年4月22日、xAIは新機能「Grok Vision」を発表しました。この機能により、ユーザーはスマートフォンのカメラを商品や標識、文書などに向けるだけで、AIがその映像をリアルタイムで解析し、内容に応じた説明や追加情報を返すことが可能となりました。この技術は、GoogleのGemini LiveやOpenAIのChatGPT Visionと同様に、画像を文脈ごとに理解するマルチモーダル処理を核としていますが、xAIは「日常の疑問を瞬時に言語化する体験」にフォーカスし、自然な対話フローに組み込んでいる点が特徴です。