Este episódio acompanha seis mudanças concretas na stack de agentes: Ollama avançando mais fundo em runtimes de agentes de codificação local, LM Studio melhorando inferência de visão em Apple Silicon e servidores locais remotos, NVIDIA posicionando DGX Spark como uma máquina séria para agentes locais, EXO mostrando onde a inferência local distribuída ainda precisa de endurecimento, xAI lançando Grok Build enquanto redireciona modelos antigos para Grok 4.3, e LiteLLM junto com Envoy AI Gateway apertando a camada de roteamento que fica entre agentes e modelos.
Show notes: https://tobyonfitnesstech.com/pt/podcasts/episode-52/