
Sign up to save your podcasts
Or
Neste episódio do podcast da MIT Technology Review Brasil, Rafael Coimbra, Andre Miceli e Carlos Aros discutem os desafios e as limitações dos benchmarks de Inteligência Artificial. Apesar de amplamente utilizados para medir o desempenho de modelos, esses indicadores estão cada vez menos eficazes para capturar a complexidade dos sistemas modernos.
A saturação dos conjuntos de dados, a repetição de métricas e o foco excessivo em resultados específicos criam uma visão distorcida sobre os avanços reais da tecnologia. Afinal, como podemos avaliar de forma mais precisa o impacto da IA em contextos reais e dinâmicos?
Ouça o novo episódio, oferecido pelo SAS.
Neste episódio do podcast da MIT Technology Review Brasil, Rafael Coimbra, Andre Miceli e Carlos Aros discutem os desafios e as limitações dos benchmarks de Inteligência Artificial. Apesar de amplamente utilizados para medir o desempenho de modelos, esses indicadores estão cada vez menos eficazes para capturar a complexidade dos sistemas modernos.
A saturação dos conjuntos de dados, a repetição de métricas e o foco excessivo em resultados específicos criam uma visão distorcida sobre os avanços reais da tecnologia. Afinal, como podemos avaliar de forma mais precisa o impacto da IA em contextos reais e dinâmicos?
Ouça o novo episódio, oferecido pelo SAS.
42 Listeners
178 Listeners
27 Listeners
62 Listeners
121 Listeners
78 Listeners
35 Listeners
212 Listeners
46 Listeners
160 Listeners
29 Listeners
17 Listeners
30 Listeners
4 Listeners
15 Listeners