
Sign up to save your podcasts
Or
Neste episódio do podcast da MIT Technology Review Brasil, Rafael Coimbra, Andre Miceli e Carlos Aros discutem os desafios e as limitações dos benchmarks de Inteligência Artificial. Apesar de amplamente utilizados para medir o desempenho de modelos, esses indicadores estão cada vez menos eficazes para capturar a complexidade dos sistemas modernos.
A saturação dos conjuntos de dados, a repetição de métricas e o foco excessivo em resultados específicos criam uma visão distorcida sobre os avanços reais da tecnologia. Afinal, como podemos avaliar de forma mais precisa o impacto da IA em contextos reais e dinâmicos?
Ouça o novo episódio, oferecido pelo SAS.
Neste episódio do podcast da MIT Technology Review Brasil, Rafael Coimbra, Andre Miceli e Carlos Aros discutem os desafios e as limitações dos benchmarks de Inteligência Artificial. Apesar de amplamente utilizados para medir o desempenho de modelos, esses indicadores estão cada vez menos eficazes para capturar a complexidade dos sistemas modernos.
A saturação dos conjuntos de dados, a repetição de métricas e o foco excessivo em resultados específicos criam uma visão distorcida sobre os avanços reais da tecnologia. Afinal, como podemos avaliar de forma mais precisa o impacto da IA em contextos reais e dinâmicos?
Ouça o novo episódio, oferecido pelo SAS.
44 Listeners
178 Listeners
29 Listeners
62 Listeners
118 Listeners
74 Listeners
35 Listeners
212 Listeners
47 Listeners
164 Listeners
37 Listeners
17 Listeners
35 Listeners
4 Listeners
15 Listeners