Folha Artificial Podcast

OpenAI revela o futuro da inteligência artificial com modelo o3


Listen Later

Bom dia!

Nesta edição, destacamos o lançamento do surpreendente modelo o3 pela OpenAI, que redefine os limites da inteligência artificial. O modelo já apresenta resultados superiores ao desempenho humano em benchmarks complexos, consolidando a OpenAI como líder no setor. Confira também novidades do Google, NVIDIA, Perplexity AI e outras notícias imperdíveis do mundo da inteligência artificial.

Na Folha de hoje:

* OpenAI apresenta o3 e redefine padrões da IA

* Google lança Gemini 2.0 com raciocínio explícito

* Microsoft expande capacidades com o modelo Phi-4

* Google lança novas versões de seus modelos de geração de imagem e vídeo

* NVIDIA apresenta supercomputador acessível Jetson Orin Nano

* Odyssey inova com geração de mundos 3D detalhados

* Perplexity AI atinge valuation de US$ 9 bilhões após nova rodada de financiamento

Obrigado por ler Folha Artificial! Subscreva gratuitamente para receber novos posts toda terça pela manhã.

Tempo de leitura: 10 minutos

NOTÍCIAS DA SEMANA

OPENAI

🤯 OpenAI anuncia sua nova geração de IA

No último dia de sua campanha “12 Dias de OpenAI”, a OpenAI apresentou ao mundo sua nova geração de IA generativa: os modelos o3 e o3 Mini. O modelo o3 obteve resultados muito acima do que qualquer modelo disponível atualmente, incluindo 96,7% de precisão em competições matemáticas e um recorde de 87,5% no Arc AGI, um benchmark rigoroso que testa habilidades de raciocínio abstrato e adaptação a novas situações. O o3 Mini, por sua vez, combina desempenho competitivo com custos reduzidos, permitindo ajustar o tempo de raciocínio para balancear velocidade e profundidade, tornando-o mais acessível a diferentes aplicações.

O desempenho do o3 no Arc AGI é um marco impressionante. O Arc AGI foi criado para avaliar a capacidade de modelos de IA em aprender e aplicar novas habilidades em situações inéditas, sem depender de padrões memorizados. O o3 é o primeiro sistema a superar consistentemente o desempenho humano médio de 85% nesse teste, um avanço gigantesco no caminho para inteligência geral artificial (AGI). Essa conquista demonstra que a OpenAI está desenvolvendo modelos capazes de extrapolar conhecimentos pré-treinados, resolvendo problemas inéditos de forma inovadora, com impacto potencial em áreas como ciência, saúde e planejamento estratégico.

Além disso, a OpenAI apresentou o conceito de Deliberative Alignment, que usa o raciocínio do modelo para aprimorar limites de segurança e identificar abusos em potencial. Os modelos o3 e o3 Mini estão disponíveis para testes de segurança com pesquisadores qualificados, com o lançamento público do o3 Mini previsto para janeiro de 2025. Esse anúncio mostra que a OpenAI continua firme na liderança do setor, com modelos cada vez mais sofisticados e avançando rapidamente na direção da AGI.

OPENAI

🚀 OpenAI conclui evento “12 Days of OpenAI” com grandes novidades

Na última semana do evento “12 Dias de OpenAI”, a OpenAI revelou uma série de atualizações e lançamentos. Na segunda-feira (16), o ChatGPT recebeu melhorias em busca, agora disponível para todos os usuários gratuitos, com otimizações para dispositivos móveis e integração com mapas e o Modo Avançado de Voz. Na terça (17), a empresa lançou o modelo o1 na API, adicionando suporte a chamadas de função e processamento de visão, além de reduzir os custos de GPT-4o em áudio. Kits de desenvolvimento para Go e Java também foram introduzidos, ampliando o suporte para desenvolvedores.

Na quarta-feira (18), a OpenAI liberou acesso ao ChatGPT via telefone gratuito e WhatsApp, permitindo a interação com IA em plataformas mais acessíveis. Quinta-feira (19) trouxe integrações do ChatGPT com ambientes de programação como JetBrains e VS Code, além de aplicativos de produtividade como Notion e Apple Notes, embora algumas funcionalidades sejam exclusivas de assinantes pagos.

A semana foi encerrada na sexta-feira (20) com o anúncio dos modelos o3 e o3-mini. O o3 atingiu recordes em benchmarks avançados como ARC-AGI, com desempenho superior ao de humanos em alguns casos, e 96,7% de precisão em competições matemáticas. Veja mais sobre estes modelos nesta edição.

GOOGLE

🧠 Google apresenta Gemini 2.0 Flash Thinking: IA que “pensa em voz alta”

O Google revelou o Gemini 2.0 Flash Thinking, um modelo experimental de inteligência artificial projetado para resolver problemas complexos explicitando seu processo de raciocínio. Essa abordagem é similar à adotada pela OpenAI em seus modelos da série o, aprimorando a capacidade de raciocínio da IA e permitindo que ela detalhe os passos que utiliza para chegar às soluções.

Durante a apresentação, Jeff Dean, cientista-chefe do Google DeepMind, demonstrou como o modelo aborda questões de física, decompondo-as em etapas gerenciáveis. Além disso, o modelo mostrou proficiência em resolver problemas que integram elementos visuais e textuais. Usuários podem experimentar gratuitamente o Gemini 2.0 Flash Thinking no Google AI Studio. Este lançamento ocorre em meio a uma corrida por modelos com melhores capacidades de raciocínio, com empresas como OpenAI explorando novas abordagens além do simples aumento do tamanho dos modelos.

MICROSOFT

⭐️ Microsoft lança o modelo de linguagem Phi-4

A Microsoft anunciou o Phi-4, um modelo de linguagem de 14 bilhões de parâmetros que se destaca em raciocínios complexos, especialmente em matemática, além de processamentos linguísticos convencionais. O Phi-4 é o mais recente da família de pequenos modelos de linguagem (SLMs) da empresa, demonstrando resultados de alta qualidade com um tamanho reduzido. Atualmente, o Phi-4 está disponível no Azure AI Foundry sob um Acordo de Licença de Pesquisa da Microsoft (MSRLA) e estará disponível no Hugging Face em breve.

O Phi-4 supera modelos comparáveis e até maiores em tarefas de raciocínio matemático, graças a avanços como o uso de conjuntos de dados sintéticos de alta qualidade, curadoria de dados orgânicos e inovações pós-treinamento. A Microsoft também disponibiliza recursos robustos para medir, mitigar e gerenciar riscos ao longo do ciclo de desenvolvimento de IA. Essas capacidades podem ser integradas facilmente em aplicativos por meio de uma única API, permitindo monitoramento contínuo da qualidade e segurança em produção.

GOOGLE

🎥 Google atualiza modelos de geração de vídeo e imagem

O Google anunciou grandes atualizações em seus modelos de geração de mídia, introduzindo o Veo 2 e o Imagen 3. O Veo 2 aprimora a criação de vídeos de alta qualidade, com melhor compreensão de física realista e nuances de movimento humano, permitindo produções em resoluções de até 4K e duração estendida. Já o Imagen 3 eleva a geração de imagens, produzindo resultados mais precisos, com melhor composição e diversidade de estilos artísticos. Ambos os modelos estão disponíveis nas ferramentas VideoFX e ImageFX do Google Labs, respectivamente.

Além disso, a empresa lançou o Whisk, uma nova ferramenta experimental que permite aos usuários gerar imagens a partir de outras imagens, facilitando processos criativos rápidos e divertidos. O Whisk utiliza o modelo Gemini para descrever detalhadamente as imagens fornecidas e, em seguida, o Imagen 3 para gerar novas imagens baseadas nessas descrições, permitindo combinações únicas de objetos, cenários e estilos.

NVIDIA

🖥️ NVIDIA lança supercomputador de IA compacto e acessível

A NVIDIA revelou o Jetson Orin Nano Super Developer Kit, um supercomputador de IA generativa compacto e acessível, com preço inicial de US$ 249. O novo dispositivo é voltado para desenvolvedores, entusiastas e estudantes, oferecendo até 1,7 vezes mais desempenho em comparação com modelos anteriores. Ele suporta a criação de chatbots, agentes visuais e robôs baseados em IA, com 67 INT8 TOPS e uma largura de banda de memória de 102 GB/s.

Compatível com ferramentas como o NVIDIA Isaac (para robótica) e o Metropolis (para visão computacional), o kit também permite que usuários do modelo anterior atualizem seu software para aproveitar os ganhos de desempenho. Este lançamento ajuda a democratizar o acesso à tecnologia de IA avançada, tornando-a viável para pequenos negócios e projetos educacionais.

ODYSSEY

🌐 Odyssey lança modelo generativo de mundos 3D

A startup Odyssey apresentou o Explorer, um modelo generativo que transforma imagens em mundos 3D detalhados, permitindo acelerar a criação de ambientes para filmes e jogos. A empresa também anunciou a entrada de Ed Catmull, cofundador da Pixar, em seu conselho, reforçando sua estratégia de inovação na narrativa digital.

O Explorer é capaz de gerar mundos fotorrealistas e em movimento, utilizando a técnica de “gaussian splats” para reconstruir cenas com detalhes impressionantes. Esses mundos podem ser editados em ferramentas de modelagem 3D como Unreal, Houdini e Blender, permitindo que artistas ajustem as criações conforme suas necessidades. Atualmente, o Explorer está sendo utilizado por um grupo seleto de artistas, com planos de expandir o acesso em breve.

PERPLEXITY

💵 Perplexity AI triplica avaliação para US$ 9 bilhões com novo financiamento

A startup de inteligência artificial Perplexity AI concluiu uma rodada de financiamento de US$ 500 milhões, elevando sua avaliação para US$ 9 bilhões. Liderada pela Institutional Venture Partners, a rodada contou com a participação de investidores como Nvidia, New Enterprise Associates, B Capital e T. Rowe Price. A Perplexity AI, conhecida por seu mecanismo de busca impulsionado por IA, planeja utilizar os recursos para atrair talentos e desenvolver seu sistema de publicidade em buscas, visando competir com gigantes como Google e OpenAI.

Fundada em 2022, a empresa tem registrado um crescimento acelerado, com 15 milhões de usuários ativos mensais, principalmente nos Estados Unidos. As receitas aumentaram de US$ 5 milhões em janeiro para US$ 35 milhões em agosto de 2024. A Perplexity AI monetiza seus serviços por meio de assinaturas e planeja iniciar colaborações publicitárias com grandes marcas. Apesar de preocupações sobre uma possível bolha de investimentos em IA, a empresa continua a expandir suas operações e a desafiar o domínio de motores de busca estabelecidos.

CURTAS

* 🔒A Meta AI anunciou novos recursos para aprimorar a robustez e segurança de agentes de inteligência artificial. As atualizações incluem o lançamento do Meta Motivo, um modelo fundamental para controlar o comportamento de agentes virtuais, e o Meta Video Seal, uma ferramenta de código aberto para marca d’água em vídeos. Saiba mais.

* 💼 O CEO da SoftBank, Masayoshi Son, anunciou um plano para investir US$ 100 bilhões em projetos de inteligência artificial e infraestrutura nos Estados Unidos nos próximos quatro anos, com a expectativa de criar 100.000 empregos. Saiba mais.

* 👁️ Ilya Sutskever, cofundador e ex-cientista-chefe da OpenAI, prevê que haverá grandes mudanças no desenvolvimento de IA daqui pra frente. Em palestra na conferência NeurIPS, ele afirmou que a fase de pré-treinamento está se esgotando devido à escassez de novos dados na internet, comparando-os a combustíveis fósseis. Sutskever sugere que futuros modelos de IA serão mais “agentes” e capazes de raciocinar, processando informações de forma semelhante ao pensamento humano. Saiba mais.

* 🤖 A OpenAI publicou documentos mosntrando que, em 2017, Elon Musk sugeriu transformar a organização em uma entidade lucrativa, buscando controle majoritário e a posição de CEO. Com a rejeição da proposta, ele deixou a OpenAI e, em 2023, fundou a xAI, uma empresa concorrente. Saiba mais.

* 🛑 O ex-CEO do Google, Eric Schmidt, afirmou que, caso uma inteligência artificial desenvolva a capacidade de se autoaperfeiçoar sem supervisão humana, a solução seria desligá-la imediatamente para evitar riscos potenciais. Saiba mais.

* 🕶️ A Meta lançou uma atualização para os óculos inteligentes Ray-Ban Meta, incluindo tradução de idiomas em tempo real (inglês para espanhol, francês e italiano) e integração com o Shazam para identificação de músicas. Disponível nos EUA e Canadá, a tradução está acessível inicialmente para usuários do Programa de Acesso Antecipado. Saiba mais.

* 🪖 A Lockheed Martin anunciou a formação da Astris AI, uma nova subsidiária dedicada a auxiliar empresas de defesa dos EUA na incorporação de inteligência artificial em suas operações. A iniciativa visa otimizar fluxos de trabalho e aprimorar capacidades no setor de defesa, que tradicionalmente tem sido cauteloso na adoção de IA devido à sensibilidade dos dados envolvidos. Saiba mais.

* 💻 O Google anunciou o lançamento do Gemini Code Assist Tools, uma extensão que permite aos desenvolvedores acessar informações e executar ações em seus sistemas de engenharia diretamente do ambiente de desenvolvimento integrado (IDE). A novidade facilita tarefas como resumir comentários recentes de um problema no Jira ou identificar o último colaborador que fez alterações em um arquivo no Git, aumentando a produtividade e mantendo o foco dos desenvolvedores. Saiba mais.

* 🤖 O Departamento de Segurança Interna dos EUA (DHS) implementou o DHS-Chat, um chatbot de inteligência artificial desenvolvido internamente, agora disponível para cerca de 19.000 funcionários na sede do DHS e usuários piloto em 10 agências operacionais. Semelhante a ferramentas como o ChatGPT, o DHS-Chat auxilia na sumarização de documentos complexos, geração de código e automação de tarefas repetitivas, operando dentro da infraestrutura segura do departamento. Saiba mais.

VÍDEO DA SEMANA

O vídeo da semana vai para a demonstração do Veo 2 pelo Google. A nova versão do modelo de geração de vídeos tem um resultado impressionante, aparentemente superior a todos os outros modelos generativos disponíveis — até mesmo o Sora da OpenAI. Clique aqui ou na imagem acima para assistir.

FERRAMENTAS

* 🤖 Reddit Answers: ferramenta de IA que permite aos usuários fazer perguntas e receber respostas resumidas, extraídas de discussões relevantes na plataforma. Atualmente em fase beta, está disponível para um grupo seleto de usuários nos EUA e suporta apenas o idioma inglês. Link.

* 🎨 Pika 2.0: plataforma que utiliza inteligência artificial para transformar descrições textuais, imagens estáticas e vídeos existentes em produções audiovisuais de alta qualidade. Oferece recursos como efeitos especiais, animações e personalizações, permitindo que usuários sem experiência técnica criem vídeos profissionais de forma intuitiva. Link.

* 💬 WithEden AI: extensão para o navegador Chrome que permite aos usuários comentar em qualquer página da web usando emojis. A inteligência artificial resume o conteúdo da página e cria comentários personalizados com base no emoji selecionado, facilitando a expressão de opiniões e reações de forma rápida e intuitiva. Link.

* 🔍 Findr: plataforma que centraliza informações de diversos aplicativos, notas e arquivos em um único local, utilizando inteligência artificial para facilitar a busca e o gerenciamento de dados. Com o Findr, é possível integrar aplicativos como Gmail, Slack, Jira e Google Drive, permitindo pesquisas rápidas e precisas por meio de uma barra de busca unificada. Além disso, a ferramenta oferece recursos de chat com seus dados, possibilitando interações mais intuitivas e eficientes. Link.

MINITUTORIAL

💼 Pratique entrevistas de emprego com o ChatGPT

O Modo de Voz Avançado do ChatGPT pode se transformar em um coach de entrevistas personalizado, conduzindo simulações e fornecendo feedback em tempo real. Passo a passo:

* Abra o Modo de Voz Avançado do ChatGPT em seu dispositivo móvel.

* Configure o cenário específico da sua entrevista e o contexto da indústria. Use o prompt: “Tenho uma entrevista para [cargo] em [tipo de indústria]. Aja como um entrevistador experiente nessa área. Conduza uma entrevista simulada focando em [habilidades/experiência específicas]. Forneça feedback sobre a clareza das minhas respostas, exemplos relevantes e pontos a melhorar.”

* Participe de uma entrevista simulada realista com perguntas focadas na sua área de atuação.

* Receba feedback imediato sobre suas respostas e apresentação.

Se precisar de mais tempo para formular suas respostas, personalize a forma como a IA responde utilizando as Instruções Personalizadas.

Até a próxima!

Obrigado por ler Folha Artificial! Subscreva gratuitamente para receber novos posts toda terça pela manhã.



This is a public episode. If you would like to discuss this with other subscribers or get access to bonus episodes, visit folhaartificial.substack.com
...more
View all episodesView all episodes
Download on the App Store

Folha Artificial PodcastBy Pablo Mascarenhas