August 13, 2024

Modelo misterioso “Strawberry” pode ser próximo grande avanço da OpenAI

3 minutes

Bom dia!

Nesta semana, destacamos a crescente especulação em torno de um modelo de IA não identificado, que pode ser o próximo grande avanço da OpenAI. Identificado como "anonymous-chatbot" na LMSYS Chatbot Arena, o modelo tem despertado grande curiosidade, com muitos acreditando que se trata do aguardado projeto “Strawberry”.

Na Folha de hoje:

* 🧠 Modelo misterioso “Strawberry” pode ser próximo grande avanço da OpenAI

* 🗣️ Meta negocia vozes de celebridades para seu assistente de IA

* 🎥 Nvidia enfrenta críticas por scraping massivo de vídeos para IA

* 🏃🏽 OpenAI continua a sofrer perdas na liderança

* 🦷 Robô dentista realiza primeira cirurgia totalmente automatizada em humano

* 🛡️ Microsoft e Palantir usam IA para reforçar a segurança nacional dos EUA

* 🏓 Robô da Google DeepMind atinge nível humano em partidas de tênis de mesa

Obrigado por ler Folha Artificial! Subscreva gratuitamente para receber novos posts toda terça pela manhã.

Tempo de leitura: 10 minutos

NOTÍCIAS DA SEMANA

OPENAI

🧠 Modelo misterioso “Strawberry” pode ser próximo grande avanço da OpenAI

Nos últimos dias, o surgimento de um modelo de IA desconhecido na LMSYS Chatbot Arena gerou intensas especulações na comunidade tecnológica. Identificado apenas como "anonymous-chatbot", o modelo tem demonstrado capacidades de raciocínio avançadas, superando até mesmo o GPT-4. Muitos acreditam que este pode ser o aguardado modelo Q*, ou sua evolução conhecida como projeto “Strawberry”, desenvolvida pela OpenAI.

A especulação se intensificou após uma série de tweets e discussões em fóruns, onde entusiastas e especialistas em IA debatem as características e o potencial desse modelo. O CEO da OpenAI, Sam Altman, contribuiu para o mistério ao postar uma imagem de um morango em suas redes sociais, o que muitos interpretaram como uma pista sobre o codinome do projeto. Esses rumores são acompanhados de relatos sobre atualizações no GPT-4, sugerindo que a OpenAI pode estar preparando o lançamento de uma nova versão mais poderosa.

Com a competição acirrada de rivais como Google e Anthropic, a possibilidade de que esse modelo anônimo seja um avanço significativo da OpenAI tem gerado grande expectativa. Se confirmado, esse lançamento pode marcar um novo salto nas capacidades da inteligência artificial, possivelmente aproximando a comunidade tecnológica do desenvolvimento da tão esperada inteligência artificial geral (AGI).

META

🗣️ Meta negocia vozes de celebridades para seu assistente de IA

A Meta está em negociações para usar as vozes de celebridades como Judi Dench, Awkwafina e Keegan-Michael Key em seu assistente digital MetaAI. A empresa planeja incorporar essas vozes em várias plataformas, incluindo Facebook, Instagram, WhatsApp e nos óculos de realidade aumentada Ray-Ban. A aposta da Meta é aumentar o engajamento dos usuários, com o apelo de vozes famosas para tornar suas interações com assistentes de IA mais envolventes.

Embora as negociações ainda estejam em andamento e enfrentem desafios, principalmente em relação aos termos de uso das vozes, Meta espera fechar os acordos antes de seu evento Connect, onde pretende revelar novas tecnologias focadas em IA. A empresa de Mark Zuckerberg está investindo bilhões de dólares em inteligência artificial, com uma ambição de liderar o setor.

NVIDIA

🎥 Nvidia enfrenta críticas por scraping massivo de vídeos para IA

Documentos vazados revelaram que a Nvidia está sendo acusada de coletar ilegalmente grandes volumes de vídeos de plataformas como YouTube e Netflix para treinar seu novo modelo de IA, chamado "Cosmos". O projeto, iniciado em 2024, envolve a extração de vídeos para criar um modelo de base, que pode ser utilizado em várias aplicações, incluindo sistemas de veículos autônomos e ferramentas de construção de mundos 3D.

A empresa, que utiliza até 30 máquinas virtuais para baixar aproximadamente 80 anos de vídeos por dia, afirma que suas práticas estão em conformidade com as leis de direitos autorais. No entanto, a questão ética e legal gerou controvérsia, especialmente com a crescente pressão para regulamentar o uso de dados para treinamento de IA. O debate intensifica-se à medida que o Congresso dos EUA discute legislações específicas para IA, como o AI Foundation Model Transparency Act, buscando maior transparência e controle sobre esses processos.

OPENAI

🏃🏽 OpenAI continua a sofrer perdas na liderança

A OpenAI está passando por uma reestruturação significativa em sua liderança, com a saída de John Schulman e a licença de Greg Brockman. Schulman, cofundador e um dos principais responsáveis pelo alinhamento de IA na empresa, anunciou sua mudança para a Anthropic, uma startup rival focada em segurança e alinhamento de IA. Ele afirmou que a decisão foi motivada por um desejo pessoal de se concentrar mais profundamente em pesquisas técnicas e alinhamento de IA, áreas nas quais a Anthropic tem grande ênfase.

Paralelamente, Greg Brockman, outro cofundador e presidente da OpenAI, entrou em uma licença até o final do ano, citando a necessidade de descanso após nove anos de trabalho contínuo desde a fundação da empresa. Esses movimentos ocorrem em meio a uma série de outras mudanças na OpenAI, incluindo saídas anteriores de outros membros-chave da equipe de segurança e alinhamento.

PERCEPTIVE

🦷 Robô dentista realiza primeira cirurgia totalmente automatizada em humano

Uma startup de Boston chamada Perceptive alcançou um marco na odontologia ao realizar o primeiro procedimento dentário totalmente automatizado usando um robô. O sistema, equipado com tecnologia avançada de IA e um scanner 3D volumétrico, consegue preparar um dente para uma coroa em apenas 15 minutos, comparado às duas horas que normalmente seriam necessárias com um dentista humano. O robô utiliza uma tecnologia de imagem chamada Optical Coherence Tomography (OCT) para criar modelos 3D detalhados da boca, eliminando a necessidade de raios-X e oferecendo uma precisão de diagnóstico superior a 90%.

Apesar do sucesso do procedimento, a tecnologia ainda não foi aprovada pela FDA, agência reguladora americana, e pode levar anos até estar disponível ao público. A expectativa é que essa inovação torne os tratamentos mais rápidos, precisos e acessíveis.

MICROSOFT / PALANTIR

🛡️Microsoft e Palantir usam IA para reforçar a segurança nacional dos EUA

Microsoft e Palantir anunciaram uma parceria estratégica para levar capacidades avançadas de inteligência artificial e análises a agências de Defesa e Inteligência dos EUA. A colaboração, que combina as plataformas de IA da Palantir com o serviço Azure OpenAI da Microsoft, será implementada em ambientes de nuvem altamente classificados, conhecidos como Azure Government Secret e Top Secret. Este movimento visa permitir que operações críticas possam usufruir de forma segura recursos de IA, abrangendo desde a logística militar até o planejamento estratégico.

Essa parceria é mais um avanço no uso de IA para missões de segurança nacional, mas levanta questões sobre o impacto e os riscos do uso dessas tecnologias em áreas sensíveis. Com o recente desmantelamento da equipe de segurança da OpenAI e as preocupações contínuas em torno de desenvolvimentos como o projeto Q*, o uso da IA em operações governamentais sensíveis tem se tornado um tema de debate intenso.

PESQUISA

🏓 Robô da Google DeepMind atinge nível humano em partidas de tênis de mesa

Pesquisadores da Google DeepMind desenvolveram um robô capaz de competir em tênis de mesa em nível humano. Através de uma abordagem inovadora, o robô utiliza uma arquitetura hierárquica de políticas modulares e técnicas de aprendizado de máquina que permitem a adaptação em tempo real a diferentes oponentes. Em testes contra 29 jogadores humanos de diversos níveis, o robô venceu 45% das partidas, mostrando desempenho equivalente ao de um jogador amador. Este avanço representa um marco significativo no desenvolvimento de robôs para tarefas físicas complexas e pode abrir caminho para aplicações em outros esportes e áreas que exigem alta precisão e tomada de decisões em tempo real.

CURTAS

* 🛠️ A OpenAI lançou a funcionalidade de Structured Outputs em sua API, permitindo que desenvolvedores obtenham respostas do modelo que seguem rigorosamente esquemas JSON definidos por eles. Essa funcionalidade é ativada pela configuração strict: true na definição de funções ou no novo parâmetro response_format. Isso garante que as saídas estejam sempre em conformidade com o esquema fornecido, o que facilita a integração com sistemas que exigem formatos de dados estruturados e consistentes. Saiba mais.

* 💻A Intel teve a oportunidade de adquirir uma participação de 15% na OpenAI por US$ 1 bilhão em 2017, mas o então CEO Bob Swan recusou a oferta. Swan acreditava que os modelos de IA não teriam impacto significativo no mercado tão cedo, o que levou a Intel a perder a chance de investir na empresa que, anos depois, se tornaria um dos principais players na área de inteligência artificial, especialmente com o lançamento do ChatGPT em 2022. Saiba mais.

* 🦾 O projeto Berkeley Humanoid, desenvolvido na Universidade da Califórnia, Berkeley, é uma plataforma de pesquisa em robótica humanoide focada em controle baseado em aprendizado. O robô, projetado para simular movimento humano com alta confiabilidade, foi criado para testar algoritmos de aprendizado que exigem baixa complexidade de simulação. Recentemente, ele foi equipado com tecnologias de IA para melhorar a agilidade e a locomoção em diferentes terrenos. A pesquisa continua a expandir as capacidades desse robô, visando aplicações futuras em várias áreas. Saiba mais.

* 🌍 A Meta anunciou a abertura das inscrições para o programa Llama 3.1 Impact Grants, destinado a apoiar projetos que utilizam o modelo de IA de código aberto Llama 3.1 para gerar impacto social e econômico significativo. O programa distribuirá um total de US$ 2 milhões em prêmios, com até US$ 500.000 por projeto. As organizações podem se inscrever até 22 de novembro de 2024, e eventos regionais também serão realizados para fornecer orientação técnica e mentoria. Saiba mais.

* 🌐 A Verizon está utilizando técnicas de inteligência artificial e machine learning para prevenir cortes em cabos de fibra ótica. Este programa inovador, que é o primeiro do tipo na indústria, analisa mais de 10 milhões de solicitações de escavação anuais nos Estados Unidos, identificando aquelas com maior risco de danificar os cabos subterrâneos da Verizon. A empresa integra essa solução com seu sistema de chamadas 811, possibilitando que ações preventivas sejam tomadas, como a comunicação adicional com os responsáveis pela escavação, o que pode reduzir significativamente os cortes de fibra ao longo do ano. Saiba mais.

* 🇨🇳 A Microsoft decidiu modificar sua parceria de $1,5 bilhão com a empresa de IA dos Emirados, G42, devido a crescentes preocupações sobre os laços da G42 com a China. Inicialmente, a parceria envolveria a transferência de tecnologia sensível, incluindo semicondutores avançados e modelos de IA, mas agora a Microsoft planeja alugar seus produtos de IA para a G42, permitindo maior controle e supervisão. A mudança ocorre em meio a pressões do Congresso dos EUA, que teme que a parceria possa facilitar o acesso de Pequim a tecnologias críticas. Saiba mais.

* 🤖 A Mistral AI anunciou novos recursos que facilitam o desenvolvimento e compartilhamento de aplicações de IA generativa. A empresa introduziu uma personalização mais simples e eficiente de modelos de linguagem, permitindo que desenvolvedores adaptem esses modelos para casos de uso específicos de maneira rápida. Além disso, foi lançada a versão alfa dos "Agents", que possibilita a criação de comportamentos personalizados e fluxos de trabalho através de instruções simples. Saiba mais.

* 🎧 A Audible está testando um novo recurso de busca com tecnologia de IA chamado "Maven", projetado para ajudar os usuários a encontrar audiolivros de maneira mais precisa e personalizada. Esse recurso permite que os usuários façam perguntas em linguagem natural, como "Estou procurando um romance de ficção inspirador com uma protagonista feminina", e recebam recomendações sob medida do vasto catálogo de quase um milhão de títulos da Audible. O Maven está disponível para cerca de metade dos clientes dos EUA em dispositivos iOS e Android, e o recurso está atualmente em fase beta, limitado a uma parte da biblioteca. Saiba mais.

* 🔍 A OpenAI desenvolveu uma tecnologia de marca d'água para identificar textos gerados pelo ChatGPT, mas tem hesitado em lançá-la devido a preocupações com possíveis impactos negativos. Embora a ferramenta seja eficaz em detectar texto de IA, inclusive após pequenos ajustes como paráfrases, há receios de que sua adoção possa desencorajar o uso do ChatGPT, especialmente por falantes não nativos de inglês, e estigmatizar o uso da IA como uma ferramenta de escrita. Além disso, quase 30% dos usuários indicaram que usariam o ChatGPT menos se essa marca d'água fosse implementada. Saiba mais.

* 📺 O Google revelou seu novo dispositivo de streaming de TV, o Gemini-AI Powered TV Streamer. Este dispositivo de última geração substitui o Chromecast, oferecendo uma experiência mais rápida e premium. Além de permitir acesso a mais de 700 mil filmes e programas de aplicativos populares, o streamer também atua como um hub inteligente para dispositivos Google Home e Matter. Com a tecnologia Gemini, o dispositivo proporciona sugestões personalizadas e recursos como resumos detalhados de conteúdo, tornando a navegação e o entretenimento mais intuitivos e envolventes. Saiba mais.

* 🍏 A Apple pode cobrar até US$ 20 por mês por algumas funcionalidades da nova plataforma "Apple Intelligence", que incorpora IA avançada em seus dispositivos. Analistas sugerem que a empresa planeja lançar essas funcionalidades ainda este ano, com potencial de transformar a experiência do usuário e adicionar uma nova fonte de receita significativa para a empresa. Saiba mais.

* 🍔 A Wendy's está introduzindo a capacidade de realizar pedidos em espanhol por meio de um sistema de inteligência artificial nos drive-thrus da Flórida. Essa inovação, parte do sistema Wendy's FreshAI, visa atender melhor a comunidade hispânica do estado. O programa piloto já está ativo em 28 restaurantes em Ohio e Flórida, permitindo que os clientes façam pedidos em seu idioma preferido, melhorando a acessibilidade e a experiência do usuário. Saiba mais.

VÍDEO DA SEMANA

A Figure lançou seu novo robô humanoide, o Figure 02, que utiliza tecnologia da OpenAI para conversas naturais por meio de fala. Equipado com alto-falantes e microfones, o robô é capaz de interagir de forma fluida e natural. Esta nova versão passou por um redesign completo, incluindo seis câmeras RGB, um modelo visual de linguagem integrado, melhor processamento de CPU/GPU e mãos aprimoradas com 16 graus de liberdade. Embora haja debates sobre o design de mãos humanoides, a Figure mantém sua aposta em mãos inspiradas em humanos, buscando expandir o uso do robô além das fábricas para aplicações comerciais e, futuramente, domésticas. Clique aqui ou na imagem acima para assistir.

FERRAMENTAS

* 💬 Ollama: plataforma que facilita a criação e o uso de modelos de linguagem em dispositivos locais. O Ollama oferece uma maneira de executar modelos de IA diretamente no seu dispositivo, sem a necessidade de se conectar à nuvem, o que melhora a privacidade e a acessibilidade. Link.

* 🛠️ LlamaCoder: ferramenta de código aberto que permite a geração de aplicativos full-stack a partir de um único prompt. Desenvolvido com o modelo Llama 3.1 e a plataforma Together AI, o LlamaCoder possibilita a criação de aplicativos completos e customizáveis, suportando modificações em tempo real através de uma abordagem que envolve o desenvolvedor no processo de ajuste. Link.

* 🎙️ Adobe Podcast: plataforma da Adobe que oferece ferramentas avançadas para a criação e edição de podcasts. Entre seus recursos estão a remoção de ruídos, equalização automática de voz e integração com o Creative Cloud, facilitando a produção de áudio de alta qualidade para criadores de conteúdo. Link.

* 🗣️ Parler TTS v1: nova versão open-source dos modelos de síntese de fala, disponíveis em duas variantes: 885M (Mini) e 2.2B (Large). Treinados em 45.000 horas de áudio aberto, esses modelos oferecem geração de fala até 4x mais rápida e suportam tecnologias como SDPA e Flash Attention 2 para maior eficiência. Com consistência aprimorada de voz e suporte para personalização de locutores, é possível até mesmo ajustar os modelos para dados específicos com apenas algumas horas de treinamento adicional. Link.

MINITUTORIAL

📽️Transforme imagens em vídeos com o Gen-3

O modelo Gen-3 Alpha da Runway agora oferece capacidades de transformar imagens em vídeos, permitindo que os usuários façam upload de uma imagem e a convertam em um vídeo curto para gerações mais consistentes. Passo a passo:

* Visite o Runway e crie uma conta (apenas planos pagos).

* No seu painel, clique em "Text/Image to Video" em "Runway's AI Tools".

* Selecione "Gen-3 Alpha", faça o upload de uma imagem 16:9 como ponto de partida e descreva o vídeo desejado.

* Escolha uma duração (5 ou 10 segundos), clique em "Generate" e veja sua imagem ganhar vida!

Até a próxima!

Obrigado por ler Folha Artificial! Subscreva gratuitamente para receber novos posts toda terça pela manhã.

This is a public episode. If you would like to discuss this with other subscribers or get access to bonus episodes, visit folhaartificial.substack.com

...more