Folha Artificial Podcast by Pablo Mascarenhas

May 14, 2024 OpenAI surpreende a indústria com novo ChatGPT

Bom dia!

A OpenAI surpreendeu o mundo tecnológico ao anunciar o lançamento do GPT-4o, um modelo de inteligência artificial que integra capacidades de processamento de texto, fala e vídeo. Este avanço permite interações mais complexas e naturais entre humanos e máquinas. Vamos explorar os principais destaques e inovações do mundo da inteligência artificial nesta edição.

Na Folha de hoje:

* GPT-4o inova com capacidades de voz e imagem

* Microsoft anuncia novo modelo de IA

* Randy Travis retorna à música com auxílio da inteligência artificial

* Google apresenta um marco para a pesquisa biológica

* Stack Overflow e OpenAI firmam parceria

* OpenAI apresenta um guia para moldar a ética de IA

* Professores não conseguem detectar textos gerados por IA

Obrigado por ler Folha Artificial! Subscreva gratuitamente para receber novos posts toda terça pela manhã.

Tempo de leitura: 10 minutos

NOTÍCIAS DA SEMANA

OPENAI

🤖 OpenAI inova mais uma vez ao lançar o modelo GPT-4o 'omni'

OpenAI apresentou nesta segunda-feira o seu mais novo modelo de inteligência artificial generativa, chamado GPT-4o, onde o "o" representa "omni". Este modelo é capaz de processar texto, fala e vídeo de forma nativa, marcando um avanço significativo em relação aos modelos anteriores. O GPT-4o será implementado de forma iterativa nos produtos voltados para desenvolvedores e consumidores da empresa nas próximas semanas. Segue um resumo das principais novidades apresentadas no evento:

* ChatGPT Desktop: versão desktop do ChatGPT, facilitando a integração com o fluxo de trabalho do usuário. Possui interface renovada, com foco em uma experiência mais natural e intuitiva.

* GPT-4o: novo modelo principal, mais rápido e acessível para todos os usuários.

* Oferece a inteligência do GPT-4 com maior eficiência.

* Mudança de paradigma na interação humano-máquina, com foco em colaboração natural e fácil.

* Capacidade de raciocinar em voz, texto e visão de forma nativa.

* Recursos de Voz:

* Conversação em tempo real com interrupções naturais.

* Respostas em tempo real, sem atrasos.

* Reconhecimento e resposta emocional.

* Geração de voz em diferentes estilos e entonações, incluindo canto.

* Recursos de Visão:

* Resolução de problemas a partir de imagens.

* Interação com código e análise de dados.

* Reconhecimento facial e análise de emoções.

* Tradução em Tempo Real: Tradução instantânea entre idiomas durante a conversa.

* Recursos que estarão disponíveis gratuitamente:

* Acesso à GPT Store, com criação e compartilhamento de experiências personalizadas com o ChatGPT.

* Upload e análise de imagens, documentos e capturas de tela.

* Acesso ao recurso de “Memória”, com continuidade entre conversas para um ChatGPT mais útil e contextualizado.

* Navegação, com busca por informações em tempo real dentro das conversas.

* Upload e análise de gráficos e dados.

* Melhoria na qualidade e velocidade em 50 idiomas.

* API GPT-4o:

* Disponível para desenvolvedores criarem aplicações de IA em escala.

* Mais rápido, 50% mais barato e com limites de taxa 5 vezes maiores que o GPT-4 Turbo.

O GPT-4o amplia significativamente as capacidades do ChatGPT, permitindo interações mais naturais e em tempo real, como interromper o ChatGPT enquanto ele responde e detectar nuances na voz do usuário para responder em diferentes estilos emotivos, incluindo canto. Com este lançamento, a OpenAI torna possível, em termos práticos, a ficção imaginada no filme Her, demonstrando que está muito à frente de seus competidores e criando as bases para uma nova forma de interação com computadores.

MICROSOFT

🧠 Microsoft anuncia novo modelo de para competir com Google e OpenAI

A Microsoft está desenvolvendo um novo modelo de linguagem de inteligência artificial chamado MAI-1, que promete ser um concorrente direto dos modelos avançados de empresas como Google e OpenAI. O MAI-1, liderado por Mustafa Suleyman, ex-chefe da equipe de desenvolvimento de IA do Google, está sendo projetado para superar os modelos anteriores da Microsoft, com cerca de 500 bilhões de parâmetros, significativamente maior que os modelos de código aberto da empresa.

Este novo modelo destaca o empenho da Microsoft em avançar no campo da IA, que se reflete em uma estratégia dual, onde a empresa busca desenvolver modelos de IA de pequena e grande escala ao mesmo tempo em que aproveita os avanços obtidos com sua participação na OpenAI. Os modelos de pequena escala seriam mais econômicos e adequados para dispositivos móveis, enquanto os modelos maiores e mais avançados funcionariam na nuvem, exigindo mais poder de computação e dados para treinamento, competindo diretamente com o Gemini e o GPT-4. A Microsoft planeja oferecer uma prévia do MAI-1 em sua conferência para desenvolvedores, Build.

MÚSICA

🎤 Randy Travis retorna à música com auxílio da inteligência artificial

Após sofrer um grave AVC em 2013, que lhe retirou a capacidade de falar e cantar, o icônico cantor de música country Randy Travis conseguiu retornar ao cenário musical graças a um avanço proporcionado pela inteligência artificial. Travis lançou a música "Where That Came From", marcando seu retorno após mais de uma década sem novas canções. Este feito foi possível através da utilização de uma tecnologia de IA que recriou sua voz a partir de gravações antigas, permitindo que ele voltasse a cantar apesar de suas limitações atuais.

O processo envolveu a minuciosa edição de trechos vocais das gravações passadas de Travis, adaptando características como a velocidade do vibrato e o tempo das frases para capturar a essência e o estilo único do cantor. Essa utilização da IA sublinha o potencial da tecnologia em restaurar habilidades perdidas, ressaltando o elemento humano em seu uso e oferecendo um exemplo tocante de como a IA pode ser empregada de maneira significativa e pessoal nas artes.

GOOGLE

🧬 AlphaFold 3: um marco na pesquisa biológica e descoberta de medicamentos

O AlphaFold 3 é uma ferramenta desenvolvida pelo Google DeepMind que usa inteligência artificial para prever como as moléculas dentro das células interagem entre si. Esta nova versão é uma evolução do modelo anterior, permitindo entender não apenas as proteínas, mas também outras moléculas como DNA e RNA. Com o uso de técnicas avançadas, o AlphaFold 3 pode simular com precisão como essas moléculas se comportam e interagem, o que é crucial para avanços científicos, especialmente na medicina.

Além disso, o AlphaFold 3 está acessível através do AlphaFold Server, uma plataforma que oferece acesso gratuito à maioria das funcionalidades do modelo para pesquisas não comerciais. Isso facilita para os cientistas utilizarem essa tecnologia em seus estudos. A Isomorphic Labs, uma subsidiária da Alphabet, está usando o AlphaFold 3 para acelerar o desenvolvimento de novos medicamentos, trabalhando junto com empresas farmacêuticas para descobrir tratamentos mais eficazes e rápidos para diversas doenças. Esta ferramenta representa um grande passo para entender melhor a biologia em um nível molecular e pode ajudar significativamente na descoberta de novas drogas e tratamentos médicos.

OPENAI

🤖 Stack Overflow e OpenAI firmam parceria

A recente colaboração entre Stack Overflow e OpenAI marcou mais um capítulo da disputa por dados para treinamento de modelos de linguagem. Essa parceria visa integrar o rico acervo de conhecimentos técnicos do Stack Overflow com os avançados modelos de linguagem da OpenAI, através do novo serviço OverflowAPI. A iniciativa promete melhorar a eficiência e a precisão dos modelos de inteligência artificial, oferecendo aos desenvolvedores acesso direto a um banco de dados verificado e preciso para solucionar problemas de forma mais rápida e eficaz.

Esta aliança estratégica possibilitará a incorporação de conhecimento técnico validado diretamente no ChatGPT, além de permitir que o Stack Overflow utilize modelos de IA da OpenAI para desenvolver novas funcionalidades dentro de sua plataforma. Com mais de 59 milhões de perguntas e respostas, o Stack Overflow é uma comunidade essencial para desenvolvedores, e essa parceria promete redefinir a experiência de desenvolvimento, fomentando a eficiência e a colaboração através da comunidade e de dados de primeira linha.

OPENAI

⚖ OpenAI apresenta um guia para moldar a ética e a eficiência dos modelos de IA

O "Model Spec" da OpenAI é uma nova iniciativa que define diretrizes sobre como moldar o comportamento dos modelos de inteligência artificial e administrar os desafios que surgem de conflitos de objetivos. Ele combina princípios gerais, regras específicas e comportamentos padrões para guiar os desenvolvedores e usuários finais no uso responsável dos modelos. O documento é projetado para ser dinâmico e evoluir com o tempo, integrando feedback contínuo de uma ampla gama de partes interessadas para refinar e aprimorar suas diretrizes.

Essencialmente, o "Model Spec" se concentra em promover um comportamento desejável por meio de objetivos amplos, como beneficiar a humanidade e refletir positivamente sobre a OpenAI, enquanto segue regras que asseguram a segurança e a legalidade, como a proteção da privacidade das pessoas e a proibição de conteúdo impróprio para o ambiente de trabalho. A iniciativa reforça a importância de um desenvolvimento de IA ético e responsável, encorajando a participação do público para melhorar o entendimento e a implementação dessas diretrizes.

PESQUISA

🏫 Estudo mostra que professores não conseguem detectar textos gerados por IA

O estudo recente intitulado "Do teachers spot AI? Evaluating the detectability of AI-generated texts among student essays" aborda um desafio emergente nas escolas e universidades: a capacidade dos professores de distinguir textos gerados por inteligência artificial dos escritos por alunos. Pesquisas anteriores indicaram que as pessoas em geral têm dificuldades em identificar textos criados por IA. Contudo, o estudo em questão é pioneiro ao investigar especificamente a habilidade dos professores, tanto novatos quanto experientes, neste reconhecimento. Os resultados revelam que ambos os grupos demonstraram uma confiança excessiva em suas habilidades de detecção, não conseguindo identificar de forma eficaz os textos gerados por IA entre as redações dos alunos.

Os achados sugerem que a integração de IA como o ChatGPT nas práticas educativas pode representar tanto um potencial quanto um risco. Enquanto alguns estudos mostram que o feedback adaptativo gerado por IA pode melhorar a qualidade das justificativas escritas por futuros professores, outros alertam para os riscos de trapaça e desonestidade, onde estudantes podem utilizar essas ferramentas para obter vantagens injustas em avaliações. Dessa forma, o estudo destaca a necessidade urgente de estratégias de avaliação que levem em conta os desenvolvimentos tecnológicos recentes, visando a integridade acadêmica e o aproveitamento educacional genuíno dos estudantes.

CURTAS

* 📱 O novo Google Pixel 8a foi lançado, oferecendo recursos de inteligência artificial e a aclamada experiência de câmera Pixel por um preço acessível de $499. Equipado com o chip Google Tensor G3, o smartphone introduz funções como Gemini e Audio Magic Eraser, mantendo-se fiel à reputação da série Pixel por sua excelente fotografia. Saiba mais.

* 🎥 Sora agora pode renderizar vídeos alterando apenas um único elemento. Esse recurso, ainda em pesquisa, não está disponível ao público, mas promete novas possibilidades na edição e personalização de vídeos. Saiba mais.

* 🕵️ Microsoft desenvolve serviço secreto de IA generativa para espionagem nos EUA. A empresa ajustou um supercomputador em Iowa para operar isoladamente, sem conexão com a internet, garantindo que informações sensíveis não sejam expostas. Saiba mais.

* 🐳 Pesquisadores do MIT e do Projeto CETI descreveram um sistema de comunicação sofisticado nas baleias cachalotes, mostrando que elas utilizam um "alfabeto fonético", semelhante ao humano, para variar os sons de clique que produzem. Este sistema permite uma gama mais ampla de expressões do que se pensava anteriormente. Saiba mais.

* 📄 Adobe lança o Acrobat AI Assistant para empresas, promovendo produtividade no local de trabalho. A ferramenta, integrada ao Acrobat, permite a interação conversacional com documentos, facilitando a criação de conteúdos como e-mails e relatórios a partir de insights extraídos dos documentos. Saiba mais.

* 🎵 ElevenLabs apresentou uma prévia de ElevenLabs Music. Todas as músicas demonstradas foram geradas a partir de um único prompt de texto sem edições. A qualidade das músicas geradas é impressionante, parecendo superar as concorrentes Udio e Suno. Saiba mais.

* 🤖 Departamento de Segurança Interna dos EUA explora IA para treinar oficiais de imigração no atendimento a refugiados. A iniciativa utiliza inteligência artificial para simular entrevistas, ajudando os oficiais a aprimorar suas habilidades em dialogar com solicitantes de refúgio que podem estar relutantes em compartilhar traumas vividos. A tecnologia visa proporcionar treinamentos mais precisos sem substituir a tomada de decisões humana. Saiba mais.

* 🧬 A inteligência artificial generativa está começando a projetar novos medicamentos de forma autônoma, prometendo transformar significativamente a indústria farmacêutica. A Eli Lilly, por exemplo, está utilizando IA para explorar milhões de moléculas, acelerando o processo de descoberta que tradicionalmente levaria muito mais tempo em laboratórios convencionais. Os designs gerados pela IA, que apresentam estruturas moleculares inovadoras, estão sendo analisados pelos cientistas com resultados surpreendentemente promissores, abrindo novas perspectivas para o desenvolvimento de medicamentos. Saiba mais.

* 💸 Uma mulher na Coreia do Sul foi vítima de uma fraude amorosa, perdendo cerca de $50.000 após ser enganada por um vídeo deepfake do CEO da Tesla, Elon Musk. Acreditando estar conversando com Musk, ela foi persuadida a investir dinheiro com promessas de riqueza, influenciada por declarações de amor e interações que pareciam autênticas. Saiba mais.

* 🕵️ Warren Buffett expressou preocupações significativas sobre o potencial de golpes utilizando inteligência artificial, prevendo que esta poderia se tornar a próxima grande indústria de crescimento. Durante a reunião anual da Berkshire Hathaway, ele destacou a capacidade da IA de reproduzir conteúdos realistas e enganosos, o que poderia facilitar atividades fraudulentas em grande escala. Buffett ressaltou que, apesar do grande potencial positivo da IA, o equilíbrio entre benefícios e malefícios ainda é incerto. Saiba mais.

* 📱 A Samsung planeja introduzir uma nova funcionalidade chamada "Battery AI" na série Galaxy S25, que promete aumentar a vida útil da bateria dos dispositivos em até 10%. Este recurso visa otimizar o uso da bateria ao encerrar tarefas desnecessárias em segundo plano e ajustar o consumo de energia de forma inteligente. Saiba mais.

VÍDEO DA SEMANA

O vídeo da semana não poderia deixar de ser a impressionante demonstração do GPT-4o da OpenAI. Com capacidade de conversar com o usuário em tempo real, o novo assistente torna realidade o que parecia um futuro distante anos atrás. Clique aqui ou na imagem acima para assistir.

Além da apresentação, a OpenAI disponibilizou vários vídeos curtos demontrando a capacidade do novo modelo em seu blog. Alguns vídeos que chamam a atenção:

* Dois GPTs interagindo e cantando em um dueto.

* GPT-4o sendo sarcástico

* Aprendendo matemática com o GPT-4o

* Pedindo ao GPT-4o para sussurar uma canção de ninar

* GPT-4o arbitrando uma disputa de pedra, papel e tesoura

* GPT-4o participando de uma reunião on-line

* Preparando-se para uma entrevista com o GPT-4o

Apertem os cintos, os próximos anos serão insanos.

FERRAMENTAS

* 🎙️ Replica Studios: plataforma de inteligência artificial para criação de vozes. A Replica Studios é especializada em fornecer vozes AI realistas para jogos, filmes e experiências no metaverso. A plataforma permite a geração instantânea de dublagens e diálogos através de texto para voz ou voz para voz, gerenciando scripts de projetos em um único local. Link.

* 🌱 Snaplet: ferramenta para desenvolvedores, proporcionando dados realísticos de produção para bases de dados relacionais. Com o Snaplet, os desenvolvedores podem gerar dados de teste realistas usando a inteligência artificial, melhorando a precisão e agilidade no desenvolvimento de software. Link.

* 🌍 GeoSpy AI: ferramenta de inteligência artificial projetada para identificar a localização geográfica de imagens. Utilizando algoritmos sofisticados, GeoSpy AI analisa dados visuais de imagens e os compara com uma extensa base de dados de locais geográficos para fornecer uma estimativa precisa do local onde a foto foi tirada. Link.

* 🧙 Wizardshot: assistente de inteligência artificial projetado especificamente para criar tutoriais passo a passo de maneira rápida e eficiente. A ferramenta permite que os usuários capturem atividades em suas telas e as transformem em tutoriais detalhados com apenas alguns cliques. Link.

MINITUTORIAL

👄 Converse com vídeos do YouTube usando o Gemini

O novo recurso "Extensões" do Google Gemini permite que os usuários acessem ferramentas externas, como o YouTube, para conversar com vídeos e obter respostas gratuitamente. Passo a passo:

* Acesse o site do Google Gemini.

* Clique no ícone de engrenagem localizado no canto inferior esquerdo, selecione "Extensões" e ative a extensão do YouTube.

* Volte para a interface de bate-papo e inicie seu prompt usando o seguinte formato: "@youtube Resuma o seguinte vídeo [URL do Youtube]"

Dica: Experimente pedir ao Gemini para explicar conceitos avançados discutidos em um vídeo, gerando exemplos concretos, criando perguntas práticas e até mesmo pedindo trechos de código.

Até a próxima!

Obrigado por ler Folha Artificial! Subscreva gratuitamente para receber novos posts toda terça pela manhã.

This is a public episode. If you would like to discuss this with other subscribers or get access to bonus episodes, visit folhaartificial.substack.com

...more

Share Folha Artificial Podcast

Sign up to save your podcasts

Folha Artificial Podcast

FAQs about Folha Artificial Podcast:

How many episodes does Folha Artificial Podcast have?

Folha Artificial Podcast episodes:

FAQs about Folha Artificial Podcast:

How many episodes does Folha Artificial Podcast have?