Bom dia!
Esta semana, a Folha traz um destaque especial para a visão de Larry Summers sobre o futuro do trabalho em meio à revolução da inteligência artificial. Segundo Summers, estamos à beira de uma transformação que poderá substituir "quase todas" as formas de trabalho, redefinindo completamente a nossa relação com as tarefas cotidianas e profissionais. Mas isso é apenas o começo. Vamos explorar as últimas notícias e inovações que estão moldando o futuro da tecnologia e da sociedade.
Na Folha de hoje:
* IA pode substituir “quase todas” as formas de trabalho, diz Larry Summers
* Jony Ive e Sam Altman planejam dispositivo de IA
* Novo agente programador open source: SWE-Agent
* Apple avança em inteligência artificial com ReALM
* Os riscos do terremoto em Taiwan para a indústria de chips
* Stability AI apresenta o Stable Audio 2.0
* Apple estuda robôs domésticos como próxima inovação
* Google explora opção de paywall para IA
* OpenAI aprimora edição de imagens com DALL·E
* Desafiando a segurança de IA com "Many-Shot Jailbreaking"
* ChatGPT sem necessidade de inscrição e outras novidades
* Ferramentas inovadoras para transformar sua rotina e negócios
* Minitutorial: Como executar modelos de código aberto localmente
Obrigado por ler Folha Artificial! Subscreva gratuitamente para receber novos posts toda terça pela manhã.
Tempo de leitura: 10 minutos
NOTÍCIAS DA SEMANA
SOCIEDADE
📈 IA pode substituir “quase todas” as formas de trabalho, diz Larry Summers
Larry Summers, ex-secretário do Tesouro dos EUA e agora membro do conselho da OpenAI, acredita que a inteligência artificial tem o potencial de substituir “quase todas” as formas de trabalho. Em uma entrevista recente, Summers comparou o impacto potencial da IA com a Revolução Industrial, sugerindo que a IA poderia eventualmente substituir a maioria das formas de trabalho humano, especialmente tarefas cognitivas. Summers prevê que a IA será capaz de realizar desde a construção de casas até diagnósticos médicos, com um foco particular no “trabalho cognitivo” dos trabalhadores de colarinho branco. Ele também destacou que a inteligência emocional (EQ) se tornará mais importante do que o quociente de inteligência (IQ) à medida que a IA avança.
Embora Summers reconheça que a IA tem o potencial de revolucionar a economia, ele também adverte que seu impacto levará tempo para se materializar. Ele argumenta que a realização de ganhos de produtividade a partir de uma nova ideia leva anos de investimento, pesquisa e desenvolvimento. A visão de Summers sobre a IA e o trabalho é um lembrete da importância de se preparar para as mudanças que a tecnologia pode trazer para o mercado de trabalho e a economia global.
STARTUPS
🤝 Jony Ive e Sam Altman planejam dispositivo de IA
Jony Ive, ex-chefe de design da Apple, e Sam Altman, CEO da OpenAI, uniram forças para desenvolver um dispositivo pessoal alimentado por inteligência artificial. A dupla está buscando financiamento para o projeto, que ainda está em estágios iniciais e não se assemelha a um smartphone. Altman, que é um grande investidor na Humane AI pin, um dispositivo vestível sem tela, pode estar criando um produto similar com Ive.
As conversas sobre a parceria começaram no ano passado, mas só agora se tornaram oficiais, com a startup ainda sem nome buscando fundos de grandes investidores. Ive tem como objetivo arrecadar até 1 bilhão de dólares em financiamento, e a OpenAI pode possuir uma parte do negócio. Entre os possíveis investidores estão a Thrive Capital, investidora da OpenAI, e a Emerson Collective, fundada por Laurene Powell Jobs.
OPEN SOURCE
🛠️ SWE-Agent: novo agente programador open source
O SWE-Agent é uma ferramenta de engenharia de software de código aberto que transforma modelos de linguagem, como o GPT-4, em agentes poderosos para corrigir bugs e problemas em repositórios reais do GitHub. O SWE-Agent oferece uma interface simples para que os modelos de linguagem possam navegar pelos repositórios, visualizar, editar e executar arquivos de código. Uma característica chave da ferramenta é seu linter, que verifica a sintaxe do código antes de permitir que as edições sejam feitas, ajudando a prevenir erros e garantindo que quaisquer alterações feitas pelo agente sejam sintaticamente corretas. Além disso, o SWE-Agent inclui um visualizador de arquivos especializado e uma ferramenta de busca no diretório, facilitando para os modelos de linguagem navegar e entender os repositórios de código.
A eficácia do agente é demonstrada por suas métricas. No conjunto de testes completo do SWE-bench, o SWE-Agent resolve 12,29% dos problemas, alcançando um desempenho de ponta. Isso mostra o poder de usar modelos de linguagem como agentes de engenharia de software e a importância de uma interface bem projetada, como a ACI (Agent-Computer Interface), para maximizar suas capacidades.
APPLE
🤖 ReALM: resolução de referências como modelagem de linguagem
Pesquisadores da Apple apresentaram o "ReALM: Reference Resolution As Language Modeling", que propõe uma nova estratégia para a resolução de referências ambíguas em diálogos, tais como pronomes e demonstrativos, que embora sejam facilmente compreendidos por seres humanos dentro de um contexto específico, representam um desafio significativo para os sistemas computacionais. O artigo apresenta um método pelo qual modelos de linguagem são aplicados para abordar e simplificar o problema de identificar a que exatamente estas referências se alinham dentro de uma conversa, tratando-o essencialmente como uma tarefa de modelagem de linguagem.
O trabalho demonstra notáveis avanços sobre abordagens prévias, evidenciado por uma melhoria de mais de 5% nos índices de precisão em tarefas de resolução de referências em tela, mesmo com os modelos de menor escala. Além disso, compara seu desempenho não só com versões anteriores de modelos de linguagem, como o GPT-3.5, mas também com o mais avançado GPT-4, mostrando que o menor modelo ReALM já se equipara ao GPT-4 em eficácia, enquanto os modelos maiores superam significativamente este padrão. Esta inovação tem como objetivo melhorar a interação com assistentes de voz e outros sistemas conversacionais, ao permitir uma compreensão mais natural e intuitiva das referências feitas por usuários, facilitando uma experiência mais fluida no uso de tais tecnologias.
TSMC
🌐 Terremoto em Taiwan e o risco para a indústria de chips
O recente terremoto em Taiwan trouxe preocupações significativas para a indústria global de semicondutores. O abalo, considerado o maior em 25 anos, causou danos e interrompeu as operações de gigantes da fabricação de chips, como a Taiwan Semiconductor Manufacturing Co. (TSMC). A TSMC, que produz cerca de 80% a 90% dos chips mais avançados do mundo, é fundamental para tecnologias como inteligência artificial, smartphones e veículos elétricos.
Apesar da evacuação de funcionários e da paralisação das operações, a TSMC espera que sua fábrica mais avançada, localizada na cidade de Tainan, retome a plena recuperação em breve. A empresa informou que mais de 80% das ferramentas já foram recuperadas e não houve danos aos equipamentos mais críticos, incluindo sistemas de litografia ultravioleta extrema. No entanto, algumas linhas de produção exigirão mais tempo para retornar ao normal devido ao maior impacto do terremoto.
A situação em Taiwan destaca a vulnerabilidade da cadeia de suprimentos global e a importância estratégica da ilha no mercado de semicondutores. Enquanto o mundo observa a recuperação de Taiwan, a necessidade de diversificação e resiliência na produção de chips torna-se cada vez mais evidente.
STABILITY AI
🎵 Apresentando o Stable Audio 2.0
O Stable Audio 2.0 é a mais recente inovação da Stability AI, estabelecendo um novo padrão na geração de áudio com inteligência artificial. Este modelo permite a criação de faixas completas de alta qualidade, com estrutura musical coerente e duração de até três minutos em estéreo 44.1kHz, a partir de um único prompt de linguagem natural. Além da capacidade de texto-para-áudio, o Stable Audio 2.0 introduz a geração de áudio-para-áudio, permitindo que os usuários carreguem amostras de áudio e as transformem em uma ampla gama de sons usando prompts naturais. Essa atualização também expande a geração de efeitos sonoros e transferência de estilo, oferecendo aos artistas e músicos mais flexibilidade, controle e um processo criativo elevado.
Construído sobre o Stable Audio 1.0, que estreou em setembro de 2023 como a primeira ferramenta comercialmente viável de geração de música IA capaz de produzir música de alta qualidade em 44.1kHz, o modelo já está disponível para uso gratuito no site do Stable Audio e em breve estará acessível através da API do Stable Audio.
APPLE
🤖 Apple estuda robôs domésticos como “próxima grande novidade”
A Apple está considerando uma incursão no campo da robótica pessoal, que tem o potencial de se tornar uma das “próximas grandes novidades” da empresa. Segundo fontes familiarizadas com a situação, a Apple tem equipes explorando dois tipos diferentes de robôs domésticos em busca de novas fontes de receita além do iPhone. A divisão de engenharia de hardware e o grupo de inteligência artificial e aprendizado de máquina da Apple estão supervisionando o trabalho em robótica pessoal. O projeto de robô doméstico ainda está na fase inicial de pesquisa e desenvolvimento.
Essa iniciativa surge após a Apple abandonar seus esforços para desenvolver um carro elétrico, juntamente com um esforço para criar telas de smartwatch de próxima geração. A busca da Apple por uma nova categoria de produto ousada inclui essa incursão em robôs, além de estar preparando novos iPads e acessórios correspondentes para maio. A entrada da Apple no mercado de robótica doméstica pode representar um avanço significativo para a empresa, conhecida por sua inovação em hardware. Com a estagnação das vendas do iPhone, que representa mais da metade de sua receita, a Apple busca se manter na vanguarda da inovação em hardware.
GOOGLE
🌐 Google explora opção de paywall para IA
A gigante da tecnologia Google está considerando a implementação de um paywall para conteúdo premium gerado por inteligência artificial, de acordo com um relatório recente. A empresa, que é utilizada por mais de um bilhão de pessoas ao redor do mundo, pode estar planejando uma grande mudança em seu modelo de negócios, adicionando certos recursos de busca alimentados por IA aos seus serviços de assinatura premium. Esses serviços já oferecem acesso ao novo assistente de IA chamado Gemini, a versão do Google do popular serviço ChatGPT. Embora o mecanismo de busca tradicional do Google permaneça gratuito e continue a exibir anúncios, a empresa está explorando a possibilidade de colocar algumas de suas principais ofertas atrás de um paywall.
O Google enfrentou desafios para se adaptar à revolução da IA, especialmente após a controvérsia gerada pelo Gemini, que criou imagens incorretas em resposta a prompts de texto. Apesar desses contratempos, o Google ainda é o número um para a maioria dos usuários de internet quando se trata de buscar informações.
OPENAI
🖼️ Edição de imagens com DALL·E
A OpenAI lançou a interface de edição do DALL·E, que permite que os usuários editem imagens geradas de maneira intuitiva. Com essa ferramenta, é possível selecionar áreas específicas da imagem para adicionar, remover ou atualizar elementos. Por exemplo, ao destacar um campo da imagem e usar o comando “adicionar flores de cerejeira”, obtém-se um resultado que incorpora as flores desejadas na imagem.
Além disso, a interface oferece opções para desfazer e refazer seleções, garantindo maior controle sobre o processo de edição. Os usuários também podem editar imagens conversacionalmente, fornecendo um comando no painel de conversação, sem a necessidade de usar a ferramenta de seleção.
PESQUISA
🛡️ “Many-Shot Jailbreaking”: desafiando a segurança de IA
O estudo “Many-Shot Jailbreaking” da Anthropic explora uma técnica de “jailbreaking” — um método que pode ser usado para contornar as medidas de segurança implementadas pelos desenvolvedores de modelos de linguagem de grande escala (LLMs). A técnica, chamada de “many-shot jailbreaking”, é eficaz tanto nos modelos próprios da Anthropic quanto nos produzidos por outras empresas de IA. A pesquisa revela que, ao incluir grandes quantidades de texto em uma configuração específica, essa técnica pode forçar os LLMs a produzir respostas potencialmente prejudiciais, apesar de terem sido treinados para não fazê-lo. O “many-shot jailbreaking” aproveita-se do aumento dramático no tamanho da janela de contexto dos LLMs, que passou de um artigo longo (~4.000 tokens) para o tamanho de vários romances longos (1.000.000 de tokens ou mais).
A Anthropic compartilhou confidencialmente os detalhes do “many-shot jailbreaking” com outros pesquisadores de IA e já implementou medidas de mitigação em seus sistemas. O objetivo é acelerar o progresso em direção a uma estratégia de mitigação e fomentar uma cultura onde explorações como essa sejam compartilhadas abertamente entre os provedores e pesquisadores de LLM.
CURTAS
* 🤖 ChatGPT agora pode ser usado instantaneamente, sem a necessidade de inscrição. A OpenAI está tornando a IA mais acessível para todos, com o objetivo de permitir que qualquer pessoa curiosa sobre suas capacidades possa experimentar o ChatGPT. Saiba mais.
* 🔬 SyntheMol, uma nova ferramenta de inteligência artificial desenvolvida por pesquisadores da Stanford Medicine, está criando receitas para químicos sintetizarem novos medicamentos para combater bactérias resistentes a antibióticos. A ferramenta gerou estruturas e receitas químicas para seis novos medicamentos destinados a matar cepas resistentes de Acinetobacter baumannii, um dos principais patógenos responsáveis por mortes relacionadas à resistência antibacteriana. Saiba mais.
* 📱 Samsung está considerando atualizar seu assistente de voz Bixby com tecnologia de inteligência artificial generativa. A empresa busca redefinir o papel do Bixby, tornando-o mais inteligente, capaz de realizar conversas mais naturais e suportar os produtos do ecossistema Samsung. Saiba mais.
* 👨💻 Replit anunciou o “Code Repair”, um agente de IA de reparo de programas de baixa latência. O Code Repair corrige automaticamente o código em segundo plano enquanto os desenvolvedores trabalham. Além disso, a Replit introduziu o “Replit Teams”, uma nova funcionalidade que permite colaborar, desenvolver e implantar software em equipe. Saiba mais.
* 🎮 Microsoft está testando um chatbot de IA para o suporte do Xbox, que promete ser uma ferramenta útil para os usuários. O agente virtual, alimentado por IA, visa ajudar os usuários com problemas de maneira eficiente, utilizando linguagem natural para facilitar e agilizar o processo de suporte. Saiba mais.
* 🌐 Reino Unido e Estados Unidos anunciaram uma parceria para testar a segurança dos modelos de inteligência artificial mais poderosos. O acordo, assinado pela Secretária de Estado para Ciência, Inovação e Tecnologia do Reino Unido, Michelle Donelan, e pela Secretária de Comércio dos EUA, Gina Raimondo, estabelece um plano de colaboração entre os dois governos. As instituições de segurança de IA dos dois países desenvolverão uma abordagem comum para testes de segurança, envolvendo o uso dos mesmos métodos e infraestrutura subjacente. Saiba mais.
* 📸 Um estudo recente mostrou que ao alimentar um gerador de imagens de IA com apenas 1000 imagens adicionais, foi possível reduzir estereótipos gerados pela IA. Os pesquisadores conseguiram fazer com que o gerador de imagens produzisse imagens menos ofensivas, simplesmente adicionando uma pequena quantidade de dados de treinamento. Saiba mais.
* 📅 O investidor bilionário Steve Cohen prevê que a tecnologia de inteligência artificial ajudará a implementar a semana de trabalho de quatro dias. Cohen, proprietário do New York Mets, expressou sua crença de que a semana de trabalho mais curta é inevitável, citando o advento da IA e a produtividade geralmente mais baixa às sextas-feiras como fatores contribuintes. Ele mencionou que, embora não preveja que seus traders tenham folga às sextas-feiras enquanto os mercados estiverem abertos, a maioria das pessoas poderá, em algum momento, desfrutar de um fim de semana de três dias. Saiba mais.
* 🌐 Opera anunciou que agora permitirá que os usuários baixem e usem modelos de linguagem de grande escala (LLMs) localmente em seus computadores. Essa funcionalidade, que está sendo lançada inicialmente para usuários do Opera One que recebem atualizações do desenvolvedor, permitirá que os usuários escolham entre mais de 150 modelos de mais de 50 famílias. A empresa está utilizando o framework de código aberto Ollama no navegador para executar esses modelos no computador do usuário. Saiba mais.
* 🚗 Waymo e Uber Eats lançaram um serviço de entrega de alimentos sem motorista na área metropolitana de Phoenix. Os clientes do Uber Eats em Tempe, Mesa e Chandler podem ter seus pedidos entregues por um veículo autônomo. A parceria está trabalhando com comerciantes selecionados, incluindo favoritos locais como Princess Pita, Filiberto’s e BoSa Donuts. Saiba mais.
* 🛒 A tecnologia “Just Walk Out” da Amazon, que promove uma experiência de compra sem caixas, aparentemente depende de centenas de trabalhadores na Índia para garantir sua precisão. Embora a Amazon tenha divulgado a tecnologia como sendo totalmente alimentada por IA, relatórios sugerem que muitas das transações “Just Walk Out” são revisadas por pessoas reais. Saiba mais.
* 🖥️ Microsoft 365 anunciou atualizações importantes para o Copilot, incluindo acesso prioritário ao modelo GPT-4 Turbo e melhorias na geração de imagens com o Microsoft Designer. Os usuários comerciais do Copilot agora têm acesso sem limites ao número de conversas por dia e à quantidade de uploads de arquivos. Além disso, a partir do próximo mês, o número de gerações de imagens por dia aumentará de 15 para 100, utilizando o modelo DALL-E 3. Saiba mais.
VÍDEO DA SEMANA
O vídeo desta semana traz uma atualização da Humane sobre seu dispositivo AI Pin. A empresa disse que as primeiras entregas começam em 11 de Abril, e fez uma demonstração das funcionalidades do dispositivo. Clique aqui ou na imagem acima para assistir.
FERRAMENTAS
* 📊Elicit: ferramenta que acelera a análise de artigos de pesquisa, automatizando tarefas de pesquisa demoradas como resumir documentos, extrair dados e sintetizar descobertas. A plataforma busca em mais de 200 milhões de artigos acadêmicos do corpus Semantic Scholar, abrangendo todas as disciplinas acadêmicas. Link.
* 💞 Maia: assistente de inteligência artificial projetada especificamente para casais, oferecendo um espaço privado de chat para melhorar a comunicação e aprofundar conexões. A Maia ajuda a planejar encontros personalizados, navegar por desacordos usando frameworks de relacionamento e iniciar conversas significativas. Link.
* 🗣️ Jessica Que: assistente virtual especializada na criação de conteúdo para LinkedIn, oferecendo um serviço rápido e eficiente para especialistas que desejam destacar sua experiência na plataforma. Com uma entrevista de apenas 5 minutos, Jessica é capaz de gerar até duas semanas de conteúdo relevante, ajudando profissionais a se posicionarem como autoridades em seus nichos. Link.
* 🚀 Astra: copiloto de inteligência artificial projetado para agências, que automatiza o lado administrativo da gestão de um negócio de serviços. A ferramenta oferece planejamento de projetos automatizado, integração com calendários para sessões de trabalho e comunicação eficiente, incluindo atualizações de progresso e escopo de trabalho. Link.
MINITUTORIAL
⚙️Execute modelos de código aberto localmente
Vários modelos de código aberto menores podem ser executados offline em seu laptop — mantendo os dados privados e evitando a censura que acompanha outros modelos. Passo a passo:
* Baixe o LM Studio - uma plataforma gratuita para modelos de IA locais.
* Dentro do LM Studio, procure por um modelo que possa ser executado no seu computador. Neste exemplo procuramos por Mistral e selecionamos na listagem esquerda dolphin-2.2.1, que é uma versão do modelo Mistral sem censura.
* No lado direito, selecione e baixe uma versão cujo tamanho seja suportado por sua placa (o programa indica se a GPU suporta). Em geral, quanto menor o tamanho, mais rápido. Neste exemplo baixamos a versão Q4_K_S.
* Abra a aba Chat, certifique-se de que o dolphin está selecionado, e comece a enviar comandos!
Até a próxima!
Obrigado por ler Folha Artificial! Subscreva gratuitamente para receber novos posts toda terça pela manhã.
This is a public episode. If you would like to discuss this with other subscribers or get access to bonus episodes, visit folhaartificial.substack.com