A NVIDIA acabou de lançar os seus mais recentes sistemas GB300 NVL72. Eles conseguem processar 50 vezes mais trabalho por megawatt de eletricidade em comparação com a plataforma Hopper mais antiga. Isso significa que os custos caem 35 vezes por cada pedaço de informação processada.
A Signal65 fez testes separados no GB200 NVL72 e descobriu que processa mais de 10 vezes a informação por watt, reduzindo os custos para um décimo do que eram.
As melhorias continuam a surgir. Apenas as atualizações da biblioteca TensorRT-LLM da NVIDIA deram ao GB200 um aumento de desempenho de cinco vezes em apenas quatro meses para tarefas que necessitam de respostas instantâneas. As equipas que trabalham nas ferramentas Dynamo, Mooncake e SGLang estão a aumentar ainda mais a eficiência.
Estas ferramentas de IA falham se houver tempo de atraso ou se não conseguirem memorizar contexto suficiente. As empresas precisam que elas funcionem realmente em situações empresariais reais, não apenas em demonstrações.
As ferramentas de inteligência artificial que escrevem código e funcionam como assistentes digitais representam agora quase metade de todas as pesquisas relacionadas com IA, em comparação com apenas 11% há um ano.
Os números vêm do relatório State of Inference da OpenRouter e mostram a rapidez com que as coisas estão a mudar neste espaço.
Este aumento repentino tem as empresas a lutarem para construir hardware que consiga acompanhar. Estes assistentes de IA precisam de responder imediatamente e memorizar o contexto de projetos de software inteiros, o que coloca exigências sérias no poder de computação.
Explosão do mercado alimenta batalha de gigantes tecnológicos pela dominância
O dinheiro envolvido é enorme. O mercado de agentes de IA valia 4,92 mil milhões de dólares em 2024. As estimativas colocam-no em 6,016 mil milhões de dólares para 2025, depois aumentando para 44,97 mil milhões de dólares até 2035. Isso representa um crescimento de 22,28% todos os anos durante a próxima década. Bancos, hospitais, lojas e fábricas são os primeiros a adotar.
As empresas estão a colocar estes agentes em sistemas de gestão de clientes, ferramentas de planeamento e configurações de segurança para poupar dinheiro e fazer mais. O que começou como tecnologia opcional está a tornar-se infraestrutura básica.
Conforme relatado pela Cryptopolitan, a Alibaba acabou de lançar o Qwen3.5 direcionado ao mercado da China, alegando custos de processamento 60% mais baixos do que antes. O modelo pode olhar para ecrãs e executar tarefas em telemóveis e computadores. Está a competir diretamente com a aplicação Doubao da ByteDance, e também há uma atualização do DeepSeek a chegar.
A OpenAI contratou Peter Steinberger no dia 15. Ele construiu o OpenClaw, um agente de IA de código aberto. O CEO Sam Altman disse que Steinberger liderará o trabalho em agentes pessoais de próxima geração e chamou-lhe um génio com ótimas ideias sobre assistentes inteligentes que podem fazer coisas úteis.
A crise de talento que ninguém consegue resolver
94% dos líderes empresariais dizem que têm falta de competências em IA. Até 2028, 44% esperam ainda ter escassez de 20 a 40%. A Workera diz que estas lacunas podem custar à economia global 5,5 biliões de dólares em 2026 devido a produtos atrasados, problemas de qualidade e vendas perdidas.
Neste momento, a procura por talento em IA supera a oferta 3,2 para um em todo o mundo. Os empregos em IA pagam 67% mais do que posições regulares de software. No entanto, 85% dos trabalhadores de escritório estão a aprender sobre estas coisas no seu próprio tempo, e 83% dizem que estão principalmente a ensinar-se a si mesmos em vez de receber formação formal.
Quando as empresas compram ferramentas de IA de fornecedores especializados, têm sucesso 67% das vezes. As construções internas só funcionam cerca de um terço das vezes.
A Salesforce viu um crescimento de agentes de 119% no início de 2025 e ultrapassou 500 milhões de dólares em receitas recorrentes para estes produtos. Adicionaram 6.000 clientes empresariais em três meses.
As empresas provavelmente comprarão soluções em vez de construí-las. Isso aponta para a concentração do mercado em torno de alguns grandes intervenientes que podem fornecer o que realmente funciona.
Fonte: https://www.cryptopolitan.com/nvidia-new-chips-to-cut-costs-by-35x/


