Consumo excessivo de tokens está a levar as gigantes de IA à rutura financeira

Continua após a publicidade

O atual modelo de subscrição mensal para ferramentas de programação com inteligência artificial (IA) está a atingir um ponto de rutura financeira. A discrepância entre o custo de acesso e o consumo real de recursos está a ameaçar o mercado de desenvolvimento de software.

Continua após a publicidade

O fim das ferramentas de terceiros nos planos "livres" das IA

A economia baseada em tokens está a sofrer um golpe, tornando as taxas fixas de IA para programadores matematicamente insustentáveis. Recentemente, um utilizador do plano Claude Max, que paga uma mensalidade de 100 dólares, gerou custos reais de API na ordem dos 5600 dólares num único ciclo de faturação.

Como resposta direta a este cenário, a Anthropic decidiu restringir o acesso de ferramentas externas, como o OpenClaw, aos seus planos de subscrição tradicionais. Além de procurar proteger o seu próprio ecossistema, esta decisão surge como uma consequência inevitável de vender tokens num regime de "buffet livre" quando o consumo real disparou entre 10 a 100 vezes nos últimos meses.

O modelo de negócio que financiou a explosão da IA para programadores baseou-se numa ficção estatística. Tradicionalmente, assume-se que os utilizadores menos ativos subsidiam os utilizadores intensivos, permitindo que a média de custos seja sustentável.

No entanto, esta lógica, que funciona em ginásios ou em plataformas de vídeo, falha quando um utilizador pode transformar-se num consumidor massivo através de agentes autónomos, uma realidade que se tornou comum desde o final de 2025.

inteligencia artificial 1

Ineficiência técnica gera um consumo excessivo de tokens

Luo Fuli, antiga responsável na equipa do modelo MiMo na Xiaomi e ex-especialista da DeepSeek, apresentou um diagnóstico preocupante sobre este problema. Segundo a especialista, ferramentas de terceiros como o OpenClaw não estão otimizadas para reutilizar a cache de contexto do Claude. Isto resulta na regeneração total de janelas de contexto com mais de 100.000 tokens em cada nova consulta.

O número de pedidos por consulta nestas ferramentas é várias vezes superior ao que seria gerado pelo sistema oficial Claude Code. Nas palavras de Luo Fuli, não estamos perante uma simples lacuna, mas sim perante um autêntico cratera financeira.

Esta ineficiência técnica acelera a queima de recursos e torna o modelo de subscrição mensal completamente inviável para as empresas fornecedoras do serviço.

Two days ago, Anthropic cut off third-party harnesses from using Claude subscriptions — not surprising. Three days ago, MiMo launched its Token Plan — a design I spent real time on, and what I believe is a serious attempt at getting compute allocation and agent harness…
— Fuli Luo (@_LuoFuli) April 5, 2026

Transição para o modelo de pagamento por utilização

Embora a Anthropic não tenha bloqueado totalmente os agentes de IA de terceiros, moveu-os para um sistema de faturação diferente, transitando da taxa plana para a API de pagamento por uso. Como forma de atenuar o impacto, a empresa incluiu créditos pontuais e descontos para quem pré-comprar pacotes de utilização extra.

Contudo, para muitos programadores independentes, este salto nos custos pode tornar o uso de agentes economicamente inviável.

Resta a grande questão sobre qual o modelo de preços que conseguirá sobreviver ao uso real destes agentes. Luo Fuli acredita que a pressão económica forçará os programadores de ferramentas externas a otimizar a gestão de contexto e a maximizar a reutilização de cache.

No entanto, enquanto essa eficiência não chega, a indústria opera com matemáticas que não batem certo, e ainda não se sabe quem irá absorver o prejuízo final.

Leia também:

Saiba mais sobre Inteligência Artificial