Os custos da inteligência artificial começaram a aparecer com clareza nas contas desta época de resultados. Meta, Shopify, Spotify e Pinterest sinalizaram o aumento das despesas com IA e inferência como um fator de pressão nas margens. A Shopify reconheceu que as economias de escala foram parcialmente compensadas por maiores custos com modelos de linguagem de grande dimensão.
Esta fatura é consequência direta do modelo de pricing que sustenta as avaliações esperadas nos IPO da OpenAI e da Anthropic, ambas projetadas acima de 800 mil milhões de dólares. Estes números partem do pressuposto de que OpenAI e Anthropic manterão quota de mercado e poder de fixação de preços, que os concorrentes não conseguem aproximar-se facilmente e que os clientes empresariais continuarão a pagar um prémio por não terem alternativas credíveis.
Os dados mais recentes apontam, no entanto, noutra direção. A IA de ponta está a tornar-se mais abundante e muito mais barata. Laboratórios chineses cobram apenas uma fração do preço praticado pelos laboratórios norte-americanos para trabalhos comparáveis, enquanto um conjunto de desafiantes ocidentais, como Nvidia, Cohere, Reflection e Mistral, está a construir alternativas mais pequenas, baratas e eficientes para empresas que recusam modelos chineses. Quando OpenAI e Anthropic apresentarem os seus prospetos de IPO, com a submissão confidencial da OpenAI esperada já para esta semana, o pressuposto central das suas avaliações pode já ter sido ultrapassado.
A diferença de custos é ampla e tende a alargar-se. Os orçamentos empresariais para IA dispararam. Cerca de 45% das empresas inquiridas pela CloudZero, uma empresa focada em custos de cloud, afirmaram gastar mais de 100 mil dólares por mês em IA em 2025, face a 20% no ano anterior. O destino dessa despesa passou a ter um peso decisivo.
A empresa de benchmarking Artificial Analysis testa todos os grandes modelos nos mesmos 10 exercícios e acompanha o custo total. Nos modelos mais capazes de cada laboratório, o Claude da Anthropic custou 4 811 dólares. O ChatGPT da OpenAI 3 357 dólares. O DeepSeek 1 071 dólares. O Kimi 948 dólares. O GLM da Zhipu 544 dólares. O Claude é quase nove vezes mais caro do que a alternativa chinesa mais barata para a mesma carga de trabalho.
Até a Google está a reforçar esta mensagem. Na conferência I/O, o CEO Sundar Pichai afirmou que muitas empresas já esgotaram os seus orçamentos anuais de tokens e ainda é maio, apresentando o modelo mais barato Gemini 3.5 Flash como resposta. Se os maiores clientes da Google Cloud deslocassem 80% das suas cargas de trabalho dos modelos de fronteira para o Gemini 3.5 Flash, Pichai disse que poderiam poupar mais de mil milhões de dólares por ano. A empresa reconhece assim que as empresas precisam de opções mais económicas.
Ao mesmo tempo, as alternativas baratas deixaram de estar um passo atrás em desempenho. A DeepSeek, o laboratório chinês cuja tecnologia desencadeou uma forte correção nas tecnológicas norte-americanas no ano passado, lançou uma prévia do seu modelo de próxima geração no mês passado que iguala ou quase iguala as últimas versões da OpenAI, Anthropic e Google em benchmarks de programação, agentes e conhecimento. Outros laboratórios chineses, como Moonshot, Xiaomi e Zhipu, lançaram modelos com níveis de capacidade semelhantes nos últimos quatro meses.
Ali Ghodsi, CEO da Databricks, tem uma visão em tempo real desta mudança. A gateway de IA da empresa funciona como intermediário entre milhares de clientes empresariais e os modelos que utilizam, e Ghodsi afirma que a receita desse produto está a aumentar de forma acentuada.
A técnica que as empresas estão a adotar chama-se modelo conselheiro. Um modelo open source barato trata por defeito da maioria do trabalho. Quando encontra uma tarefa que não consegue resolver, tem acesso a uma ferramenta que lhe permite recorrer a um modelo de fronteira da OpenAI ou da Anthropic para obter ajuda.
Segundo Ghodsi, desta forma é possível controlar os custos de forma muito eficaz.
A rapidez desta transição é significativa. Na OpenRouter, um mercado que permite a programadores acederem a centenas de modelos através de uma única interface, a utilização de modelos chineses passou de cerca de 1% em 2024 para mais de 60% em maio.
Os fornecedores começaram também a vender redução de custos como produto. O CEO da Figma, Dylan Field, descreve três fases de adoção de IA nas empresas. Primeiro, praticamente ninguém usa. Depois, todos têm de usar, com algumas empresas a realizar competições internas para ver quem consegue gastar mais em tokens. A terceira fase é a perceção de que todos estão a gastar demasiado e têm de cortar. Muitas empresas estão agora a entrar nessa terceira fase. A Figma está a vender funcionalidades que reduzem o consumo de tokens dos clientes entre 20% e 30%.
Esta diferença de custos reflete estruturas muito distintas. Os laboratórios norte-americanos na linha da frente da IA estão a operar com centenas de milhares de milhões de dólares de investimento em capital, treinando modelos cada vez maiores nos chips mais caros da Nvidia, dentro de uma rede elétrica norte-americana que não consegue aumentar a capacidade à mesma velocidade. Esses custos são repassados ao cliente.
Nos laboratórios chineses, a restrição converteu-se em estratégia. Sujeitos a restrições de exportação de chips, foram forçados a otimizar de forma agressiva, treinando modelos competitivos com menos capacidade de computação e operando-os de forma mais eficiente.
A melhor defesa dos laboratórios norte-americanos é a confiança. Aidan Gomez, CEO da Cohere, que vende modelos de IA especificamente para bancos, entidades de defesa e outros setores regulados, afirma que estes clientes não consideram modelos chineses, independentemente do preço. A receita da Cohere cresceu seis vezes no último ano precisamente neste segmento. Mas trata-se de uma fatia relativamente estreita do mercado empresarial. Fora das indústrias reguladas, onde as regras de segurança e conformidade são menos rígidas, torna-se mais difícil justificar o pagamento de um prémio.
Está também em formação uma resposta norte-americana baseada em alternativas abertas. A Nvidia, principal beneficiária do boom da IA, está agora a promover publicamente um modelo diferente, ao disponibilizar sistemas de IA próprios que qualquer empresa pode descarregar e executar nos seus próprios servidores, sem custos, como alternativa tanto às opções chinesas como aos modelos fechados da OpenAI e da Anthropic. A Reflection AI angariou capital a uma avaliação de vários milhares de milhões de dólares com o objetivo específico de construir modelos open source norte-americanos para empresas que querem uma alternativa doméstica. Ambas são bem capitalizadas e miram o mesmo espaço de mercado, modelos capazes, mais baratos do que os de fronteira e que correm em infraestrutura em que as empresas norte-americanas já confiam.
O principal argumento contra esta mudança tem sido a segurança nacional. Mas a objeção está a perder força na prática. O próprio AI Safety Institute do governo norte-americano, que classificou os modelos da DeepSeek como inferiores aos norte-americanos em segurança e desempenho, documentou um aumento de quase 1 000% nas descargas desde o lançamento do R1 em janeiro de 2025.
A Anthropic reconhece claramente a pressão. Num documento de política pública publicado em maio, a empresa admitiu que os modelos norte-americanos estão apenas vários meses à frente dos chineses e alertou que Pequim está a ganhar em adoção global graças ao preço.
A OpenAI tem uma leitura diferente. Uma pessoa familiarizada com o posicionamento da empresa afirmou que cada lançamento de um novo modelo de fronteira, incluindo o GPT-5.5 no mês passado, gerou um forte aumento na utilização da API e dos produtos, com a procura empresarial a crescer quase em linha vertical. Os modelos open source têm um papel em tarefas de menor criticidade, referiu a mesma fonte, mas não estão a afetar o núcleo do negócio. A pressão sobre preços não figura entre as dez principais preocupações da empresa.
Um CEO de uma empresa de IA empresarial, que pediu anonimato para proteger relações com clientes, oferece uma perspetiva distinta. O crescimento é real, disse, mas seria ainda maior para os modelos de fronteira se esta técnica de modelo conselheiro não estivesse a ser utilizada.
É este o mercado que a OpenAI e a Anthropic deverão apresentar aos investidores públicos. Com avaliações próximas de um bilião de dólares para cada uma, os prospetos S-1 terão de demonstrar crescimento da receita empresarial e concentração de clientes que justifiquem o múltiplo. Mas o prémio que suporta estas avaliações está a degradar-se mais depressa precisamente nos segmentos que estes laboratórios precisam de dominar.

