73% das organizações estouraram o budget de IA. 98% agora gerenciam AI spend — há dois anos eram 31%. O State of FinOps 2026, da FinOps Foundation, ouviu 1.192 practitioners e mapeou 83 bilhões de dólares em cloud spend anual. Os dados são claros: IA reintroduziu cost chaos. Cloud costs estavam ficando controláveis. IA chegou e quebrou a visibilidade.
FinOps não é mais cloud cost management
O relatório marca uma mudança estrutural. FinOps passou de cloud cost management para technology value management. Os números provam: 90% gerenciam SaaS (era 65% em 2025). 64% gerenciam licensing (+15% YoY). 57% private cloud (+18%). 48% data center (+12%). O escopo explodiu.
A prática também subiu na hierarquia. FinOps agora reporta ao CTO e CIO, não mais ao CFO isolado. Converge com ITAM, platform engineering e arquitetura. A conversa mudou de "como reduzir spend" para "como maximizar valor mensurável de IA, cloud e infraestrutura." Isso muda tudo: o objetivo não é mais cortar custos, é garantir que cada dólar em tecnologia gere resultado rastreável.
Na Tech86, vimos essa transição acontecer com clientes que já tinham cloud costs sob controle e foram pegos de surpresa pelo crescimento de workloads de IA. O playbook de FinOps que funcionava para compute e storage não funciona para inferência — e a maioria demorou a perceber.
A crise de forecast: 80% erram por mais de 10%
Apenas 20% das organizações previram AI spend dentro de ±10%. 54% erraram por 11-25%. Empresas AI-Native: 36% erraram por mais de 50%. Isso não é imprecisão — é cegueira sistemática.
O problema tem causas estruturais. Pricing models variam entre providers. Alocação por business unit é mais difícil em IA do que em compute tradicional. ROI de IA é obscuro porque investimentos são exploratórios — você não sabe se o agentic workflow vai processar 1 milhão ou 100 milhões de tokens até que ele esteja em produção. E a maioria do custo está em inferência, que escala com uso. Cada usuário a mais, cada prompt mais longo, aumenta a conta permanentemente. Não é como reservar uma instância — é como deixar uma torneira aberta.
IA reintroduziu cost chaos
Cloud costs estavam ficando controláveis. Reserved instances, savings plans, rightsizing — o playbook de FinOps tradicional funcionava. Então IA chegou e quebrou a visibilidade.
Workloads de IA saltaram de 4% para 18% do cloud budget em empresas AI-active, segundo dados da Flexera. GPU utilization em produção: 15-30%. 35-60% do budget de GPU é evitável — idle time, modelos mal dimensionados, reservas não usadas. O custo de inferência é opaco. A bill chega como linha única, sem breakdown por endpoint, cliente ou feature. O Cost Explorer que funcionava para EC2 não enxerga tokens. Alocação por business unit, que já era difícil em cloud tradicional, em IA se torna quase impossível sem instrumentação no application layer.
Na Tech86, quando auditamos workloads de IA, o primeiro sinal de alerta é forecast accuracy. Se o erro dos últimos 3 meses está acima de 25%, o processo precisa mudar — não o orçamento. Já cobrimos cost-per-token e GPU utilization em detalhe em outro artigo. Aqui o foco é outro: a estrutura do problema e o que está funcionando para resolver.
O que está funcionando
Executive alignment é o fator de maior impacto. VP+ engagement gera 2-4x mais influência sobre seleção de tecnologia. Quando FinOps tem assento na mesa de arquitetura, as decisões de IA incorporam custo desde o início — não depois da fatura.
Self-funding é o modelo que mais ganha tração. Savings em cloud tradicional financiam investimentos em IA. Isso cria um ciclo virtuoso: otimizar cloud libera budget para IA, que acelera a urgência de otimização. Quanto mais você economiza em workloads tradicionais, mais budget tem para experimentar com IA sem precisar de aprovação nova.
FOCUS spec é a infraestrutura de dados que faltava. A FinOps Open Cost and Usage Specification normaliza dados de custo entre providers. 68% das empresas com 100M+ em spend já usam ou experimentam. Sem FOCUS, comparar AWS, Azure e GCP exige tradução manual de cada campo. Com FOCUS, você compara na mesma estrutura.
IA para FinOps é a ironia produtiva. Usar IA para detectar anomalias de custo, recomendar right-sizing e permitir queries em linguagem natural sobre gastos. Em vez de navegar dashboards complexos, o time pergunta "quanto gastamos com GPU na última semana?" e obtém a resposta. A ferramenta que causa o problema também ajuda a resolvê-lo. O relatório mostra que essa aplicação está entre as mais adotadas por teams maduros — e com razão.
Conclusão
IA é a categoria de custo que mais cresce, que ninguém sabe prever e onde 80-90% do dinheiro vai para inferência. 73% estouraram budget. GPU utilization é 15-30%. Apenas 20% preveem gasto dentro de ±10%. Mas o State of FinOps 2026 também mostra caminhos: executive alignment, self-funding, FOCUS spec e IA aplicada ao próprio FinOps.
Na Tech86, desenhamos arquiteturas com FinOps integrado desde o dia 1 — de GPU workloads a inference pipelines. Se seu AI budget surpreende todo trimestre, você está pagando para descobrir problemas que poderiam ter sido previstos.
