A Anthropic publicou dados internos que mudam a conversa sobre produtividade em engenharia: Claude escreve mais de 80% do código que vai para produção. Engenheiros shipam 8× mais código por dia que em 2024. Taxa de sucesso em tarefas abertas: 76% em maio de 2026, ante 26% em novembro de 2025. A aceleração é real. Mas a mesma Anthropic reconhece: conforme começamos a empurrar mais código pela organização, o code review (code review) humano se tornou um novo gargalo.
Os números que ninguém quer ver
A Faros AI instrumentou 22 mil desenvolvedores em 4 mil times e quantificou o outro lado da moeda. Tempo mediano de review: +441,5%. Taxa de defeitos por desenvolvedor: aumento que acelerou de 9% para 54%. Incidents-to-PR ratio: +242,7%. Code churn (code churn): +861%. PRs mergeados com zero review: +31,3%.
Ninguém decidiu parar de revisar. Revisores simplesmente não acompanharam o volume. O resultado é previsível: PRs acumulam, revisores ficam sobrecarregados, e a qualidade cai — não porque a IA escreve código ruim, mas porque o processo de garantia de qualidade não foi redesenhado para o novo volume.
O GitClear dá a pedra de Roseta: usuários diários de IA produzem aproximadamente 4× o output bruto de não-usuários, mas o ganho real de produtividade é aproximadamente 12%. O gap entre 4× e 12% é onde mora a crise de review. Código que entra rápido, mas precisa ser reescrito, revertido ou corrigido logo depois, não é produtividade — é ruído disfarçado de velocidade.
A ironia estrutural
A construtora pede freios enquanto acelera. A Anthropic publica dados provando que IA se constrói sozinha — Claude já escreve a maioria do código de produção —, depois pede um mecanismo global de pausa verificável. Mas só se os concorrentes também pausarem. Enquanto isso, shipam updates a cada duas semanas. A mesma empresa que removeu seu próprio compromisso binding de halt em fevereiro agora pede ao mundo que construa um.
Isso não é hipocrisia — é a tensão estrutural da indústria. Quem desacelera sozinho perde mercado. Quem acelera sem freios perde qualidade. O resultado é que a qualidade se torna o custo oculto da velocidade, e esse custo recai sobre engenheiros seniors — exatamente as pessoas que você menos pode perder.
A evidência se acumula
A CMU estudou o Cursor: +39% PRs mergeados, +25,1% complexidade de código. A CodeRabbit: código gerado por IA carrega 1,7× mais issues. A Veracode: 45% do código gerado por IA contém falhas de segurança. E o dado mais desconcertante, segundo a Anthropic internamente: devs com IA pontuaram 17% menor em testes de compreensão — 50% vs 67% dos que não usaram IA.
O padrão é consistente: mais código, mais rápido, com menos compreensão do que está sendo mergeado. O sistema está quebrando nas costuras. A aceleração é real. A qualidade é o custo oculto. E o custo recai sobre engenheiros seniors, que são exatamente as pessoas que você menos pode perder.
Redesenhar o pipe, não desacelerar
A resposta não é voltar a escrever código manualmente. É redesenhar o pipeline de garantia de qualidade para o novo volume. Circuit breaker (circuit breaker): triagem de PRs por blast radius (blast radius) antes de review humano. AI-assisted review (AI-assisted review) como primeiro filtro — segundo a Anthropic, essa abordagem elevou a taxa de review substantivo de 16% para 54% com sua ferramenta interna. Tiered review (tiered review): mudanças em módulos críticos exigem review humano obrigatório; mudanças em módulos periféricos podem seguir com review AI-first.
Na Tech86, aplicamos esse raciocínio na prática. Quando ajudamos equipes a integrar IA no processo de desenvolvimento, o primeiro passo não é escolher o modelo — é redesenhar o pipeline de qualidade. Sem circuit breaker (circuit breaker) por blast radius (blast radius) e AI-assisted review (AI-assisted review) como primeiro filtro, a IA apenas move o gargalo de escrever código para confiar no código. E o problema de confiança é mais difícil que o de escrita jamais foi.
