27% dos deferimentos em sistemas financeiros com LLMs carregam zero informação decisória relevante. O modelo escreve "revisão adicional necessária devido à complexidade" e pronto: conformidade cosmética, substância nenhuma. Segundo o paper arXiv:2605.14744, de José Manuel de la Chica Rodríguez e Carlos Martí-González do Santander AI Lab, esse é um problema estrutural — e o mech-gov-framework resolve com quatro primitivos mecânicos que operam fora do loop interpretativo do modelo.
O problema: Goodhart no coração da governança de LLMs
O problema é estrutural. Quando o LLM interpreta e satisfaz a mesma política de governança, a política vira recomendação, não restrição. É Goodhart puro: a métrica de conformidade (o deferimento) se torna o alvo, e o alvo deixa de ser boa métrica.
No regime R1 (text-only), o LLM recebe a política como prompt e auto-interpreta. O resultado: 27% dos deferimentos são informacionalmente vazios. O modelo adia a decisão, mas o deferimento não carrega informação útil para auditoria. É conformidade cosmética — o modelo parece cumprir a política, mas o deferimento não contém informação decisória.
A solução: quatro primitivos mecânicos
O mech-gov-framework define três regimes de governança. R1 (somente texto): o LLM recebe a política como prompt e auto-interpreta. R2 (a inovação): enforcement mecânico com hard gates, commit-reveal de entropia, congelamento de candidatos e checagem de qualidade argumentativa. R3: regime adaptativo/exploratório.
Os quatro primitivos mecânicos operam FORA do loop interpretativo do modelo:
- Hard gates: regras determinísticas avaliam risco, completude e flags regulatórios ANTES de consultar o LLM. Segundo o paper, 33% dos casos são decididos mecanicamente sem o modelo ser chamado (Gate Override Rate = 0.327).
- E3 (Entropy Commit-Reveal): empresta da criptografia — o protocolo de Blum (1983) garante que o seed de aleatoriedade é commitado antes do scoring, impedindo ataques de seed-conditioning.
- CEFL (Candidate Expansion and Freezing): resolve selection-by-negation — o agente pode suprimir alternativas do conjunto de candidatos para direcionar a decisão. O CEFL externaliza a geração antes do scoring, bloqueando o viés na raiz.
- I6Q (Argumentative Quality Enforcement): exige mínimo de 10 tokens e diversidade lexical (TTR maior ou igual a 0.4). Segundo o paper, sem ele, 28% dos casos precisam de retry. O modelo é forçado a produzir raciocínio substantivo.
Os números: cada primitivo é necessário
Segundo o paper, os resultados são contundentes. MCC sobe de 0.43 para 0.88. CDL cai 73% (de 0.273 para 0.074). DIU mais que dobra (de 0.298 para 0.766). A ablação causal confirma que cada primitivo é individualmente necessário — remover qualquer um degrada significativamente a governança.
Esses não são incrementos marginais. São saltos qualitativos que mudam a natureza do sistema: de governança cosmética para governança auditável.
Governance-task decoupling: o achado central
O achado central do paper é o governance-task decoupling. Sob estresse estrutural, R2 preserva governança mesmo quando a acurácia cai. No cenário S2, R2 atinge sua melhor governança (CDL = 0.088, DIU = 0.852) e pior acurácia (MCC = 0.285) simultaneamente. Sob R1, governança e tarefa degradam juntas.
A implicação é clara: acurácia não é proxy suficiente para governança regulada. Você pode ter alta acurácia e governança terrível. O modelo pode estar certo e ainda assim não ser auditável. Os eixos de governança e acurácia se movem independentemente sob pressão.
Guardrails tradicionais vs. governança mecânica
Segundo o paper, ferramentas como Guardrails AI, NeMo Guardrails e Llama Guard medem segurança de saída — se o conteúdo é tóxico ou ofensivo. O mech-gov-framework mede qualidade de governança — se o deferimento preserva informação para revisão humana. São eixos distintos.
Guardrails tradicionais verificam o que o modelo diz. O mech-gov verifica como o modelo decide. Para conformidade regulatória, você precisa dos dois: guardrails para segurança de conteúdo e governança mecânica para rastreabilidade de decisões.
Implicações para o EU AI Act
A implicação para o AI Act é direta. Após o acordo político do Omnibus (7 de maio de 2026), o prazo para sistemas de alto risco passou para 2 de dezembro de 2027. Agosto de 2026 traz obrigações de transparência para deployers (Artigo 50): rotular conteúdo gerado por IA e informar usuários sobre interação com IA.
Scoring de crédito é classificação de alto risco (Anexo III 5(b)). Detecção de fraude é explicitamente excluída dessa classificação. A EBA confirmou em novembro de 2025: sem contradições significativas entre AI Act e legislação bancária europeia. São complementares — mas complementaridade exige integração deliberada entre os dois frameworks.
Multas: até 35 milhões de euros ou 7% do faturamento global para práticas proibidas. O Evident AI Index 2025 registrou o Santander subindo 7 posições para o 21º lugar global, fortalecendo os pilares de Innovation e Transparency.
Os pacotes open-source do Santander (sota-stressed-datasets para benchmarks de robustez, autoguardrails para guardrails de LLMs) são relevantes para os requisitos de robustez e guardrails do AI Act. O framework é Python, agnóstico a modelo, sob licença Apache 2.0.
Conclusão
Acurácia não é proxy suficiente para conformidade regulada. O governance-task decoupling prova que os eixos de governança e acurácia se movem independentemente sob pressão. Se você opera LLMs regulados e confia em prompts de governança como controle, está medindo o eixo errado. Governança que depende da interpretação do modelo não é governança — é conformidade cosmética.
Na Tech86, nós ajudamos empresas a implementar governança mecânica para LLMs regulados — desde a avaliação da postura atual (R1 vs R2) até o alinhamento com os requisitos do EU AI Act. O framework existe, é open-source e é auditável. O que falta é a decisão de usá-lo.
