Pular para o conteúdo principal
Fechar
IA

Governança Mecânica para LLMs: O mech-gov-framework e o EU AI Act

Gabriel Ferraresi· CEO | Tech8627 de junho de 20265 min
iagovernancaeu-ai-actllmregulamentacao

27% dos deferimentos em sistemas financeiros com LLMs carregam zero informação decisória relevante. O modelo escreve "revisão adicional necessária devido à complexidade" e pronto: conformidade cosmética, substância nenhuma. Segundo o paper arXiv:2605.14744, de José Manuel de la Chica Rodríguez e Carlos Martí-González do Santander AI Lab, esse é um problema estrutural — e o mech-gov-framework resolve com quatro primitivos mecânicos que operam fora do loop interpretativo do modelo.

O problema: Goodhart no coração da governança de LLMs

O problema é estrutural. Quando o LLM interpreta e satisfaz a mesma política de governança, a política vira recomendação, não restrição. É Goodhart puro: a métrica de conformidade (o deferimento) se torna o alvo, e o alvo deixa de ser boa métrica.

No regime R1 (text-only), o LLM recebe a política como prompt e auto-interpreta. O resultado: 27% dos deferimentos são informacionalmente vazios. O modelo adia a decisão, mas o deferimento não carrega informação útil para auditoria. É conformidade cosmética — o modelo parece cumprir a política, mas o deferimento não contém informação decisória.

A solução: quatro primitivos mecânicos

O mech-gov-framework define três regimes de governança. R1 (somente texto): o LLM recebe a política como prompt e auto-interpreta. R2 (a inovação): enforcement mecânico com hard gates, commit-reveal de entropia, congelamento de candidatos e checagem de qualidade argumentativa. R3: regime adaptativo/exploratório.

Os quatro primitivos mecânicos operam FORA do loop interpretativo do modelo:

  • Hard gates: regras determinísticas avaliam risco, completude e flags regulatórios ANTES de consultar o LLM. Segundo o paper, 33% dos casos são decididos mecanicamente sem o modelo ser chamado (Gate Override Rate = 0.327).
  • E3 (Entropy Commit-Reveal): empresta da criptografia — o protocolo de Blum (1983) garante que o seed de aleatoriedade é commitado antes do scoring, impedindo ataques de seed-conditioning.
  • CEFL (Candidate Expansion and Freezing): resolve selection-by-negation — o agente pode suprimir alternativas do conjunto de candidatos para direcionar a decisão. O CEFL externaliza a geração antes do scoring, bloqueando o viés na raiz.
  • I6Q (Argumentative Quality Enforcement): exige mínimo de 10 tokens e diversidade lexical (TTR maior ou igual a 0.4). Segundo o paper, sem ele, 28% dos casos precisam de retry. O modelo é forçado a produzir raciocínio substantivo.

Os números: cada primitivo é necessário

Segundo o paper, os resultados são contundentes. MCC sobe de 0.43 para 0.88. CDL cai 73% (de 0.273 para 0.074). DIU mais que dobra (de 0.298 para 0.766). A ablação causal confirma que cada primitivo é individualmente necessário — remover qualquer um degrada significativamente a governança.

Esses não são incrementos marginais. São saltos qualitativos que mudam a natureza do sistema: de governança cosmética para governança auditável.

Governance-task decoupling: o achado central

O achado central do paper é o governance-task decoupling. Sob estresse estrutural, R2 preserva governança mesmo quando a acurácia cai. No cenário S2, R2 atinge sua melhor governança (CDL = 0.088, DIU = 0.852) e pior acurácia (MCC = 0.285) simultaneamente. Sob R1, governança e tarefa degradam juntas.

A implicação é clara: acurácia não é proxy suficiente para governança regulada. Você pode ter alta acurácia e governança terrível. O modelo pode estar certo e ainda assim não ser auditável. Os eixos de governança e acurácia se movem independentemente sob pressão.

Guardrails tradicionais vs. governança mecânica

Segundo o paper, ferramentas como Guardrails AI, NeMo Guardrails e Llama Guard medem segurança de saída — se o conteúdo é tóxico ou ofensivo. O mech-gov-framework mede qualidade de governança — se o deferimento preserva informação para revisão humana. São eixos distintos.

Guardrails tradicionais verificam o que o modelo diz. O mech-gov verifica como o modelo decide. Para conformidade regulatória, você precisa dos dois: guardrails para segurança de conteúdo e governança mecânica para rastreabilidade de decisões.

Implicações para o EU AI Act

A implicação para o AI Act é direta. Após o acordo político do Omnibus (7 de maio de 2026), o prazo para sistemas de alto risco passou para 2 de dezembro de 2027. Agosto de 2026 traz obrigações de transparência para deployers (Artigo 50): rotular conteúdo gerado por IA e informar usuários sobre interação com IA.

Scoring de crédito é classificação de alto risco (Anexo III 5(b)). Detecção de fraude é explicitamente excluída dessa classificação. A EBA confirmou em novembro de 2025: sem contradições significativas entre AI Act e legislação bancária europeia. São complementares — mas complementaridade exige integração deliberada entre os dois frameworks.

Multas: até 35 milhões de euros ou 7% do faturamento global para práticas proibidas. O Evident AI Index 2025 registrou o Santander subindo 7 posições para o 21º lugar global, fortalecendo os pilares de Innovation e Transparency.

Os pacotes open-source do Santander (sota-stressed-datasets para benchmarks de robustez, autoguardrails para guardrails de LLMs) são relevantes para os requisitos de robustez e guardrails do AI Act. O framework é Python, agnóstico a modelo, sob licença Apache 2.0.

Conclusão

Acurácia não é proxy suficiente para conformidade regulada. O governance-task decoupling prova que os eixos de governança e acurácia se movem independentemente sob pressão. Se você opera LLMs regulados e confia em prompts de governança como controle, está medindo o eixo errado. Governança que depende da interpretação do modelo não é governança — é conformidade cosmética.

Na Tech86, nós ajudamos empresas a implementar governança mecânica para LLMs regulados — desde a avaliação da postura atual (R1 vs R2) até o alinhamento com os requisitos do EU AI Act. O framework existe, é open-source e é auditável. O que falta é a decisão de usá-lo.

Precisa de orientação especializada?

Agende uma consultoria com nossos especialistas.

Consultoria de Governança de IA

Perguntas Frequentes

Governança mecânica (termo original do paper do Santander AI Lab, arXiv:2605.14744) opera FORA do loop interpretativo do modelo. No regime R1 (text-only), o LLM recebe a política como prompt e auto-interpreta — a política vira recomendação, não restrição. No regime R2 (enforcement mecânico), hard gates, commit-reveal de entropia, congelamento de candidatos e checagem de qualidade argumentativa são aplicados deterministicamente. Segundo o paper, sob R1, 27% dos deferimentos carregam zero informação decisória relevante. Sob R2, o CDL cai 73% e o DIU sobe de 0.298 para 0.766.

Governance-task decoupling é o achado central do paper: sob estresse estrutural, o regime R2 preserva governança mesmo quando a acurácia cai. No cenário S2, R2 atinge sua melhor governança (CDL = 0.088, DIU = 0.852) e pior acurácia (MCC = 0.285) simultaneamente. Sob R1, governança e tarefa degradam juntas. A implicação: acurácia não é proxy suficiente para governança regulada. Você pode ter alta acurácia e governança terrível — o modelo pode estar certo e ainda assim não ser auditável.

Após o acordo político do Omnibus (7 de maio de 2026), o prazo para sistemas de alto risco passou para 2 de dezembro de 2027. Scoring de crédito é classificação de alto risco (Anexo III 5(b)). Detecção de fraude é explicitamente excluída dessa classificação. O Artigo 50 traz obrigações de transparência para deployers a partir de agosto de 2026: rotular conteúdo gerado por IA e informar usuários sobre interação com IA. Multas chegam a 35 milhões de euros ou 7% do faturamento global para práticas proibidas. A EBA confirmou em novembro de 2025 que não há contradições significativas entre AI Act e legislação bancária europeia — são complementares.

Segundo o paper, ferramentas como Guardrails AI, NeMo Guardrails e Llama Guard medem segurança de saída — se o conteúdo é tóxico ou ofensivo. O mech-gov-framework mede qualidade de governança — se o deferimento preserva informação para revisão humana. São eixos distintos. Guardrails tradicionais verificam o que o modelo diz; o mech-gov verifica como o modelo decide. Para conformidade com o EU AI Act, você precisa dos dois: guardrails para segurança de conteúdo e governança mecânica para rastreabilidade de decisões.

Blog — Fale Conosco

Tem alguma pergunta sobre nossos artigos ou serviços? Nossa equipe está pronta para ajudar.

Agendar Reunião

Reserve um horário.

Agendar Agora

E-mail

Envie uma mensagem.

[email protected]

WhatsApp

Conversa rápida.

Endereço

Avenida Paulista, 1636 - São Paulo - SP - 01310-200

Especialista Tech86

Online agora

Olá! Como podemos ajudar a escalar seu negócio hoje?

Tech86 Engineering

Nós valorizamos sua privacidade

Utilizamos cookies e tecnologias similares para otimizar a sua experiência, analisar o tráfego do site e personalizar conteúdo. Ao clicar "Aceitar Todos", você concorda com o uso de todos os cookies. Leia nossa Política de Privacidade.