ADR-002: Conformal Prediction como gate final¶

Status: ✅ Accepted (2026-04)

Contexto¶

Em v1.x as predições eram emitidas apenas com base na probabilidade do modelo:

if max(probs) > 0.55:
    signal = ["BUY", "SELL", "NO_TRADE"][np.argmax(probs)]
else:
    signal = "NO_TRADE"

Problemas:

Calibração ruim: P=0.62 não significa "62% de chance" se o modelo é mal calibrado (ECE alto)
Sem garantia estatística de cobertura
Threshold absoluto (0.55) é ad-hoc e varia por símbolo

Implementar Inductive Conformal Prediction (ICP) com α = 0.15 → cobertura ≥ 85%.

# configs/model.yaml
training:
  conformal_alpha: 0.15

$$s_i = 1 - P(y_i | x_i)$$

$$\text{set}(x) = { y : 1 - P(y|x) \leq q_{1-\alpha}(s) }$$

Teorema do ICP: P(y_true ∈ set(x)) ≥ 1 - α = 85%.

Isso é distribution-free — não depende do modelo estar bem calibrado.

Por que não: corrige calibração mas não dá garantia de cobertura. Ainda emite predições incertas como se fossem confiáveis.

Por que não: ainda dependente do modelo, sem garantia estatística. Foi usado em v1.x e era frágil.

Por que não: modelo gradient-boosted não tem distribuição posterior nativa. Bootstrapping seria oneroso.

Considerado: α diferente para BUY/SELL/NO_TRADE. Complica configuração sem ganho prático em backtests.

Cobertura empírica em produção ≈ 87% (validamos com 2 meses de forward data)
Reduz falsos positivos sem sacrificar muito recall
Independente de qualidade de calibração do modelo
Auditável (qualquer um pode verificar cobertura)

Backtested 0.05, 0.10, 0.15, 0.20:

α	Cobertura	Sinais BUY/SELL	PF médio
0.05	~95%	<5% sinais	1.18
0.10	~91%	12% sinais	1.29
0.15	~87%	~30% sinais	1.42
0.20	~82%	~45% sinais	1.31 (mais ruído)

0.15 é o sweet spot: cobertura ainda forte + sinais suficientes para o EA operar.