A engine de regime, em uma nota

A maior parte do trabalho de design do long sleeve está num lugar só: o classificador de regime. Tudo o mais - as faixas dos sleeves, o piso de renda fixa, o throttle de drawdown, a reserva - sai da resposta para “em que regime estamos”. Esta nota é o classificador, de ponta a ponta.

A primeira decisão foi o número de estados. Ficamos com três: bull, chop, bear. Dois é pouco; o comportamento de uma fita quieta e em range é genuinamente diferente do bear, e juntar os dois custa cerca de 200bps por ano no sleeve. Cinco é muito - os estados extras (bull fraco, fim de ciclo, recuperação) overfitam a janela de calibração, e o posterior suavizado fica pulando entre eles de um jeito que gera turnover sem gerar retorno. Três é o menor número em que cada estado se justifica. Já testamos quatro e cinco a cada seis meses por dois anos; três venceu toda auditoria.

Um Hidden Markov Model é tão bom quanto aquilo que ele observa. O nosso observa seis features, calculadas diariamente numa janela móvel de 60 dias, e a gente vai passar uma a uma porque a escolha é onde a maior parte do tempo de pesquisa foi.

A primeira é volatilidade realizada em janela de 20 dias - log-returns anualizados da cesta de risco composta (mistura 60/40 BTC/SPY, ponderada pela alocação atual do sleeve). Regimes bear têm saltos característicos de volatilidade; chop tem baseline elevada; bull tem a baseline mais baixa dos três e os saltos mais raros. A forma da distribuição é diferente, não só o nível.

A segunda é força de tendência via Mann-Kendall na curva de log-preço de 90 dias. Robusto a outliers, não finge que existe monotonicidade quando não existe, atravessa transições de regime de forma limpa. Tentamos EWMA-trend e slope-of-OLS antes; ambos foram piores out-of-sample.

A terceira é breadth. Dos quatro ativos elegíveis para o sleeve - BTC, SPY, GLD, SHY - quantos estão acima da média móvel de 60 dias. 3-de-4 é um confirm bull razoável; 0-de-4 é um confirm bear forte; 2-de-4 com a composição certa (defensiva pesada) lê como chop.

A quarta é a inclinação da term structure SHY-para-IEF, o diferencial entre as yields de Treasuries de curto e médio prazo. Inverte no fim de ciclo, fica mais íngreme no começo. O sleeve não opera isso, mas é uma feature limpa de condicionamento de regime e o HMM ama, porque carrega informação macro que features só de preço não têm.

A quinta é a razão risk-on/risk-off: retorno do SPY menos retorno do GLD numa janela de 30 dias. Discriminador surpreendentemente limpo nas transições de regime, porque SPY e GLD divergem com mais força quando o regime está realmente mudando - são as duas proxies mais limpas para “apetite ao risco subindo” e “apetite ao risco desabando”.

A sexta é a profundidade de drawdown: distância do pico de patrimônio da janela móvel de 252 dias. Condicionar nisso significa que um drawdown de 10% num bull é tratado diferente de um drawdown de 10% num bear; a mistura de regimes se resolve sozinha desde que você deixe o modelo condicionar na própria profundidade.

Tentamos adicionar mais sete features (spreads de CDS, term structure do VIX, taxas de funding de perp, breadth em cestas estendidas). Nenhuma melhorou a precisão de classificação out-of-sample em mais de 0.4pp. Algumas pioraram, adicionando ruído. Seis foi o que sobreviveu ao corte, e a gente retestará o corte todo ano.

O modelo em si é Baum-Welch direto numa janela móvel de 5 anos, re-treinado mensalmente. A matriz de transição é regularizada na direção de um prior dominante na diagonal - não queremos que o modelo aprenda que regimes viram a cada outra semana, porque não viram, e um modelo que pensa que viram gera turnover que come o edge. As probabilidades posterior recebem um suavizador exponencialmente ponderado de 14 dias antes de serem usadas downstream; posteriors cruas são tremidas demais e fariam o sleeve oscilar no ruído.

A lição de design mais limpa dos últimos três anos não tem a ver com o modelo e tem totalmente a ver com como o modelo é ligado à alocação. O regime não deve fazer a aposta; o regime deve definir o teto da aposta.

Cada sleeve tem uma faixa - BTC 5-35%, SPY 10-45%, GLD 5-15%, SHY ≥20%. O regime determina onde dentro da faixa o sleeve se senta, mas a faixa em si é estrutural e nunca se move. Num bull forte, BTC fica perto de 35%. Num chop, perto de 15-20%. Num bear, perto de 5%. O piso de renda fixa é inegociável em qualquer regime. Isso é teto de exposição condicional ao regime, não posicionamento condicional ao regime, e a distinção importa exatamente quando o regime está errado, o que acontece numa fração não-trivial do tempo. Quando o classificador rotula chop como bull, o sleeve sobre-aloca BTC perto do topo da faixa - mas não passa da faixa, porque a faixa é um teto estrutural, não saída de modelo. O dano fica limitado.

Um modelo de posicionamento condicional ao regime - bear significa short, bull significa long alavancado - não teria esse limite. Consideramos e rejeitamos. Os intervalos de confiança de 90% da classificação de regime em qualquer momento são amplos o suficiente para você não querer que o regime defina o sinal real da posição; você quer que ele module exposição dentro de uma estrutura já limitada.

Transições de regime são os momentos mais arriscados. A confiança do modelo cai, posteriors ficam aproximadamente iguais em dois estados, e o sleeve deve fazer menos, não mais, até o regime novo estabilizar. A gente força isso com uma regra suave de de-risking: se a maior probabilidade posterior fica abaixo de 0.65 por mais de cinco dias seguidos, cada alocação de sleeve se move até a metade do peso de regime bear, independentemente de qual é o regime mais provável. Isso custa um pouco de retorno esperado nos casos em que o modelo se resolve limpo em bull ou chop, e poupa muita dor nos casos em que se resolve em bear. A assimetria do payoff torna a escolha óbvia.

A fraqueza honesta do setup atual é a janela de calibração. Cinco anos é pouco - não contém ciclos completos suficientes. Estamos indo para uma janela de 12 anos com um prior hierárquico que deixa dados recentes pesarem mais sem dominar. Essa é a única mudança estrutural que esperamos fazer no próximo ano. Todo o resto se sustentou.

inite team