Monitoramento e Alertas
O que monitorar e sobre o que alertar para market makers.
Health Checks
Saúde da API
Endpoint: GET /health
Resposta: { "status": "ok" }
Monitoramento: Verifique a cada 30-60 segundos
Alerta: Se o health check falhar, o servidor da API pode estar fora do ar
Conexão WebSocket
Monitoramento: Acompanhe o status da conexão WebSocket
Alerta: Se a conexão cair, reconecte imediatamente
Boa prática: Implemente backoff exponencial na reconexão
Monitoramento de Ordens
Taxa de Rejeição
Métrica: Porcentagem de ordens rejeitadas
Alerta: Se a taxa de rejeição for > 5%, investigue:
- Problemas de margem
- Restrições de tier
- Instrumentos vencidos
- Sobrecarga do sistema
Taxa de Execução
Métrica: Porcentagem de ordens executadas
Alerta: Se a taxa de execução cair significativamente, investigue:
- Condições de mercado
- Competitividade das cotações
- Profundidade do livro de ofertas
Latência de Ordens
Métrica: Tempo entre o envio da ordem e a execução/confirmação
Alerta: Se a latência for > 1s, investigue:
- Sobrecarga do sistema
- Problemas de rede
- Atrasos de processamento do engine
Monitoramento de Portfólio
Uso de Margem
Métrica: total_margin_used / balance
Alerta: Se o uso de margem for > 80%, considere:
- Reduzir o tamanho da posição
- Adicionar colateral
- Fechar posições
Saldo em Caixa
Métrica: Saldo em caixa da conta
Alerta: Se o saldo em caixa for < limite definido, deposite fundos (quando implementado)
Monitoramento de MMP
Acionamentos de MMP
Métrica: Número de acionamentos de MMP por hora
Alerta: Se o MMP for acionado com frequência, considere:
- Aumentar os limites de MMP
- Reduzir a frequência de cotação
- Revisar os padrões de execução
Taxa de Cancelamento por MMP
Métrica: Porcentagem de ordens canceladas pelo MMP
Alerta: Se a taxa de cancelamento por MMP for > 10%, revise a configuração do MMP
Monitoramento do Sistema
Tempos de Resposta da API
Métrica: Tempos de resposta P50, P95, P99
Alerta: Se P95 > 500ms, investigue a carga do sistema
Taxa de Mensagens do WebSocket
Métrica: Mensagens por segundo no WebSocket
Alerta: Se a taxa de mensagens disparar, investigue:
- Volatilidade do mercado
- Sobrecarga do sistema
- Atrasos no processamento de mensagens
Alertas Recomendados
- Falha no health check: Servidor da API fora do ar
- Alta taxa de rejeição: > 5% das ordens rejeitadas
- Baixa taxa de execução: < 50% das ordens executadas (depende do contexto)
- Alto uso de margem: > 80% da margem utilizada
- Acionamentos de MMP: > 5 acionamentos por hora
- Desconexão do WebSocket: Conexão perdida
- Alta latência: P95 > 500ms
Ferramentas de Monitoramento
Recomendado:
- Endpoint de health check para monitoramento de uptime
- Acompanhamento do status da conexão WebSocket
- Reconciliação de ordens/execuções para precisão
- Acompanhamento da margem do portfólio
Atualmente: Não há dashboard de monitoramento integrado. Use ferramentas externas (ex.: Prometheus, Grafana).