3 incidentes críticos abertos

web-api, pagamentos e fila de builds com erros 5xx.

Nova release aguardando aprovação

checkout v3.2.1 pronta para promover para produção.

Uso de CPU

72%
+3.1%pico por builds paralelas
Uso de CPU sparklinePequeno gráfico de linha representando tendência em escala relativa.

Uso de Memória

65%
-1.4%sobre headroom de 4GB
Uso de Memória sparklinePequeno gráfico de linha representando tendência em escala relativa.

Latência média

182ms
-6.8%95p: 240ms
Latência média sparklinePequeno gráfico de linha representando tendência em escala relativa.

Erros/min

14
+2incidentes em api-web
Erros/min sparklinePequeno gráfico de linha representando tendência em escala relativa.

Serviços UP

42/45
+12 degradados, 1 em manutenção
Serviços UP sparklinePequeno gráfico de linha representando tendência em escala relativa.

Deploys 24h

28
+680% sucesso
Deploys 24h sparklinePequeno gráfico de linha representando tendência em escala relativa.

Saúde da Plataforma

Panorama consolidado por domínio

Status da Plataforma

Estável

SLO 99.8% nas últimas 24h

ok

Incidentes Abertos

3 críticos

web-api, pagamentos, builds

atenção

Deploys HO

6 execuções

2 aguardando aprovação

ok

Alertas

18 ativos

5 críticos, 7 altos, 6 médios

atenção

Deploys recentes

Promoções em produção e stage

web-api

prodSucesso

v2.18.4 - ana.silva - há 8 min

checkout

prodFalha

v3.2.1 - devops-bot - há 22 min

catalog

stageSucesso

v1.9.0 - rodrigo.m - há 35 min

worker-billing

prodEm execução

v1.4.7 - ana.silva - em curso

Hotspots de Erro

Endpoints com maiores taxas de falha

Atenção

web-api

/orders/checkout

1.90%Subindo

checkout

/pay

1.40%Estável

auth

/login

0.60%Caindo

notifications

/send

0.40%Estável

Fluxo de rede

Tráfego médio (req/s) e variação

Em execução

Edge ingress

1320 req/s
mini gráficoPequeno gráfico de linha representando tendência em escala relativa.

+4.2% vs última hora

Serviços internos

980 req/s
mini gráficoPequeno gráfico de linha representando tendência em escala relativa.

+2.1% vs última hora

Filas / workers

410 req/s
mini gráficoPequeno gráfico de linha representando tendência em escala relativa.

-1.3% vs última hora

SLOs críticos

Acompanhamento de latência e erros

Tempo real

Checkout

OK
99.9%
Tendência CheckoutPequeno gráfico de linha representando tendência em escala relativa.

Auth

OK
99.95%
Tendência AuthPequeno gráfico de linha representando tendência em escala relativa.

Web-API

Risco
99.8%
Tendência Web-APIPequeno gráfico de linha representando tendência em escala relativa.

Pagamentos

Risco
99.9%
Tendência PagamentosPequeno gráfico de linha representando tendência em escala relativa.