Pular para conteúdo

Auto Scaling (EC2/ECS)

O que é

Mecanismo de ajuste automático de capacidade conforme métricas e demanda.

Caso de uso

Aumentar/ reduzir instâncias e tasks em picos sem intervenção manual.

Por que existe

Existe para equilibrar performance, disponibilidade e custo.

Trade-offs

  • Reduz risco de indisponibilidade por pico.
  • Política mal calibrada causa oscillation (sobe/desce sem estabilidade).

Boas práticas

  • Use cooldown adequado e métricas alinhadas ao gargalo real.
  • Teste comportamento em carga sintética.
  • Defina limites mínimo/máximo por ambiente.

Quando não usar

  • Quando o problema pode ser resolvido com uma opção mais simples e barata.
  • Quando o time não tem maturidade operacional para sustentar a complexidade do Auto Scaling.
  • Quando os requisitos de latência, compliance ou portabilidade pedem outra estratégia.

Erros comuns

  • Escolher tecnologia por hype, sem mapear padrão real de acesso/tráfego.
  • Ignorar custo total (execução + transferência + observabilidade + operação).
  • Não definir limites, alarmes e dono do serviço em produção.

Checklist de decisão rápida

  • Qual SLO/SLA esperado (latência, disponibilidade, throughput)?
  • Qual o volume de tráfego e perfil de crescimento (picos previsíveis ou não)?
  • Qual o nível de esforço operacional aceitável para o time?