Pilar 02 · Data Blog

Multi-cloud: mito ou estratégia — critério honesto pra decidir

Multi-cloud é o argumento favorito de vendedores de nuvem — curiosamente, de todos eles ao mesmo tempo. AWS, Azure e GCP têm documentação detalhada sobre como executar arquitetura multi-cloud com cada um deles como provedor principal. A lógica parece sólida: não depender de um único fornecedor, ter opção de saída, negociar melhor contrato. O problema é que a premissa raramente sobrevive ao contato com a operação real.

A maioria das empresas que declara ser multi-cloud está descrevendo acidente, não arquitetura. Salesforce roda na AWS, o Google Analytics está no GCP, o Active Directory vive no Azure AD. Isso é SaaS em nuvens diferentes — não é multi-cloud de infraestrutura.

O que multi-cloud é — e o que não é

Multi-cloud técnico significa distribuir cargas de trabalho de infraestrutura entre dois ou mais provedores de forma intencional, com critério definido pra cada alocação. Workload A roda em AWS porque o time tem expertise comprovado e os dados de produção já estão ali. Workload B roda em GCP porque o volume de ML justifica TPUs. Os dois se comunicam com latência e segurança definidas, monitorados por ferramentas unificadas.

Isso exige:

  1. Dois sets completos de skills de operação — certificações distintas, modelos de segurança diferentes, billing e pricing models separados.
  2. Ferramentas de orquestração cross-cloud — Terraform multi-provider, observabilidade unificada (Datadog, Grafana Cloud), gestão de identidade e IAM cross-cloud.
  3. Contabilização do custo de egress — tráfego que cruza fronteiras de cloud paga. Workloads que conversam entre AWS e GCP adicionam latência de 20–100ms e custo de saída real por GB transferido.

O que aparece com mais frequência na prática não é isso. É empresa com ERP em Azure (legado de licenciamento Microsoft), warehouse no Snowflake que roda em AWS, e um projeto de ML no GCP que nasceu de PoC e nunca migrou. Três provedores por acidente, não por design.

Por que o argumento de lock-in não fecha como parece

O pitch central pra multi-cloud é: "use dois provedores pra não ficar preso em nenhum." O problema é que o lock-in que multi-cloud resolve — compute e networking — não é o lock-in que dói de verdade.

O lock-in que dói é de dados e de serviços proprietários. Sacar 1 PB do S3 pra outro storage custa egress fee na ordem de US$ 20–90 mil, dependendo da região. Mover workload de Kubernetes de uma cloud pra outra é operação de semanas — caro, mas factível. O lock-in mais profundo mora nos serviços proprietários — Redshift, BigQuery, Synapse — que acumulam dependência de SQL dialect e integrações específicas. Esse é o lock-in que multi-cloud não resolve, porque precisaria abrir mão do que diferencia cada provedor.

A ironia: pra extrair o máximo de cada cloud, você usa os serviços proprietários dela. Quanto mais usa, mais fica preso. Multi-cloud como estratégia de evitar lock-in forçaria usar apenas os denominadores comuns entre provedores — que são, por definição, os menores diferenciais técnicos de cada um.

Multi-cloud como estratégia de evitar lock-in é contradição: só funciona se você não usar o que cada provedor tem de melhor.

Cinco situações em que multi-cloud faz sentido

Existem cenários em que multi-cloud é a resposta correta. São cinco, e todos têm critério técnico ou regulatório específico — não viés de vendor.

  1. Soberania de dados e regulação. Dados de clientes sujeitos a restrições contratuais de território, ou dados europeus sob GDPR com requisito de data residency na UE. Se o provedor principal não tem região local adequada, um segundo provedor pode ser obrigação legal, não opção.

  2. Best of breed com capacidade de operar. GPU compute no GCP (TPUs são genuinamente mais baratos pra certos workloads de ML) + AWS para workload enterprise estabelecido. Só faz sentido quando o time tem expertise operacional nos dois provedores — não como legado de PoC que ficou em produção por inércia.

  3. Disaster recovery com SLA contratual. Primary em AWS São Paulo, failover em Azure East US. Custo justificado quando o SLA de disponibilidade exigido por contrato não é atingível com uma única região de um único provedor — cenário que existe em setores financeiros e de saúde.

  4. Herança de aquisição. Comprou empresa que roda em GCP; você roda em AWS. Multi-cloud por herança, não por design. A decisão real é consolidar ou coexistir — não fingir que a situação é estratégica. Se a decisão for coexistir, operacionalize com rigor em vez de deixar crescer em silos paralelos sem governança.

  5. Barganha de contrato com piloto real. Ter segundo provedor em uso ativo — mesmo que em escala menor — muda a posição de negociação com o provedor principal. Funciona quando o piloto é operacional de verdade, não teatro de demonstração.

Fora desses cinco, a resposta correta quase sempre é single cloud bem operado e bem governado.

O overhead que o slide não mostra

Estimativas de times que operaram multi-cloud real por dois ou mais anos apontam para 30–40% de overhead operacional comparado a single-cloud equivalente bem configurado. Custo mensurável em horas de engenharia, tickets de suporte cruzado, incidentes de permissão em fronteiras de IAM distintas, e onboarding de novos engenheiros que precisam aprender dois mundos.

A escolha de warehouse na prática quase sempre depende do contexto organizacional, não de benchmark técnico isolado. O mesmo princípio vale pra cloud: o melhor provedor é o que o time consegue operar bem — não o que tem o maior feature set no slide de comparação.

Multi-cloud adiciona complexidade estrutural permanente. Antes de decidir, o número relevante é o overhead projetado para cinco anos de operação — não o custo de setup do primeiro mês.

A pergunta que simplifica a decisão

Uma pergunta resolve 80% dos casos: por que não é single cloud?

Se a resposta for "porque nosso provedor principal não tem X que precisamos" — essa é a única razão técnica que fecha por si. Verifique se X existe ou se é questão de maturidade de uso antes de assumir que o segundo provedor resolve.

Se a resposta for "para não ficar preso" — calcule o custo de lock-in hipotético (egress + migração eventual) versus o overhead de multi-cloud pelos próximos cinco anos. Em 80% dos casos, o overhead real supera o custo de lock-in estimado.

Se a resposta for "porque o board pediu" ou "porque o concorrente faz" — há um problema de comunicação estratégica, não de arquitetura.

Quem está definindo arquitetura de dados em 2026 enfrenta pressão pra adotar o que soa moderno. Multi-cloud soa moderno — e essa é, com frequência, a única razão real por trás da decisão.

Multi-cloud não é errado. É caro — e o custo só se justifica quando o ganho específico (regulação, capacidade técnica comprovada, DR com SLA contratual, ou barganha de contrato real) supera o overhead permanente de operar dois provedores com qualidade. A pergunta certa não é "devemos ser multi-cloud?" mas "qual problema específico estamos resolvendo que single cloud bem operado não resolve?"

Continuar a conversa

Quer discutir esse tema com um sócio?

Diagnóstico inicial sem compromisso. Levamos uma primeira leitura do seu cenário em uma semana e devolvemos um relatório.

Conversar com um sócio