Amazon Redshift

AWS Managed Columnar Data Warehousing

Data warehouse totalmente gerenciado e otimizado para analytics em petabytes

O que é Amazon Redshift?

Amazon Redshift é um serviço de data warehouse totalmente gerenciado na nuvem AWS, projetado para análises de dados em escala de petabytes. Utiliza armazenamento colunar e processamento paralelo massivo (MPP) para entregar performance rápida e consistente.

Arquitetura MPP

Redshift utiliza arquitetura de processamento paralelo massivo:

  • Leader Node: Coordena consultas e distribui trabalho
  • Compute Nodes: Executam consultas em paralelo
  • Node Slices: Partições de dados para processamento
  • Columnar Storage: Armazenamento otimizado por colunas

Vantagens

  • Performance otimizada para analytics
  • Integração nativa com ecossistema AWS
  • Escalabilidade de petabytes
  • Backup e recuperação automáticos
  • Compressão avançada de dados
  • Redshift Serverless disponível

Casos de Uso Ideais

  • Business Intelligence e relatórios
  • Analytics de dados históricos
  • Data warehousing empresarial
  • Análises de big data

Principais Recursos

🚀 Redshift Serverless

Execução sem gerenciamento de clusters

📊 Spectrum

Consultas diretas em S3 data lakes

🤖 ML Integrado

Machine learning com Amazon SageMaker

🔄 Concurrency Scaling

Escalabilidade automática para consultas

Casos de Uso

✅ Recomendado para:
  • Organizações que usam AWS
  • Analytics de dados estruturados
  • Business Intelligence tradicional
  • Workloads batch regulares
  • Integração com ferramentas AWS

Exemplos Práticos

Criação de Tabela Otimizada

CREATE TABLE sales (
    sale_id INTEGER NOT NULL,
    product_id INTEGER NOT NULL,
    customer_id INTEGER NOT NULL,
    sale_date DATE NOT NULL,
    amount DECIMAL(10,2)
)
DISTKEY(customer_id)
SORTKEY(sale_date);

Consulta com Redshift Spectrum

-- Consulta combinando dados do Redshift e S3
SELECT 
    r.customer_id,
    r.total_purchases,
    s.web_activity
FROM redshift_table r
JOIN spectrum.web_logs s 
    ON r.customer_id = s.customer_id
WHERE r.purchase_date >= '2024-01-01';

Comparações

Aspecto Redshift Snowflake BigQuery
Cloud AWS Only Multi-cloud GCP Only
Performance ⭐⭐⭐⭐ ⭐⭐⭐⭐⭐ ⭐⭐⭐⭐⭐
Custo Médio Alto Médio-Alto
📊 Quick Facts
Lançamento: 2012
Licença: Comercial
Cloud: AWS
Arquitetura: MPP Columnar
🔄 Tecnologias Relacionadas