Data warehouse totalmente gerenciado e otimizado para analytics em petabytes
Amazon Redshift é um serviço de data warehouse totalmente gerenciado na nuvem AWS, projetado para análises de dados em escala de petabytes. Utiliza armazenamento colunar e processamento paralelo massivo (MPP) para entregar performance rápida e consistente.
Redshift utiliza arquitetura de processamento paralelo massivo:
Execução sem gerenciamento de clusters
Consultas diretas em S3 data lakes
Machine learning com Amazon SageMaker
Escalabilidade automática para consultas
CREATE TABLE sales (
sale_id INTEGER NOT NULL,
product_id INTEGER NOT NULL,
customer_id INTEGER NOT NULL,
sale_date DATE NOT NULL,
amount DECIMAL(10,2)
)
DISTKEY(customer_id)
SORTKEY(sale_date);
-- Consulta combinando dados do Redshift e S3
SELECT
r.customer_id,
r.total_purchases,
s.web_activity
FROM redshift_table r
JOIN spectrum.web_logs s
ON r.customer_id = s.customer_id
WHERE r.purchase_date >= '2024-01-01';
Aspecto | Redshift | Snowflake | BigQuery |
---|---|---|---|
Cloud | AWS Only | Multi-cloud | GCP Only |
Performance | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
Custo | Médio | Alto | Médio-Alto |