Elastic MapReduce - Serviço gerenciado da AWS
Amazon EMR é um serviço de nuvem gerenciado que facilita o processamento de grandes quantidades de dados usando frameworks como Hadoop, Apache Spark, HBase, Presto e Flink. O EMR elimina a complexidade de configurar, gerenciar e dimensionar clusters de big data.
Versão Hadoop | 2.10.x, 3.3.x |
Versão Spark | 3.3.x, 3.4.x |
Instâncias EC2 | Todas as famílias disponíveis |
Storage | S3, EBS, Instance Store |
Networking | VPC, Security Groups |
Spot Instances | Suporte nativo |
Auto Scaling | Baseado em métricas |
Clusters prontos em minutos com configuração automática de todos os componentes.
Spot Instances, auto-scaling e cobrança por uso para reduzir custos significativamente.
IAM, VPC, encryption at rest/transit e integração com AWS security services.
CloudWatch metrics, logs centralizados e alertas automáticos.
Clusters tradicionais em instâncias EC2
Jobs Spark em clusters Kubernetes
Execução serverless de jobs