Serviço de analytics da Microsoft Azure para big data
Azure HDInsight é um serviço de analytics na nuvem totalmente gerenciado que torna mais fácil, rápido e econômico processar grandes quantidades de dados. Suporta frameworks populares de código aberto como Hadoop, Spark, Hive, LLAP, Kafka, Storm, R e muito mais.
| Versão Hadoop | 2.10.x, 3.1.x |
| Versão Spark | 2.4.x, 3.1.x, 3.2.x |
| Azure VMs | Todas as séries disponíveis |
| Storage | Azure Storage, Data Lake Storage |
| Networking | Virtual Network, NSG |
| Spot VMs | Suporte nativo |
| Auto Scaling | Baseado em schedule e métricas |
Integração com Azure Active Directory, encryption e compliance enterprise.
Conectividade perfeita com Power BI, Synapse, Data Factory e outros serviços.
Spot VMs, auto-scaling e reserved instances para redução de custos.
Suporte nativo para R, Python, Scala e integração com Azure ML.
Processamento batch tradicional
Processamento in-memory rápido
Analytics interativo com LLAP
Streaming de dados em tempo real
Database NoSQL distribuído
Machine Learning com R e Python