H2O.ai é uma plataforma de machine learning open-source que democratiza a IA através de AutoML (Automated Machine Learning). A empresa oferece tanto soluções open-source quanto produtos empresariais para acelerar a adoção de ML.
Com foco em facilitar o uso de machine learning para usuários não-especialistas, H2O.ai oferece ferramentas que automatizam muitas das tarefas complexas do desenvolvimento de modelos ML.
Plataforma open-source de machine learning distribuído
AutoML empresarial com interpretabilidade
Framework para aplicações ML em tempo real
Plataforma para operacionalização de modelos
Democratização do ML para não-especialistas
Detecção de fraude, credit scoring, risk management
Diagnóstico médico, descoberta de medicamentos
Customer segmentation, churn prediction
Exemplo de AutoML com H2O-3:
import h2o
from h2o.automl import H2OAutoML
import pandas as pd
# Inicializar H2O
h2o.init()
# Carregar dados
data = h2o.import_file("https://s3.amazonaws.com/h2o-public-test-data/smalldata/iris/iris_wheader.csv")
# Definir features e target
x = data.columns[:-1] # todas as colunas exceto a última
y = data.columns[-1] # última coluna (target)
# Dividir dados
train, test = data.split_frame(ratios=[0.8], seed=42)
# Configurar AutoML
aml = H2OAutoML(
max_models=20,
max_runtime_secs=300, # 5 minutos
seed=42,
project_name="iris_classification"
)
# Treinar modelos automaticamente
aml.train(x=x, y=y, training_frame=train)
# Ver leaderboard
print("Leaderboard:")
print(aml.leaderboard.head())
# Melhor modelo
best_model = aml.leader
print(f"\nMelhor modelo: {best_model.model_id}")
# Fazer predições
predictions = best_model.predict(test)
print("\nPrimeiras predições:")
print(predictions.head())
# Avaliar performance
performance = best_model.model_performance(test)
print(f"\nAUC: {performance.auc()[0][0]:.4f}")
print(f"Accuracy: {performance.accuracy()[0][0]:.4f}")
# Explicabilidade do modelo
explainer = h2o.explain(best_model, test)
# Salvar modelo
model_path = h2o.save_model(best_model, path="./models/", force=True)
print(f"\nModelo salvo em: {model_path}")
# Shutdown H2O
h2o.shutdown(prompt=False)