Google Pub/Sub

Name: Google Pub/Sub
Price: Pay-per-use USD
Availability: InStock
Author: Google Cloud

Commercial Managed GCP Streaming

Serviço de mensageria assíncrona do Google Cloud para integração de aplicações e análise de dados

O que é Google Pub/Sub?

Google Cloud Pub/Sub é um serviço de mensageria assíncrona totalmente gerenciado que permite desacoplar serviços que produzem e consomem mensagens. Baseado no padrão publish-subscribe, o Pub/Sub oferece entrega de mensagens durável e de alta disponibilidade em escala global.

O serviço é projetado para suportar aplicações distribuídas modernas, oferecendo garantias de entrega at-least-once, ordenação de mensagens e integração nativa com outros serviços do Google Cloud Platform.

História

Lançado pelo Google Cloud Platform em 2015, o Pub/Sub foi desenvolvido baseado na experiência interna do Google com sistemas de mensageria em larga escala. O serviço evoluiu para se tornar uma peça fundamental da arquitetura de microserviços e aplicações serverless no GCP.

Arquitetura

A arquitetura do Pub/Sub é baseada em conceitos simples mas poderosos:

Topics: Canais nomeados onde publishers enviam mensagens
Subscriptions: Endpoints que recebem mensagens de topics
Publishers: Aplicações que enviam mensagens para topics
Subscribers: Aplicações que recebem mensagens via subscriptions
Messages: Dados enviados entre publishers e subscribers

Vantagens

Escalabilidade automática e global
Totalmente gerenciado pelo Google Cloud
Baixa latência e alta throughput
Garantias de entrega at-least-once
Suporte a push e pull delivery
Integração nativa com GCP services
Dead letter queues para tratamento de erros
Modelo de preços pay-per-use

Desvantagens

Vendor lock-in com Google Cloud
Limitações de ordenação de mensagens
Custos podem ser altos para grandes volumes
Menos controle sobre configurações avançadas
Dependência da infraestrutura do Google
Limitações geográficas baseadas em regiões GCP

Principais Recursos

🌍 Global Messaging

Mensageria global com baixa latência entre regiões

📈 Auto-scaling

Escalabilidade automática baseada na demanda

✅ At-least-once Delivery

Garantia de entrega de mensagens com acknowledgments

🔄 Push & Pull

Suporte a entrega push e pull para subscribers

💀 Dead Letter Queues

Tratamento automático de mensagens com falha

🔐 Security

Criptografia em trânsito e em repouso com IAM

Especificações Técnicas

Throughput	Milhões de mensagens por segundo
Tamanho Máximo da Mensagem	10 MB
Retenção de Mensagens	7 dias (padrão), até 31 dias
Latência	< 100ms (99th percentile)
Regiões Disponíveis	Todas as regiões GCP
SLA	99.95% de disponibilidade

Casos de Uso

🔗 Microservices Integration

Comunicação assíncrona entre microserviços com desacoplamento e resiliência.

📊 Event-driven Analytics

Coleta e processamento de eventos para análise em tempo real com BigQuery e Dataflow.

🔄 ETL Pipelines

Orquestração de pipelines de dados com Cloud Functions e Cloud Run.

📱 Mobile and Web Notifications

Sistema de notificações push para aplicações móveis e web em tempo real.

🏭 IoT Data Ingestion

Coleta de dados de dispositivos IoT com processamento em tempo real.

Quando Usar Google Pub/Sub

✅ Recomendado para:

Aplicações já hospedadas no Google Cloud
Arquiteturas de microserviços e serverless
Necessidade de escalabilidade automática
Integração com outros serviços GCP
Casos onde simplicidade operacional é importante
Aplicações que requerem mensageria global

⚠️ Considere alternativas se:

Precisa evitar vendor lock-in
Requer ordenação estrita de mensagens
Volumes de dados são extremamente altos
Orçamento é limitado para serviços gerenciados
Infraestrutura não está no Google Cloud
Precisa de controle total sobre configuração

Exemplos Práticos

Criação de Topic e Subscription (gcloud CLI)

# Criar topic
gcloud pubsub topics create my-topic

# Criar subscription
gcloud pubsub subscriptions create my-subscription --topic=my-topic

# Listar topics
gcloud pubsub topics list

# Listar subscriptions
gcloud pubsub subscriptions list

Publisher em Python

from google.cloud import pubsub_v1
import json
import time
from datetime import datetime

# Configurar cliente
project_id = "my-project"
topic_id = "my-topic"

publisher = pubsub_v1.PublisherClient()
topic_path = publisher.topic_path(project_id, topic_id)

def publish_message(data):
    # Converter dados para bytes
    message_data = json.dumps(data).encode('utf-8')
    
    # Adicionar atributos
    attributes = {
        'timestamp': datetime.now().isoformat(),
        'source': 'python-publisher'
    }
    
    # Publicar mensagem
    future = publisher.publish(topic_path, message_data, **attributes)
    message_id = future.result()
    print(f"Published message ID: {message_id}")
    return message_id

# Exemplo de uso
for i in range(100):
    data = {
        'user_id': f'user_{i}',
        'event': 'page_view',
        'page': f'/page_{i % 10}',
        'timestamp': datetime.now().isoformat()
    }
    
    publish_message(data)
    time.sleep(0.1)

Subscriber em Python (Pull)

from google.cloud import pubsub_v1
import json
from concurrent.futures import ThreadPoolExecutor

project_id = "my-project"
subscription_id = "my-subscription"

subscriber = pubsub_v1.SubscriberClient()
subscription_path = subscriber.subscription_path(project_id, subscription_id)

def callback(message):
    try:
        # Processar mensagem
        data = json.loads(message.data.decode('utf-8'))
        attributes = dict(message.attributes)
        
        print(f"Received message: {data}")
        print(f"Attributes: {attributes}")
        
        # Simular processamento
        time.sleep(0.1)
        
        # Acknowledge mensagem
        message.ack()
        print(f"Message acknowledged: {message.message_id}")
        
    except Exception as e:
        print(f"Error processing message: {e}")
        message.nack()

# Configurar subscriber
flow_control = pubsub_v1.types.FlowControl(max_messages=100)
executor = ThreadPoolExecutor(max_workers=10)

print(f"Listening for messages on {subscription_path}...")

# Iniciar subscriber
streaming_pull_future = subscriber.subscribe(
    subscription_path, 
    callback=callback,
    flow_control=flow_control,
    executor=executor
)

try:
    streaming_pull_future.result()
except KeyboardInterrupt:
    streaming_pull_future.cancel()
    print("Subscriber stopped.")

Cloud Function Trigger

import json
import base64
from google.cloud import bigquery

def pubsub_trigger(event, context):
    """Cloud Function triggered by Pub/Sub message"""
    
    # Decodificar mensagem
    if 'data' in event:
        message_data = base64.b64decode(event['data']).decode('utf-8')
        data = json.loads(message_data)
    else:
        print('No data in Pub/Sub message')
        return
    
    # Obter atributos
    attributes = event.get('attributes', {})
    
    print(f"Processing message: {data}")
    print(f"Attributes: {attributes}")
    
    # Exemplo: inserir no BigQuery
    client = bigquery.Client()
    table_id = "my-project.my_dataset.events"
    
    rows_to_insert = [{
        'user_id': data.get('user_id'),
        'event': data.get('event'),
        'page': data.get('page'),
        'timestamp': data.get('timestamp'),
        'processed_at': datetime.utcnow().isoformat()
    }]
    
    errors = client.insert_rows_json(table_id, rows_to_insert)
    
    if errors:
        print(f"BigQuery insert errors: {errors}")
        raise Exception("Failed to insert into BigQuery")
    else:
        print("Data inserted successfully into BigQuery")

Terraform Configuration

# Pub/Sub Topic
resource "google_pubsub_topic" "example" {
  name = "my-topic"
  
  labels = {
    environment = "production"
    team        = "data-engineering"
  }
  
  message_retention_duration = "86400s"
}

# Pub/Sub Subscription
resource "google_pubsub_subscription" "example" {
  name  = "my-subscription"
  topic = google_pubsub_topic.example.name
  
  # Configurações de entrega
  ack_deadline_seconds = 20
  
  # Dead letter policy
  dead_letter_policy {
    dead_letter_topic     = google_pubsub_topic.dead_letter.id
    max_delivery_attempts = 5
  }
  
  # Retry policy
  retry_policy {
    minimum_backoff = "10s"
    maximum_backoff = "600s"
  }
  
  # Push configuration (opcional)
  push_config {
    push_endpoint = "https://my-app.com/webhook"
    
    attributes = {
      x-goog-version = "v1"
    }
  }
}

# Dead Letter Topic
resource "google_pubsub_topic" "dead_letter" {
  name = "my-topic-dead-letter"
}

Comparações

Pub/Sub vs Alternativas

Aspecto	Google Pub/Sub	Amazon Kinesis	Apache Kafka
Gerenciamento	Totalmente gerenciado	Totalmente gerenciado	Self-managed
Escalabilidade	Automática	Manual (shards)	Manual
Ordenação	Limitada	Por partition key	Por partition
Latência	~100ms	~200ms	~10ms
Throughput	Muito alto	Alto	Muito alto
Modelo de Preços	Pay-per-message	Pay-per-shard	Infraestrutura

Matriz de Decisão

🎯 Escolha Pub/Sub se:

Já usa Google Cloud Platform
Prefere escalabilidade automática
Precisa de mensageria global
Quer integração com GCP services
Simplicidade operacional é prioridade
Casos de uso serverless

🔄 Considere alternativas se:

Precisa de ordenação estrita
Quer evitar vendor lock-in
Requer latência ultra-baixa
Volumes são extremamente altos
Orçamento limitado para managed services
Multi-cloud é requisito

📊 Quick Facts

Lançamento:	2015
Licença:	Proprietária
Tipo:	Managed Service
Provider:	Google Cloud
SLA:	99.95%

🔗 Links Oficiais

🌐 Site Oficial 📚 Documentação 💰 Preços 🎛️ Console GCP

🔄 Tecnologias Relacionadas

Apache Kafka Amazon Kinesis Apache Beam Google BigQuery

🎓 Cursos Relacionados

Pub/Sub Fundamentals GCP Messaging Serverless Messaging

💼 Conteúdo Patrocinado

Conteúdo Patrocinado

Google Cloud Training

Treinamentos oficiais Google Cloud para Pub/Sub.

Saiba Mais