Observability

Monitoring & Observability

Metrics, structured logs and response playbooks to ensure operational reliability.

Observabilidade

Monitoramento & Observabilidade

Métricas, logs estruturados e playbooks de resposta para garantir confiabilidade operacional.

Structured Logging

Orion Framework provides structured logging through the OrionContext logger interface. Every pipeline execution, node execution and data operation is logged with context.

Using the Logger

def transform(context: OrionContext, df: pd.DataFrame):
    context.logger.info(f"Processing {len(df)} records")
    context.logger.warning("Data quality check: missing values detected")
    context.logger.error("Failed to process record", exc_info=True)
    return df

Log Levels

  • INFO: Informational messages about pipeline execution
  • WARNING: Warning messages about potential issues
  • ERROR: Error messages for failures
  • DEBUG: Detailed debugging information

Metrics Collection

Track key metrics for pipeline health and performance:

  • Execution time per node
  • Record counts at each stage
  • Data quality metrics
  • Error rates

Error Handling & Response

Implement robust error handling in your nodes to ensure pipeline reliability:

  • Validate input data before processing
  • Use try/except blocks with proper logging
  • Implement retry logic for transient failures
  • Monitor error rates and set up alerts

Logging Estruturado

O Orion Framework fornece logging estruturado através da interface de logger do OrionContext. Cada execução de pipeline, execução de node e operação de dados é registrada com contexto.

Usando o Logger

def transform(context: OrionContext, df: pd.DataFrame):
    context.logger.info(f"Processando {len(df)} registros")
    context.logger.warning("Verificação de qualidade: valores faltantes detectados")
    context.logger.error("Falha ao processar registro", exc_info=True)
    return df

Níveis de Log

  • INFO: Mensagens informativas sobre execução de pipeline
  • WARNING: Mensagens de aviso sobre possíveis problemas
  • ERROR: Mensagens de erro para falhas
  • DEBUG: Informações detalhadas de depuração

Coleta de Métricas

Acompanhe métricas-chave para saúde e desempenho da pipeline:

  • Tempo de execução por node
  • Contagem de registros em cada estágio
  • Métricas de qualidade de dados
  • Taxas de erro

Tratamento de Erros & Resposta

Implemente tratamento robusto de erros em seus nodes para garantir confiabilidade da pipeline:

  • Valide dados de entrada antes de processar
  • Use blocos try/except com logging apropriado
  • Implemente lógica de retry para falhas transitórias
  • Monitore taxas de erro e configure alertas