MODULO 2.8

💰 Governanca de Custos

Como tratar custo como metrica de qualidade e manter controle financeiro sobre uso de IA.

6
Topicos
~30
Minutos
Interm.
Nivel
Pratico
Tipo
1

💰 Custo como metrica de qualidade

No GIPM, custo nao e apenas uma despesa - e uma metrica de eficiencia do sistema.

Por que custo e metrica de qualidade?

  • Prompts ruins gastam mais tokens sem melhor resultado
  • Contexto excessivo aumenta custo sem necessidade
  • Retries frequentes indicam problemas na implementacao
  • Modelo errado pode ser overkill ou insuficiente

💡 Principio

Um sistema bem governado custa menos para produzir o mesmo resultado. Custo alto sem justificativa e sinal de governanca fraca.

2

📊 Metricas: por execucao, entrega, usuario

Por Execucao

  • • Tokens de entrada
  • • Tokens de saida
  • • Custo unitario (USD)
  • • Tempo de resposta
  • • Modelo utilizado

Por Entrega

  • • Custo total do artefato
  • • Numero de chamadas
  • • Retries necessarios
  • • Custo por tipo de output
  • • Eficiencia (custo/qualidade)

Por Usuario

  • • Custo acumulado
  • • Media por request
  • • Uso por periodo
  • • Quota consumida
  • • Tendencia de uso
3

📈 Dashboard de custos

Elementos essenciais do dashboard

$1,234
Custo Mensal
$0.03
Media/Request
45K
Requests/Mes
72%
Budget Usado

Graficos recomendados

  • Custo diario (linha do tempo)
  • Distribuicao por modelo (pizza)
  • Top usuarios (barras)
  • Custo por tipo de tarefa (barras empilhadas)
4

⚠️ Alertas e limites

# Configuracao de alertas e limites
cost_config = {
    "alerts": {
        "daily_warning": 100.00,    # Alerta amarelo
        "daily_critical": 200.00,   # Alerta vermelho
        "monthly_budget": 3000.00,  # Budget mensal
    },
    "limits": {
        "per_request_max": 0.50,    # Bloqueia requests caros
        "per_user_daily": 10.00,    # Limite por usuario/dia
        "per_user_monthly": 100.00, # Limite por usuario/mes
    },
    "actions": {
        "on_warning": "notify_admin",
        "on_critical": "notify_admin + slow_down",
        "on_limit": "block_and_notify",
    }
}
5

🔧 Otimizacao de chamadas

Estrategias para reduzir custos sem perder qualidade.

Boas praticas

  • Usar modelo adequado para a tarefa
  • Cachear respostas repetitivas
  • Limitar contexto ao necessario
  • Batch requests similares
  • Prompts concisos e diretos

Anti-patterns

  • GPT-4 para tarefas simples
  • Injetar contexto inteiro sempre
  • Retries sem backoff
  • Ignorar tokens de saida
  • Nao monitorar custos
6

📋 Relatorios de ROI

Demonstrar o retorno sobre investimento em IA e essencial para justificar o uso.

Metricas de ROI

Custo por documento gerado $0.15

vs $25/hora de um redator humano

Tempo economizado por mes 120 horas

Tarefas que seriam manuais

ROI estimado 340%

(Valor gerado - Custo IA) / Custo IA

📝 Resumo do Modulo

Custo = Qualidade - Custo alto indica governanca fraca
Metricas - Por execucao, entrega e usuario
Alertas - Limites e acoes automaticas
ROI - Demonstrar valor para stakeholders