Portal TransformaΓ§Γ£o Digital
MODULO 2.8

πŸ’° Governanca de Custos

Como tratar custo como metrica de qualidade e manter controle financeiro sobre uso de IA.

6
Topicos
~30
Minutos
Interm.
Nivel
Pratico
Tipo
1

πŸ’° Custo como metrica de qualidade

No GIPM, custo nao e apenas uma despesa - e uma metrica de eficiencia do sistema.

Por que custo e metrica de qualidade?

  • β€’Prompts ruins gastam mais tokens sem melhor resultado
  • β€’Contexto excessivo aumenta custo sem necessidade
  • β€’Retries frequentes indicam problemas na implementacao
  • β€’Modelo errado pode ser overkill ou insuficiente

πŸ’‘ Principio

Um sistema bem governado custa menos para produzir o mesmo resultado. Custo alto sem justificativa e sinal de governanca fraca.

2

πŸ“Š Metricas: por execucao, entrega, usuario

Por Execucao

  • β€’ Tokens de entrada
  • β€’ Tokens de saida
  • β€’ Custo unitario (USD)
  • β€’ Tempo de resposta
  • β€’ Modelo utilizado

Por Entrega

  • β€’ Custo total do artefato
  • β€’ Numero de chamadas
  • β€’ Retries necessarios
  • β€’ Custo por tipo de output
  • β€’ Eficiencia (custo/qualidade)

Por Usuario

  • β€’ Custo acumulado
  • β€’ Media por request
  • β€’ Uso por periodo
  • β€’ Quota consumida
  • β€’ Tendencia de uso
3

πŸ“ˆ Dashboard de custos

Elementos essenciais do dashboard

$1,234
Custo Mensal
$0.03
Media/Request
45K
Requests/Mes
72%
Budget Usado

Graficos recomendados

  • β€’Custo diario (linha do tempo)
  • β€’Distribuicao por modelo (pizza)
  • β€’Top usuarios (barras)
  • β€’Custo por tipo de tarefa (barras empilhadas)
4

⚠️ Alertas e limites

# Configuracao de alertas e limites
cost_config = {
    "alerts": {
        "daily_warning": 100.00,    # Alerta amarelo
        "daily_critical": 200.00,   # Alerta vermelho
        "monthly_budget": 3000.00,  # Budget mensal
    },
    "limits": {
        "per_request_max": 0.50,    # Bloqueia requests caros
        "per_user_daily": 10.00,    # Limite por usuario/dia
        "per_user_monthly": 100.00, # Limite por usuario/mes
    },
    "actions": {
        "on_warning": "notify_admin",
        "on_critical": "notify_admin + slow_down",
        "on_limit": "block_and_notify",
    }
}
5

πŸ”§ Otimizacao de chamadas

Estrategias para reduzir custos sem perder qualidade.

Boas praticas

  • βœ“Usar modelo adequado para a tarefa
  • βœ“Cachear respostas repetitivas
  • βœ“Limitar contexto ao necessario
  • βœ“Batch requests similares
  • βœ“Prompts concisos e diretos

Anti-patterns

  • βœ—GPT-4 para tarefas simples
  • βœ—Injetar contexto inteiro sempre
  • βœ—Retries sem backoff
  • βœ—Ignorar tokens de saida
  • βœ—Nao monitorar custos
6

πŸ“‹ Relatorios de ROI

Demonstrar o retorno sobre investimento em IA e essencial para justificar o uso.

Metricas de ROI

Custo por documento gerado $0.15

vs $25/hora de um redator humano

Tempo economizado por mes 120 horas

Tarefas que seriam manuais

ROI estimado 340%

(Valor gerado - Custo IA) / Custo IA

πŸ“ Resumo do Modulo

βœ“Custo = Qualidade - Custo alto indica governanca fraca
βœ“Metricas - Por execucao, entrega e usuario
βœ“Alertas - Limites e acoes automaticas
βœ“ROI - Demonstrar valor para stakeholders