1
💰 Custo como metrica de qualidade
No GIPM, custo nao e apenas uma despesa - e uma metrica de eficiencia do sistema.
Por que custo e metrica de qualidade?
- •Prompts ruins gastam mais tokens sem melhor resultado
- •Contexto excessivo aumenta custo sem necessidade
- •Retries frequentes indicam problemas na implementacao
- •Modelo errado pode ser overkill ou insuficiente
💡 Principio
Um sistema bem governado custa menos para produzir o mesmo resultado. Custo alto sem justificativa e sinal de governanca fraca.
2
📊 Metricas: por execucao, entrega, usuario
Por Execucao
- • Tokens de entrada
- • Tokens de saida
- • Custo unitario (USD)
- • Tempo de resposta
- • Modelo utilizado
Por Entrega
- • Custo total do artefato
- • Numero de chamadas
- • Retries necessarios
- • Custo por tipo de output
- • Eficiencia (custo/qualidade)
Por Usuario
- • Custo acumulado
- • Media por request
- • Uso por periodo
- • Quota consumida
- • Tendencia de uso
3
📈 Dashboard de custos
Elementos essenciais do dashboard
$1,234
Custo Mensal
$0.03
Media/Request
45K
Requests/Mes
72%
Budget Usado
Graficos recomendados
- •Custo diario (linha do tempo)
- •Distribuicao por modelo (pizza)
- •Top usuarios (barras)
- •Custo por tipo de tarefa (barras empilhadas)
4
⚠️ Alertas e limites
# Configuracao de alertas e limites
cost_config = {
"alerts": {
"daily_warning": 100.00, # Alerta amarelo
"daily_critical": 200.00, # Alerta vermelho
"monthly_budget": 3000.00, # Budget mensal
},
"limits": {
"per_request_max": 0.50, # Bloqueia requests caros
"per_user_daily": 10.00, # Limite por usuario/dia
"per_user_monthly": 100.00, # Limite por usuario/mes
},
"actions": {
"on_warning": "notify_admin",
"on_critical": "notify_admin + slow_down",
"on_limit": "block_and_notify",
}
}
5
🔧 Otimizacao de chamadas
Estrategias para reduzir custos sem perder qualidade.
Boas praticas
- ✓Usar modelo adequado para a tarefa
- ✓Cachear respostas repetitivas
- ✓Limitar contexto ao necessario
- ✓Batch requests similares
- ✓Prompts concisos e diretos
Anti-patterns
- ✗GPT-4 para tarefas simples
- ✗Injetar contexto inteiro sempre
- ✗Retries sem backoff
- ✗Ignorar tokens de saida
- ✗Nao monitorar custos
6
📋 Relatorios de ROI
Demonstrar o retorno sobre investimento em IA e essencial para justificar o uso.
Metricas de ROI
Custo por documento gerado
$0.15
vs $25/hora de um redator humano
Tempo economizado por mes
120 horas
Tarefas que seriam manuais
ROI estimado
340%
(Valor gerado - Custo IA) / Custo IA
📝 Resumo do Modulo
✓Custo = Qualidade - Custo alto indica governanca fraca
✓Metricas - Por execucao, entrega e usuario
✓Alertas - Limites e acoes automaticas
✓ROI - Demonstrar valor para stakeholders