Resposta direta

Eu estou vendo uma virada chata para quem ainda trata open source como hobby: a conta, o controle e a qualidade começaram a andar juntos. TL;DR Eu parei de tratar IA open source como hobby quando ela começou a bater preço, controle e qualidade ao mesmo tempo. O GLM-5.2 e outros sinais recentes no X mostram que a conta está mudando rápido.

Eu estou vendo uma virada chata para quem ainda trata open source como hobby: a conta, o controle e a qualidade começaram a andar juntos.

Capa editorial do artigo IA open source: 3 sinais de que ficou séria

TL;DR

  • Eu parei de tratar IA open source como hobby quando ela começou a bater preço, controle e qualidade ao mesmo tempo.

  • O GLM-5.2 e outros sinais recentes no X mostram que a conta está mudando rápido.

  • Eu uso um filtro simples de 3C para decidir onde open source entra no negócio e onde ainda vale ficar na nuvem.

O problema

Eu estou vendo founders cometerem o mesmo erro que eu já cometi: achar que open source é sinônimo de barato e pronto.

Não é.

Às vezes é mais barato. Às vezes é mais chato. Às vezes é os dois. E, quando funciona, vira vantagem de negócio de verdade.

A mudança ficou difícil de ignorar porque os sinais vieram em três frentes ao mesmo tempo: modelo melhor, custo menor e execução local ficando viável.

Nos últimos dias, eu vi discussões no X sobre o GLM-5.2 que não pareciam mais conversa de entusiasta. Um post do @milesdeutscher colocou o modelo na conversa de forma séria, com comparações de custo que chamam atenção: algo perto de US$ 5,80 por milhão de tokens para um nível de desempenho que muita gente descreveu como perto do Opus 4.8, contra algo em torno de US$ 23 em modelos fechados fortes.

Eu não trato isso como evangelho. Eu trato como sinal.

Outro post que me chamou atenção falava em rodar o modelo localmente num Mac Studio a cerca de 21 tokens por segundo. Isso importa porque muda a conversa de “dá para brincar?” para “dá para operar?”.

E aí a ficha cai: open source deixou de ser só escolha ideológica. Virou escolha econômica e operacional.

Eu já escrevi sobre isso quando falei de [IA local e modelos open weights](/blog/ia-local-modelos-open-weights). A pergunta agora é outra: onde isso entra no fluxo real sem virar bagunça?

O meu filtro: 3C

Eu uso um filtro simples para não cair no hype. Chamo de 3C: Capacidade, Custo e Controle.

Não é bonito. É útil. E, no fim do dia, eu prefiro útil a bonito.

1. Capacidade

Eu começo pelo óbvio: o modelo resolve a tarefa ou não?

Se ele erra demais, inventa coisa ou só parece inteligente, eu não avanço.

Eu não preciso do melhor modelo do planeta para tudo. Eu preciso do modelo certo para a tarefa certa.

Para revisar código, resumir documento, classificar lead ou responder ticket repetitivo, talvez um open source bom o bastante já resolva.

Para raciocínio pesado, contexto complicado ou casos críticos, eu ainda prefiro o topo da cadeia.

Benchmark é entretenimento com gráfico. Eu compro resultado.

2. Custo

Aqui a conversa fica adulta.

Quando eu vejo gente falando em desempenho parecido com o de modelos fechados por algo como US$ 5,80 por milhão de tokens, eu não penso “ganhamos o jogo”.

Eu penso “a planilha acabou de mudar”.

Se o uso é ocasional, tudo bem.

Se a IA faz parte do processo todos os dias, token vira despesa. Despesa vira margem. Margem vira reunião chata. E reunião chata quase sempre termina com alguém perguntando por que a conta subiu.

Se eu precisar provar isso com números, eu olho o volume.

No cenário que apareceu no X, a diferença de preço entre algo em torno de US$ 23 e US$ 5,80 por milhão de tokens dá cerca de US$ 17,20 por milhão. Isso significa aproximadamente:

  • US$ 86 por mês em 5 milhões de tokens

  • US$ 172 por mês em 10 milhões de tokens

  • US$ 860 por mês em 50 milhões de tokens

Não é dinheiro para virar manchete.

É dinheiro para sair do desperdício e entrar na margem.

E, antes de comprar qualquer coisa com IA na embalagem, eu gosto de passar pelo meu [checklist de IA antes de comprar software](/blog/checklist-ia-antes-de-comprar-software). Ele evita muita empolgação cara.

3. Controle

Esse é o ponto que costuma decidir a partida.

Quando eu consigo rodar algo localmente, eu ganho controle sobre dado, latência, dependência e custo futuro.

O post sobre Mac Studio rodando GLM-5.2 a 21 tokens por segundo é relevante exatamente por isso. Não porque eu queira transformar o escritório numa sala de servidor. Mas porque a barreira para testar caiu muito.

Se eu consigo manter contexto sensível dentro de casa, eu ganho mais uma opção.

Se eu consigo testar sem depender de API externa, eu ganho velocidade.

Se eu consigo operar sem ficar refém de preço e limite, eu ganho margem de decisão.

E escolha, para mim, é a parte mais valiosa dessa história.

Como aplicar hoje

Eu não começaria trocando a empresa inteira para open source.

Isso é o jeito mais rápido de transformar uma boa tese em caos operacional.

Eu faria assim:

1. Escolha uma tarefa repetitiva

Pegue um fluxo que acontece toda semana ou todo dia.

Eu posso começar por resumo de reunião, triagem de lead, classificação de ticket, leitura de contrato, primeira resposta de suporte ou revisão de conteúdo.

2. Teste três versões

Eu compararia:

  • um modelo fechado forte

  • um modelo open source via API

  • um modelo open source local, se fizer sentido

3. Meça o que interessa

Eu olharia só para cinco coisas:

  • qualidade da resposta

  • custo por tarefa

  • velocidade

  • esforço de manutenção

  • risco de vazamento de dados

4. Faça um piloto curto

Se o modelo passar no teste, eu não inventaria estratégia de seis meses.

Eu faria um piloto de 7 dias em um processo real.

Se não aguentar a operação, eu paro.

Se aguentar, eu aumento o escopo.

Eu faria o piloto sem teatro, sem slide heroico e sem promessa vazia.

Se você quiser ir mais fundo antes do piloto, eu também tenho um texto sobre [agentes de IA e os 4 testes para não começar caro](/blog/agentes-ia-4-testes-piloto-caro).

Resultados esperados

Quando eu testo direito, eu normalmente encontro três classes de trabalho.

A primeira ainda pede modelo fechado de ponta. Tudo certo. Eu uso o melhor onde o erro custa caro.

A segunda funciona bem com open source via API. Aqui eu ganho custo e controlo mais o jogo.

A terceira pode rodar localmente. É a parte que mais me interessa quando o dado é sensível ou o volume é alto.

Na prática, o ganho não é só técnico.

É financeiro.

É operacional.

É estratégico.

Se eu rodar 10 milhões de tokens por mês, a diferença de aproximadamente US$ 17,20 por milhão já economiza cerca de US$ 172 por mês em um único fluxo. Em vários fluxos, isso começa a aparecer de verdade.

E tem outro ganho que muita gente ignora: dependência menor de fornecedor.

Isso vale mais do que parece quando o produto muda preço, regra ou limite sem pedir licença.

FAQ

IA open source já ganhou dos modelos fechados?

Não em tudo.

Em algumas tarefas, ela já encosta. Em outras, ainda perde.

A pergunta certa é: ganhou no que eu preciso fazer hoje?

Dá para usar open source numa empresa pequena?

Dá, e às vezes até vale mais a pena do que numa empresa grande.

Empresa pequena sente custo mais rápido e decide mais rápido.

Só não tente montar um laboratório quando você só precisa resolver um processo.

Rodar localmente vale a pena?

Vale quando dado, custo ou dependência de fornecedor viram problema real.

Se a tarefa é simples e o volume é baixo, talvez eu nem mexa.

Se o volume cresce ou o dado é sensível, aí eu testo sem dó.

O que eu meço no teste?

Qualidade, custo, velocidade, manutenção e risco.

Se eu preciso corrigir a resposta o tempo todo, o modelo não me ajuda.

IA open source substitui SaaS?

Não automaticamente.

Mas pressiona SaaS ruim.

Se a ferramenta cobra caro só porque colocou IA no topo de um fluxo mediano, eu começo a olhar torto.

Conclusão

IA open source ficou séria porque três coisas aconteceram ao mesmo tempo: o modelo melhorou, o custo caiu e o controle voltou para a mesa.

Isso não quer dizer que eu vou largar modelos fechados.

Quer dizer que eu agora tenho opção.

E opção muda decisão.

Meu filtro continua simples: capacidade, custo e controle.

Se passar nesses três, eu testo.

Se não passar, eu sigo na nuvem sem culpa.

O truque não é torcer por open source nem defender cloud como religião.

O truque é escolher o modelo certo para o processo certo.

Se eu tivesse que resumir em uma frase, seria essa:

A IA open source parou de ser curiosidade.

Agora ela é argumento de negócio.

E quando isso acontece, eu presto atenção.

Se você quer começar amanhã, faça o seguinte: escolha um processo chato da empresa, rode três versões do mesmo teste e compare como adulto. A planilha não se empolga com hype.