Presta atenção porque essa movimentação é daquelas que o analista de banco grande vai demorar três semanas pra entender — e quando entender, já era.
A Amazon fechou um acordo com a Cerebras Systems para chips de inferência de inteligência artificial. Sim, a Cerebras. Aquela empresa que fabrica o maior chip do mundo — literalmente um wafer inteiro transformado num único processador. Enquanto todo mundo estava ocupado rezando na igreja da Nvidia e repetindo "Jensen Huang é gênio" como mantra de LinkedIn, a Amazon foi lá e fez o que sempre faz: jogou o tabuleiro no chão e montou um novo.
O que diabos é inferência e por que isso importa
Vou traduzir o economês técnico pra você.
No mundo da IA, existem dois momentos: o treinamento (quando o modelo aprende) e a inferência (quando o modelo responde). Pensa assim: treinamento é o Rocky Balboa correndo na neve da Rússia, tomando porrada. Inferência é o Rocky no ringue, na hora H, respondendo cada golpe do Ivan Drago em tempo real.
O mercado de treinamento é dominado pela Nvidia. Ninguém discute. Mas o mercado de inferência — que é onde o dinheiro de verdade vai escorrer nos próximos anos — ainda tá em disputa aberta. Cada vez que você faz uma pergunta pro ChatGPT, cada vez que um carro autônomo decide não te atropelar, cada vez que um sistema de trading algorítmico executa uma ordem... isso é inferência. É volume. É escala. É onde a guerra de verdade acontece.
E a Amazon sabe disso.
Por que a Cerebras e não qualquer outra
A Cerebras não é uma startup qualquer de garagem no Vale do Silício queimando dinheiro de VC em ping-pong e kombucha. Eles construíram uma arquitetura radicalmente diferente. Enquanto a Nvidia empilha GPUs como se fosse Lego, a Cerebras pegou e disse: "Foda-se, vamos fazer o chip inteiro de uma vez."
O WSL-3 da Cerebras é um monstro. Um único wafer-scale chip com trilhões de transistores. A proposta é simples e brutal: menos complexidade de sistema, mais eficiência por watt, custo menor na inferência em escala.
Pra Amazon, que opera a AWS — a maior plataforma de nuvem do planeta — isso é ouro. Cada centavo economizado por inferência multiplicado por bilhões de requisições por dia é uma montanha de dinheiro. Não é romantismo tecnológico, é matemática fria.
O xadrez por trás da jogada
Aqui é onde a coisa fica interessante pra quem pensa como investidor e não como torcedor de ação.
A Amazon já tem seus chips proprietários — o Trainium e o Inferentia. Então por que fechar com a Cerebras? Porque diversificação de supply chain não é fraqueza, é inteligência. Pergunte a qualquer um que dependia 100% da Nvidia em 2023 quando os lead times foram pra 9 meses.
É a mesma lógica de Nassim Taleb: você não quer ser frágil. Você quer ser antifrágil. Ter múltiplas opções de fornecimento de chips de inferência significa que, quando a próxima crise de semicondutores bater — e ela vai bater — a Amazon não vai estar na fila mendigando alocação.
Além disso, tem o fator IPO. A Cerebras vem tentando abrir capital faz tempo. Um contrato gordo com a Amazon no currículo é o tipo de validação que faz o roadshow de IPO ficar muito mais fácil. É bom pra todo mundo — menos pra Nvidia, que agora tem mais um competidor legitimado comendo pelas beiradas.
O que isso muda no tabuleiro
Pra quem acompanha Nvidia como se fosse jogo do Flamengo: calma. A Nvidia não vai morrer amanhã. Mas o mercado de IA não é um monopólio eterno. Nunca é. A Intel achava que era intocável nos anos 2000. A Nokia achava que dominaria celulares pra sempre. O mercado é uma máquina de humilhar quem fica arrogante.
Este acordo é mais um sinal de que a cadeia de valor da IA está se fragmentando. Google tem seus TPUs. Amazon tem Trainium, Inferentia e agora Cerebras. Microsoft segue abraçada na Nvidia mas já faz barulho com chips customizados. O oligopólio da Nvidia no treinamento não se traduz automaticamente em domínio na inferência.
E inferência, meu amigo, é onde está o fluxo de caixa recorrente. Treinamento é gasto de capex. Inferência é receita operacional.
Quem você acha que vai ganhar essa guerra? O cara que vende a pá de ouro mais cara, ou o cara que encontrou uma pá que cava o dobro pela metade do preço?
Pensa nisso antes de sair comprando Nvidia a 30x receita como se fosse ingresso pro céu.