
1. O que é o OpenAI Jalapeño?
2. Por que um ASIC só para inferência?
3. Nove meses do projeto à produção
4. OpenAI, Google e Amazon na corrida dos chips proprietários
5. O que o Jalapeño muda na prática (e quando ele chega)
A OpenAI anunciou em 24 de junho de 2026 o seu primeiro chip de inteligência artificial. Ele se chama OpenAI Jalapeño e foi projetado internamente, com produção em parceria com a Broadcom (NASDAQ: AVGO).
Com o lançamento, a dona do ChatGPT deixa de ser apenas desenvolvedora de modelos e produtos. Passa também a desenhar o hardware que roda essas IAs, um movimento que mira o custo de operar inteligência artificial em escala.
A escolha do alvo não é aleatória. O Jalapeño foi construído para inferência, a etapa em que um modelo já treinado responde aos comandos dos usuários. É nessa etapa que a IA encontra as pessoas: cada resposta do ChatGPT, cada tarefa do Codex e cada chamada de API passa por ela. Reduzir o custo dessa operação é o que está em jogo.
E foi por aí que a OpenAI entrou na disputa em que Google e Amazon já estavam.
O OpenAI Jalapeño é o primeiro chip de inteligência artificial projetado pela OpenAI. É um acelerador desenhado do zero para inferência de modelos de linguagem (LLMs) e fabricado em parceria com a Broadcom. A empresa o classifica como seu primeiro 'Intelligence Processor' e como o primeiro acelerador de uma plataforma de computação que pretende durar várias gerações. Diferente de um chip de uso geral, ele não foi adaptado de cargas antigas de IA. Foi concebido a partir do conhecimento que a OpenAI tem sobre como seus próprios modelos funcionam, dos kernels aos sistemas que servem as respostas. Segundo a empresa, o projeto opera com qualquer LLM, atual ou futuro, e não só com os modelos da casa.
O chip não é um conceito distante de laboratório. Amostras de engenharia já rodam cargas reais de machine learning nas instalações da OpenAI, em frequência e consumo próximos aos de produção. Entre elas está o modelo GPT-5.3-Codex-Spark. O primeiro exemplar físico foi entregue ao CEO Sam Altman e ao presidente Greg Brockman. Quem fez a entrega foram o presidente e CEO da Broadcom, Hock Tan, e o presidente Charlie Kawwas. O nome, vale o registro, é o mesmo da pimenta mexicana, dentro da linha de batismos pouco solenes da indústria de IA.
Para entender a aposta, vale separar dois momentos da IA. O treino é quando o modelo aprende, ajustando seus parâmetros a partir de grandes volumes de dados. A inferência vem depois: é quando o modelo já pronto usa esses parâmetros para interpretar novos dados e gerar respostas em tempo real. Treino e inferência têm demandas técnicas distintas, e o Jalapeño foi feito para a segunda.
A natureza do chip reforça essa especialização. Ele é um ASIC, sigla em inglês para circuito integrado de aplicação específica. É um chip desenhado sob medida para uma tarefa, em vez de servir a muitos propósitos como as GPUs que dominam os data centers. Ao se especializar, o ASIC perde flexibilidade. Em troca, ganha eficiência e custo menor nas cargas para as quais foi feito, segundo análise da CNBC sobre o anúncio.
É aí que está a promessa central. A OpenAI afirma que, em testes iniciais, o Jalapeño entrega desempenho por watt substancialmente superior ao dos melhores aceleradores disponíveis hoje. Um relatório técnico detalhado foi prometido para os próximos meses. As declarações de fora foram mais agressivas.
Em entrevista à Reuters, Hock Tan colocou o chip em pé de igualdade com o Blackwell, da Nvidia, e com as TPUs do Google. À Bloomberg, Tan disse que os primeiros testes apontam um custo de inferência por token cerca de 50% menor que o das GPUs atuais.
O dado, porém, ainda não tem verificação independente. Os números são autorreportados, sem benchmarks publicados nem base de comparação divulgada.
Um dado chama atenção tanto quanto o desempenho: o tempo de desenvolvimento. A OpenAI afirma que o Jalapeño saiu do design inicial ao tape-out em apenas nove meses. Tape-out é o ponto em que o projeto é fechado para fabricação.
A empresa descreve o ciclo como possivelmente o mais rápido já alcançado em um ASIC de semicondutores avançados. Para efeito de comparação, a Tom's Hardware lembra que projetar um ASIC do zero costuma levar de 1,5 a 2 anos.
Parte dessa velocidade veio de dentro. A empresa diz que usou seus próprios modelos de IA para acelerar etapas do design e da otimização do chip. Brockman afirmou à CNBC que o grau dessa ajuda surpreendeu a própria equipe.
A fabricação fica a cargo da TSMC, em Taiwan, com memória fornecida por Samsung e SK Hynix à Broadcom. A parceria entre as duas empresas havia sido anunciada em outubro de 2025. Isso coloca o anúncio do produto dentro de uma janela curta de execução.
Ao lançar silício próprio, a OpenAI entra numa disputa que já estava em curso. As grandes empresas de IA vêm desenhando seus próprios chips por dois motivos: depender menos de fornecedores externos e baratear a operação. Veja como cada uma se posiciona hoje:
O fornecedor em questão tem nome. Hoje considerada a maior cliente de GPUs da Nvidia, a OpenAI passa a ter uma alternativa própria para suas cargas mais sensíveis a custo. A pressão por capacidade ajuda a explicar a urgência. Brockman disse à CNBC que a empresa não consegue computação rápido o suficiente, e Tan classificou a demanda de seus clientes como insaciável.
A OpenAI também prepara uma oferta pública de ações e convive com custos operacionais altos. Reduzir a conta de inferência é, assim, uma forma de sustentar a viabilidade financeira da operação. Decisões desse tipo, sobre infraestrutura e custo de IA, são o terreno em que uma estratégia de IA com critérios de ROI se mostra consistente ou não.
Para o usuário final, o efeito é indireto, mas concreto. Cada ganho de custo, velocidade e confiabilidade na inferência pode aparecer de formas simples. Uma resposta mais rápida do ChatGPT, uma tarefa do Codex que avança sem travar, ou uma API mais barata de operar.
É a tese da OpenAI de que controlar a infraestrutura, e não só os modelos, permite servir mais inteligência por um custo menor. O mesmo princípio sustenta a construção de soluções de IA proprietárias dentro das empresas.
O calendário, porém, pede cautela. A implementação em larga escala está prevista para começar no fim de 2026. Os primeiros data centers serão operados pela Microsoft e por outros parceiros, com sistemas montados pela canadense Celestica.
A Broadcom fala em escala de gigawatts e num roteiro de múltiplas gerações, com uma nova versão do chip prevista para 2028. Por enquanto, o que existe é um anúncio forte, amostras rodando em laboratório e uma promessa de eficiência sem benchmarks abertos.
O Jalapeño marca a entrada da OpenAI no hardware. Ele mostra que a disputa em IA já não se decide apenas em quem tem o melhor modelo. Ela se decide também em quem controla o silício e o custo de rodar inteligência artificial em escala.
Para quem acompanha o mercado corporativo, é nesse tipo de movimento que se enxerga para onde vão os preços e a infraestrutura dos próximos anos. Assine a AI Factory News, newsletter de inteligência artificial do Distrito, e receba toda semana a leitura do que muda em IA e inovação, sem ruído.