2026
May 13, 2026 Unitree
Unitree apresenta o GD01 — um "mecha" transformável pilotado por cerca de 650 000 USD
A Unitree revelou o GD01, uma máquina transformável pilotada de cerca de 500 kg que alterna entre uma postura humanoide e uma configuração de veículo com rodas. A Global Times e a cobertura subsequente descreveram-no como pronto para produção a um preço de cerca de 3,9 milhões de yuanes — perto de 650 000 dólares — bem acima das próprias linhas de quadrúpedes e humanoides de consumo da empresa. A verificação independente continua escassa: por enquanto, a maior parte da cobertura remete para as imagens de demonstração da própria Unitree e para alguns meios chineses. As afirmações de capacidade devem ser tratadas como material de marketing até que terceiros tenham contacto direto. Mesmo assim, a categoria é nova — um passo não trivial dos humanoides de plataforma de investigação para hardware de demonstração pilotável por um operador.Coverage of the GD01 reveal
Info
April 22, 2026
Google divide a TPU de oitava geração em dois chips: TPU 8t para treino e TPU 8i para inferência
Na Google Cloud Next 2026, a Google apresentou duas TPUs de oitava geração concebidas em parceria com a DeepMind. A TPU 8t foca-se no treino de modelos de fronteira, com um único superpod a escalar até 9.600 chips e dois petabytes de memória de largura de banda partilhada; a Google afirma cerca de 2,8x melhor relação preço-desempenho face à geração anterior e escalabilidade quase linear até um milhão de chips através da nova rede Virgo, em conjunto com JAX e Pathways. A TPU 8i destina-se a inferência sensível à latência em cargas com vários agentes em simultâneo, com uma nova topologia de serviço chamada Boardfly, o triplo de SRAM on-chip, um motor de aceleração de coletivos e até 80% mais desempenho por dólar face à geração anterior. Ambos os chips reivindicam até o dobro do desempenho por watt da Ironwood, e o suporte nativo a PyTorch entrou em pré-visualização com o lançamento.Google ↗
Apr 2026
Sony AI apresenta o Ace, um robô de ténis de mesa que vence jogadores de elite
A Sony AI apresentou o Ace, um robô autónomo de ténis de mesa que venceu três de cinco partidas frente a jogadores de elite sob as regras da ITTF na sede da Sony em Tóquio. O sistema combina hardware robótico personalizado de alta velocidade com sensores de visão baseados em eventos — câmaras que reportam as alterações de pixéis à medida que ocorrem, em vez de a uma taxa de quadros fixa — dando-lhe tempos de reação rápidos o suficiente para devolver bolas de alta velocidade e com muito efeito. O trabalho foi publicado na Nature a 22 de abril de 2026.Nature ↗
Apr 2026
ASUS lança o acelerador de IA USB UGen300 — 40 TOPS a 2,5 watts
A ASUS anunciou o UGen300, um acelerador de IA em formato pen USB baseado num processador Hailo. Oferece até 40 TOPS de desempenho de inferência com um consumo de cerca de 2,5 watts, visando cargas de IA generativa local em portáteis, mini-PCs e dispositivos de ponta. O produto junta-se a uma categoria crescente de aceleradores plug-in destinados a manter a inferência fora da nuvem, no próprio hardware do utilizador.ASUS Press Release ↗
Mar 2026
TSMC adiciona 100 mil milhões de dólares à produção de chips no Arizona
A TSMC anunciou um investimento adicional de 100 mil milhões de dólares no seu complexo de fábricas no Arizona, além dos 65 mil milhões já comprometidos. A expansão acrescenta linhas de fabricação, packaging avançado e um centro de investigação. A primeira fábrica de 4nm estava prevista para iniciar a produção no início de 2025.TSMC Press Release ↗
Mar 2026
Tesla, SpaceX e xAI anunciam Terafab — uma fábrica de chips de 20 mil milhões de dólares
Elon Musk anunciou planos para uma instalação semicondutora verticalmente integrada em Austin, Texas, visando tecnologia de processo de 2nm e, eventualmente, um milhão de inícios de wafer por mês. O projeto, com um orçamento de 20 a 25 mil milhões de dólares, consolidaria o design de chips, a fabricação, a memória, o packaging e os testes sob um único teto — com o objetivo de fornecer chips de IA personalizados para veículos Tesla, robôs Optimus e sistemas SpaceX.Tom's Hardware ↗
Mar 2026
Choque no fornecimento de hélio elimina 30% do gás global para fabrico de chips
O encerramento de uma grande instalação de hélio no Médio Oriente retirou cerca de 30% do hélio de grau semicondutor do mercado global, deixando fabricantes de chips como a TSMC e a Samsung com reservas para semanas. O hélio arrefece os wafers de silício durante a litografia a temperaturas que nenhum outro gás consegue manter, e não há substituto. Os preços spot duplicaram em poucos dias após a perturbação.Tom's Hardware ↗
Mar 2026
Starcloud angaria 170 milhões de dólares para construir centros de dados em órbita
A Starcloud fechou uma Série A de 170 milhões de dólares a uma avaliação de 1,1 mil milhões para construir os primeiros centros de dados comerciais em órbita terrestre baixa, usando lançamentos SpaceX para transportar o hardware. A computação espacial elimina os custos de arrefecimento terrestres — os radiadores orbitais podem dissipar calor passivamente para o vácuo, sem água nem ar condicionado — e evita os atrasos de uso do solo e ligação à rede que travam as construções terrestres. Se viável à escala, marca a primeira categoria genuinamente nova de infraestrutura de computação desde o início da era da nuvem hiperescala.TechCrunch ↗
Jan 2026
OpenAI e Cerebras assinam acordo de infraestrutura de inferência de 10 mil milhões de dólares
A OpenAI estabeleceu uma parceria com a Cerebras para implementar 750 megawatts de hardware de inferência de escala de wafer, concebido para inferência em tempo real do GPT-5. A Cerebras reviveu separadamente os seus planos de IPO para meados de 2026.Cerebras ↗
2025
Dec 2025
NVIDIA adquire Groq por 20 mil milhões de dólares
A NVIDIA comprou a tecnologia de chips de inferência da Groq e a sua equipa de engenharia na sua maior aquisição. Os engenheiros da Groq integraram uma nova divisão de Inferência em Tempo Real, refletindo a mudança da indústria do hardware de treino para sistemas otimizados para inferência.NVIDIA ↗
Jun 2025
AMD lança a MI355X, a sua GPU de centro de dados mais competitiva
A AMD lançou a Instinct MI355X, reivindicando quatro vezes o desempenho da sua MI300X para treino e inferência de IA. O chip deu aos fornecedores de nuvem uma alternativa credível à NVIDIA e algum poder de negociação em termos de preços.AMD Newsroom ↗
Jan 2025
NVIDIA GeForce RTX 5090 lançada — Blackwell chega aos consumidores
A NVIDIA lançou a GeForce RTX 5090 a 30 de janeiro de 2025, a um preço de 1.999 dólares e construída na arquitetura Blackwell para consumidores. Com 92 mil milhões de transístores e 3.352 AI TOPS, era duas vezes mais rápida que a RTX 4090 em cargas de trabalho aceleradas por IA. O DLSS 4 introduziu a geração de múltiplas imagens, produzindo até três imagens geradas por IA para cada imagem real.NVIDIA Newsroom ↗
2025
Exigências energéticas dos centros de dados de IA sobrecarregam as redes elétricas dos EUA
A computação de IA empurrou as redes elétricas para os limites de capacidade. O maior operador de rede dos EUA projetou um défice de fiabilidade de seis gigawatts até 2027. Os designers de chips responderam tornando a eficiência energética um objetivo de design de primeira classe, a par com o desempenho bruto.Utility Dive ↗
2025
AIE: centros de dados globais consumiram 415 TWh em 2024, com procura a poder mais do que duplicar até 2030
A Agência Internacional de Energia reportou que os centros de dados globais consumiram cerca de 415 terawatts-hora de eletricidade em 2024, aproximadamente 1,5% da procura mundial, e projetou que esse valor poderá mais do que duplicar até 2030. A agência identificou os Estados Unidos como o maior contribuinte e avisou que os centros de dados representarão uma fatia significativa do crescimento da procura elétrica norte-americana na próxima década. Estimou ainda que cerca de 20% dos projetos de centros de dados planeados poderão sofrer atrasos se as limitações da rede elétrica não forem resolvidas, com algumas comercializadoras a reverem em alta as suas projeções.IEA — Energy and AI ↗
Warning
2025
Escassez de memória provoca atrasos de 40 a 60% nas implementações de IA
A memória de alta largura de banda atingiu graves escassezes, criando estrangulamentos mesmo com a melhoria do fornecimento de GPUs. Clientes empresariais reportaram atrasos significativos nas implementações. O padrão mostrou que as cadeias de fornecimento de hardware de IA envolvem muito mais do que GPUs — a memória, o packaging e o arrefecimento tornaram-se todos pontos de estrangulamento em sequência.AI News ↗
2025
TurboQuant da Google reduz uso de memória em 6x e acelera a atenção em 8x
Investigadores da Google publicaram o TurboQuant, um algoritmo que comprime a cache KV — o armazenamento de memória que guarda o contexto durante a inferência — em seis vezes, enquanto acelera oito vezes o cálculo da atenção. A abordagem tornou prático executar janelas de contexto muito mais longas no hardware existente, aliviando um dos principais estrangulamentos que impulsionavam as escassezes de memória de 2025.VentureBeat ↗
2024
Sep 2024
xAI conclui Colossus — 100.000 H100s em 122 días
A xAI construiu o supercomputador Colossus em Memphis, Tennessee, em 122 dias, reunindo 100.000 GPUs NVIDIA H100. Entrou em operação em setembro de 2024 e é utilizado para treinar e servir a família de modelos Grok. A velocidade de construção — cerca de quatro meses para um cluster que normalmente demora mais de um ano — demonstrou o que é possível quando a energia, o espaço e o hardware são tratados como um problema de aprovisionamento de emergência.xAI ↗
May 2024
Microsoft lança PCs Copilot+ — a IA torna-se uma especificação de hardware
A Microsoft introduziu a categoria de PC Copilot+ em maio de 2024, exigindo uma unidade de processamento neural mínima de 40 TOPS de qualquer fabricante. Os primeiros dispositivos foram lançados com o Qualcomm Snapdragon X Elite, com NPUs ARM a tratar de tarefas no dispositivo, como legendas em tempo real, geração de imagens e pesquisa semântica sem chamadas à nuvem. A Intel e a AMD seguiram-se com os seus próprios chips com NPU até ao final do ano, tornando o silício de IA dedicado padrão nos portáteis de consumo.Microsoft Blog ↗
2024
Cerebras constrói WSE-3 com 4 biliões de transístores num único wafer
A Cerebras anunciou o seu Wafer-Scale Engine de terceira geração em TSMC de 3nm, com cerca de 4 biliões de transístores num único die do tamanho de um wafer. A empresa angariou 1,1 mil milhões de dólares a uma avaliação de 8,1 mil milhões para escalar a produção. Permanece o maior chip alguma vez construído.Cerebras ↗
2022
Mar 2022
NVIDIA anuncia a GPU H100 Hopper
A H100 introduziu um Motor Transformer construído especificamente para grandes modelos de linguagem, com um treino até 9x mais rápido que a A100. A procura superou massivamente a oferta ao longo de 2023, com GPUs individuais a ser transacionadas acima de 40.000 dólares nos mercados secundários. Este foi o chip por detrás da era do GPT-4.NVIDIA Newsroom ↗
2020
Nov 2020
Apple lança o M1, trazendo motores neurais para os portáteis de consumo
O primeiro silício ARM personalizado da Apple para Mac incluiu um Motor Neural de 16 núcleos a executar 11 biliões de operações por segundo em TSMC de 5nm. Provou que o hardware de ML dedicado num dispositivo de consumo podia superar os processadores de uso geral tanto em velocidade como em eficiência energética.Apple Newsroom ↗
May 2020
NVIDIA lança a A100, a sua primeira GPU construída de raiz para IA
A A100 ofereceu 19,5 teraflops de desempenho FP32 com tecnologia de GPU de múltiplas instâncias que permitia que um único chip executasse vários trabalhos de IA em simultâneo. Tornou-se o hardware de treino padrão para o GPT-3, o DALL-E e a primeira geração de modelos de fundação.NVIDIA Newsroom ↗
2018
2018
Google abre o acesso a TPUs para clientes de nuvem
Após desenvolver as Tensor Processing Units internamente desde 2015, a Google disponibilizou pods de TPU v3 através do Google Cloud. As TPUs tornaram-se o hardware de treino por detrás do BERT e mais tarde do PaLM, estabelecendo o modelo de as grandes tecnológicas construírem o seu próprio silício de IA em vez de dependerem inteiramente da NVIDIA.Google Cloud ↗
Info
2016
May 2016
Google revela que tem estado a usar chips de IA personalizados desde 2015
No Google I/O, a Google revelou que as Tensor Processing Units personalizadas tinham estado a funcionar nos seus centros de dados desde 2015, alimentando a Pesquisa, o Street View e o AlphaGo. O anúncio mostrou que as maiores cargas de trabalho de IA já estavam a superar a capacidade do hardware de uso geral.DataCenter Knowledge ↗
Info
2012
2012
AlexNet vence o ImageNet usando duas GPUs de gaming
A rede neural profunda de Alex Krizhevsky venceu a competição ImageNet com uma margem alargada, treinada em dois cartões gráficos NVIDIA GTX 580 de consumo com 3 GB de memória cada. O resultado provou que as GPUs concebidas para jogos podiam treinar redes neurais muito mais rapidamente do que as CPUs — a descoberta que acabaria por redirecionar todo o negócio da NVIDIA.IEEE Spectrum ↗
2025
Mid-2025
GPUs NVIDIA Blackwell B200 atingem a produção em massa
A arquitetura Blackwell da NVIDIA atingiu a produção em plena escala após os primeiros sistemas GB200 NVL72 terem sido enviados para fornecedores de nuvem no final de 2024. A B200 oferecia ganhos de velocidade de cerca de 2,5x e de eficiência energética de 25x em relação à Hopper para trabalhos de inferência.NVIDIA ↗