Linha do Tempo do Hardware de IA

2026
2025
2024
2022
2020
2018
2016
2012

2026

June 10, 2026 Midjourney

O CEO da Midjourney diz que estão a ser enviados convites para o seu primeiro lançamento de hardware

O fundador da Midjourney, David Holz, publicou que estão a ser enviados convites para o primeiro produto de hardware da empresa. Não foram partilhadas especificações publicamente. Se o produto chegar ao mercado, a Midjourney passaria a ser uma empresa de software de IA que também vende hardware físico — uma expansão notável face às suas origens como serviço de geração de imagens. Os detalhes são escassos; convém encarar isto como um sinal inicial e não como um produto confirmado.David Holz on X →

Info

June 10, 2026 NVIDIA

A NVIDIA publica um design de referência aberto de robô humanoide com hardware da Unitree e Isaac GR00T

A NVIDIA divulgou um design de referência aberto para robôs humanoides que combina hardware da Unitree, computação Jetson Thor, o modelo de base Isaac GR00T, o Isaac Sim e o Isaac Lab. A pilha de referência pretende baixar a barreira para que laboratórios, universidades e startups construam humanoides, fornecendo uma configuração de partida documentada e testada em vez de obrigar cada equipa a integrar hardware e software de raiz. Posiciona a pilha de IA física da NVIDIA como o ambiente de desenvolvimento por defeito para robôs humanoides.NVIDIA press release →

Info

May 28, 2026 Brockovich Data Center Reporting

Erin Brockovich lança um mapa colaborativo de centros de dados de IA

Um projecto de cartografia colaborativa associado a Erin Brockovich começou a registar os centros de dados de IA dos EUA por estado — operacionais, em construção, propostos e reportados pela comunidade —, com uma actualização do site no final de Maio de 2026. O mapa agrega registos oficiais e relatos de residentes sobre instalações novas e planeadas. O projecto reflecte o crescente escrutínio local da pegada da expansão da IA em energia, água e solo, dando às comunidades uma ferramenta pública para acompanhar uma localização de centros de dados que muitas vezes avançou com pouca visibilidade.Brockovich Data Center Reporting

Info

May 20, 2026 Blackstone / Google

Blackstone e Google criam empresa conjunta para nova nuvem de TPU — 5 mil milhões de dólares em capital

A Blackstone e a Google anunciaram uma empresa conjunta para construir uma nova nuvem de computação como serviço baseada em TPU, com a Blackstone a comprometer cerca de 5 mil milhões de dólares em capital. A operação coincide com o Google I/O 2026 e pretende alargar a capacidade de TPU disponível para clientes externos, em conjunto com os chips TPU 8t/8i de oitava geração que a Google apresentou no Cloud Next 2026. A cobertura enquadra o acordo como um passo estrutural rumo a implantações de computação de IA apoiadas por capital privado, semelhantes em forma aos acordos de infraestrutura de energia e centros de dados que a Blackstone e outras firmas de private equity têm fechado nos últimos trimestres.Blackstone press release → Google blog →

Warning

#AIInfrastructure

May 20, 2026 Google

Google anuncia Android XR Glasses — primeiro só áudio no outono, depois com câmaras e marcas parceiras

No Google I/O 2026, a Google anunciou a sua plataforma Android XR Glasses, com um lançamento só de áudio no outono e modelos com câmara mais tarde. Entre os parceiros estão a Samsung e a Warby Parker, e a plataforma é posicionada como o companheiro de hardware para a pilha agentic Gemini da Google (Spark, Daily Brief, Universal Cart). A categoria é o regresso mais explícito da Google ao hardware vestível desde o programa Glass original, apoiando-se na plataforma Android XR para programadores anunciada no final de 2024.Google I/O 2026 announcements →

Info

#AIInfrastructure

May 13, 2026 US EIA

EIA: servidores de centros de dados nos EUA deverão representar 22 a 33% da eletricidade de edifícios comerciais em 2050

A Annual Energy Outlook 2026 da Administração de Informação de Energia dos EUA (EIA) projeta que os servidores de centros de dados — impulsionados por cargas de IA — representarão cerca de 22 a 33% de toda a eletricidade dos edifícios comerciais nos EUA em 2050, consoante os cenários de adoção. Nos cenários de maior procura, o consumo elétrico dos servidores ultrapassa mais de 16 vezes o nível de 2020. Os servidores já correspondiam a cerca de 7% da eletricidade comercial em 2025. A previsão inverte o pressuposto anterior de um crescimento elétrico praticamente estável nos EUA e destaca os centros de dados autónomos como um segmento de crescimento mais rápido do que as implantações dentro de edifícios, com implicações em cadeia para as elétricas, a capacidade da rede e a intensidade energética dos edifícios comerciais.EIA Today in Energy → Annual Energy Outlook 2026 →

Warning

#AIInfrastructure

May 13, 2026 Unitree

Unitree apresenta o GD01 — um "mecha" transformável pilotado por cerca de 650 000 USD

A Unitree revelou o GD01, uma máquina transformável pilotada de cerca de 500 kg que alterna entre uma postura humanoide e uma configuração de veículo com rodas. A Global Times e a cobertura subsequente descreveram-no como pronto para produção a um preço de cerca de 3,9 milhões de yuanes — perto de 650 000 dólares — bem acima das próprias linhas de quadrúpedes e humanoides de consumo da empresa. A verificação independente continua escassa: por enquanto, a maior parte da cobertura remete para as imagens de demonstração da própria Unitree e para alguns meios chineses. As afirmações de capacidade devem ser tratadas como material de marketing até que terceiros tenham contacto direto. Mesmo assim, a categoria é nova — um passo não trivial dos humanoides de plataforma de investigação para hardware de demonstração pilotável por um operador.Coverage of the GD01 reveal

Info

April 22, 2026

Google divide a TPU de oitava geração em dois chips: TPU 8t para treino e TPU 8i para inferência

Na Google Cloud Next 2026, a Google apresentou duas TPUs de oitava geração concebidas em parceria com a DeepMind. A TPU 8t foca-se no treino de modelos de fronteira, com um único superpod a escalar até 9.600 chips e dois petabytes de memória de largura de banda partilhada; a Google afirma cerca de 2,8x melhor relação preço-desempenho face à geração anterior e escalabilidade quase linear até um milhão de chips através da nova rede Virgo, em conjunto com JAX e Pathways. A TPU 8i destina-se a inferência sensível à latência em cargas com vários agentes em simultâneo, com uma nova topologia de serviço chamada Boardfly, o triplo de SRAM on-chip, um motor de aceleração de coletivos e até 80% mais desempenho por dólar face à geração anterior. Ambos os chips reivindicam até o dobro do desempenho por watt da Ironwood, e o suporte nativo a PyTorch entrou em pré-visualização com o lançamento.Google ↗

Apr 2026

Sony AI apresenta o Ace, um robô de ténis de mesa que vence jogadores de elite

A Sony AI apresentou o Ace, um robô autónomo de ténis de mesa que venceu três de cinco partidas frente a jogadores de elite sob as regras da ITTF na sede da Sony em Tóquio. O sistema combina hardware robótico personalizado de alta velocidade com sensores de visão baseados em eventos — câmaras que reportam as alterações de pixéis à medida que ocorrem, em vez de a uma taxa de quadros fixa — dando-lhe tempos de reação rápidos o suficiente para devolver bolas de alta velocidade e com muito efeito. O trabalho foi publicado na Nature a 22 de abril de 2026.Nature ↗

Apr 2026

ASUS lança o acelerador de IA USB UGen300 — 40 TOPS a 2,5 watts

A ASUS anunciou o UGen300, um acelerador de IA em formato pen USB baseado num processador Hailo. Oferece até 40 TOPS de desempenho de inferência com um consumo de cerca de 2,5 watts, visando cargas de IA generativa local em portáteis, mini-PCs e dispositivos de ponta. O produto junta-se a uma categoria crescente de aceleradores plug-in destinados a manter a inferência fora da nuvem, no próprio hardware do utilizador.ASUS Press Release ↗

Mar 2026

TSMC adiciona 100 mil milhões de dólares à produção de chips no Arizona

A TSMC anunciou um investimento adicional de 100 mil milhões de dólares no seu complexo de fábricas no Arizona, além dos 65 mil milhões já comprometidos. A expansão acrescenta linhas de fabricação, packaging avançado e um centro de investigação. A primeira fábrica de 4nm estava prevista para iniciar a produção no início de 2025.TSMC Press Release ↗

Mar 2026

Tesla, SpaceX e xAI anunciam Terafab — uma fábrica de chips de 20 mil milhões de dólares

Elon Musk anunciou planos para uma instalação semicondutora verticalmente integrada em Austin, Texas, visando tecnologia de processo de 2nm e, eventualmente, um milhão de inícios de wafer por mês. O projeto, com um orçamento de 20 a 25 mil milhões de dólares, consolidaria o design de chips, a fabricação, a memória, o packaging e os testes sob um único teto — com o objetivo de fornecer chips de IA personalizados para veículos Tesla, robôs Optimus e sistemas SpaceX.Tom's Hardware ↗

Mar 2026

Choque no fornecimento de hélio elimina 30% do gás global para fabrico de chips

O encerramento de uma grande instalação de hélio no Médio Oriente retirou cerca de 30% do hélio de grau semicondutor do mercado global, deixando fabricantes de chips como a TSMC e a Samsung com reservas para semanas. O hélio arrefece os wafers de silício durante a litografia a temperaturas que nenhum outro gás consegue manter, e não há substituto. Os preços spot duplicaram em poucos dias após a perturbação.Tom's Hardware ↗

Mar 2026

Starcloud angaria 170 milhões de dólares para construir centros de dados em órbita

A Starcloud fechou uma Série A de 170 milhões de dólares a uma avaliação de 1,1 mil milhões para construir os primeiros centros de dados comerciais em órbita terrestre baixa, usando lançamentos SpaceX para transportar o hardware. A computação espacial elimina os custos de arrefecimento terrestres — os radiadores orbitais podem dissipar calor passivamente para o vácuo, sem água nem ar condicionado — e evita os atrasos de uso do solo e ligação à rede que travam as construções terrestres. Se viável à escala, marca a primeira categoria genuinamente nova de infraestrutura de computação desde o início da era da nuvem hiperescala.TechCrunch ↗

Jan 2026

OpenAI e Cerebras assinam acordo de infraestrutura de inferência de 10 mil milhões de dólares

A OpenAI estabeleceu uma parceria com a Cerebras para implementar 750 megawatts de hardware de inferência de escala de wafer, concebido para inferência em tempo real do GPT-5. A Cerebras reviveu separadamente os seus planos de IPO para meados de 2026.Cerebras ↗

2025

Dec 2025

NVIDIA adquire Groq por 20 mil milhões de dólares

A NVIDIA comprou a tecnologia de chips de inferência da Groq e a sua equipa de engenharia na sua maior aquisição. Os engenheiros da Groq integraram uma nova divisão de Inferência em Tempo Real, refletindo a mudança da indústria do hardware de treino para sistemas otimizados para inferência.NVIDIA ↗

Jun 2025

AMD lança a MI355X, a sua GPU de centro de dados mais competitiva

A AMD lançou a Instinct MI355X, reivindicando quatro vezes o desempenho da sua MI300X para treino e inferência de IA. O chip deu aos fornecedores de nuvem uma alternativa credível à NVIDIA e algum poder de negociação em termos de preços.AMD Newsroom ↗

Jan 2025

NVIDIA GeForce RTX 5090 lançada — Blackwell chega aos consumidores

A NVIDIA lançou a GeForce RTX 5090 a 30 de janeiro de 2025, a um preço de 1.999 dólares e construída na arquitetura Blackwell para consumidores. Com 92 mil milhões de transístores e 3.352 AI TOPS, era duas vezes mais rápida que a RTX 4090 em cargas de trabalho aceleradas por IA. O DLSS 4 introduziu a geração de múltiplas imagens, produzindo até três imagens geradas por IA para cada imagem real.NVIDIA Newsroom ↗

2025

Exigências energéticas dos centros de dados de IA sobrecarregam as redes elétricas dos EUA

A computação de IA empurrou as redes elétricas para os limites de capacidade. O maior operador de rede dos EUA projetou um défice de fiabilidade de seis gigawatts até 2027. Os designers de chips responderam tornando a eficiência energética um objetivo de design de primeira classe, a par com o desempenho bruto.Utility Dive ↗

2025

AIE: centros de dados globais consumiram 415 TWh em 2024, com procura a poder mais do que duplicar até 2030

A Agência Internacional de Energia reportou que os centros de dados globais consumiram cerca de 415 terawatts-hora de eletricidade em 2024, aproximadamente 1,5% da procura mundial, e projetou que esse valor poderá mais do que duplicar até 2030. A agência identificou os Estados Unidos como o maior contribuinte e avisou que os centros de dados representarão uma fatia significativa do crescimento da procura elétrica norte-americana na próxima década. Estimou ainda que cerca de 20% dos projetos de centros de dados planeados poderão sofrer atrasos se as limitações da rede elétrica não forem resolvidas, com algumas comercializadoras a reverem em alta as suas projeções.IEA — Energy and AI ↗

Warning

2025

Escassez de memória provoca atrasos de 40 a 60% nas implementações de IA

A memória de alta largura de banda atingiu graves escassezes, criando estrangulamentos mesmo com a melhoria do fornecimento de GPUs. Clientes empresariais reportaram atrasos significativos nas implementações. O padrão mostrou que as cadeias de fornecimento de hardware de IA envolvem muito mais do que GPUs — a memória, o packaging e o arrefecimento tornaram-se todos pontos de estrangulamento em sequência.AI News ↗

2025

TurboQuant da Google reduz uso de memória em 6x e acelera a atenção em 8x

Investigadores da Google publicaram o TurboQuant, um algoritmo que comprime a cache KV — o armazenamento de memória que guarda o contexto durante a inferência — em seis vezes, enquanto acelera oito vezes o cálculo da atenção. A abordagem tornou prático executar janelas de contexto muito mais longas no hardware existente, aliviando um dos principais estrangulamentos que impulsionavam as escassezes de memória de 2025.VentureBeat ↗

2024

Sep 2024

xAI conclui Colossus — 100.000 H100s em 122 días

A xAI construiu o supercomputador Colossus em Memphis, Tennessee, em 122 dias, reunindo 100.000 GPUs NVIDIA H100. Entrou em operação em setembro de 2024 e é utilizado para treinar e servir a família de modelos Grok. A velocidade de construção — cerca de quatro meses para um cluster que normalmente demora mais de um ano — demonstrou o que é possível quando a energia, o espaço e o hardware são tratados como um problema de aprovisionamento de emergência.xAI ↗

May 2024

Microsoft lança PCs Copilot+ — a IA torna-se uma especificação de hardware

A Microsoft introduziu a categoria de PC Copilot+ em maio de 2024, exigindo uma unidade de processamento neural mínima de 40 TOPS de qualquer fabricante. Os primeiros dispositivos foram lançados com o Qualcomm Snapdragon X Elite, com NPUs ARM a tratar de tarefas no dispositivo, como legendas em tempo real, geração de imagens e pesquisa semântica sem chamadas à nuvem. A Intel e a AMD seguiram-se com os seus próprios chips com NPU até ao final do ano, tornando o silício de IA dedicado padrão nos portáteis de consumo.Microsoft Blog ↗

2024

Cerebras constrói WSE-3 com 4 biliões de transístores num único wafer

A Cerebras anunciou o seu Wafer-Scale Engine de terceira geração em TSMC de 3nm, com cerca de 4 biliões de transístores num único die do tamanho de um wafer. A empresa angariou 1,1 mil milhões de dólares a uma avaliação de 8,1 mil milhões para escalar a produção. Permanece o maior chip alguma vez construído.Cerebras ↗

2022

Mar 2022

NVIDIA anuncia a GPU H100 Hopper

A H100 introduziu um Motor Transformer construído especificamente para grandes modelos de linguagem, com um treino até 9x mais rápido que a A100. A procura superou massivamente a oferta ao longo de 2023, com GPUs individuais a ser transacionadas acima de 40.000 dólares nos mercados secundários. Este foi o chip por detrás da era do GPT-4.NVIDIA Newsroom ↗

2020

Nov 2020

Apple lança o M1, trazendo motores neurais para os portáteis de consumo

O primeiro silício ARM personalizado da Apple para Mac incluiu um Motor Neural de 16 núcleos a executar 11 biliões de operações por segundo em TSMC de 5nm. Provou que o hardware de ML dedicado num dispositivo de consumo podia superar os processadores de uso geral tanto em velocidade como em eficiência energética.Apple Newsroom ↗

May 2020

NVIDIA lança a A100, a sua primeira GPU construída de raiz para IA

A A100 ofereceu 19,5 teraflops de desempenho FP32 com tecnologia de GPU de múltiplas instâncias que permitia que um único chip executasse vários trabalhos de IA em simultâneo. Tornou-se o hardware de treino padrão para o GPT-3, o DALL-E e a primeira geração de modelos de fundação.NVIDIA Newsroom ↗

2018

Google abre o acesso a TPUs para clientes de nuvem

Após desenvolver as Tensor Processing Units internamente desde 2015, a Google disponibilizou pods de TPU v3 através do Google Cloud. As TPUs tornaram-se o hardware de treino por detrás do BERT e mais tarde do PaLM, estabelecendo o modelo de as grandes tecnológicas construírem o seu próprio silício de IA em vez de dependerem inteiramente da NVIDIA.Google Cloud ↗

Info

2016

May 2016

Google revela que tem estado a usar chips de IA personalizados desde 2015

No Google I/O, a Google revelou que as Tensor Processing Units personalizadas tinham estado a funcionar nos seus centros de dados desde 2015, alimentando a Pesquisa, o Street View e o AlphaGo. O anúncio mostrou que as maiores cargas de trabalho de IA já estavam a superar a capacidade do hardware de uso geral.DataCenter Knowledge ↗

Info

2012

AlexNet vence o ImageNet usando duas GPUs de gaming

A rede neural profunda de Alex Krizhevsky venceu a competição ImageNet com uma margem alargada, treinada em dois cartões gráficos NVIDIA GTX 580 de consumo com 3 GB de memória cada. O resultado provou que as GPUs concebidas para jogos podiam treinar redes neurais muito mais rapidamente do que as CPUs — a descoberta que acabaria por redirecionar todo o negócio da NVIDIA.IEEE Spectrum ↗

2025

Mid-2025

GPUs NVIDIA Blackwell B200 atingem a produção em massa

A arquitetura Blackwell da NVIDIA atingiu a produção em plena escala após os primeiros sistemas GB200 NVL72 terem sido enviados para fornecedores de nuvem no final de 2024. A B200 oferecia ganhos de velocidade de cerca de 2,5x e de eficiência energética de 25x em relação à Hopper para trabalhos de inferência.NVIDIA ↗

2026

June 22, 2026 Nvidia

A Nvidia afirma que o arrefecimento por líquido morno pode reduzir a carga de refrigeração dos centros de dados de IA

A Axios noticiou a alegação da Nvidia de que o arrefecimento por líquido morno pode reduzir a carga de refrigeração dos centros de dados de IA, aliviando parte da pressão de água e energia que acompanha a computação densa. A proposta reflecte como a narrativa da infraestrutura de IA passou dos chips para o arrefecimento, a água e a energia. Quanto ajudará na prática dependerá de destacamentos reais à escala.Axios →

Info

June 18, 2026 Axios

Os reguladores dos EUA promovem ligações à rede mais rápidas para os centros de dados de IA

A Axios noticiou que os reguladores de energia dos EUA se preparavam para acelerar as ligações à rede dos centros de dados de IA, à medida que a energia e as filas de interligação se tornam uma restrição ao crescimento da computação. O estrangulamento da IA é cada vez mais a rede, o arrefecimento e o licenciamento, e não tanto os chips. Ligações mais rápidas permitiriam que mais capacidade anunciada entrasse de facto em funcionamento.Axios →

Info

June 2026 Meta

A Meta associa-se à Reliance num centro de dados com IA na Índia

A Meta anunciou uma parceria com a Reliance para construir um centro de dados habilitado para IA na Índia, acrescentando capacidade de computação regional num dos maiores mercados de internet do mundo. O acordo faz parte de um esforço mais amplo para expandir a infraestrutura de IA para além dos EUA. Liga uma grande empresa de IA de fronteira a um importante conglomerado indiano para capacidade de longo prazo.Meta →

Info

June 10, 2026 OpenAI

A OpenAI pondera arrendar um campus de centros de dados de 10 gigawatts no Ohio

A Reuters noticiou que a OpenAI ponderava arrendar um campus de centros de dados proposto de 10 gigawatts no Ohio, com possível apoio da Nvidia. A escala sublinha o quanto as ambições de computação já ultrapassam as instalações existentes. Um local desse tamanho estaria entre os maiores campus de IA contemplados até à data, à espera de compromissos firmes.Reuters →

Info