Mercado fechado
  • BOVESPA

    109.114,16
    -2.601,84 (-2,33%)
     
  • MERVAL

    38.390,84
    +233,89 (+0,61%)
     
  • MXX

    44.808,56
    -587,38 (-1,29%)
     
  • PETROLEO CRU

    77,05
    +0,34 (+0,44%)
     
  • OURO

    1.637,30
    +3,90 (+0,24%)
     
  • BTC-USD

    19.765,80
    +865,68 (+4,58%)
     
  • CMC Crypto 200

    453,04
    +19,94 (+4,60%)
     
  • S&P500

    3.655,04
    -38,19 (-1,03%)
     
  • DOW JONES

    29.260,81
    -329,60 (-1,11%)
     
  • FTSE

    7.020,95
    +2,35 (+0,03%)
     
  • HANG SENG

    17.789,41
    -65,73 (-0,37%)
     
  • NIKKEI

    26.610,70
    +179,15 (+0,68%)
     
  • NASDAQ

    11.410,75
    +94,50 (+0,84%)
     
  • BATS 1000 Index

    0,0000
    0,0000 (0,00%)
     
  • EURO/R$

    5,1899
    +0,0105 (+0,20%)
     

Nvidia GeForce RTX 4090 e 4080 são lançadas com até 4x mais performance

Após mais de um ano de rumores diversos, a Nvidia anunciou na tarde desta terça-feira (20) a aguardada família de GPUs gamer GeForce RTX 4000. Baseada na inédita microarquitetura Ada Lovelace, a linha promete proporcionar mais um grande salto de performance que chega a 4x em comparação à atual topo de linha, a RTX 3090 Ti, enquanto fornece ganhos massivos em Ray Tracing com a 3ª geração dos RT Cores e upscaling turbinado com o DLSS 3, agora capaz de criar quadros completos do zero.

Linha RTX 4000 estreia arquitetura Ada Lovelace

No coração das novas placas está a microarquitetura Ada Lovelace, sucessora da Ampere vista na linha RTX 3000. Diferente da geração anterior, que dividia a mesma tecnologia entre as placas gamer e as GPUs para data center, a empresa decidiu separar os segmentos destinando a arquitetura Hopper para os servidores e a Lovelace para os consumidores comuns. O nome da novidade é uma homenagem a Ada Lovelace, considerando a primeira programadora do mundo.

O chip de referência da Nvidia para a linha, o AD102, é fabricado no processo customizado 4N de 4 nm da TSMC — substituindo a litografia de 8 nm da Samsung utilizado na família anterior — e apresenta 76 bilhões de transistores, contra apenas 28 bilhões do GA102 presente na RTX 3090 Ti, crescimento massivo de 2,7 vezes, o que na prática deve significar maior eficiência energética e muito mais desempenho.

Fabricado no processo 4N de 4 nm da TSMC, chip da GPU AD102 emprega a nova arquitetura Nvidia Ada Lovelace contando com mais de 18 mil núcleos CUDA (Imagem: Nvidia)
Fabricado no processo 4N de 4 nm da TSMC, chip da GPU AD102 emprega a nova arquitetura Nvidia Ada Lovelace contando com mais de 18 mil núcleos CUDA (Imagem: Nvidia)

A configuração completa do AD102 conta com 18.432 núcleos CUDA divididos em 144 Streaming Multiprocessors (SMs), contra 10.752 núcleos em 84 SMs, o que resulta em um aumento de pouco mais de 70% na contagem de núcleos. Com clocks que ultrapassam a barreira dos 2.500 MHz, a solução consegue entregar 90 TFLOPs de poder computacional, mais de duas vezes mais performance que os 40 TFLOPs do GA102.

Essas unidades não apenas estão em maior número, como ainda estão significativamente mais inteligentes, graças a múltiplos ajustes implementados pela arquitetura Lovelace. A primeira grande novidade está na adição da tecnologia Shader Execution Reordering, ou SER, pensado especialmente para o processamento de Ray Tracing (RT). Apesar dos ótimos resultados e do apoio do DLSS e outras funcionalidades, o Ray Tracing é uma técnica que conflita com a natureza das GPUs.

A tecnologia de Shader Execution Reordering, ou SER, organiza os dados "bagunçados", especialmente os de Ray Tracing, para aprimorar o desempenho em até 2x (Imagem: Nvidia)
A tecnologia de Shader Execution Reordering, ou SER, organiza os dados "bagunçados", especialmente os de Ray Tracing, para aprimorar o desempenho em até 2x (Imagem: Nvidia)

Os chips gráficos são especializados em calcular dados paralelamente, de maneira ordenada, mas os raios utilizados na aplicação do RT geram dezenas de dados desorganizados em virtude da variedade de objetos 3D e materiais presentes na cena do game. O SER chega para aliviar esse problema ao organizar os dados antes que os núcleos CUDA e os RT Cores realizem o processamento — a função atua de maneira similar às Thread Sorting Units usadas pela Intel nas placas gamer Arc.

A Nvidia promete que essa adição proporciona 2 vezes mais desempenho, com taxas de quadro 25% maiores nos games. Complementam esses avanços os RT Cores de 3ª geração, que entregariam até 191 RT-TFLOPs de desempenho de RT, contra 78 RT-TFLOPs dos RT Cores de 2ª geração da RTX 3090 Ti, um aumento de 2,8 vezes na performance. Além desse crescimento, as unidades contam com duas novas estruturas: as Opacity Micro-Map Engines e as Micro-Mesh Engines.

Os novos RT Cores empregam estruturas inéditas para aprimorar o Ray Tracing, prometendo melhor qualidade em partículas e outros objetos translucentes, além de melhor qualidade em geral (Imagem: Nvidia)
Os novos RT Cores empregam estruturas inéditas para aprimorar o Ray Tracing, prometendo melhor qualidade em partículas e outros objetos translucentes, além de melhor qualidade em geral (Imagem: Nvidia)

As primeiras são especializadas em aprimorar o processamento de Ray Tracing em partículas, como faíscas e fumaça, e outros objetos translucentes para entregar um resultado mais fiel, enquanto as outras são capazes de adicionar geometria aos objetos 3D para aprimorar o resultado da iluminação sem causar impactos negativos no desempenho dos games, já que apenas pequenas áreas teriam aumento na complexidade.

Especializados no processamento de Inteligência Artificial, possibilitando recursos como o DLSS, os Tensor Cores chegam à 4ª geração adotando os mesmos aprimoramentos vistos na H100, a GPU para data centers do time verde baseada na microarquitetura Hopper. A grande novidade está na capacidade de realizar cálculos com dados no formato FP8 de alta precisão, o que traria um aumento de 5 vezes na capacidade de IA.

Com novos Tensor Cores e os inéditos Optical Flow Accelerators, o DLSS 3 consegue eliminar artefatos de objetos em movimento e até contornar limitações de CPU gerando quadros inteiros sozinho (Imagem: Nvidia)
Com novos Tensor Cores e os inéditos Optical Flow Accelerators, o DLSS 3 consegue eliminar artefatos de objetos em movimento e até contornar limitações de CPU gerando quadros inteiros sozinho (Imagem: Nvidia)

Outra novidade importante que será essencial para o novo DLSS 3 são as estruturas Optical Flow Accelerator, que avaliam diferenças de movimentos de pixels entre quadros do game para não apenas eliminar artefatos de movimentação, como ainda possibilitar a criação de um quadro novo inteiro diretamente na GPU, contornando as limitações de CPU do computador.

Por fim, a arquitetura Ada Lovelace embarca codificadores e decodificadores NVENC duplos para gravação e reprodução de vídeos, prometendo 2 vezes mais velocidade na renderização de gravações e permitindo agora que o GeForce ShadowPlay, a ferramenta de capturas interna das placas GeForce, suporte resolução 8K a 60 FPS. Pensando no futuro, os novos NVENC agora suportam codec AV1, significativamente mais eficiente que o H.265 amplamente utilizado no momento.

RTX 4090 e RTX 4080 são primeiros lançamentos

Com a nova arquitetura anunciada, a Nvidia apresentou a família de placas de vídeo gamer a utilizá-la, a GeForce RTX 4000. A linha é liderada pela GeForce RTX 4090, equipada com a GPU AD102 em uma configuração levemente reduzida, embarcando 16.384 núcleos CUDA divididos em 128 SMs, acompanhados de 128 RT Cores e 512 tensor Cores. Graças à nova litografia da TSMC, as frequências subiram drasticamente, chegando ao clock base de 2.230 MHz e boost de 2.520 MHz.

Com mais de 16 mil núcleos CUDA, a Nvidia GeForce RTX 4090 promete ser até 4 vezes mais veloz que a RTX 3090 Ti (Imagem: Nvidia)
Com mais de 16 mil núcleos CUDA, a Nvidia GeForce RTX 4090 promete ser até 4 vezes mais veloz que a RTX 3090 Ti (Imagem: Nvidia)

Nessa combinação, a RTX 4090 apresenta 83 TFLOPs de poder computacional, aumento de pouco mais de 2 vezes frente aos 40 TFLOPs da RTX 3090 Ti. Completa a ficha técnica os 24 GB de VRAM GDDR6X, operando a 21 Gbps em uma interface de 384-bit para apresentar largura de banda de 1.008 GB/s. A gigante promete que veremos ganhos lineares em games, com títulos como Microsoft Flight Simulator e Warhammer 40.000: Darktide dobrando o desempenho.

Saltos ainda mais massivos deverão ser vistos em games que possuem Ray Tracing, graças às novas estruturas introduzidas pela arquitetura Lovelace. A empresa exibiu dados de Cyberpunk 2077, que receberá um novo modo extremo de RT, o RT Overdrive, em que a GPU estreante entregaria 4 vezes mais performance que a antecessora. O vão de desempenho também deve ser visto em "jogos da nova geração", como os inéditos Portal RTX e Racer RTX, que elevam o uso da tecnologia de iluminação a um maior patamar de intesidade.

Logo abaixo está a RTX 4080, desta vez dividida em duas versões. A mais poderosa é a RTX 4080 com 16 GB de VRAM, munida de chip AD103 que traz 9.728 núcleos CUDA distribuídos em 76 SMs, com 76 RT Cores e 304 Tensor Cores. O clock base é estabelecido em 2.210 MHz e o boost em 2.510 MHz, com poder computacional chegando aos 48 TFLOPs. Fecha o pacote os 16 GB de VRAM GDDR6X, trabalhando a 23 Gbps em interface de 256-bit para oferecer largura de banda de 736 GB/s.

A empresa garante que o modelo seria duas vezes mais veloz que a RTX 3080 Ti, e a escolha ideal para profissionais que precisam trabalhar com cenas 3D mais complexas ou edições de vídeo em altíssimas resoluções sem compressão, como em arquivos RAW em 12K. A outra variante, a RTX 4080 de 12 GB, curiosamente embarca um chip mais simples, o AD104, com modestos 7.680 núcleos CUDA repartidos em 60 SMs, com 60 RT Cores e 240 Tensor Cores.

A Nvidia GeForce RTX 4080 chega em versões de 12 GB e 16 GB, com desempenho até 4 vezes maior que o da RTX 3080 Ti (Imagem: Nvidia)
A Nvidia GeForce RTX 4080 chega em versões de 12 GB e 16 GB, com desempenho até 4 vezes maior que o da RTX 3080 Ti (Imagem: Nvidia)

Com menos estruturas as frequências são mais altas, e assim a solução apresenta clock base de 2.310 MHz e boost de 2.610 MHz, conseguindo atingir poder computacional de 40 TFLOPs. Apesar do número semelhante à RTX 3090 Ti, a Nvidia promete que o lançamento seria mais rápido que a flagship da família Ampere, tendo como principais benefícios os avanços da microarquitetura Lovelace.

As novas GeForce RTX 4000 serão disponibilizadas em modelos customizados de marcas como ASUS, Colorful, Gainward, GALAX, GIGABYTE, INNO3D, MSI, Palit, PNY e ZOTAC, com a RTX 4090 e RTX 4080 16 GB também recebendo modelos Founder's Edition, trazendo design ligeiramente modificado em comparação à geração anterior. Além de trocar as bordas grafite por bronze, as variantes trazem 10% mais aletas de resfriamento, alimentação de 23 fases e novo conector de alimentação PCIe 5.0 (12VHPWR), atendendo a fontes ATX 3.0.

Preço e disponibilidade

A família Nvidia GeForce RTX 4000 tem lançamento previsto para 12 de outubro, com a chegada da RTX 4090 às lojas pelo preço sugerido de US$ 1.599 (~R$ 8.240), seguida então pela RTX 4080 em novembro, cujos valores sugeridos são de US$ 899 (~R$ 4.640) para o modelo de 12 GB e US$ 1.199 (~R$ 6.180) para a variante de 16 GB.

Segundo informações obtidas pelo portal Adrenaline, a RTX 4090 deve chegar ao Brasil custando R$ 14.999, enquanto a RTX 4080 de 16 GB deverá ser vendida por R$ 10.999. A RTX 4080 de 12 GB, por sua vez, deve ser comercializada com preço sugerido de R$ 8.199. Ainda assim, até o momento, não há informações de disponibilidade para o Brasil.

Nvidia GeForce RTX 4090: ficha técnica

  • GPU: AD102

  • Streaming Multiprocessors (SMs): 128

  • CUDA Cores (Núcleos): 16.384

  • Tensor Cores (IA): 512

  • RT Cores (Ray Tracing): 128

  • Frequências: 2.230 MHz (Base), 2.520 MHz (Boost)

  • Poder computacional (FP32): até 83 TFLOPs

  • Memória VRAM: 24 GB GDDR6X

  • Interface da memória: 384-bit

  • Velocidade da memória: 21 Gbps

  • Largura de banda: 1.008 GB/s

  • Consumo: 450 W

  • Conector de energia: 1x conector PCIe 5.0 (12VHPWR) de 12 pinos ou 3x conectores de 8 pinos (adaptador na caixa)

  • Fonte recomendada: 850 W

Nvidia GeForce RTX 4080 16 GB: ficha técnica

  • GPU: AD103

  • Streaming Multiprocessors (SMs): 76

  • CUDA Cores (Núcleos): 9.728

  • Tensor Cores (IA): 304

  • RT Cores (Ray Tracing): 76

  • Frequências: 2.210 MHz (Base), 2.510 MHz (Boost)

  • Poder computacional (FP32): até 48 TFLOPs

  • Memória VRAM: 16 GB GDDR6X

  • Interface da memória: 256-bit

  • Velocidade da memória: 23 Gbps

  • Largura de banda: 736 GB/s

  • Consumo: 320 W

  • Conector de energia: 1x conector PCIe 5.0 (12VHPWR) de 12 pinos ou 3x conectores de 8 pinos (adaptador na caixa)

  • Fonte recomendada: 750 W

Nvidia GeForce RTX 4080 12 GB: ficha técnica

  • GPU: AD104

  • Streaming Multiprocessors (SMs): 60

  • CUDA Cores (Núcleos): 7.680

  • Tensor Cores (IA): 240

  • RT Cores (Ray Tracing): 60

  • Frequências: 2.310 MHz (Base), 2.610 MHz (Boost)

  • Poder computacional (FP32): até 40 TFLOPs

  • Memória VRAM: 12 GB GDDR6X

  • Interface da memória: 192-bit

  • Velocidade da memória: 21 Gbps

  • Largura de banda: 504 GB/s

  • Consumo: 285 W

  • Conector de energia: 1x conector PCIe 5.0 (12VHPWR) de 12 pinos ou 2x conectores de 8 pinos (adaptador na caixa)

  • Fonte recomendada: 700 W

Fonte: Canaltech

Trending no Canaltech: