Mercado fechado
  • BOVESPA

    98.672,26
    +591,91 (+0,60%)
     
  • MERVAL

    38.390,84
    +233,89 (+0,61%)
     
  • MXX

    47.741,50
    +1.083,62 (+2,32%)
     
  • PETROLEO CRU

    107,06
    +2,79 (+2,68%)
     
  • OURO

    1.828,10
    -1,70 (-0,09%)
     
  • BTC-USD

    21.436,85
    +8,90 (+0,04%)
     
  • CMC Crypto 200

    462,12
    +8,22 (+1,81%)
     
  • S&P500

    3.911,74
    +116,01 (+3,06%)
     
  • DOW JONES

    31.500,68
    +823,32 (+2,68%)
     
  • FTSE

    7.208,81
    +188,36 (+2,68%)
     
  • HANG SENG

    21.719,06
    +445,19 (+2,09%)
     
  • NIKKEI

    26.491,97
    +320,72 (+1,23%)
     
  • NASDAQ

    12.132,75
    +395,25 (+3,37%)
     
  • BATS 1000 Index

    0,0000
    0,0000 (0,00%)
     
  • EURO/R$

    5,5524
    +0,0407 (+0,74%)
     

Tachyum Prodigy é "CPU universal" com 128 núcleos a 5,7 GHz e 950 W

  • Opa!
    Algo deu errado.
    Tente novamente mais tarde.
Neste artigo:
  • Opa!
    Algo deu errado.
    Tente novamente mais tarde.

Especializada no mercado de Computação de Alta Performance (HPC) e pesquisas, a Tachyum começou a disponibilizar nesta semana a clientes selecionados o Prodigy, mais novo processador da companhia para servidores e data centers. A novidade se destaca por ser "o primeiro processador universal do mundo", capaz de executar tarefas de CPU, GPU e Inteligência Artificial em um único chip, embarcado com algumas das tecnologias mais avançadas disponíveis atualmente.

Tachyum Prodigy tem 128 núcleos e consumo de 950 W

Com o Prodigy, a Tachyum mira em soluções como a recente Nvidia H100 e a AMD Instinct MI250X, tendo como maior diferencial a capacidade de atuar como CPU, GPU ou TPU (Tensor Processing Unit), dedicada a IA, dependendo do código que está executando. Com isso, a empresa chama a novidade de "processador universal", possibilitando que data centers substituam estruturas complexas com múltiplas CPUs e GPUs por apenas um chip.

A fabricante promete que o componente é até 4 vezes mais poderoso que um Intel Xeon Platinum 8380 (3ª geração Ice Lake, o mais recente disponível) em tarefas de HPC, como processamento de banco de dados e simulações, e até 6 vezes mais potente que a Nvidia H100 em cargas de trabalho de IA e inferência. No geral, a família de processadores Prodigy entregaria 10 vezes mais desempenho que os concorrentes consumindo a mesma quantidade de energia.

Com 128 núcleos fabricados em 5 nm pela TSMC, o Tachyum Prodigy T16128-AIX é o "primeiro processador universal", capaz de realizar tarefas de CPU, GPU e TPU (Imagem: Divulgação/Tachyum)
Com 128 núcleos fabricados em 5 nm pela TSMC, o Tachyum Prodigy T16128-AIX é o "primeiro processador universal", capaz de realizar tarefas de CPU, GPU e TPU (Imagem: Divulgação/Tachyum)

A linha conta com 8 modelos em diferentes configurações de núcleos, mas o destaque vai para o T16128-AIX, topo de linha com 128 núcleos e configurações extremas. Fabricados no processo N5P de 5 nm da TSMC, otimizado para chips de data center, todos os 128 núcleos rodam a 5,7 GHz e têm acesso a até 32 TB de RAM DDR5-7200, distribuídos em 16 canais e 64 módulos no formato DIMM com largura de banda que atinge 2 TB/s, e 64 pistas de barramento PCIe 5.0.

As especificações poderosas se traduzem em um consumo de 950 W, número que impressiona quando consideramos se tratar de um único processador, mas que acaba sendo muito menor que o da combinação de CPUs e GPUs dedicadas. As empresas interessadas podem ainda combinar 2 ou 4 Prodigy em um rack 2U (a "gaveta" de servidor com espessura de cerca de 90 mm), levando esse conjunto a um patamar ainda mais elevado com até 512 núcleos e consumo de 3.600 W.

Um dos pontos mais interessantes da família Tachyum Prodigy é que, além de executarem tarefas de CPU, GPU e TPU, todos podem ainda rodar instruções da arquitetura nativa da Tachyum ou traduzir código das arquiteturas x86, ARM e RISC-V, reforçando o propósito "universal" dos componentes. No entanto, não há informações de como essa tradução afetaria o desempenho.

Para conquistar o feito, a linha de chips traz 2 Vector Units de 1024-bit e 1 Matrix Processor de 4.096-bit por núcleo, suporte a cálculos nos formatos FP64, FP32, TF32, BF16, INT8, FP8 e TAI, suporte a quantização dos processos para suportar formatos de dados de baixa precisão, além de compatibilidade com os processos "Scatter" e "Gatter", que agilizariam o carregamento de matrizes para IA.

Testes e futuro com mais núcleos em 3 nm

A empresa divulgou alguns benchmarks realizados com o Prodigy no teste SPECrate 2017, em que o lançamento teria atingindo até 4 vezes melhor performance que concorrentes como a H100, o Xeon 8380 e o AMD EPYC 7763 Milan com núcleos Zen 3. Os ganhos seriam maiores em aplicações de IA com cálculos FP64 de alta precisão, em que o chip seria nada menos que 30 vezes superior.

Segundo a Tachyum, o Prodigy seria até 30 vezes mais poderoso que concorrentes ao realizar cálculos em FP64 (Imagem: Divulgação/Tachyum)
Segundo a Tachyum, o Prodigy seria até 30 vezes mais poderoso que concorrentes ao realizar cálculos em FP64 (Imagem: Divulgação/Tachyum)

Em número práticos, um T16128 garante entregar 90 TFLOPs de poder computacional em FP64, mas um rack com 4 desses chips e refrigeração a ar atingiria 6,2 PFLOPs (PetaFLOPs, ou 6.200 TFLOPs) — em comparação, o DGX H100, servidor da Nvidia com 4 unidades da nova GPU H100, promete entregar 960 TFLOPs. A expectativa é ainda mais alta na versão do Prodigy com resfriamento líquido, que entregaria 12,9 PFLOPs.

A Tachyum não divulgou preços, considerando se tratar de um produto para empresas, mas detalhou que os racks chegarão aos clientes como unidades de avaliação, para que as devidas adaptações sejam feitas. As companhias interessadas devem realizar a pré-venda, recebendo os servidores em um período de 6 a 9 meses — a escassez de componentes é o motivo citado pela demora.

Sucessor do Prodigy, o Prodigy 2 está previsto para chegar em 2024 com litografia de 3 nm, mais núcleos, memória HBM e barramentos PCIe 6.0 e CXL 3.0 (Imagem: Divulgação/Tachyum)
Sucessor do Prodigy, o Prodigy 2 está previsto para chegar em 2024 com litografia de 3 nm, mais núcleos, memória HBM e barramentos PCIe 6.0 e CXL 3.0 (Imagem: Divulgação/Tachyum)

Junto ao anúncio do Prodigy, a companhia divulgou ainda um roadmap para os próximos 2 anos, em que projeta a estreia do Prodigy 2 em 2024. Poucos detalhes técnicos do sucessor foram divulgados, mas espera-se que a nova geração traga fabricação em 3 nm, um número ainda maior de núcleos, memórias HBM para turbinar a largura de banda e os novos barramentos CXL 3.0 e PCIe 6.0.

Fonte: Canaltech

Trending no Canaltech:

Nosso objetivo é criar um lugar seguro e atraente onde usuários possam se conectar uns com os outros baseados em interesses e paixões. Para melhorar a experiência de participantes da comunidade, estamos suspendendo temporariamente os comentários de artigos