NVIDIA Enterprise anuncia a Mellanox InfiniBand para supercomputação de Inteligência Artificial em exoescala
25/11/2020 –
Ecossistema global de parceiros de servidores e armazenamento para oferecer sistemas com NVIDIA Mellanox 400G, é a única plataforma de aceleração totalmente em rede do mundo
A NVIDIA Enterprise apresenta a próxima geração da NVIDIA® Mellanox® 400G InfiniBand, que oferece aos desenvolvedores de Inteligência Artificial e pesquisadores científicos o desempenho de rede mais rápido disponível no mercado para solucionar os problemas mais desafiadores do mundo.
À medida que os requisitos de computação continuam a crescer exponencialmente em áreas como descoberta de medicamentos, pesquisa climática e genoma, a NVIDIA Mellanox 400G InfiniBand está acelerando o trabalho por meio de um salto drástico no desempenho oferecido na única plataforma de computação totalmente em rede e offloaded do mundo.
A sétima geração da Mellanox InfiniBand oferece latência extremamente baixa e duplica a taxa de transferência de dados com o NDR 400 Gb/s, além de adicionar novos mecanismos de computação em rede da NVIDIA para oferecer aceleração adicional.
Os principais líderes fabricantes de infraestruturas de tecnologia do mundo, incluindo Atos, Dell Technologies, Fujitsu, Inspur, Lenovo e Supermicro, planejam integrar a NVIDIA Mellanox 400G InfiniBand nas suas ofertas de soluções empresariais e HPC. Esses compromissos são complementados pelo amplo suporte dos principais parceiros de infraestrutura de armazenamento, incluindo o DDN e o armazenamento da IBM, entre outros.
“O trabalho mais importante dos nossos clientes é baseado em IA e softwares cada vez mais complexos, que exigem redes mais rápidas, mais inteligentes e dimensionáveis”, afirma Gilad Shainer, vice-presidente sênior de redes na NVIDIA. “Os mecanismos de taxa de transferência e aceleração inteligente da NVIDIA Mellanox 400G InfiniBand permitem que as infraestruturas de nuvem de HPC, IA e hiperescala alcancem um desempenho incomparável com menor custo e complexidade.”
O anúncio amplia a liderança da Mellanox InfiniBand como a solução mais robusta do setor para supercomputação de IA. A NVIDIA Mellanox NDR 400G InfiniBand oferece o triplo da densidade de porta de switches e aumenta o poder de aceleração de IA em 32 vezes. Além disso, aumenta em 5 vezes a taxa de transferência bidirecional agregada do sistema de switches, para 1,64 petabits por segundo, permitindo que os usuários executem cargas de trabalho maiores com menos limitações.
Expandindo o ecossistema para cargas de trabalho em expansão
Algumas das maiores organizações de pesquisa científica do mundo expressaram interesse antecipado na próxima geração da Mellanox InfiniBand.
“A parceria com o Microsoft Azure e NVIDIA Networking deriva de nossa paixão compartilhada por ajudar cientistas e pesquisadores para impulsionar a inovação e a criatividade por meio de HPC e IA dimensionáveis. Em HPC, as VM (máquinas virtuais) da série HBv2 no Azure são as primeiras a colocar a InfiniBand HDR na nuvem e alcançar escala e desempenho de supercomputação para aplicações de client MPI com uma escala demonstrada que supera 80.000 núcleos para MPI HPC”, explica Nidhi Chappell, chefe de produto, Azure HPC e IA na Microsoft Corp. “Em IA, para atender às necessidades ambiciosas de inovação de IA, as VMs do Azure NDv4 também utilizam a InfiniBand HDR com 200 GB/s por GPU, um total enorme de 1,6 TB/s de largura de banda de interconexão por VM, e escalam para milhares de GPUs sob a mesma estrutura de InfiniBand de baixa latência para ampliar o acesso à supercomputação de IA. A Microsoft aplaude a contínua inovação na linha de produtos Mellanox InfiniBand da NVIDIA, e estamos ansiosos para dar continuidade à nossa sólida parceria.”
“As interconexões de alto desempenho são tecnologias essenciais necessárias para exoescala e muito mais. O Los Alamos National Laboratory continua na vanguarda em termos de tecnologias de rede de HPC”, afirma Steve Poole, arquiteto-chefe de plataformas de última geração do Los Alamos National Laboratory. “O laboratório continuará a trabalhar com a NVIDIA na avaliação e na análise da sua tecnologia mais avançada de 400 GB/s destinada a solucionar os diversos requisitos de carga de trabalho no Los Alamos.”
“Na nova era de computação exoescala, pesquisadores e cientistas estão pressionando os limites da aplicação da modelagem matemática à química quântica, dinâmica molecular e segurança civil”, declara o professor Thomas Lippert, chefe do Jülich Supercomputing Centre. “Estamos comprometidos em aprimorar a próxima geração da Mellanox InfiniBand para ampliar nosso histórico de liderança na Europa em construção de supercomputadores de última geração.”
“A InfiniBand continua a manter seu ritmo de inovação e desempenho, destacando o que a diferencia como a interconexão de servidores e armazenamento de alto desempenho mais utilizada em sistemas de HPC e IA”, afirma Addison Snell, CEO da Intersect360 Research. “À medida que as aplicações continuam a exigir uma maior taxa de transferência das redes, a necessidade de soluções de alto desempenho, como a NVIDIA Mellanox 400G InfiniBand, tem o potencial de continuar a expandir para novos casos de uso e mercados.”
Especificações e disponibilidade de produtos
As operações de descarga são cruciais para as cargas de trabalho de IA. A terceira geração da tecnologia NVIDIA Mellanox SHARP permite que operações de treinamento deep learning sejam reduzidas e aceleradas pela rede InfiniBand, resultando em um poder de aceleração 32 vezes superior. Quando combinado com o conjunto de software NVIDIA Magnum IO, ela oferece uma computação científica acelerada e pronta para uso.
Os switches de borda, baseados na arquitetura InfiniBand do Mellanox, têm uma taxa de transferência bidirecional agregada de 51,2 TB/s, com uma capacidade de pontos de referência de mais de 66,5 bilhões de pacotes por segundo. Os switches modulares baseados em uma Mellanox InfiniBand terão uma taxa de transferência bidirecional agregada de 1,64 petabits por segundo, cinco vezes maior do que a da última geração.
A arquitetura Mellanox InfiniBand baseia-se nos padrões da indústria para garantir compatibilidade com versões anteriores e futuras e proteger investimentos em data center. Espera-se que as soluções baseadas na arquitetura comecem a surgir no segundo trimestre de 2021.
Mais informações sobre a NVIDIA Mellanox InfiniBand na live Apresentação Especial sobre NVIDIA SC20, às 20h (horário de Brasília),