Японская рабочая станция сочетается с 64-ядерным процессором AMD EPYC и двумякартами GeForce RTX 30903080 Tom s

Антон Шилов, 18 сентября 2020 г.

HPC System представляет рабочую станцию ​​PAW-300 с высочайшей производительностью

HPC Systems, производитель рабочих станций из Японии, объявила, что ее новая рабочая станция оснащена процессором AMD EPYC с 64 ядрами, а также двумя картами Nvidia GeForce RTX 3080/3090. Машина PAW-300 предназначена в первую очередь для разработчиков искусственного интеллекта, но ее, безусловно, можно использовать для других приложений, таких как создание цифрового контента, как только Nvidia выпустит драйверы Studio для своих последних графических процессоров.

Рабочая станция монстра

HPC PAW-300, безусловно, одна из самых мощных рабочих станций, доступных сегодня. В максимальной конфигурации система может быть оснащена процессором AMD серии EPYC 7002 с количеством ядер до 64, которые могут сопровождаться до 512 ГБ памяти DDR4-3200 ECC. Графический отдел включает в себя одну или две карты GeForce RTX 3090 трех ширины, которые поддерживают интерфейс NVLink для конфигураций с несколькими графическими процессорами, или платы GeForce RTX 3080, которые не поддерживают NVLink. Судя по изображению, предоставленному HPC, PAW-300 использует системы жидкостного охлаждения с обратной связью для всех своих вычислительных компонентов. Что касается хранилища, в компьютере есть один слот M.2 для SSD и порт U.2 для диска уровня рабочей станции.

READ  Google тестирование - игра дня - функция для Chrome

Возможности подключения HPC PAW-300 довольно обширны, поскольку система имеет два разъема 10 GbE, управляемых Intel X550-AT2, четыре USB 3.1 Gen 2 (два Type-A и два Type-C), а также два USB 3.0 Type- Порты, COM-порт и аудиоразъемы. Система также оснащена Aspeed AST2500 BMC (вместе с RJ45 IPMI и разъемом D-Sub) для удаленного управления.

(Изображение предоставлено: HPC Systems)

GeForce RTX 30-Series против A100?

После того, как Nvidia выпускает свои новые игровые карты, компании обычно требуется некоторое время, чтобы выпустить платы Quadro для профессионалов САПР и DCC и, возможно, платы Titan для профессионалов и специализированные модели HPC для приложений AI и HPC. Это не относится к семье Ампера. Nvidia A100 была представлена ​​еще в мае, а PN только на этой неделе выпустила карты для разработчиков AI и HPC.

HPC Systems по сути предлагает людям использовать его рабочую станцию ​​на базе GeForce RTX для тех же рабочих нагрузок, для которых был разработан Nvidia A100. Карты PNY Nvidia A100 полезны только для вычислений, в настоящее время они почти не доступны и стоят около 12500 фунтов стерлингов в Великобритании. Это приводит к вопросу: имеет ли смысл использовать карты GeForce RTX 30-й серии Ampere для вычислений AI / ML вместо A100??

READ  Nvidia GeForce GTX 1650 может стать быстрее оперативной памяти GDDR6 в соответствии с этой острой утечкой

Что касается возможностей и реальной производительности Nvidia A100 по сравнению с одной или двумя картами GeForce RTX 3090, ситуация выглядит довольно интересной.

Японская рабочая станция сочетается с 64-ядерным процессором AMD EPYC и двумя картами GeForce RTX 30903080 Tom s

Карты Nvidia GeForce традиционно не поддерживают FP64 должным образом, поэтому A100 не имеет себе равных для рабочих нагрузок HPC. Кроме того, GeForce RTX 30-й серии, похоже, не поддерживает инструкции INT4 и INT8 для AI / ML, так что A100 снова имеет преимущество. Наконец, A100 содержит 40 ГБ HBM2 SDRAM, что значительно больше памяти, чем его аналоги серии GeForce RTX 30, что важно для больших наборов данных. еще одна победа.

Сравнение пиковой производительности семейства Nvidia Ampere

Сравнение пиковой производительности семейства Nvidia Ampere
A100RTX 3090RTX 3080
GPUGA100GA102GA102
Ядра CUDA6912104968704
FP64 Производительность9,7 терафлопс558 ГФЛОПС465 ГФЛОПС
Тензорное ядро ​​FP6419,5 терафлопс
FP32 Производительность19,5 терафлопс35,7 терафлопс29,8 терафлопс
Tensor Float 32 (TF32) Производительность156 терафлопс | 312 терафлопс143 ТФЛОПС | 285 терафлопс119 терафлопс | 238 терафлопс
FP16 / Bfloat 16 Производительность312 терафлопс | 624 терафлопс143 ТФЛОПС | 285 терафлопс119 терафлопс | 238 терафлопс
INT8 Производительность624 TOPS | 1248 ТОПС
INT4 Производительность1248 TOPS | 2496 ТОПС
Память на борту40 ГБ HBM224 ГБ GDDR6X10 ГБ GDDR6X
Пропускная способность памяти1,6 ТБ / с936 ГБ / с760 ГБ / с
Примечание: Структурная разреженность включена
READ  Объявлен Huawei P Smart 2021 с дюймовым дисплеем FHD, процессором Kirin 710A и аккумулятором на 5000 мАч - TechAndroids

Два лучше, чем один?

Имеет ли смысл для разработчиков AI / ML использовать пару карт GeForce RTX 3090/3080 вместо одного ускорителя A100, полностью зависит от проектов, над которыми они работают. Графические процессоры Nvidia GA100 и GA102 были разработаны для совершенно разных рабочих нагрузок, а первый также оптимизирован для длительной работы при высоких нагрузках, поэтому использование игровых плат для рабочих станций не всегда идеально.

Но в свете того факта, что Nvidia еще не может предложить свои карты Titan и Quadro на базе архитектуры Ampere для профессионалов, неизбежно, что по крайней мере некоторые производители рабочих станций будут предлагать рабочие станции с платами Nvidia GeForce RTX 30-й серии.