GTC 2018: глубинному обучению — рекордную производительность
GTC 2018: глубинному обучению — рекордную производительность

Дженсен Хуанг: «Мы увеличиваем производительность нашей платформы темпами, значительно опережающими закон Мура»


09:34 02.04.2018   |  Ханна Уильямс |  Computerworld, Великобритания

Рубрика Технологии |   1285 прочтений



Графические платы Tesla V100, широко используемые в научных исследованиях, поступают на службу системам глубинного обучения Nvidia DGX.

Компания Nvidia анонсировала серию новых продуктов, призванных способствовать дальнейшему повышению эффективности глубинного обучения. Среди них следует выделить высокопроизводительный сервер DGX-2, который предоставит приложениям искусственного интеллекта вычислительные мощности в 2 PFLOPS.

Выступая на 10-й ежегодной конференции Nvidia GTC, основатель и генеральный директор компании Дженсен Хуанг объявил также об удвоении памяти графической платы Tesla V100 до 32 Гбайт, что позволит повысить эффективность глубинного обучения и высокопроизводительных вычислений.

Хуанг указал, что вычислительная мощность графических процессоров продолжает увеличиваться, а для сохранения существующих темпов роста нужны еще более мощные компьютеры, оснащенные всем необходимым.

«Сегодня мы находимся на переломном этапе, а количество людей, обращающихся к вычислительным мощностям графических процессоров, растет невиданными темпами, – указал Хуанг. – За последние пять лет число разработчиков, использующих графические процессоры, увеличилось в десять раз и достигло почти миллиона человек. Глядя на перемены, произошедшие за последние пять лет, мы нисколько не сомневаемся в том, что организация вычислений с помощью графических ускорителей стала правильным ответом на возникающие вызовы».

Графическая плата Tesla V100, уже успевшая завоевать популярность среди исследователей всего мира, теперь нашла применения и в системах глубинного обучения Nvidia DGX.

Компания анонсировала также новую технологию внутренних межсоединений NVSwitch, позволяющая организовать в одном серверном узле обмен данными между 16 графическими платами Tesla V100 на скорости 2,4 Тбайт/с. Это позволит справиться с недостаточной производительностью шины PCIe при построении систем, объединяющих несколько графических процессоров, и создать более быструю и масштабируемую структуру внутренних соединений.

По словам Хуанга, у разработчиков появится возможность проектировать системы, которые объединят больше графических процессоров, поддерживающих высокоскоростной обмен.

Генеральный директор Nvidia представил новый комплекс DGX-2 – первый одиночный сервер с производительностью в 2 PFLOPS, предназначенный для решения сложных задач искусственного интеллекта. Система DGX-2 заменяет собой 300 обычных серверов, занимающих в ЦОДе 15 стоек. Он оснащен пространством хранения объемом в 30 Тбайт и работает в десять раз быстрее предыдущей модели DGX-1, выпущенной всего шесть месяцев назад. Новая система начнет поставляться в третьем квартале 2018 года по цене 399 тыс. долл. (ориентировочные цены в США. — Прим. ред.), однако некоторые исследователи данных уже сейчас используют в своей работе этот продукт.

«Многих нынешних достижений удалось добиться благодаря платформе глубинного обучения Nvidia, – добавил Хуанг. – Мы увеличиваем производительность нашей платформы темпами, значительно опережающими закон Мура, осуществляя прорывы, которые помогают совершать революцию в сфере здравоохранения, транспорта, научных исследований и несчетном количестве других областей».


Теги: Nvidia Высокопроизводительные системы Графические процессоры Nvidia Tesla Дженсен (Джен-Сан) Хуанг Глубинное обучение

На ту же тему: