«Паскаль» дает умные ответы

Особенности графических процессоров делают их пригодными для построения систем глубинного обучения; нвые же модели Nvidia Tesla поддерживают еще и низкоуровневые вычисления


11:38 13.09.2016   |   3500 |  Агам Шах |  Служба новостей IDG



Новые графические процессоры Nvidia Tesla P4 и P40 предназначены для глубинного обучения.

Для идентификации объектов, объезда препятствий и смены полос автономным автомобилям нужны дополнительные вычислительные мощности. В сложившейся ситуации графические процессоры получают неплохой шанс проявить себя в ЦОД или даже непосредственно на автомагистралях.

Держа в голове такой сценарий, Nvidia представила два новых графических процессора, Tesla P4 и P40, созданных на основе архитектуры Pascal и предназначенных для установки в серверы или компьютеры, которые будут оказывать автономным автомобилям помощью в управлении. В последние годы графические процессоры Tesla были ориентированы на суперкомпьютеры, теперь же их целью становятся системы глубинного обучения, помогающие классифицировать данные и устанавливать взаимосвязи между ними.

Под «глубинным обучением» обычно понимаются алгоритмические технологии, базирующиеся на нейронных сетях – системах простых процессоров (искусственных нейронов), соединенных и упорядоченно взаимодействующих между собой.

Все это является частью общей тенденции: по мере увеличения объемов данных, которые пересылаются в облако различными системами и устройствами, растет потребность в системах глубинного обучения, позволяющих получать ответы на задаваемые вопросы путем анализа данных с учетом текущего контекста.

Facebook и Google, например, используют графические процессоры в системах глубинного обучения, предназначенных для распознавания образов и обработки естественного языка. В Nvidia утверждают, что платформа распознавания речи Baidu Deep Speech 2 построена на основе графических процессоров Tesla.

Новые модели Tesla обладают значительной по меркам графических процессоров вычислительной мощностью. Чип P40 имеет 3840 ядер CUDA, обеспечивает производительность в 12 TFLOPS при выполнении операций одинарной точности, поддерживает 24 Гбайт памяти GDDR5 и потребляет 250 ватт электрической мощности. У P4 имеется 2560 ядер и 8 Гбайт памяти GDDR5. Его производительность при выполнении операций одинарной точности составляет 5,5 TFLOPS, а потребляемая мощность – 75 ватт.

Особенности графических процессоров делают их пригодными для построения систем глубинного обучения. Быстрые чипы обычно отличаются высоким быстродействием при выполнении операций двойной точности, что позволяет повышать качество вычислений. Новые же модели Tesla поддерживают еще и низкоуровневые вычисления. Каждое ядро обрабатывает определенную порцию информации, при этом блоки данных можно объединять друг с другом для соответствующей интерпретации информации с целью распознавания, например, объектов, присутствующих в изображении, или слов, которые произносят люди во время беседы.

Системы глубинного обучения делают ставку главным образом на низкоуровневые вычисления, поскольку операции двойной точности позволяют получать лучшие результаты, но требуют дополнительной вычислительной мощности, что приводит к замедлению обработки.

В начале текущего года компания Nvidia представила процессор Tesla P100, который опережает по быстродействию P4 и P40. Чип P100 предназначен для серверов старшего класса и используется при тонкой настройке глубинного обучения нейронных сетей.

Новые графические процессоры Tesla P4 и P40 имеют низкоуровневые блоки целочисленных операций и операций с плавающей точкой, которые можно использовать для аппроксимации на локальном уровне. Дело в том, что возможность подключения систем и автомобилей к облаку появляется не всегда, и в этом случае необходимую обработку требуется выполнять локально.

Корпорация Intel также анонсировала чип Knights Mill, который будет предназначен для глубинного обучения.

Графические процессоры Tesla P4 и P40 должны прийти на смену чипам Tesla M4 и M40, которые были выпущены компанией Nvidia в прошлом году с прицелом на обработку графики и виртуализацию. Новые чипы тоже способны решать эти задачи.

Модель Tesla P40 начнет поставляться в октябре, а P4 – в ноябре. Новые графические процессоры будут устанавливаться в серверы Dell, Hewlett Packard Enterprise, Lenovo, Quanta, Wistron, Inventec и Inspur.


Теги: показывать на главной Самое интересное Nvidia Робототехника Графические процессоры Машинное обучение Nvidia Tesla
На ту же тему: