Москва
Мероприятия
Блог
Войти
main-bg
Блог

Специальное железо для нейросетей. Роскошь или необходимость?

Антон Юдин
Антон Юдин,
Менеджер по развитию продуктовой экспертизы департамента развития перспективных технологий и решений
01.06.2021
Подписаться в MAX

Розничная торговля – отличный пример отрасли, в которой технологии искусственного интеллекта и аналитики данных применимы и востребованы. Прогнозные модели, нейросети для прикладных задач – все это на практике, а не в теории помогает ритейлерам улучшать ассортимент, планировать складскую логистику и улучшать клиентский опыт. Сегодня мы поговорим о железе, на котором эти интеллектуальные решения работают.

На чем считать ИИ?

Для просчета математических моделей, работы нейросетей, обучения предиктивных систем и т.д. требуются серьезные вычислительные мощности и специальные архитектуры высокопроизводительных программно-аппаратных комплексов. 

Ситуация, когда расчеты занимают часы и даже дни, вполне типичны для этой категории задач. Но для бизнеса это может быть слишком долго и даже опасно, реакция часто должна быть немедленной, а иногда требуются и проактивные меры для сохранения денег, здоровья, ресурсов и т.п.

Первым шагом к ускорению вычислений стало использование графических ускорителей – производительных карт, созданных изначально для графических задач, но показавших высокую эффективность и для других расчетов, не связанных с графикой.

Такие карты устанавливаются в стандартные слоты (например, PCIe). Их можно поставить сразу несколько, и все современные приложения с интенсивными вычислениями умеют их использовать. Существует технология SXM4, когда GPU «расшита» на плате, за счет чего минимизируются задержки передачи данных через шину.

Технологический вклад NVIDIA

Главный мировой разработчик и производитель графических ускорителей – компания NVIDIA. Их флагманский продукт, ускоритель A100, имеет впечатляющие характеристики: 8192 ядер, в том числе тензорные, до 80 ГБ памяти, производительность до 9,7 TFLOPS. 

Узкое место систем с графическими ускорителями - обмен данными. Чтобы эффективно объединить в сеть множество вычислительных процессоров, NVIDIA предложила собственную шину данных NVLink. В новейших версиях она достигает пропускной способности 600 Гбайт/с на один GPU (в 10 раз быстрее, чем PCIe v4). 

Идея получила дальнейшее развитие с появлением коммутатора NVSwitch, способного объединить до 12 шин NVLink и открывающего путь к построению из графических ускорителей мощных и легко масштабируемых вычислительных кластеров.

Компания NVIDIA не была бы лидером в своей области, если не предложила бы собственную реализацию такого кластера – в виде продукта DGX A100.
Это сервер, в котором карточки A100 установлены не в слотах, а «расшиты» на плате и связаны коммутатором NVSwitch. Скоростные сетевые коммутаторы Mellanox (компания в 2020 году куплена NVIDIA) позволяют построить из нескольких DGX A100 кластер и концентрировать в одном месте невероятный объем вычислительных ресурсов.

Чем DGX хороши для задач ИИ?

Замкнутая предсказуемая экосистема. DGX – это не просто сервер, а полноценный программно-аппаратный комплекс. NVIDIA поддерживает огромный ландшафт ПО для обучения нейронных сетей и их штатной эксплуатации и для аналитики данных. Программная часть NVIDIA DGX базируется на мощной аппаратной платформе, которая является самой технологичной в мире.

Компетенции NVIDIA по data science. В NVIDIA по всему миру работают несколько сотен человек, которые обучают нейросети и строят предсказательные модели – разработчики и аналитики. А значит, NVIDIA обладает отличными компетенциями на рынке для поддержки заказчиков, которые занимаются data science и обеспечивает им одну точку входа для решения всех вопросов.

Каталог NGC. В него входит множество готовых решений, оптимизированных для графических процессоров – как собственные разработки NVIDIA, так и разработки партнеров. Это решения для задач искусственного интеллекта, машинного обучения и высокопроизводительных вычислений. Благодаря предварительно обученным моделям искусственного интеллекта и отраслевым SDK, заказчики могут решать свои задачи быстрее, чем когда-либо прежде.

Ускорение вычислений для «Спортмастера»

«Спортмастер» - большой ритейлер с классическими для своего бизнеса задачами. Моделями искусственного интеллекта в «Спортмастере» пользуются для прогнозирования спроса и оптимизации управления товарными операциями – чтобы избежать дефицита товаров на прилавках и скопления неликвидной продукции на складах. Например, каждый день формируется заказ товара в торговую сеть из тысяч магазинов и десятков тысяч товарных позиций.

Следующая задача - увеличение конверсии продаж и повышения эффективности программ лояльности. Маркетинговые кампании, особенно таргетированные, требуют постоянной оценки и оптимизации. Еще одна бизнес-задача - привлечение необходимого числа сотрудников для работы в магазинах в часы пиковой нагрузки.

Объем данных и количество факторов, влияющих на прогнозные показатели, огромны и постоянно растут, а время принятия решений сокращается. Человек не в состоянии решать столь масштабные задачи оптимизации, однако к нему на помощь приходят системы искусственного интеллекта.

Команда экспертов по анализу данных «Спортмастер» накопила большой опыт по моделированию сложных бизнес-процессов компании, но обучение моделей на имеющихся мощностях (между прочим, 10-узловый кластер BigData) занимало слишком много времени. Приняв решение перейти на специализированную платформу с ускорением вычислений на GPU, компания обратила внимание на комплекс NVIDIA DGX-2.

Для пилотного проекта NVIDIA поставила в дата-центр заказчика «младшего брата» DGX-2 – сервер NVIDIA DGX Station. Для максимального использования возможностей DGX пришлось переписать скрипты для подготовки данных и процесса обучения, провести тестирование выбранных боевых моделей машинного обучения.

Результаты оказались весьма оптимистичными. Ключевую роль сыграла GPU-совместимость конкретных алгоритмов в определенных фреймворках искусственного интеллекта. Алгоритмы с поддержкой GPU (особенно c полноценной реализацией режима multi-threaded GPU) показали резкий прирост производительности. Например, на градиентном бустинге в Сatboost был зафиксирован 30-кратный прирост, а на XGBOOST в H2O – 20-кратный.

По итогам тестирования, а также с учетом активного развития проекта open-source RAPIDS, поддерживаемого NVIDIA (там все больше алгоритмов переносится на GPU), заказчик принял решение о внедрении NVIDIA DGX-2. После разработки точных технических требований два комплекса DGX-2 были поставлены в дата-центр.

Миграция боевых моделей искусственного интеллекта на production-платформу DGX-2 подтвердила успешные результаты пилотного тестирования и показала дополнительный прирост производительности за счет более мощного железа DGX-2. Появилось окно возможностей для наращивания функционала. Например, переход с еженедельной на ежедневную технологию полного обучения моделей, значительное увеличение количества факторов и возможности «эшелонирования» моделей, использование новых ресурсоемких алгоритмов для повышения качества прогноза и результатов классификации.

Немного цифр: если на прежнем «железе» обучение модели продолжалось 12 часов, то на DGX-2 – всего 2,5 часа. После обучения инференс, занимавший на прежнем железе 36 часов, завершился на DGX-2 через 4 часа.

Экспертиза Softline

Программно-аппаратный комплекс, который мы поставили, не имеет аналогов в России, а его продвижением на отечественный рынок занимаются лишь несколько партнеров NVIDIA, среди которых – Softline. На текущий момент Softline имеет наивысший на рынке вендорский статус ELITE. 

Портфель продуктов и сервисов Softline постоянно пополняется собственными и вендорскими решениями в области искусственного интеллекта. Мы можем предложить заказчикам такое решение как SuperPod – кластер с вычислительной частью DGX, устройствами хранения и скоростной сетевой инфраструктурой.

Большая и важная категория наших заказчиков – университеты. АГНИ (Альметьевский государственный нефтяной институт) решает на железе NVIDIA задачи геологоразведки, в Институте прикладной семиотики Татарстана разрабатывают русско-татарский переводчик, в Санкт-Петербургском государственном электротехническом университете «ЛЭТИ» – обучают новых специалистов согласно указу Президента.

 

Теги:

Новости, истории и события
Смотреть все
Bell Integrator FabricaONE.AI (акционер – ГК Softline) привел информационные системы финансовой организации к единому стандарту разработки
Новости

Bell Integrator FabricaONE.AI (акционер – ГК Softline) привел информационные системы финансовой организации к единому стандарту разработки

11.06.2026

«Софтлайн Решения» (ГК Softline) получила наивысший партнерский статус Elite Integrator от «Систэм Электрик»
Новости

«Софтлайн Решения» (ГК Softline) получила наивысший партнерский статус Elite Integrator от «Систэм Электрик»

11.06.2026

EXEPLANT FabricaONE.AI (акционер - ГК Softline) выпустила новую версию ExeMES 3.0
Новости

EXEPLANT FabricaONE.AI (акционер - ГК Softline) выпустила новую версию ExeMES 3.0

10.06.2026

«Софтлайн Решения» (ГК Softline) открыла первый киберполигон Ampire в учреждении среднего профессионального образования
Новости

«Софтлайн Решения» (ГК Softline) открыла первый киберполигон Ampire в учреждении среднего профессионального образования

10.06.2026

VPG LaserONE (кластер «СФ Тех» ГК Softline) расширит Центр промышленной робототехники в партнерстве с Правительством Московской области
Новости

VPG LaserONE (кластер «СФ Тех» ГК Softline) расширит Центр промышленной робототехники в партнерстве с Правительством Московской области

09.06.2026

«Инферит Техника» (кластер «СФ Тех» ГК Softline) и 3Logic Group заключили партнерское соглашение
Новости

«Инферит Техника» (кластер «СФ Тех» ГК Softline) и 3Logic Group заключили партнерское соглашение

09.06.2026

ПАО «Софтлайн» подало иск о возмещении убытков, вызванных арестом активов компаний группы
Новости

ПАО «Софтлайн» подало иск о возмещении убытков, вызванных арестом активов компаний группы

08.06.2026

ГК Softline представит отечественный симулятор управления дронами на Ассамблее образования и креативных индустрий в Санкт-Петербурге
Новости

ГК Softline представит отечественный симулятор управления дронами на Ассамблее образования и креативных индустрий в Санкт-Петербурге

08.06.2026

Infosecurity (ГК Softline) вывела на рынок комплекс услуг по безопасности искусственного интеллекта
Новости

Infosecurity (ГК Softline) вывела на рынок комплекс услуг по безопасности искусственного интеллекта

05.06.2026

Группа «Борлас» (ГК Softline) получила статус «1С:Центр MDM»
Новости

Группа «Борлас» (ГК Softline) получила статус «1С:Центр MDM»

05.06.2026

Группа «Борлас» (включая компанию BeringPro) вошла в топ лидеров цифровой трансформации промышленности России
Новости

Группа «Борлас» (включая компанию BeringPro) вошла в топ лидеров цифровой трансформации промышленности России

04.06.2026

ГК Softline приняла участие в заседании Комитета по информационным технологиям Ассоциации менеджеров
Новости

ГК Softline приняла участие в заседании Комитета по информационным технологиям Ассоциации менеджеров

04.06.2026

«Инферит ИТМен» (кластер «СФ Тех» ГК Softline) выпустил обновление 7.1 с расширенными возможностями инвентаризации
Новости

«Инферит ИТМен» (кластер «СФ Тех» ГК Softline) выпустил обновление 7.1 с расширенными возможностями инвентаризации

03.06.2026

«Инферит» (кластер «СФ Тех» ГК Softline) и СДИ Софт объявили о партнерстве в сфере автоматизации управления ИТ-инфраструктурой
Новости

«Инферит» (кластер «СФ Тех» ГК Softline) и СДИ Софт объявили о партнерстве в сфере автоматизации управления ИТ-инфраструктурой

02.06.2026

ActiveCloud расширяет направление DevOps-услуг для российского бизнеса
Новости

ActiveCloud расширяет направление DevOps-услуг для российского бизнеса

02.06.2026

Цифровое ПО Bimeister от fabricaONE.AI (акционер – ГК Softline) официально подтвердило совместимость с платформой «Штурвал»
Новости

Цифровое ПО Bimeister от fabricaONE.AI (акционер – ГК Softline) официально подтвердило совместимость с платформой «Штурвал»

01.06.2026

Эксперт РА повысил кредитный рейтинг ПАО «Софтлайн» до уровня ruA- со стабильным прогнозом
Новости

Эксперт РА повысил кредитный рейтинг ПАО «Софтлайн» до уровня ruA- со стабильным прогнозом

28.05.2026

ГК Softline и GreenMDC объединят усилия для развития ИТ-инфраструктуры и цифрового суверенитета регионов РФ
Новости

ГК Softline и GreenMDC объединят усилия для развития ИТ-инфраструктуры и цифрового суверенитета регионов РФ

27.05.2026

Новые ИТ-льготы и запреты, ИИ в судах, дроны в медицине, контроль чипов и возвращение Roblox
Блог

Новые ИТ-льготы и запреты, ИИ в судах, дроны в медицине, контроль чипов и возвращение Roblox

11.06.2026

Облако на OpenStack: готовая замена VMware для бизнеса и госсектора
Блог

Облако на OpenStack: готовая замена VMware для бизнеса и госсектора

09.06.2026

ТОП-5 российских систем видеоконференцсвязи в 2026 году: сравнение особенностей и преимуществ
Блог

ТОП-5 российских систем видеоконференцсвязи в 2026 году: сравнение особенностей и преимуществ

04.06.2026

Как выбрать систему инвентаризации, учета и контроля ИТ-инфраструктуры: обзор 5 российских решений
Блог

Как выбрать систему инвентаризации, учета и контроля ИТ-инфраструктуры: обзор 5 российских решений

01.06.2026

Главные ИТ-новости недели 29.05.2026
Блог

Главные ИТ-новости недели 29.05.2026

29.05.2026

ИИ в образовании 2026: практика, инфраструктура, регулирование
Блог

ИИ в образовании 2026: практика, инфраструктура, регулирование

22.05.2026

Управление программными активами (SAM) — как эффективно распоряжаться ИТ-активами, избежать штрафов и выполнить требования регуляторов
Блог

Управление программными активами (SAM) — как эффективно распоряжаться ИТ-активами, избежать штрафов и выполнить требования регуляторов

19.05.2026

Как меняется инфраструктура образования: опыт российских школ
Блог

Как меняется инфраструктура образования: опыт российских школ

13.05.2026

Главные ИТ-новости недели 08.05.2026
Блог

Главные ИТ-новости недели 08.05.2026

08.05.2026

Электронные подписи в 2026: получить по биометрии, обновить «КриптоПро» и избежать штрафов
Блог

Электронные подписи в 2026: получить по биометрии, обновить «КриптоПро» и избежать штрафов

06.05.2026

Как сократить расходы на облачную инфраструктуру: распределение нагрузок на практике
Блог

Как сократить расходы на облачную инфраструктуру: распределение нагрузок на практике

29.04.2026

ИТ-инфраструктура: как бизнес решает задачи отказоустойчивости и импортозамещения
Блог

ИТ-инфраструктура: как бизнес решает задачи отказоустойчивости и импортозамещения

22.04.2026

Лицензионный хаос: как избежать штрафов и навести порядок в ПО
Блог

Лицензионный хаос: как избежать штрафов и навести порядок в ПО

21.04.2026

Информационная безопасность в проектах «Софтлайн Решений»
Блог

Информационная безопасность в проектах «Софтлайн Решений»

17.04.2026

Главные ИТ-новости недели 10.04.2026
Блог

Главные ИТ-новости недели 10.04.2026

10.04.2026

Цифровые технологии на производстве: от кибербезопасности до облаков — опыт компаний
Блог

Цифровые технологии на производстве: от кибербезопасности до облаков — опыт компаний

08.04.2026

Первый российский PDF-редактор с ИИ-ассистентом: обзор функций
Блог

Первый российский PDF-редактор с ИИ-ассистентом: обзор функций

06.04.2026

Технические меры защиты информации: виды и способы обеспечения безопасности
Блог

Технические меры защиты информации: виды и способы обеспечения безопасности

03.04.2026