Москва
Мероприятия
Блог
Войти
main-bg
Блог

Специальное железо для нейросетей. Роскошь или необходимость?

Розничная торговля – отличный пример отрасли, в которой технологии искусственного интеллекта и аналитики данных применимы и востребованы. Прогнозные модели, нейросети для прикладных задач – все это на практике, а не в теории помогает ритейлерам улучшать ассортимент, планировать складскую логистику и улучшать клиентский опыт. Сегодня мы поговорим о железе, на котором эти интеллектуальные решения работают.

На чем считать ИИ?

Для просчета математических моделей, работы нейросетей, обучения предиктивных систем и т.д. требуются серьезные вычислительные мощности и специальные архитектуры высокопроизводительных программно-аппаратных комплексов. 

Ситуация, когда расчеты занимают часы и даже дни, вполне типичны для этой категории задач. Но для бизнеса это может быть слишком долго и даже опасно, реакция часто должна быть немедленной, а иногда требуются и проактивные меры для сохранения денег, здоровья, ресурсов и т.п.

Первым шагом к ускорению вычислений стало использование графических ускорителей – производительных карт, созданных изначально для графических задач, но показавших высокую эффективность и для других расчетов, не связанных с графикой.

Такие карты устанавливаются в стандартные слоты (например, PCIe). Их можно поставить сразу несколько, и все современные приложения с интенсивными вычислениями умеют их использовать. Существует технология SXM4, когда GPU «расшита» на плате, за счет чего минимизируются задержки передачи данных через шину.

Технологический вклад NVIDIA

Главный мировой разработчик и производитель графических ускорителей – компания NVIDIA. Их флагманский продукт, ускоритель A100, имеет впечатляющие характеристики: 8192 ядер, в том числе тензорные, до 80 ГБ памяти, производительность до 9,7 TFLOPS. 

Узкое место систем с графическими ускорителями - обмен данными. Чтобы эффективно объединить в сеть множество вычислительных процессоров, NVIDIA предложила собственную шину данных NVLink. В новейших версиях она достигает пропускной способности 600 Гбайт/с на один GPU (в 10 раз быстрее, чем PCIe v4). 

Идея получила дальнейшее развитие с появлением коммутатора NVSwitch, способного объединить до 12 шин NVLink и открывающего путь к построению из графических ускорителей мощных и легко масштабируемых вычислительных кластеров.

Компания NVIDIA не была бы лидером в своей области, если не предложила бы собственную реализацию такого кластера – в виде продукта DGX A100.
Это сервер, в котором карточки A100 установлены не в слотах, а «расшиты» на плате и связаны коммутатором NVSwitch. Скоростные сетевые коммутаторы Mellanox (компания в 2020 году куплена NVIDIA) позволяют построить из нескольких DGX A100 кластер и концентрировать в одном месте невероятный объем вычислительных ресурсов.

Чем DGX хороши для задач ИИ?

Замкнутая предсказуемая экосистема. DGX – это не просто сервер, а полноценный программно-аппаратный комплекс. NVIDIA поддерживает огромный ландшафт ПО для обучения нейронных сетей и их штатной эксплуатации и для аналитики данных. Программная часть NVIDIA DGX базируется на мощной аппаратной платформе, которая является самой технологичной в мире.

Компетенции NVIDIA по data science. В NVIDIA по всему миру работают несколько сотен человек, которые обучают нейросети и строят предсказательные модели – разработчики и аналитики. А значит, NVIDIA обладает отличными компетенциями на рынке для поддержки заказчиков, которые занимаются data science и обеспечивает им одну точку входа для решения всех вопросов.

Каталог NGC. В него входит множество готовых решений, оптимизированных для графических процессоров – как собственные разработки NVIDIA, так и разработки партнеров. Это решения для задач искусственного интеллекта, машинного обучения и высокопроизводительных вычислений. Благодаря предварительно обученным моделям искусственного интеллекта и отраслевым SDK, заказчики могут решать свои задачи быстрее, чем когда-либо прежде.

Ускорение вычислений для «Спортмастера»

«Спортмастер» - большой ритейлер с классическими для своего бизнеса задачами. Моделями искусственного интеллекта в «Спортмастере» пользуются для прогнозирования спроса и оптимизации управления товарными операциями – чтобы избежать дефицита товаров на прилавках и скопления неликвидной продукции на складах. Например, каждый день формируется заказ товара в торговую сеть из тысяч магазинов и десятков тысяч товарных позиций.

Следующая задача - увеличение конверсии продаж и повышения эффективности программ лояльности. Маркетинговые кампании, особенно таргетированные, требуют постоянной оценки и оптимизации. Еще одна бизнес-задача - привлечение необходимого числа сотрудников для работы в магазинах в часы пиковой нагрузки.

Объем данных и количество факторов, влияющих на прогнозные показатели, огромны и постоянно растут, а время принятия решений сокращается. Человек не в состоянии решать столь масштабные задачи оптимизации, однако к нему на помощь приходят системы искусственного интеллекта.

Команда экспертов по анализу данных «Спортмастер» накопила большой опыт по моделированию сложных бизнес-процессов компании, но обучение моделей на имеющихся мощностях (между прочим, 10-узловый кластер BigData) занимало слишком много времени. Приняв решение перейти на специализированную платформу с ускорением вычислений на GPU, компания обратила внимание на комплекс NVIDIA DGX-2.

Для пилотного проекта NVIDIA поставила в дата-центр заказчика «младшего брата» DGX-2 – сервер NVIDIA DGX Station. Для максимального использования возможностей DGX пришлось переписать скрипты для подготовки данных и процесса обучения, провести тестирование выбранных боевых моделей машинного обучения.

Результаты оказались весьма оптимистичными. Ключевую роль сыграла GPU-совместимость конкретных алгоритмов в определенных фреймворках искусственного интеллекта. Алгоритмы с поддержкой GPU (особенно c полноценной реализацией режима multi-threaded GPU) показали резкий прирост производительности. Например, на градиентном бустинге в Сatboost был зафиксирован 30-кратный прирост, а на XGBOOST в H2O – 20-кратный.

По итогам тестирования, а также с учетом активного развития проекта open-source RAPIDS, поддерживаемого NVIDIA (там все больше алгоритмов переносится на GPU), заказчик принял решение о внедрении NVIDIA DGX-2. После разработки точных технических требований два комплекса DGX-2 были поставлены в дата-центр.

Миграция боевых моделей искусственного интеллекта на production-платформу DGX-2 подтвердила успешные результаты пилотного тестирования и показала дополнительный прирост производительности за счет более мощного железа DGX-2. Появилось окно возможностей для наращивания функционала. Например, переход с еженедельной на ежедневную технологию полного обучения моделей, значительное увеличение количества факторов и возможности «эшелонирования» моделей, использование новых ресурсоемких алгоритмов для повышения качества прогноза и результатов классификации.

Немного цифр: если на прежнем «железе» обучение модели продолжалось 12 часов, то на DGX-2 – всего 2,5 часа. После обучения инференс, занимавший на прежнем железе 36 часов, завершился на DGX-2 через 4 часа.

Экспертиза Softline

Программно-аппаратный комплекс, который мы поставили, не имеет аналогов в России, а его продвижением на отечественный рынок занимаются лишь несколько партнеров NVIDIA, среди которых – Softline. На текущий момент Softline имеет наивысший на рынке вендорский статус ELITE. 

Портфель продуктов и сервисов Softline постоянно пополняется собственными и вендорскими решениями в области искусственного интеллекта. Мы можем предложить заказчикам такое решение как SuperPod – кластер с вычислительной частью DGX, устройствами хранения и скоростной сетевой инфраструктурой.

Большая и важная категория наших заказчиков – университеты. АГНИ (Альметьевский государственный нефтяной институт) решает на железе NVIDIA задачи геологоразведки, в Институте прикладной семиотики Татарстана разрабатывают русско-татарский переводчик, в Санкт-Петербургском государственном электротехническом университете «ЛЭТИ» – обучают новых специалистов согласно указу Президента.

 

Теги:

Новости, истории и события
Смотреть все
Акционеры ПАО «Софтлайн» в ходе Годового общего собрания приняли решение впервые выплатить дивиденды
Новости

Акционеры ПАО «Софтлайн» в ходе Годового общего собрания приняли решение впервые выплатить дивиденды

26.06.2026

ГК Softline и НГТУ НЭТИ объединяют усилия в подготовке ИТ-кадров
Новости

ГК Softline и НГТУ НЭТИ объединяют усилия в подготовке ИТ-кадров

25.06.2026

Bell Integrator FabricaONE.AI (акционер – ГК Softline) обеспечил доступность 99,99% критичным сервисам ведущего банка
Новости

Bell Integrator FabricaONE.AI (акционер – ГК Softline) обеспечил доступность 99,99% критичным сервисам ведущего банка

25.06.2026

ENTERCHAIN fabricaONE.AI  (акционер – ГК Softline) помогла компании Greiner повысить компетенции в управлении цепочками поставок и развитии процессов планирования на российских производственных площадках
Новости

ENTERCHAIN fabricaONE.AI (акционер – ГК Softline) помогла компании Greiner повысить компетенции в управлении цепочками поставок и развитии процессов планирования на российских производственных площадках

24.06.2026

СберТех и fabricaOne.AI (акционер - ГК Softline) предложат рынку корпоративные решения для работы с данными
Новости

СберТех и fabricaOne.AI (акционер - ГК Softline) предложат рынку корпоративные решения для работы с данными

24.06.2026

Софтлайн Решения (ГК Softline) и компания «Перспективный мониторинг» открыли киберполигон Ampire в Краснодарском университете МВД России
Новости

Софтлайн Решения (ГК Softline) и компания «Перспективный мониторинг» открыли киберполигон Ampire в Краснодарском университете МВД России

23.06.2026

ГК Softline и ГК «Аквариус» объединяют усилия для обеспечения технологической независимости госсектора и предприятий
Новости

ГК Softline и ГК «Аквариус» объединяют усилия для обеспечения технологической независимости госсектора и предприятий

23.06.2026

ГК Softline представит архитектуру защищенного ИИ и АСУ ТП на РИБ-2026
Новости

ГК Softline представит архитектуру защищенного ИИ и АСУ ТП на РИБ-2026

23.06.2026

ПАО «Софтлайн» продолжит обратный выкуп акций Компании
Новости

ПАО «Софтлайн» продолжит обратный выкуп акций Компании

22.06.2026

Команда ПАО «Софтлайн» приняла участие в Smart-Lab Conf 2026
Новости

Команда ПАО «Софтлайн» приняла участие в Smart-Lab Conf 2026

22.06.2026

«Софтлайн Решения» (ГК Softline) оснастила московский колледж симуляторами БПЛА
Новости

«Софтлайн Решения» (ГК Softline) оснастила московский колледж симуляторами БПЛА

22.06.2026

SL Soft fabricaONE.AI (акционер — ГК Softline) развивает семантический поиск и интеллектуального помощника в платформе Citeck
Новости

SL Soft fabricaONE.AI (акционер — ГК Softline) развивает семантический поиск и интеллектуального помощника в платформе Citeck

22.06.2026

ГК Softline представила инновационные решения на Всероссийском форуме-выставке «ГОСЗАКАЗ»
Новости

ГК Softline представила инновационные решения на Всероссийском форуме-выставке «ГОСЗАКАЗ»

19.06.2026

«Инферит» (кластер «СФ Тех» ГК Softline) и АО «Информатика» создадут комплексное решение для управления ИТ-инфраструктурой
Новости

«Инферит» (кластер «СФ Тех» ГК Softline) и АО «Информатика» создадут комплексное решение для управления ИТ-инфраструктурой

19.06.2026

ГК Softline и Deeray расширяют стратегическое партнерство в сфере ИИ-аналитики клиентских коммуникаций
Новости

ГК Softline и Deeray расширяют стратегическое партнерство в сфере ИИ-аналитики клиентских коммуникаций

19.06.2026

Группа «Борлас» (ГК Softline), включая BeringPro, заняла 1-е место в рэнкинге RAEX в сегменте управленческого ИТ-консалтинга
Новости

Группа «Борлас» (ГК Softline), включая BeringPro, заняла 1-е место в рэнкинге RAEX в сегменте управленческого ИТ-консалтинга

18.06.2026

ActiveCloud запускает комплексное сопровождение кластеров Kubernetes
Новости

ActiveCloud запускает комплексное сопровождение кластеров Kubernetes

18.06.2026

VPG LaserONE (кластер «СФ Тех» ГК Softline) представила отечественные лазерные решения для промышленности, медицины и телекома на выставке технологического лидерства в Совете Федерации
Новости

VPG LaserONE (кластер «СФ Тех» ГК Softline) представила отечественные лазерные решения для промышленности, медицины и телекома на выставке технологического лидерства в Совете Федерации

18.06.2026

Аутсорсинг ИТ. 10 задач, которые выгоднее передать внешнему партнеру
Блог

Аутсорсинг ИТ. 10 задач, которые выгоднее передать внешнему партнеру

26.06.2026

Как быстро купить лицензионное ПО: пошаговая инструкция
Блог

Как быстро купить лицензионное ПО: пошаговая инструкция

25.06.2026

Почему промышленный ИИ остается локальным инструментом — и что с этим делать
Блог

Почему промышленный ИИ остается локальным инструментом — и что с этим делать

18.06.2026

Новые ИТ-льготы и запреты, ИИ в судах, дроны в медицине, контроль чипов и возвращение Roblox
Блог

Новые ИТ-льготы и запреты, ИИ в судах, дроны в медицине, контроль чипов и возвращение Roblox

11.06.2026

Облако на OpenStack: готовая замена VMware для бизнеса и госсектора
Блог

Облако на OpenStack: готовая замена VMware для бизнеса и госсектора

09.06.2026

ТОП-5 российских систем видеоконференцсвязи в 2026 году: сравнение особенностей и преимуществ
Блог

ТОП-5 российских систем видеоконференцсвязи в 2026 году: сравнение особенностей и преимуществ

04.06.2026

Как выбрать систему инвентаризации, учета и контроля ИТ-инфраструктуры: обзор 5 российских решений
Блог

Как выбрать систему инвентаризации, учета и контроля ИТ-инфраструктуры: обзор 5 российских решений

01.06.2026

Главные ИТ-новости недели 29.05.2026
Блог

Главные ИТ-новости недели 29.05.2026

29.05.2026

ИИ в образовании 2026: практика, инфраструктура, регулирование
Блог

ИИ в образовании 2026: практика, инфраструктура, регулирование

22.05.2026

Управление программными активами (SAM) — как эффективно распоряжаться ИТ-активами, избежать штрафов и выполнить требования регуляторов
Блог

Управление программными активами (SAM) — как эффективно распоряжаться ИТ-активами, избежать штрафов и выполнить требования регуляторов

19.05.2026

Как меняется инфраструктура образования: опыт российских школ
Блог

Как меняется инфраструктура образования: опыт российских школ

13.05.2026

Главные ИТ-новости недели 08.05.2026
Блог

Главные ИТ-новости недели 08.05.2026

08.05.2026

Электронные подписи в 2026: получить по биометрии, обновить «КриптоПро» и избежать штрафов
Блог

Электронные подписи в 2026: получить по биометрии, обновить «КриптоПро» и избежать штрафов

06.05.2026

Как сократить расходы на облачную инфраструктуру: распределение нагрузок на практике
Блог

Как сократить расходы на облачную инфраструктуру: распределение нагрузок на практике

29.04.2026

ИТ-инфраструктура: как бизнес решает задачи отказоустойчивости и импортозамещения
Блог

ИТ-инфраструктура: как бизнес решает задачи отказоустойчивости и импортозамещения

22.04.2026

Лицензионный хаос: как избежать штрафов и навести порядок в ПО
Блог

Лицензионный хаос: как избежать штрафов и навести порядок в ПО

21.04.2026

Информационная безопасность в проектах «Софтлайн Решений»
Блог

Информационная безопасность в проектах «Софтлайн Решений»

17.04.2026

Главные ИТ-новости недели 10.04.2026
Блог

Главные ИТ-новости недели 10.04.2026

10.04.2026