Москва
Мероприятия
Блог
Корзина
Регистрация Войти
main-bg
Блог

Российские суперкомпьютеры для искусственного интеллекта

Юлия Кальмаева
Юлия Кальмаева,
Менеджер департамента аппаратной архитектуры Softline
06.12.2024

Тем искусственного интеллекта как в мире, так и в России не теряет актуальности по сей день. Анонс федерального проекта «Искусственный интеллект» в рамках Национального проекта «Экономика данных и цифровая трансформация государства» лишний раз это подтверждает. В числе важных проблем, стоящих перед государством, было отмечено отсутствие необходимой вычислительной инфраструктуры для искусственного интеллекта (ИИ).

Для исправления сложившейся ситуации в сфере ИИ и развития российской ИТ-отрасли в целом на 2025-2030 годы в числе прочих были определены следующие задачи:

  1. Кратное увеличение объема вычислительных мощностей в сфере ИИ от текущей отметки 0,1 Экзафлопс.
  2. Значительный рост количества высококвалифицированных специалистов в сфере ИИ. Дефицит кадров планируется решать обучением 5 тыс. студентов по профильным инновационным программам. Также в планах проведение 60 хакатонов.

Зачем и где нужен искусственный интеллект?

Наука и университеты. Искусственный интеллект активно развивается в научной среде и высшем образовании, так как государство поддерживает научные сообщества грантами и форматом государственно-частного партнерства.

Промышленность. Как правило, промышленные предприятия пользуются заказной разработкой и услугами специалистов в области ИИ, привлекаемых из сторонних организаций.

Банки, телеком, транспорт, маркетинг. В 2024 году прошло много тендеров на серверы с видеокартами под нужды ИИ в банковской сфере, телекоме, транспорте, государственном секторе. Следует ожидать дальнейшего повышения спроса.

Медицина. По всем прогнозам, использование искусственного интеллекта в медицинской отрасли должно дать наибольший вау-эффект от внедрения, так как именно это скажется на продолжительности и качестве жизни населения.

Госструктуры. Использование искусственного интеллекта для видеоаналитики в целях повышения безопасности общественной среды, анализа качества и загруженности дорог, профилактики ДТП, помощи в аналитике и прогнозировании чрезвычайных ситуаций/преступлений.

Проблемы развития искусственного интеллекта в России

  1. Отсутствие обширной высоконагруженной инфраструктуры. Ее нет ни в государственном, ни в частном секторе. Вариант решение проблемы — использование облаков. На при таком варианте неизбежен вопрос — чью нейросеть мы обогащаем и обучаем собственными базами данных, и насколько эти базы данных защищены.
  2. Зависимость от Nvidia. Видеокарты A100 и H100 технологически и функционально созданы для работы с искусственных интеллектом, а специализированный софт Nvidia демонстрируют неизменно высокое качество. Но так как Россия сильна программистами, то создание собственного продукта, позволяющего распараллеливать задачи для сложных вычислений, является вопросом времени. В пользу этого процесса играют и санкционные риски, так как есть вероятность, что со временем Nvidia станет невозможно купить или активировать программную часть.
  3. Нехватка кадров для развития прогностических моделей ИИ, а также их недостаточная синергия с бизнесом и практикоориентированность.

 

Направления развития российского рынка железа для ИИ

Для работы с большими данными нужен фундамент — инфраструктура. Таким фундаментом для искусственного интеллекта является сервер с сопроцессорами — видеокартами. В начале 2024 года на Реестровом рынке железа не было подходящих для этого решений — только с 1-2 видеокартами. Под конец года появились варианты исполнения серверов с 4-8 видеокартами.

В дальнейшем ожидается развитие в следующих направлениях:

  • Развитие в направление программно-аппаратных комплексов (ПАК). Российские заказчики хотят получать под ключ оборудование hi-end класса и не думать о совместимости софта и железа. Реестр минпромторга наполняется ПАКами и это — тренд 2025 года.
  • Программные средства, решающие трудности с видеокартами.

Особенности архитектуры суперкомпьютеров

Архитектура суперкомпьютера представляет собой кластер с вычислениями на процессорах и сопроцессорах — видеокартах.

Современные российские суперкомпьютеры состоят из шести модулей:

  1. Управляющий узел из двухпроцессорных серверов Gen 4/5.
  2. Вычислительные узлы. Рекомендуется использовать гибридное исполнение — серверы без GPU и серверы с 2-4 видеокартами.
  3. Коммутаторы. Высокоскоростное соединение Ethernet 25G/100G в коммутаторах ядра SAN и коммутаторы внутренней сети InfiniBand.
  4. Система хранения данных.
  5. Система резервного копирования.
  6. Инженерная инфраструктура (шкафы, холодоснабжение, пожаротушение, источники бесперебойного питания, система безопасности и др.)

Железо для суперкомпьютеров

Видеокарты. В настоящее время лучше всего для суперкомпьютеров подходят видеокарты Nvidia Н100 и А100.

Процессоры. В российских суперкомпьютерах предпочтение отдается процессорам Gen4 и Gen5 в составе кластера. Общие преимущества таких процессоров:

  • Увеличенное количество ядер и объема кеша L3.
  • Скорость передачи данных ОЗУ DDR5 до 5600 МТ/с.
  • Возможность установки плат стандарта PCI-E5.0 и CXL.
  • Интеграция в процессоры Gen 4/5 технологии Advanced Matrix Extension (AMX), которая обеспечивает многократный (от 8 до 14 раз) прирост вычислительной мощности в задачах ИИ.

  • Технология гибкой настройки производительности SST-PP (SpeedSelect), которая позволяет гибко настраивать производительность. Процессоры с такой технологией имеют несколько преднастроенных профилей, каждый из которых задает количество активных ядер и базовую частоту процессора. Это позволяет иметь множество одинаковых серверов, конфигурируемых под текущие задачи.

Коммутаторы. Несмотря на то, что все результаты вычисления либо файловые, либо RAW (объекты) для коммутации используется Infiniband — блочный протокол. Он выбран как стандарт внутрикластерной сети в связи с меньшими задержками. Это действительно так и вот почему — несмотря на то, что инкапсуляция IP-стека в Infiniband вносит бóльшие задержки, чем тот же процесс в Ethernet, в Ethernet тратится куда больше времени на обработку пакетов в самих коммутаторах. По итогу общие показатели задержки у Infiniband оказываются ниже, чем в Ethernet. Поэтому, несмотря на всеобщее применение Ethernet для внутренней сети суперкомпьютеров, большинство суперкомпьютеров, представленных в топ-100, построены на Infiniband.

Это интересно!

Подсчет вычислительной производительности суперкомпьютеров

К подсчету вычислительной производительности суперкомпьютеров есть два подхода — расчет производительности процессоров и расчет производительности видеокарт.

Для видеокарт берутся табличные значения производительности. Правда, следует учитывать, что этот показатель посчитан с разной точностью — от BF16 до FP64.

  • Для больших языковых моделей (LLM) хватает BF16-FP16 (ChatGPT).
  • Для повседневных задач, включая рендеринг графики, обработку изображений и обучение нейросетей используется в основном FP32.
  • В случае, если предусмотрено дальнейшее дообучение системы, то следует выбирать максимальные значения точности FP64.

Для процессоров используются формула вычисления FP64 = F × n × p×10-6,  где F — тактовая частота процессора, n — количество ядер, p — количество операций с плавающей запятой за такт.

Важный момент: «р» у процессоров серии Ice Lake, Sapphire Rapids, и Emerald Rapids не равен стандартным 4, как для десктопных процессоров. р = 32 операции для двойной четности и 64 — для одинарной четности.

Например, у процессора P8462Y FP64 = 2800МГц*32*32*2/1000000 = 5.7344 для одного двухпроцессорного сервера с без GPU.

В серверах с GPU TFlops считаются как сумма вычислительных мощностей CPU+GPU.

Области применения суперкомпьютеров

Компьютерное зрение. Анализ поведения людей, технический контроль, алгоритмы обнаружения аномалий.

Обработка текста. Распознавание запроса для поиска информации. Уже сейчас появились новые профессии и обучающие программы на промт-менеджеров и промт-инженеров.

Синтез речи. Обработка голосовых запросов пользователей.

Принятие решения. Предиктивная аналитика, рекомендации по управлению, прогнозирование.

Новые методы ИИ. Робототехника, сенсорика.

Цифровые двойники. Машиностроение, градостроительство, транспорт, экология и медицина.

Выводы

ИТ-отрасль России в настоящее время испытывает мощный подъем, несмотря на санкции и даже благодаря им. Ее развитие подстегнул процесс импортозамещения. Некоторое отставание компенсируется со временем, чему в немалой степени помогут принятые государством программы, направленные на стимулирование ИТ-сферы.

Искусственный интеллект — одно из перспективных и востребованных направлений развития. И это учитывается в федеральном проекте «Искусственный интеллект».

Современной базой для суперкомпьютеров для ИИ являются серверы на процессорах Gen 4/5, в составе которых насчитывается до четырех видеокарт. Такие решения уже есть в реестровом исполнении на отечественном рынке. Проблемы, связанные с импортными видеокартами, в перспективе планируется решать с помощью отечественного программного обеспечения.

За помощью в выборе решений для ИИ и консультациями по актуальным технологиям обращайтесь к Юлии Кальмаевой по email: Yuliya.kalmaeva@softline.com.

Теги:

Новости, истории и события
Смотреть все
Академия Softline запускает первую в России корпоративную программу по безопасности систем машинного обучения
Новости

Академия Softline запускает первую в России корпоративную программу по безопасности систем машинного обучения

14.03.2025

ГК Softline стала платиновым партнером UserGate
Новости

ГК Softline стала платиновым партнером UserGate

13.03.2025

SL Soft (ГК Softline) представила обновления платформы ROBIN и цифрового ассистента
Новости

SL Soft (ГК Softline) представила обновления платформы ROBIN и цифрового ассистента

12.03.2025

В «Цитрос ЮЗ ЭДО» от SL Soft (ГК Softline) поддержаны новые правила работы по упрощенной системе налогообложения
Новости

В «Цитрос ЮЗ ЭДО» от SL Soft (ГК Softline) поддержаны новые правила работы по упрощенной системе налогообложения

11.03.2025

Провайдер «Инферит Облако» (ГК Softline) защитит данные клиентов с помощью DRaaS
Новости

Провайдер «Инферит Облако» (ГК Softline) защитит данные клиентов с помощью DRaaS

11.03.2025

Провайдер «Инферит Облако» (ГК Softline) представил новый интерфейс для управления облачными ресурсами
Новости

Провайдер «Инферит Облако» (ГК Softline) представил новый интерфейс для управления облачными ресурсами

10.03.2025

Провайдер «Инферит Облако» (ГК Softline) заключил технологическое партнерство с MIND Software
Новости

Провайдер «Инферит Облако» (ГК Softline) заключил технологическое партнерство с MIND Software

07.03.2025

ГК Softline объявляет о смене названия компании НТО «ИРЭ-Полюс» на VPG Laserone с 7 марта 2025 года
Новости

ГК Softline объявляет о смене названия компании НТО «ИРЭ-Полюс» на VPG Laserone с 7 марта 2025 года

07.03.2025

ГК Softline оснастила новый корпус центра детского (юношеского) технического творчества «Охта» в Санкт-Петербурге
Новости

ГК Softline оснастила новый корпус центра детского (юношеского) технического творчества «Охта» в Санкт-Петербурге

06.03.2025

Bell Integrator (ГК Softline) провела конференцию «Автоматизация тестирования в ИТ»
Новости

Bell Integrator (ГК Softline) провела конференцию «Автоматизация тестирования в ИТ»

05.03.2025

Подтверждена совместимость UDV ITM и UDV DATAPK Industrial Kit с ОС семейства «МСВСфера» (ГК Softline)
Новости

Подтверждена совместимость UDV ITM и UDV DATAPK Industrial Kit с ОС семейства «МСВСфера» (ГК Softline)

04.03.2025

Ирина Назаренко возглавит направление «Инферит ОС» (ГК Softline)
Новости

Ирина Назаренко возглавит направление «Инферит ОС» (ГК Softline)

04.03.2025

FastFox перешел на отечественную ОС «МСВСфера Сервер» 9 от «Инферит» (ГК Softline)
Новости

FastFox перешел на отечественную ОС «МСВСфера Сервер» 9 от «Инферит» (ГК Softline)

03.03.2025

Российский ИТ-вендор «Инферит» (ГК Softline) вошел в АРПЭ
Новости

Российский ИТ-вендор «Инферит» (ГК Softline) вошел в АРПЭ

03.03.2025

ГК Softline снова запускает программу обучения «ИТ — твоё место работы» для менеджеров по продажам
Новости

ГК Softline снова запускает программу обучения «ИТ — твоё место работы» для менеджеров по продажам

03.03.2025

Российский производитель лазеров НТО «ИРЭ-Полюс» (ГК Softline) принял участие в международном мероприятии SUAC-2025 – 36‑й конференции Саудовской урологической ассоциации
Новости

Российский производитель лазеров НТО «ИРЭ-Полюс» (ГК Softline) принял участие в международном мероприятии SUAC-2025 – 36‑й конференции Саудовской урологической ассоциации

28.02.2025

Академия Softline объявляет о стратегическом партнерстве с Arenadata и развитии направления Data Science
Новости

Академия Softline объявляет о стратегическом партнерстве с Arenadata и развитии направления Data Science

28.02.2025

ГК Softline реализовала комплексное оснащение школ-новостроек в Ставрополе
Новости

ГК Softline реализовала комплексное оснащение школ-новостроек в Ставрополе

28.02.2025

Инновации в школах в 2025 году: 3D-модели, БПЛА, роботы и VR
Блог

Инновации в школах в 2025 году: 3D-модели, БПЛА, роботы и VR

14.03.2025

Инвестиции в цифровизацию ритейла: стратегии 2025 года
Блог

Инвестиции в цифровизацию ритейла: стратегии 2025 года

11.03.2025

Топ-редакторы для работы с PDF — сравниваем программы
Блог

Топ-редакторы для работы с PDF — сравниваем программы

04.03.2025

Российские офисные системы: выбор и преимущества
Блог

Российские офисные системы: выбор и преимущества

03.03.2025

Softline Assessment и СУБД Tantor: мощный тандем для диагностики инфраструктуры
Блог

Softline Assessment и СУБД Tantor: мощный тандем для диагностики инфраструктуры

26.02.2025

Интервью ГК Softline и «Базальт СПО»: сервис Softline Enterprise Agreement — инфраструктура заказчика из единого окна
Блог

Интервью ГК Softline и «Базальт СПО»: сервис Softline Enterprise Agreement — инфраструктура заказчика из единого окна

24.02.2025

ИИ-тренды в промышленности: от цифровых ассистентов до умных АСУ ТП
Блог

ИИ-тренды в промышленности: от цифровых ассистентов до умных АСУ ТП

20.02.2025

Как эффективно защитить инфраструктуру компании от DDoS-атак?
Блог

Как эффективно защитить инфраструктуру компании от DDoS-атак?

14.02.2025

ИТ-тренды в образовании: с чем идем в 2025 год
Блог

ИТ-тренды в образовании: с чем идем в 2025 год

11.02.2025

Программирование без кода: как с помощью No-Code и Low-Code адаптировать Service Desk под любые задачи
Блог

Программирование без кода: как с помощью No-Code и Low-Code адаптировать Service Desk под любые задачи

04.02.2025

Егор Кукушкин (Группа «Борлас»): «Отечественный рынок смог в существенной степени переориентироваться на импортозамещение»
Блог

Егор Кукушкин (Группа «Борлас»): «Отечественный рынок смог в существенной степени переориентироваться на импортозамещение»

04.02.2025

Юрий Латин, Bell Integrator: Будущее заказной разработки перспективное, и не только из-за импортозамещения
Блог

Юрий Латин, Bell Integrator: Будущее заказной разработки перспективное, и не только из-за импортозамещения

04.02.2025

Стек российских технологий из одного «окна»: как выгодно импортозаместить ПО с Softline Enterprise Agreement
Блог

Стек российских технологий из одного «окна»: как выгодно импортозаместить ПО с Softline Enterprise Agreement

04.02.2025

Как технологии no-code ускоряют внедрение цифровых двойников
Блог

Как технологии no-code ускоряют внедрение цифровых двойников

03.02.2025

Как оснастить школу в соответствии с приказом № 838: руководство для строительных компаний
Блог

Как оснастить школу в соответствии с приказом № 838: руководство для строительных компаний

29.01.2025

Рынок BPM-систем вчера, сегодня, завтра
Блог

Рынок BPM-систем вчера, сегодня, завтра

28.01.2025

Дата-центры в России: тенденции и перспективы
Блог

Дата-центры в России: тенденции и перспективы

13.01.2025

Как эффективно внедрить стандарты ГОСТ в организацию: этапы и советы
Блог

Как эффективно внедрить стандарты ГОСТ в организацию: этапы и советы

12.01.2025