www.samag.ru
     
Поиск   
              
 www.samag.ru    Web  0 товаров , сумма 0 руб.
E-mail
Пароль  
 Запомнить меня
Регистрация | Забыли пароль?
Журнал "Системный администратор"
Журнал «БИТ»
Подписка
Архив номеров
Где купить
Авторам
Рекламодателям
Контакты
   

  Опросы
  Статьи

Автоматизация  

Автоматизируем рутину: что реально работает?

Многие сисадмины автоматизировали что-то за последний год. Но далеко не все остались

 Читать далее...

Защита ИТ-системы  

Практическая защита: что вы внедрили и что мешает?

Какие меры безопасности реально внедрить в реальных условиях – и что не

 Читать далее...

Вопрос-ответ  

Обеспечиваем безопасную эксплуатацию базы данных

Что для вас чаще всего является причиной инцидентов с БД? Как вы

 Читать далее...

Книжная полка  

От «безопасного» Linux до Контролируемого взлома

Издательство «БХВ» продолжает радовать читателей интересными новинками и в наступившем году. Вы можете

 Читать далее...

1001 и 1 книга  
19.03.2018г.
Просмотров: 12220
Комментарии: 0
Машинное обучение с использованием библиотеки Н2О

 Читать далее...

12.03.2018г.
Просмотров: 12344
Комментарии: 0
Особенности киберпреступлений в России: инструменты нападения и защита информации

 Читать далее...

12.03.2018г.
Просмотров: 9812
Комментарии: 0
Глубокое обучение с точки зрения практика

 Читать далее...

12.03.2018г.
Просмотров: 5529
Комментарии: 0
Изучаем pandas

 Читать далее...

12.03.2018г.
Просмотров: 6398
Комментарии: 0
Программирование на языке Rust (Цветное издание)

 Читать далее...

19.12.2017г.
Просмотров: 6261
Комментарии: 0
Глубокое обучение

 Читать далее...

19.12.2017г.
Просмотров: 9126
Комментарии: 0
Анализ социальных медиа на Python

 Читать далее...

19.12.2017г.
Просмотров: 5712
Комментарии: 0
Основы блокчейна

 Читать далее...

19.12.2017г.
Просмотров: 5915
Комментарии: 0
Java 9. Полный обзор нововведений

 Читать далее...

16.02.2017г.
Просмотров: 10091
Комментарии: 0
Опоздавших не бывает, или книга о стеке

 Читать далее...

17.05.2016г.
Просмотров: 13483
Комментарии: 0
Теория вычислений для программистов

 Читать далее...

30.03.2015г.
Просмотров: 14967
Комментарии: 0
От математики к обобщенному программированию

 Читать далее...

18.02.2014г.
Просмотров: 16726
Комментарии: 0
Рецензия на книгу «Читаем Тьюринга»

 Читать далее...

13.02.2014г.
Просмотров: 11570
Комментарии: 0
Читайте, размышляйте, действуйте

 Читать далее...

12.02.2014г.
Просмотров: 9575
Комментарии: 0
Рисуем наши мысли

 Читать далее...

10.02.2014г.
Просмотров: 7811
Комментарии: 4
Страна в цифрах

 Читать далее...

18.12.2013г.
Просмотров: 6968
Комментарии: 0
Большие данные меняют нашу жизнь

 Читать далее...

18.12.2013г.
Просмотров: 5800
Комментарии: 0
Компьютерные технологии – корень зла для точки роста

 Читать далее...

04.12.2013г.
Просмотров: 5429
Комментарии: 0
Паутина в облаках

 Читать далее...

03.12.2013г.
Просмотров: 5774
Комментарии: 1
Рецензия на книгу «MongoDB в действии»

 Читать далее...

Друзья сайта  

 Повышение эффективности использования GPU в кластерах Kubernetes для рабочих нагрузок AI/ML

Архив номеров / 2026 / Выпуск №1-2 (278-279) / Повышение эффективности использования GPU в кластерах Kubernetes для рабочих нагрузок AI/ML

Рубрика: Наука и технологии /  Раздел для научных публикаций

Матушкин Д.Р.,
студент, НИУ ВШЭ, matushkin2003@list.ru

 

Повышение эффективности
использования GPU в кластерах Kubernetes для рабочих нагрузок AI/ML

В работе исследуются подходы к повышению использования GPU в Kubernetes для рабочих нагрузок AI/ML за счет совместного использования и дробления видеокарт. Даны обзор подходов, сравнение изоляции нагрузок и эксперимент с совместным инференсом embedding модели и LLM в RAG сценарии на одном GPU.

 

Введение

AI/ML практик увеличило спрос на GPU и сделало их одними из самых дорогих и дефицитных элементов вычислительной инфраструктуры. Поскольку стоимость владения GPU во многом определяется тем, насколько полно устройства загружены, для организаций становится критичным уметь повышать утилизацию этих ресурсов при сохранении предсказуемости работы нагрузок.

Во многих командах GPU нагрузки запускаются в Kubernetes, который обеспечивает единый способ доставки, масштабирования и изоляции контейнеров. При этом стандартная модель выделения GPU в Kubernetes по умолчанию опирается на целочисленный ресурс: GPU запрашивается через «resources.limits», планировщик исходит из этого значения, а «долю GPU» в виде стандартного ресурса указать нельзя. На практике это означает, что даже небольшой инференс сервис может занять целый GPU, хотя фактически использует лишь часть вычислительных возможностей устройства.

Следствием становится систематическое недоиспользование дорогостоящего оборудования [1, 2] и рост совокупной стоимости AI/ML платформы [3]: вместо повышения плотности размещения и управляемости ресурсов организации нередко вынуждены наращивать общий объем GPU для реализации всех этапов жизненного цикла моделей машинного обучения.

Один из рабочих путей улучшения ситуации — внедрение механизмов совместного использования и дробления GPU, которые делают возможным запуск нескольких независимых нагрузок на одном физическом ускорителе. В Kubernetes такие подходы обычно реализуются через экосистему NVIDIA (device plugin и связанные компоненты) и поддерживаемые режимы дробления, при которых один GPU может быть разделён на несколько независимых GPU экземпляров.

Цель данной работы — исследовать методы повышения эффективности использования GPU в Kubernetes кластерах за счёт внедрения механизмов шаринга и дробления GPU для AI/ML нагрузок, а также проверить эффективность изоляции нагрузок и рассмотреть вариант применения данных технологий.

Рассмотрим три подхода дробления видеокарты, которые частично взаимозаменяемы по цели (повышение плотности размещения и утилизации), но различаются по механизму разделения и уровню изоляции:

  • Nvidia Time-Slicing;
  • Nvidia MIG;
  • Nvidia MPS.

 

<...>

Ключевые слова: GPU, Nvidia, MIG, Time-Slicing, MPS, RAG, AI, ML, LLM


Полную версию статьи читайте в журнале
Подпишитесь на журнал

Комментарии отсутствуют

Добавить комментарий

Комментарии могут оставлять только зарегистрированные пользователи

               Copyright © Системный администратор

Яндекс.Метрика
Tel.: (499) 277-12-45
E-mail: sa@samag.ru