Перейти к содержанию

GPU в Bootsman

Общая информация

Внимание!

Использование GPU возможно только в подчиненных кластерах.

Внимание!

При использовании GPU в Yandex Cloud необходимо указывать количество gpus, cores и memory в соответствии документацией.

Внимание!

Для работы vsphere или baremetal внутри vsphere потребуются дополнительные настройки для Golden Image.
Ознакомьтесь с главой GPU

Для работы с графическими устройствами потребуется создать WorkerPool с дополнительными настройками.

Мы рекомендуем создавать WorkerPool с gpu минимум 2-м, чтобы необходимые для функционирования платформы сервисы не забирали вычислительные ресурсы узлов с gpu.

Для создания подчиненного кластера можно воспользоваться одной из инструкций:

  1. Baremetal

  2. VMWare vCenter

  3. Yandex Cloud

  4. VK cloud

Создание WorkerPool для GPU

Создание с помощью установщика Bootsman

Заполните форму создания подчиненного кластера в соответствии с инструкцией.

Далее создайте дополнительный WorkerPool

Add Worker Pool

Создание с помощью yaml-манифестов

Стандартный Yaml для подчиненного кластера.

Добавьте в ваш yaml дополнительные опции:

...
spec:
  infrastructure:
    bareMetalProviderConfig:
      resources:
        requests:
          gpu: ${GPU_REQUEST}
...
Где:

- ${GPU_REQUEST} - минимальное число графических ядер доступных на узле;

Стандартный Yaml для подчиненного кластера.

Vsphere провайдер поддерживает только работу gpu Nvidia Tesla A100

Добавьте в ваш yaml дополнительные опции:

...
spec:
  infrastructure:
    vsphereConfig:
      gpu:
        device: A100
        vendor: nvidia
...

Стандартный Yaml для подчиненного кластера.

Выберите необходимый вам platformId и укажите gpus, cores и memory согласно таблице для выбранной платформы

spec:
  infrastructure:
    yandexConfig:
      gpus: 1
      cores: 4
      memory: 16
      platformId: standard-v3-t4i

Стандартный Yaml для подчиненного кластера.

Используйте значения для flavorRef в соотвествии с документацией VK Cloud

Заметка

После успешного создания подчиненного кластера, модуль GPU будет добавлен автоматически. В редких случаях может потребоваться дополнительная настройка.

Настройка модуля

Add Addon

YAML
  enabled: ${GPU_ENABLED}
  driverEnabled: ${GPU_DRIVER_ENABLED}
  driverVersion: ${DRIVER_VERSION}
  driverEnv:
    - name: CUSTOM_ASTRALINUX_REPOSITORIES
      value: |
        deb http://download.astralinux.ru/astra/stable/1.7_x86-64/repository-main/ 1.7_x86-64 main contrib non-free

        deb http://download.astralinux.ru/astra/stable/1.7_x86-64/repository-update/ 1.7_x86-64 main contrib non-free

        deb http://download.astralinux.ru/astra/stable/1.7_x86-64/repository-base/ 1.7_x86-64 main contrib non-free

        deb http://download.astralinux.ru/astra/stable/1.7_x86-64/repository-extended/ 1.7_x86-64 main contrib non-free

        deb http://dl.astralinux.ru/astra/frozen/1.7_x86-64/1.7.5/repository-update/ 1.7_x86-64 main contrib non-free

        deb http://dl.astralinux.ru/astra/frozen/1.7_x86-64/1.7.5/uu/1/repository-update/ 1.7_x86-64 main contrib non-free
Параметр Описание Комментарий
${GPU_ENABLED} Включение политики При правильном создании WorkerPool конфигурация добавится автоматически. Можно выключить
${GPU_DRIVER_ENABLED} Включение драйвера
${DRIVER_VERSION} Версия драйвера
driverEnv Дополнительные параметры окружения для драйвера
CUSTOM_ASTRALINUX_REPOSITORIES Дополнительные репозитории для Astra Не конфликтует при использовании другой ОС