GPU в Bootsman
Общая информация
Внимание!
Использование GPU возможно только в подчиненных кластерах.
Внимание!
При использовании GPU в Yandex Cloud необходимо указывать количество gpus, cores и memory в соответствии документацией.
Внимание!
Для работы vsphere или baremetal внутри vsphere потребуются дополнительные настройки для Golden Image.
Ознакомьтесь с главой GPU
Для работы с графическими устройствами потребуется создать WorkerPool с дополнительными настройками.
Мы рекомендуем создавать WorkerPool с gpu минимум 2-м, чтобы необходимые для функционирования платформы сервисы не забирали вычислительные ресурсы узлов с gpu.
Для создания подчиненного кластера можно воспользоваться одной из инструкций:
Создание WorkerPool для GPU
Создание с помощью установщика Bootsman
Заполните форму создания подчиненного кластера в соответствии с инструкцией.
Далее создайте дополнительный WorkerPool
Создание с помощью yaml-манифестов
Стандартный Yaml для подчиненного кластера.
Добавьте в ваш yaml дополнительные опции:
...
spec:
infrastructure:
bareMetalProviderConfig:
resources:
requests:
gpu: ${GPU_REQUEST}
...
- ${GPU_REQUEST} - минимальное число графических ядер доступных на узле;
Стандартный Yaml для подчиненного кластера.
Vsphere провайдер поддерживает только работу gpu Nvidia Tesla A100
Добавьте в ваш yaml дополнительные опции:
...
spec:
infrastructure:
vsphereConfig:
gpu:
device: A100
vendor: nvidia
...
Стандартный Yaml для подчиненного кластера.
Выберите необходимый вам platformId и укажите gpus, cores и memory согласно таблице для выбранной платформы
spec:
infrastructure:
yandexConfig:
gpus: 1
cores: 4
memory: 16
platformId: standard-v3-t4i
Стандартный Yaml для подчиненного кластера.
Используйте значения для flavorRef в соотвествии с документацией VK Cloud
Заметка
После успешного создания подчиненного кластера, модуль GPU будет добавлен автоматически. В редких случаях может потребоваться дополнительная настройка.
Настройка модуля
YAML
enabled: ${GPU_ENABLED}
driverEnabled: ${GPU_DRIVER_ENABLED}
driverVersion: ${DRIVER_VERSION}
driverEnv:
- name: CUSTOM_ASTRALINUX_REPOSITORIES
value: |
deb http://download.astralinux.ru/astra/stable/1.7_x86-64/repository-main/ 1.7_x86-64 main contrib non-free
deb http://download.astralinux.ru/astra/stable/1.7_x86-64/repository-update/ 1.7_x86-64 main contrib non-free
deb http://download.astralinux.ru/astra/stable/1.7_x86-64/repository-base/ 1.7_x86-64 main contrib non-free
deb http://download.astralinux.ru/astra/stable/1.7_x86-64/repository-extended/ 1.7_x86-64 main contrib non-free
deb http://dl.astralinux.ru/astra/frozen/1.7_x86-64/1.7.5/repository-update/ 1.7_x86-64 main contrib non-free
deb http://dl.astralinux.ru/astra/frozen/1.7_x86-64/1.7.5/uu/1/repository-update/ 1.7_x86-64 main contrib non-free
| Параметр | Описание | Комментарий |
|---|---|---|
| ${GPU_ENABLED} | Включение политики | При правильном создании WorkerPool конфигурация добавится автоматически. Можно выключить |
| ${GPU_DRIVER_ENABLED} | Включение драйвера | |
| ${DRIVER_VERSION} | Версия драйвера | |
| driverEnv | Дополнительные параметры окружения для драйвера | |
| CUSTOM_ASTRALINUX_REPOSITORIES | Дополнительные репозитории для Astra | Не конфликтует при использовании другой ОС |

