Utiliser les fGPU avec OKS

Vous pouvez utiliser des GPU NVIDIA dans vos clusters OKS grâce à l’allocation de flexible GPU (fGPU). La configuration adéquate de vos node pools permet à vos worker nodes d’allouer, d’attacher et d’utiliser des fGPU.

Actuellement, OKS permet d’attacher 1 GPU par node.

Activer la prise en charge de GPU avec votre manifeste de node pool

Pour utiliser des fGPU avec vos worker nodes, vous devez appliquer un manifeste Kubernetes à votre node pool. Il doit contenir le champ fgpu et suivre la syntaxe suivante :

Exemple de manifeste
apiVersion: oks.dev/v1beta2
kind: NodePool
metadata:
  name: application-pool2-a
spec:
  desiredNodes: 2
  nodeType: tinav5.c2r4p1
  fgpu:
    model: "nvidia-p6"
    k8s-operator: true
  zones:
    - eu-west-2a
  upgradeStrategy:
    maxUnavailable: 1
    maxSurge: 0
    autoUpgradeEnabled: false
  autoHealing: true

Vous pouvez configurer la prise en charge de GPU en précisant les caractéristiques suivantes sous la section spec de votre manifeste de node pool.

Exemple de spec fgpu
spec:
  fgpu:
    model: "nvidia-p6"
    k8s-operator: true

Cet exemple contient les champs suivants que vous devez spécifier :

  • model : Le modèle de GPU à allouer.

  • k8s-operator : Indique si l’opérateur GPU officiel de NVIDIA dans le namespace gpu-operator est installé sur le cluster (true | false).

    La suppression du node pool ne désinstalle pas l’opérateur.

Modèles de fGPU pris en charge

OKS prend en charge les modèles de fGPU suivants, proposés par 3DS OUTSCALE :

  • nvidia-a100

  • nvidia-a100-80

  • nvidia-h100

  • nvidia-l40

  • nvidia-m60

  • nvidia-p6

  • nvidia-p100

  • nvidia-v100

Pour en savoir plus sur ces modèles, voir À propos des flexible GPU > Modèles de fGPU.

Vous devez vous assurer que le modèle de fGPU choisi est pris en charge par le type de VM défini lors de la création de votre node pool. Si le modèle de fGPU et le type de VM sont incompatibles, les GPU alloués peuvent ne pas parvenir à s’attacher. Après 3 tentatives infructueuses, la VM peut également ne pas parvenir à démarrer.

Pages connexes