GPU passthrough¶
Détection¶
anklume détecte le GPU via nvidia-smi :
- Présence du GPU
- Modèle (ex: RTX PRO 5000)
- VRAM totale et utilisée
Profils GPU¶
Quand un GPU est détecté, anklume crée automatiquement un profil
Incus gpu-passthrough :
Les machines avec gpu: true reçoivent ce profil automatiquement.
Politique GPU¶
Configurée dans anklume.yml :
graph LR
subgraph "exclusive (défaut)"
E1[1 seule instance GPU]
E2["Erreur si 2e instance<br/>demande le GPU"]
end
subgraph "shared"
S1[Instance A — GPU]
S2[Instance B — GPU]
S3["Warning affiché"]
end
style E1 fill:#3b82f6,color:#fff
style S1 fill:#eab308,color:#000
style S2 fill:#eab308,color:#000
| Mode | Comportement |
|---|---|
exclusive |
Une seule instance GPU à la fois, erreur sinon |
shared |
Plusieurs instances partagent le GPU, warning |
Validation¶
gpu: truesans GPU détecté → erreurgpu: trueavec politiqueexclusive+ autre instance GPU → erreur
Gestion VRAM¶
# Voir l'état VRAM
anklume ai status
# Décharger tous les modèles Ollama + arrêter llama-server
anklume ai flush
flush libère la VRAM en :
- Déchargeant les modèles Ollama (
/api/generateaveckeep_alive: 0) - Arrêtant llama-server si actif
- Mesurant la VRAM avant/après
Accès exclusif¶
L'état est stocké dans /var/lib/anklume/ai-access.json.