如何通过 Prometheus 监控 Kubernetes 的 GPU 资源?

提问者:Rae 问题分类:面试刷题
如何通过 Prometheus 监控 Kubernetes 的 GPU 资源?
1 个回答
永不落的梦想
永不落的梦想
1、部署 DCGM Exporter 或 NVIDIA GPU Operator,暴露 GPU 指标。
2、Prometheus 抓取对应指标并配置告警规则。
发布于:3天前 IP属地:四川省
我来回答