如何通过 Prometheus 监控 Kubernetes 的 GPU 资源?
如何通过 Prometheus 监控 Kubernetes 的 GPU 资源?
发布于:1年前 (2025-03-14) IP属地:四川省
1 个回答
1、部署 DCGM Exporter 或 NVIDIA GPU Operator,暴露 GPU 指标。
2、Prometheus 抓取对应指标并配置告警规则。
2、Prometheus 抓取对应指标并配置告警规则。
发布于:1年前 (2025-03-14) IP属地:四川省
我来回答
您需要 登录 后回答此问题!
