MTDCGM

摩尔线程数据中心GPU管理器(MTDCGM)是一套用于在集群环境中管理和监控mthreads数据中心GPU的工具。它包括主动健康监控、全面的诊断、系统警报等功能。基础设施团队可以单独使用它,并且它能够轻松地与mthreads合作伙伴提供的集群管理工具、资源调度和监控产品集成。

资源下载

版本
说明
下载
MTDCGM v1.0.0
DCGM支持在x86_64平台上的Linux操作系统。安装包中包含了库、二进制文件、验证套件(MTVS),以及使用API(C、Python和Go)的源代码示例。
下载