Главная » 2012»Ноябрь»02 » Использование Ganglia для мониторинга производительности GPU
17:53
Использование Ganglia для мониторинга производительности GPU
Диаграммы Ganglia показывают метрики состояния и производительности, которые собираются при помощи sFlow.
Комбинация Ganglia и sFlow позволяет создать масштабируемое решение для мониторинга производительности больших компьютерных кластеров на базе GPU, исключая необходимость сбора GPU-метрик. Вместо этого все метрики хоста и GPU эффективно принудительно направляются прямо в центральный коллектор Ganglia. Эта копия экрана показывает новые метрики GPU, включая: • Процессы • Утилизация GPU • Утилизацию памяти • Ошибки ECC • Питание • Температуру Подробно основные шаги, которые необходимо предпринять для конфигурирования Ganglia как коллектора sFlow описаны в статье Ganglia 3.2 released. После конфигурирования Ganglia будет автоматически обнаруживать и отслеживать новые серверы по мере их добавления в сеть.
Примечание: Поддержка метрик GPU в Ganglia доступна только в случае, если вы скомпилируете gmond из последнего кода.