Hadoop - программное обеспечение класса open source для хранения и обработки больших наборов данных, используя кластер серверов. Здесь мы покажем, как с помощью агентов
sFlow можно контролировать производительность такого кластера.
Для начала инсталлируем Host sFlow на каждом узле кластера Hadoop (см.
пример инсталляции Host sFlow на сервере Linux). Эти агенты экспортируют стандартную статистику о процессоре, памяти, диске и сети. В нашем случае агент Host sFlow будет инсталлироваться на виртуальную машину Cloudera.
Поскольку Hadoop работает на Java, следующий шаг включает в себя инсталляцию и конфигурирование Java-агента sFlow (см
...
Читать дальше »