Системные требования для
коллектора NetFlow значительно выше, чем для обычных программ. Очень часто, даже самые лучшие серверы работают медленно. Как правило это связано с неправильной конфигурацией жестких дисков. Вы должны помнить, что диск ограничен в количестве операций записи в единицу времени и если коллектор не может писать на диск достаточно быстро, это может вызвать многочисленные проблемы. Это основная проблема медленной работы коллекторов NetFlow.
Большая сеть может иметь тысячи потоков в секунду и каждый из них должен быть записан на диск. Реальная проблема заключается в том, что в среднем стандартный диск, работающий со скоростью 7200 RPM, достигает максимум 100 IOPS (операций чтения/записи в секунду). Просто поставив диски, работающие на скорости 15000 RPM, вы можете удвоить производительность, но даже такой диск может не справиться при большом количестве потоков.
Многие знают, что массив RAID может значительно поднять производительность коллектора. Но какую конфигурацию из многих возможных выбрать? Во первых, уточним два известных факта.
• RAID 0: использование двух или более дисков без избыточности. Это простейший массив, использующий чередование без четности. Вся входящая информация разбивается на блоки фиксированной длины и раскидывается на все имеющиеся диски.
• RAID 1: зеркалирование 2 дисков для обеспечения надежности (это мало влияет на производительность). На два жестких диска пишутся две одинаковые копии данных.
Для большинства коллекторов требуется и то и другое, поэтому используется вариант RAID 10.
RAID 10: это массив RAID 0 из четного количества зеркал RAID 1. Это даст вам дополнительную производительность и защищенность от аварий. Это та конфигурация, которая нужна для хорошей работы коллектора NetFlow.
Теперь рассмотрим еще несколько вещей, которые могут улучшить производительность. Если говорить о RAID, еще одна популярная конфигурация - это RAID 5. Это использование 3 или более дисков, причем контрольные суммы не хранятся на одном диске, а разбрасываются по всем, что позволяет значительно поднять скорость записи. Такая конфигурация позволяет увеличить дисковое пространство, улучшить надежность и поднять скорость считывания. В этой конфигурации вы также не выиграете в скорости записи, поэтому 4 диска со скоростью 15000 RPM будут работать лучше в сервере с RAID 10, чем с RAID 5.

Другая дисковая технология, которая может быть использована, это SAN. Хотя SAN делает жизнь инженеров намного проще, позволяя создавать быстрое пространство хранения без добавления дисков в новый физический сервер, она может иногда создавать проблемы. Проблема может быть связана с увеличением задержки. Иногда RAID 10 может давать задержку в 0,08 сек или меньше при записи информации, а SAN может иногда увеличивать ее величину до 0,1 сек или больше и вызывать проблемы со сбором потоков.
Последняя вещь, которую надо упомянуть и которая влияет на скорость записи/чтения, это работа сервера в виртуальной среде, особенно если система хранения совместно используется и другими приложениями. Особенно надо убедиться в том, что виртуальный сервер не имеет лимитированного доступа к диску.
Впрочем, сейчас есть ряд высокопроизводительных устройств коллекторов NetFlow, который заранее отконфигурированы так, чтобы решить эти проблемы и вы можете воспользоваться ими. Одна из подобных систем -
Lancope StealthWatch.
По материалам компании Plixer