СРЕДСТВА АНАЛИЗА И ОПТИМИЗАЦИИ ЛОКАЛЬНЫХ СЕТЕЙ

       

Использование RAID-массивов для повышения производительности


Главными характеристиками дискового накопителя являются его емкость, быстродействие и надежность. Требуемая емкость диска (или дисков) определяется задачами пользователей сети и требованиями к развитию системы.

Показателями быстродействия диска являются две характеристики - среднее время доступа к диску, зависящее от времени перемещения головок между дорожками диска, и скорость передачи данных между диском и контроллером диска. Кроме того, для оценки производительности дисков, используемых для хранения баз данных, удобной характеристикой является скорость транзакций, обычно измеряемая в количестве вводов/выводов в секунду. Предлагаемые на рынке диски имеют в основном два типа интерфейса между диском и контроллером диска: IDE и SCSI (с его разновидностями - SCSI-2 и FastSCSI-2). Требуемую скорость передачи данных обеспечивает интерфейс SCSI, к тому же он позволяет подключить к одному контроллеру до 7 дисков, что не может интерфейс IDE. Поэтому для файл-серверов в сетях с количеством пользователей больше 10 желательно использовать диски с интерфейсом SCSI. Желательно, чтобы контроллер диска имел большую кэш-память, в этом случае обмен с дисками значительно ускоряется.

Для обеспечения надежного хранения данных на дисках в файл-серверах широко используются дисковые массивы - так называемые RAID-массивы (RedundantArrayofInexpensiveDisks - избыточные массивы недорогих дисков). Для компьютера дисковый массив представляется одним диском. Существуют различные схемы организации внешней памяти на основе набора дисков - RAID-уровни. Одни из них повышают только надежность, другие - только скорость доступа к данным, а некоторые - сочетают в себе оба эти достоинства. При этом, немаловажным обстоятельством является степень избыточности оборудования, требуемая для реализации того или иного уровня RAID, которая влияет на экономичность выбранного решения.

УровеньRAID-0 повышает скорость доступа к данным за счет их расщепления. Общий для дискового массива контроллер передает данные параллельно на все диски, при этом первый байт данных записывается на первый диск, второй - на второй и т.
д. Время доступа при выполнении одной операции ввода-вывода сокращается за счет одновременности операций записи/чтения по всем дискам массива. В параллельном дисковом массиве должен использоваться специальный контроллер, обеспечивающий синхронизацию дисководов. Понятно, что надежность этой схемы по сравнению с одиночным диском в общем случае не только не повышается, а становится ниже, действительно вероятность отказа возрастает, из-за увеличения числа дисков. Зато уровень RAID не создает избыточности данных в дисковом массиве.

УровеньRAID-1 реализует зеркальную запись на диски. Второй (или резервный) диск дублирует каждый основной диск. Если основной диск выходит из строя, зеркальный продолжает сохранять данные. Этот способ характеризуется высокой надежностью, сопровождаемой, однако, высокой избыточностью. Очевидно, что скорость доступа к данным не повышается.

Уровень RAID-2 используется в больших компьютерах и представляет собой способ побитного расслоения, который позволяет увеличить скорость доступа к данным за счет расспараллеливания запроса.

В реализацииRAID-3 используется массив из N дисков, запись на N-1 из них производится параллельно с побайтным (или блочным) расщеплением, как в методе RAID-0. N-ый диск используется для записи контрольной информации о четности. Диск четности является резервным. Если какой-либо диск выходит из строя, то данные остальных дисков плюс данные о четности резервного диска позволяют восстановить утраченную информацию. Уровень RAID-3 повышает как надежность, так и скорость обмена информацией, однако обладает избыточностью, хотя и меньшей, чем уровень RAID-1.

Уровень RAID-4 также использует один резервный диск для записи контрольной информации о четности, но расщепление происходит на уровне более крупных единиц данных - на уровне секторов. За счет этого может происходить независимый обмен с каждым диском. Скорость передачи данных не выше, чем у отдельного диска, однако, поскольку диски работают независимо, данные могут считываться одновременно со всех дисков.


Это делает возможным одновременное выполнение нескольких операций ввода-вывода. Основным недостатком уровня RAID-4 является низкая скорость записи. Информация о четности должна корректироваться каждый раз, когда выполняется операция записи. Старые данные и старая информация о четности сначала должны быть считаны, а затем объединены с новыми данными, чтобы получить новую информацию о четности. Затем она должна быть записана на диск четности. Причиной значительного уменьшения скорости в методе RAID-4 является то, что после чтения старых данных и старой информации о четности каждый диск должен повернуться на один полный оборот до того, как новые данные и информация о четности могут быть записаны. Кроме того, при параллельном выполнении нескольких операций ввода-вывода могут возникать очереди при обращении к диску с контрольной информацией.

В уровнеRAID-5 используется метод, аналогичный RAID-4, но данные о контроле четности распределяются по дискам массива. Каждая команда записи инициирует ту же последовательность считывание-модификация-запись в нескольких дисках, как и в методе RAID-4. Поскольку информация о четности может быть считана и записана на несколько дисков одновременно, вероятность возникновения очередей к дискам уменьшается, а, следовательно, скорость записи по сравнению с уровнем RAID-4 увеличивается. Однако она все еще гораздо ниже скорости отдельного диска, метода RAID-1 или RAID-3.

Существуют и другие способы использования RAID-массивов. Иногда могут встречаться комбинации разных схем, например, уровень RAID-10 представляет собой расслоение (RAID-0) в сочетании с зеркальным отображением (RAID-1). Наиболее часто в дисковых подсистемах файловых серверов используются уровни RAID-1, RAID-3 и RAID-5.



Содержание раздела