B2B поставщик с 2007 г.
22.01.2026
автор КЦ Алекомп

Архитектура контроллеров СХД: Руководство по выбору для Enterprise сред

В условиях современного бизнеса, где данные являются главным активом, обеспечение высокой доступности (High Availability) и предсказуемой производительности систем хранения данных (СХД) — это критически важная бизнес-задача. Для CIO, системных архитекторов и ИТ-директоров выбор архитектуры СХД напрямую влияет на капитальные затраты (CAPEX), операционные риски и выполнение SLA.

Ключевым аппаратным элементом, определяющим эти характеристики, является модель работы контроллеров хранения. Три основные архитектуры контроллеров предлагают принципиально разные подходы к балансировке I/O, обработке сбоев и утилизации вычислительных мощностей.

Стратегическое сравнение архитектур

Критерий Active-Passive (A/P) ALUA (Asymmetric A/A) SAA (Symmetric A/A)
Утилизация мощностей 50% (Один работает, второй простаивает) 100% (Оба активны, но привязаны к своим LUN) 100% (Полное равноправие для всех томов)
Доступность путей Активен только 1 путь к LUN. Разделение на Optimized и Non-Optimized. Все пути активны и Optimized.
Балансировка I/O Отсутствует. Гранулярность на уровне томов (LUN). Гранулярность на уровне блоков ввода-вывода.
Влияние при аппаратном сбое Заметная задержка (переключение путей и кэша). Кратковременный всплеск задержки (переход на неоптимальный путь). Минимальное или незаметное для бизнес-приложений.
Уровень TCO и Сложности Низкий (Экономичная архитектура) Средний (Баланс цены и производительности) Высокий (Системы класса Tier-0/1)

1. Active-Passive (Классический Активный-Пассивный) Базовый уровень

Исторически самая распространенная и простая модель обеспечения высокой доступности. В нормальном режиме всю полезную нагрузку обрабатывает Контроллер А, в то время как Контроллер Б находится в режиме ожидания (Standby).

Сервер (Хост)
 
 
Контроллер А Активный
Контроллер Б Резерв
 
Дисковый массив
Раскрыть технические детали failover-процесса

При сбое Контроллера А, Контроллер Б выполняет процедуру перехвата управления (trespass). Задержка обслуживания зависит от нескольких факторов. Математически время остановки ввода-вывода (freeze time) выражается формулой:

$$T_{\text{failover}} = t_{\text{detect}} + t_{\text{cache\_flush}} + t_{\text{path\_switch}}$$

Где $t_{\text{detect}}$ — время обнаружения сбоя, $t_{\text{cache\_flush}}$ — дестейджинг зеркалированного кэша, а $t_{\text{path\_switch}}$ — время, требуемое MPIO серверов для перестройки маршрутов. В этот период приложения могут поставить транзакции на паузу.

2. ALUA (Asymmetric Logical Unit Access) Корпоративный стандарт

ALUA — это стандарт протокола SCSI (SAM-5), сочетающий в себе черты A/A и A/P. Оба контроллера активны одновременно, но для настройки производительности сохраняется концепция «владения» логическим томом. Для LUN_1 оптимальным будет Контроллер А, а для LUN_2 — Контроллер Б.

Многопутевое ПО (MPIO)
 
 
Контроллер А Владелец LUN 1
Контроллер Б Владелец LUN 2

Внутренняя шина синхронизации

LUN 1
LUN 2
Раскрыть физику неоптимальных путей

Если сервер отправляет I/O запрос к LUN_1 по пути через Контроллер Б (неоптимальный путь), Контроллер Б пробросит пакет через внутреннюю шину на Контроллер А, и только тот запишет данные. Задержка (latency) описывается так:

$$Latency_{\text{non-optimized}} = Latency_{\text{optimized}} + \Delta T_{\text{interconnect\_overhead}}$$

MPIO на стороне хоста использует метки TPGS (Target Port Group Support), чтобы всегда приоритетно выбирать оптимальные маршруты и минимизировать $\Delta T_{\text{interconnect\_overhead}}$.

3. SAA (Symmetric Active/Active) Mission-Critical

Вершина технологического развития, используемая в Hi-End системах. Концепция привязки тома (LUN) к контроллеру отсутствует полностью. Все пути к СХД всегда являются оптимальными. Любой контроллер имеет прямой и независимый доступ к блокам данных.

Кластер серверов / СУБД
 
 
Контроллер А Global Access
Контроллер Б Global Access
Единый Global LUN
Раскрыть вычислительные нюансы SAA

Реализация истинного SAA требует сложных алгоритмов. Поскольку два контроллера могут параллельно изменять один и тот же блок данных, необходим менеджер распределенных блокировок (Distributed Lock Manager). Итоговая производительность системы описывается как:

$$IOPS_{\text{total}} = \left( \sum_{i=1}^{n} IOPS_{\text{ctrl}_i} \right) - O_{\text{lock\_overhead}}$$

Где $O_{\text{lock\_overhead}}$ — накладные расходы на арбитраж и синхронизацию блокировок. В СХД премиум-сегмента используются специализированные ASIC-чипы для сведения этого параметра к минимуму.


Практический вывод для заказчика

Выбор профиля СХД напрямую зависит от ценности обрабатываемых данных и профиля нагрузки (Workload Profile):

  • Выбирайте Active-Passive для периферийных узлов, систем видеонаблюдения или хранилищ резервных копий (Backup Targets), где снижение стоимости (CAPEX) важнее долей секунды при переключении.
  • Выбирайте ALUA для 80% типичных бизнес-задач: виртуализация (vSphere, Hyper-V), типовые базы данных, VDI. Это де-факто рыночный стандарт, обеспечивающий отличный баланс отказоустойчивости и цены.
  • Выбирайте Symmetric Active/Active (SAA) для ядра финансового биллинга, высокочастотного трейдинга и тяжелых OLTP баз, где каждая миллисекунда простоя стоит десятки тысяч долларов (Zero Downtime).

Комментарии

Сообщения не найдены

Написать отзыв