Повышение доступности серверов с помощью динамических аппаратных разделов

🕛 10.03.2009, 00:21

Введение

Большинство критически важных бизнес-приложений во многих компаниях работают в среде Windows Server на базе Intel-платформ. При этом постоянно возрастают требования бизнеса к непрерывности работы и доступности этих приложений. Как следствие ИТ-отделы постоянно давят на производителей серверов и программного обеспечения с целью получения более экономичных систем высокой надежности. Пользователей интересует: «Если производители способны выпускать высоконадежные и доступные системы уровня мэйнфреймов, то почему они не могу предоставлять такие же возможности для стандартных Windows-серверов?». Новая серверная операционная система Microsoft Windows Server 2008, новые серверные наборы микросхем и обновленное серверное аппаратное обеспечение теперь могут предоставить ИТ-подразделениям надежность, доступность и удобство в обслуживании уровня мэйнфреймов, но за меньшие деньги.

Данная статья описывает сочетание аппаратных и программных решений от компаний Microsoft, Intel и NEC, позволяющее динамически распределять процессоры, память и платы ввода-вывода между вычислительными средами во время повышенной вычислительной нагрузки или динамически заменять их в случае выхода из строя. И все это без перезагрузки операционной системы.

Поддержка динамических аппаратных разделов (Dynamic Hardware Partitioning, DHP), реализованная в Windows Server 2008 Datacenter Edition, предлагает высокую доступность и гибкое управление ресурсами. Данная технология позволяет мгновенно определять отказ процессоров или модулей памяти и необходимость их замены без прерывания работы критичных приложений, до того, как произойдет отказ всей системы. Кроме того, когда критичным бизнес-приложениям требуется повышенная производительность процессоров, памяти или плат ввода-вывода, поддержка DHP позволяет добавить эти ресурсы в уже работающие аппаратные разделы на лету. Windows Server 2008 распознает новое аппаратное обеспечение и автоматически увеличивает размер доступных для вычислений ресурсов.

Технология DHP в Windows Server 2008, делает возможным использование в операционной системе функций «горячего добавления» и «горячей замены», позволяющие осуществлять динамическое управление ресурсами без ущерба работающим операционной системе или приложениям. Ранее, в Windows Server 2003 SP1, возможно было только «горячее» добавление памяти.

DHP имеет некоторое сходство с виртуализацией серверов. Обе эти технологии позволяют запускать несколько операционных систем на одном физическом сервере. Однако, DHP предоставляет возможность более четкого контроля над аппаратными ресурсами - динамически распределять физические аппаратные ресурсы для повышения производительности и динамически заменять вышедшее из строя аппаратное обеспечение без перерывов в работе.

Операционная систем Windows Server 2008 Datacenter Edition, работающая на сервере NEC серии Express5800/1000 на базе процессоров Intel Itanium 2, представляет собой отличный пример того, как повышенная доступность, гибкость и надежность могут быть достигнуты на Windows-серверах, благодаря решению на базе аппаратного и программного обеспечения компаний NEC, Intel и Microsoft.
Состояние индустрии

В 70-х годах XX столетия крупные ИТ-компании запускали свои критически важные вычисления на мэйнфрейм-системах, где аппаратное и программное обеспечение и операционные системы, как правило, были спроектированы и разработаны одним производителем. Это давало огромные преимущества в разработке механизмов обработки ошибок физических и логических ресурсов. При этом системы получались чрезвычайно дорогостоящими.

Сегодня и аппаратное, и программное обеспечение, и операционные системы проектируются, разрабатываются и выпускаются различными производителями. Конкуренция в этих областях не только значительно снизила стоимость систем, но также усложнила задачу создания системы высокой надежности. Например, теперь на аппаратном уровне возможность памяти, процессоров, шин и устройств ввода-вывода сообщать об ошибках используется как часть описания их интерфейса. Каждый компонент аппаратного обеспечения предоставляет различного рода информацию для обработки ошибок. Эти ошибки, если они не обрабатываются на аппаратном уровне, должны быть переданы операционной системе. Операционная система, включая драйвера устройств, написанные сторонними производителями, должна обрабатывать ошибки или игнорировать их в зависимости от своих возможностей по обработке.

Кроме того, возможности систем класса мэйнфреймов по физическому разделению систем - процессоров, памяти и каналов ввода-вывода - (предоставление нескольким окружениям общего доступа к одному физическому серверу для получения большей гибкости в управлении нагрузкой), действительно, отсутствовали в серверах на базе Windows. Подобный уровень гибкости требует расширенных возможностей и согласования между системой аппаратного обеспечения и операционной системой.

Решение проблемы

Высокая доступность критичных бизнес-приложений становится требованием сегодняшнего дня для предприятий любых масштабов, от больших корпораций до организаций среднего бизнеса. Для удовлетворения этих потребностей ИТ-подразделения в основном закупают серверы с избыточными компонентами - вентиляторами, блоками питания, сетевыми платами и т.д. Однако многие серверы не способны поддерживать избыточные процессоры и модули памяти в одном корпусе.

Высокодоступные кластерные решения предлагают возможность мониторинга кластерных систем на наличие сбоев и автоматического перезапуска критичных бизнес-приложений на других системах в случае сбоя. Хотя это и снижает время простоя из-за сбоев, но не устраняет самой проблемы. К тому же, отказоустойчивые избыточные системы становятся слишком дорогими не только с точки зрения стоимости, но и в плане энергоснабжения, охлаждения, размещения и обслуживания этих систем. Но даже несмотря на свою высокую стоимость, высокодоступные кластеры остаются менее дорогостоящими, нежели системы уровня мэйнфрэймов.

Высокая доступность - это не только требование непрерывности вычислений, но также и вытекающая из нее возможность распределять (или перераспределять) ресурсы для критичных приложений по требованию бизнеса. На первый взгляд технология виртуализации серверов в Windows Server предоставляет в этой области отличный уровень гибкости для многих приложений. Однако на сегодняшний день решения по виртуализации серверов могут распределять только логические ресурсы.

Таким образом, ИТ-подразделения нуждаются в удобной в обслуживании системе высокой доступности за умеренную цену. Как отметил вице-президент одной крупной финансовой компании: «Производительность системы и ее доступность - ключевые критерии для наших клиентов».

Представление возможностей мэйнфрэймов в Windows Server

Создание такой гибкой, надежной, доступной и удобной в обслуживании системы с нуля требует взаимодействия всех компонентов в системе, и на аппаратном, и на программном уровнях. Анонсированная в Windows Server 2008 Datacenter Edition поддержка динамических аппаратных разделов(Dynamic Hardware Partitioning, DHP) и усовершенствованная архитектура аппаратных ошибок Windows (Windows Hardware Error Architecture, WHEA), совместно с технологией Machine Check Architecture (MCA) процессоров Intel Itanium 2, позволили NEC, основываясь на ее опыте в построении систем класса мэйнфреймов, создать высокоинтегрированную, гибкую, доступную и удобную в обслуживании систему в сервере NEC серии Express 5800/1000.
Обзор решения

На высоком уровне данное решение позволяет администратору использовать аппаратные разделы для разделения многопроцессорных систем на несколько физически отдельных серверов (см. Рис. 1), каждый из которых работает под управлением своего экземпляра Windows Server 2008. В дальнейшем, администратор может динамически изменять аппаратные разделы на основе политики или в реальном времени для исправления ошибок и оптимизации производительности.

Рис. 1: 32-процессорная система «разделенная» на 3 сервера
Просмотр в полном разрешении

Эта платформа позволяет администратору устанавливать связь пороговых значений загрузки процессора с соответствующими политиками для автоматического добавления (неиспользуемых и нераспределенных) процессоров и памяти в разделы, когда уровень загрузки превышает пороговое значение («горячее добавление»). Администратор также может устанавливать пороговые значения для сбоев в работе процессоров и памяти с соответствующими политиками для автоматического перемещения вычислений с поврежденного набора процессоров и памяти на стабильные (неиспользуемые и нераспределенные) процессоры и память, и все это без необходимости в перезагрузке операционной системы или приложений («горячая замена»). Это дает администратору высокий уровень гибкости, направленный на предупреждение отказов и повышенной нагрузки процессоров, сохраняя критичные бизнес-приложения доступными в режиме 24x7x365.

Архитектура решения

Двуядерные процессоры Intel Itanium 2 включают в себя технологию Machine Check Architecture (MCA), которая обрабатывает ошибки и сообщает о неисправностях, связанных с процессорами и памятью, как показано на Рис. 2. Неисправности отправляются на уровень программно-аппаратных средств NEC Express5800/1000, затем в Windows Hardware Error Architecture(WHEA) для управления и регистрирования на уровне операционной системы. Такая плотная интеграция аппаратного и программного обеспечения, направленная на обнаружение, исправление ошибок и управление ими, обеспечивает основу высокой надежности, доступности, удобства в обслуживании и гибкости.

Рис. 2: Архитектура Dynamic Hardware Partitioning
Просмотр в полном разрешении

Двуядерные процессоры Itanium 2 с технологией Machine Check Architecture(MCA)

Все процессоры имеют систему многоуровневой обработки ошибок и сбоев. Одно из основных отличий между процессорами - возможность определять, автоматически исправлять и сообщать об этих ошибках. Процессоры Intel Itanium 2 были спроектированы для высокоуровневой надежности и доступности критичных бизнес-приложений, используя современную архитектуру многоуровневой обработки ошибок, называемую Machine Check Architecture(MCA). Ключевой компонент MCA это программно-аппаратный уровень Processor Abstraction Leyer (PAL). PAL способен исправлять и регистрировать все однобитовые ошибки и обрабатывать свыше 99.99% всех аппаратных процессорных ошибок. Процессоры с меньшими возможностями обработки ошибок, чем процессор Itanium 2, должны отправлять большее количество ошибок напрямую операционной системе для обработки. Сокращая количество ошибок, отправляемых операционной системе, улучшается эффективность их обработки (и производительность системы) и сокращаются возможные сбои системного уровня. Для случаев, когда PAL не способен обработать ошибку, она передается на следующий уровень - System Abstraction Layer (SAL), как показано на рисунке 2, для обработки или передачи операционной системе. Значение информации о регистрации и обработке ошибок для SAL в том, что система становится осведомленной об этих ошибках и может заблаговременно отреагировать на сбои процессоров или памяти, прежде чем из-за них будет нарушена работа системы.

NEC серии Express 5800/1000

«Сердцем» сервера NEC серии Express5800/1000 служит 64-разрядный двуядерный процессор Intel Itanium 2. К нему добавлен переработанный набор микросхем А3 («A в кубе») с 24 Мб кэш-памяти для увеличения производительности. Каждый сервер разделен на ячейки с процессорами и памятью. Каждая ячейка содержит до 4 процессоров и до 64 Гб памяти. Чипсет A3 обеспечивает высокую скорость и малые задержки при передаче данных внутри ячейки.

На системном уровне NEC внедрили System Abstraction Level для связи с Machine Check Architecture, а так же избыточные сервисные процессоры для мониторинга и управления общим состоянием и конфигурацией системы. Сервисные процессоры могут быть доступны через командную строку или через консоль управления GlobalMaster с графическим интерфейсом. Сервисные процессоры обеспечивают для DHP возможность администратору разбивать и переразбивать аппаратные ячейки в зависимости от приоритетов бизнеса и политик. В серверах NEC серии Express 5800/1000 каждый раздел может состоять из одной или нескольких ячеек и иметь назначенную ему операционную систему или находиться в резерве. Благодаря аппаратным разделам, каждая операционная система и раздел определяют отдельностоящий сервер, физически изолированный от других разделов, и не имеющий представления о других средах внутри системы.

GlobalMaster включает в себя два компонента, интерфейс управления GlobalMaster и GlobalMaster-агент (GMA). Интерфейс управления GlobalMaster, установленный в системе администратора, предоставляет возможности внешнего управления и конфигурации. Этот компонент осуществляет связь с сервисным процессором для выполнения конфигурации или переконфигурации, и GlobalMaster-агентом. GlobalMaster-агент - это маленький агент, находящийся над Windows, для сбора информации о состоянии системы.

Windows Hardware Error Architecture (WHEA)

Windows Hardware Error Architecture (WHEA) предоставляет расширенную поддержку исправления и анализа причин аппаратных ошибок посредством связанной инфраструктуры аппаратных ошибок. WHEA предоставляет преимущество использования расширенной информации об ошибках, передаваемой аппаратным обеспечением, таким как двуядерные процессоры Intel Itanium 2 и набор микросхем NEC A3. Такая архитектура обеспечивает:
-

получение расширенных данных об ошибках и их регистрацию в стандартном формате;
-

механизмы восстановления аппаратных ошибок;
-

приложения для управления ошибками.

К тому же, эта архитектура открыта для аппаратных улучшений, операционная система Windows может приспосабливаться под изменения.

Поддержка динамических аппаратных разделов (DHP)

DHP - это возможность динамического назначения, замены и переназначения физических аппаратных средств в специальные аппаратные разделы. Это осуществляется путем «горячего добавления» и «горячей замены» аппаратных компонентов, таких как процессоры, память, платы ввода-вывода. Windows Server 2008 поддерживает «горячее добавление» процессоров, памяти, плат ввода вывода, и «горячую замену» процессоров и памяти благодаря реализации технологии DHP.
Сбор всего воедино - NEC Express 580/1000

Сервер NEC серии Express 5800/1000 предоставляет надежность, доступность, удобство в обслуживании и гибкость класса мэйнфреймов для серверных систем Windows благодаря оптимальной реализации сочетания технологии Microsoft DHP c расширенными возможностями Machine Check Architecture процессоров Intel Itanium 2 и Windows Hardware Error Architecture. На Рис. 1 изображена структурная схема сервера NEC серии Express 5800/1000: 32-процессорная система, разделенная на 3 сервера, один включает в себя 4 ячейки другие два - по 2 ячейки в каждом.

GlobalMaster может устанавливать автоматическую и динамическую перенастройку разделов по следующими трем сценариям:
-

на основании сбоев процессора и памяти;
-

на основании процессорной нагрузки;
-

на временной основе.

Сценарии, основанные на загруженности процессора или отказах процессора или памяти, взаимодействуют с WHEA и DHP, помогая обеспечивать непрерывную доступность процессора и памяти для приложений, работающих на критичных для бизнеса разделах. Переразбиение на временной основе предоставляет гибкое использование ресурсов в режиме 24x7.

Переразбиение на основании сбоев (горячая замена)

Переразбиение на основании сбоев в сервере NEC Express5800/1000 позволяет одному или нескольким разделам автоматически заменять неисправные ячейки процессоров и памяти на исправные без перезапуска приложений или перезагрузки системы. Администратор может назначить запуск тяжелых критичных бизнес-приложений на разделе, состоящем из четырех ячеек; приложение, обслуживающее клиентов, на разделе, состоящем из двух ячеек, и оставить две ячейки в резерве, как показано на Рис.3. Администратор может выполнить это разбиение с помощью интерфейса управления GlobalMaster. Так же имеется GlobalMaster-агент (GMA на Рис. 3), расположенный в операционной системе каждого раздела. Этот агент отслеживает состояние системы, взаимодействуя непосредственно с операционной системой, и предоставляет изменения состояния сервера системе управления GlobalMaster. Это позволяет администратору управлять множеством серверных разделов из единой консоли.

Сбои случаются и в процессоре, и в памяти. Когда происходит сбой процессора или памяти, количество ошибок увеличивается. Для избежания общего сбоя администратор может использовать интерфейс управления GlobalMaster, чтобы установить пороговые значения максимально-допустимого количества ошибок. Если это пороговое значение достигнуто или превышено, ячейка, содержащая поврежденные процессор или память, будет заменена на новую ячейку, прежде чем сервер выключится из-за невосстановимых ошибок.

Рис. 3: Система, поделенная на два раздела и две запасные ячейки
Просмотр в полном разрешении

Взаимодействие между уровнями процессора, системы и слоем архитектуры операционной системы необходимо для плавного перемещения с одного набора процессоров на другой. Двухядерные процессоры Intel Itanium 2 посредством Machine Check Architecture, передают информацию о количестве сбоев и ошибок на программно-аппаратный уровень System Abstract Layer(SAL). Intel Itanium Machine Check Architecture исправляет большинство однобитовых ошибок внутри процессора или аппаратно-программного уровня, это называется Processor Abctraction Layer (PAL). Если PAL не способен обработать эту ошибку, он передает ее на SAL для обработки или отправки операционной системе. В сервере NEC серии Express5800/1000, работающем под управлением Windows Server 2008, SAL передает ошибки Windows Harware Error Architecture (WHEA) для обработки/регистрации ошибок, как показано на Рис 2. Если количество ошибок достигает или превышает пороговое значение, как показано на Рис.4, GlobalMaster-агент на сервере предупреждает систему управления GlobalMaster, которая инициирует замену.

Рис. 4: Достижение порогового значения количества сбоев
Просмотр в полном разрешении

Как на Рис.4, указанная ниже последовательность действий происходит по достижению порогового значения количества сбоев:

1.

Внутри Machine Check Architecture, PAL на каждом процессоре информирует SAL о наличии ошибок для разрешения или регистрации.

2.

Затем SAL передает эти ошибки Windows Server 2008 WHEA так же для разрешения и (или) регистрации.

3.

GlobalMaster-агент NEC следит за сообщениями об ошибках.

4.

GlobalMaster-агент отправляет информацию системе управления GlobalMaster.

5.

Если достигнуто пороговое значение для сбоев, GlobalMaster уведомляет сервисный процессор о начале замены.

GlobalMaster связывается с сервисным процессором для преобразования запасных ячеек в адресное пространство поврежденных ячеек (см. Рис. 5). Сервисный процессор информирует SAL о связи с интерфейсом Windows Server 2008 DHP для перемещения содержимого и контекста поврежденных ячеек процессоров и памяти.

Рис. 5: Сервисный процессор инициирует преобразование в новые ячейки
Просмотр в полном разрешении

6.

Сервисный процессор инициализирует ячейку для использования в качестве замены неисправной.

7.

Сервисный процессор связывается с GlobalMaster для начала процесса замены.

8.

Контекст памяти поврежденной ячейки копируется в запасную ячейку, используя средство копирования набора микросхем NEC A3, которое инициирует копирование памяти (быстрее, чем программное копирование памяти). Любые изменения памяти, происходящие во время операции копирования, осуществляются одновременно в обеих ячейках.

9.

SAL связывается с DHP для уведомления DHP о замене. Система переходит в пассивное состояние, или состояние псевдо-S4 (hibernation), где все вычисления остановлены.

10.

Операционная система, SAL и сервисный процессор взаимодействуют для копирования состояния процессора поврежденной ячейки в заменяющую ячейку. Весь процесс копирования завершается настолько быстро, что сетевые серверные подключения не прерываются.

Когда копирование завершено, как показано на Рис. 6:

Рис. 6: Поврежденная ячейка заменена на резервную
Просмотр в полном разрешении

11.

Операционная система выходит из пассивного состояния и продолжает вычисления.

12.

SAL освобождает поврежденный процессор, чтобы он мог быть удален из системы для ремонта.

13.

SAL информирует сервисный процессор о том, что замена завершена.

14.

Сервисный процессор информирует GlobalMaster о том, что замена завершена.

Как показано в этом примере, как только копирование завершено, Windows Server 2008 автоматически продолжает вычисления, используя новую ячейку, ровно с того места, где вычисления были приостановлены, без необходимости перезапуска приложений или перезагрузки системы. Поврежденная ячейка может быть удалена из корпуса, и замененная ячейка может стать запасной. При этом приложения на других аппаратных разделах (например, поддержка клиентов) продолжают функционировать без перерыва и без ведома о том, что произошла замена соседней ячейки.

Переразбиение на основании загруженности процессора (горячее добавление)

Переразбиение на основе загруженности процессора в сервере NEC серии Express5800/1000 позволяет одному или более разделов иметь ячейки процессоров и памяти, добавляемые в раздел без перезагрузки системы. Как и в предыдущем примере, администратор может выбрать для больших критичных бизнес-приложений раздел, состоящий из четырех ячеек, для приложения поддержки клиентов - раздел из двух ячеек и оставить две ячейки для замены, как показано на Рис. 3.

В этом примере особокритичное бизнес-приложение может становиться причиной всплеска загрузки процессора, но бизнес не может себе позволить остановить это приложение из-за недостаточной процессорной производительности. Чтобы защититься от таких возможностей, администратор с помощью интерфейса управления GlobalMaster, устанавливает пороговое значение 80% для загрузки процессора раздела и настраивает политику горячего добавления ячейки в случае превышения порогового значения. GlobalMaster-агент отслеживает загруженность центрального процессора и сообщает показания загруженности системе управления GlobalMaster. Как только будет достигнуто пороговое значение раздела, как показано на рис. 7, GlobalMaster инициирует «горячее» добавление ресурсов с помощью сервисного процессора и операционной системы Windows Server 2008.

Рис. 7: Загрузка процессора достигла предельного значения
Просмотр в полном разрешении

В примере, показанном на Рис. 7, когда загруженность достигает порогового значения, происходят следующие шаги:

1.

GlobalMaster-агент следит за показателями загруженности процессора, доступными из операционной системы.

2.

Агент передает эти значения системе управления GlobalMaster.

3.

Когда достигнуто пороговое значение, GlobalMaster сообщает сервисному процессору о начале «горячего» добавления.

4.

Сервисный процессор инициализирует ячейку для «горячего» добавления.

5.

Затем сервисный процессор связывается с SAL для начала «горячего» добавления выбранных ячеек.

6.

SAL сообщает Windows DHP о начале процедуры «горячего» добавления и передает DHP адресацию новой ячейки и информацию о памяти. Windows DHP добавляет новую ячейку в текущую адресацию и информирует SAL, когда «горячее» добавление будет завершено.

Рис. 8: Автоматическое добавление резервной ячейки
Просмотр в полном разрешении

7.

Windows Server 2008 DHP расширяет текущий регистр и адреса памяти новой информацией.

8.

Сервисный процессор и GlobalMaster уведомляют об изменениях.

Как только Windows Server 2008 устанавливает расположение памяти и процессора, добавленная ячейка становится доступна для приложения - все это без требования останавливать приложение или перезагружать систему. Кроме того, приложение поддержки клиентов на другом аппаратном разделе совершенно не ведает о происходящем и не подвергается влиянию изменений в других разделах. Оба приложения - и критичное бизнес-приложение, и приложение поддержки клиентов - остаются работающими.

Переразбиение на временной основе

Переразбиение на временной основе направлено на решение проблемы систем вычисления в зависимости от меняющихся требований, в зависимости от времени дня. Например, сервер разработки сильно перегружен в течение рабочего времени, но ночью он не используется. Чтобы воспользоваться неиспользуемыми системами, сервер NEC серии Express5800/1000 может автоматически переконфигурировать аппаратные разделы в предварительно настроенное время для использования для других необходимых вычислений.

Администратор может получить доступ к конфигурированию с помощью GlobalMaster. Он может сконфигурировать сервер таким образом, чтобы выбранные аппаратные разделы стали активны с 7:00 утра до 22:00 вечера, а с 22:01 до 6:59 будет активна другая конфигурация разделов. В 22:00 все запущенные приложения будут завершены и операционная система будет выключена. GlobalMaster переконфигурирует аппаратные разделы и перезапустит операционную систему и приложения, связанные с новым разделом, для вычислений в ночное время, давая бизнесу максимальную гибкость в использовании серверных ресурсов.
Динамические аппаратные разделы или виртуализация серверов?

Иногда путают технологии DHP и виртуализации серверов. На самом деле они совершенно разные и используются для разных задач.

Виртуализация серверов предоставляет возможность создавать несколько операционных систем использующих физические ресурсы одной системы, используя для управления ресурсами диспетчер виртуальных машин (VMM) или гипервизор (hypervisor). Виртуализация серверов - это отличная возможность объединить x86-системы с низкой загруженностью в единую систему, повысив использование сервера и возврат от инвестиций, выполняя больше работы на каждом физическом сервере. Само собой, виртуализация серверов ничего не дает в плане улучшения доступности виртуальных машин (VM), запущенных на сервере. Для повышения доступности необходимо добавить несколько типов возможностей кластеризации либо VMM, либо VM, либо и то, и другое. Это обеспечивается, отчасти, автоматическим перезапуском виртуальных машин и приложений на отказоустойчивом кластерном сервере в случае выхода из строя. Такой способ кластеризации повышает доступность, но требует перезапуска виртуальных машин и (или) VMM, операционной среды и приложений. В том случае, если VMM предоставляет возможность миграции в режиме реального времени, может быть осуществлен перенос виртуальных машин на другой сервер в кластере, вручную или автоматически, с использованием дополнительного программного обеспечения для управления, когда загруженность достигнет установленного порогового значения.

Динамические аппаратные разделы так же предоставляют возможность запускать несколько операционных систем на единой системе. Однако это не связано с VMM. Вместо этого сервер разделяется на аппаратном уровне для создания нескольких изолированных серверов на одной физической платформе. Каждый сервер, действительно, работает как отдельностоящий аппаратный сервер. Такой тип виртуализации доступен на сервере NEC серии Express5800/1000. Разделы могут быть полностью распределены или часть системы может оставаться нераспределенной, как горячий резерв для добавления или замены ресурсов в других разделах. Способность динамически добавлять дополнительные физические аппаратные ресурсы для повышения производительности и (или) надежности на сегодняшний день недоступна для продуктов виртуализации x86-серверов.

В качестве примера приложения, которое может быть лучше настроено на системе, использующей аппаратные разделы, чем на системе использующей виртуализацию серверов, может быть критичная для бизнеса база данных SQL. Тяжелые приложения баз данных обычно работают лучше, когда они не борются за ресурсы с другими приложениями. При использовании аппаратных разделов все процессоры, память и платы ввода-вывода в разделе назначаются этому особому разделу (операционной системе). Если работающая система базы данных приближается к пределу системных ресурсов, дополнительные процессоры, память и платы ввода-вывода могут быть динамически добавлены. Если появляются отказы процессоров или памяти внутри ячейки, поврежденная ячейка будет заменена без прерывания работы базы данных.
Основные преимущества

Динамические аппаратные разделы на сервере NEC серии Express5800/1000 предоставляют потребителям доступность и гибкость класса мэйнфреймов без высокой цены. В сервере NEC серии Express5800/1000 функция «горячей» замены автоматически определяет и заменяет неисправное аппаратное обеспечение до того как произойдет остановка. Это означает, что критичные бизнес-приложения будут продолжать работать в тех случаях, когда раньше они могли бы отказать. Иллюстрируя общие преимущества, один из клиентов заявил: «У нас есть строгое соглашение об уровне сервиса (SLA) с нашими клиентами и установленные жесткие штрафы, когда мы не способны удовлетворить SLA. Но гораздо большей потерей для нас является потеря доверия к нашей организации со стороны клиентов, и восстановить его гораздо сложнее и дольше, нежели просто оплатить денежный штраф»

Поддержка технологии DHP в сервере NEC Express5800/1000 так же позволяет администратору увеличивать производительность по требованию, путем «горячего» добавления ресурсов в серверную среду, которая требует дополнительных ресурсов на время повышенных нагрузок. Это дает IT возможность быть более отзывчивым по отношению к требованиям сегодняшнего бизнеса.

Как сказал один заказчик: «Технология DHP с возможностью горячей замены позволит нам получить доступность 99,999%. Возможность динамически распределять ресурсы на лету - обрабатывать непредвиденные события - позволит нам реагировать быстрее без снижения производительности».

В целом, данное решение позволяет автоматически реагировать и избегать ситуаций, приводящих к простоям, прежде чем они произойдут, тем самым предоставляя улучшенную производительность и доступность и сохраняя их время и деньги.
Заключение

Использование динамических разделов дает возможность ИТ-подразделениям компаний повысить надежность, доступность и удобство в обслуживании критичных для бизнеса систем на базе Windows Server. И ставит это решение на одну ступень с дорогостоящими системами класса мэйнфрэймов.

В завершение хотелось бы еще раз напомнить, что технология DHP будет реализована не во всех редакциях Windows Server 2008, а только в редакциях Datacenter Edition (x64/64-bit) и Itanium (IA64)