Резервирование n 1 что это – резервирование инженерных систем / Группа Компаний ХОСТ corporate blog / Habr

резервирование инженерных систем / Группа Компаний ХОСТ corporate blog / Habr

Начинать чинить надо, пока не сломалось — сломанное поддаётся ремонту гораздо неохотней.
Юрий Татаркин

После того как обеспечены надежные стены и крыша над головой для ЦОД (статья «Риски ЦОД: выбираем месторасположение»), следующим шагом на пути обеспечения его отказоустойчивости должно стать резервирование инженерных систем. Строя дата-центры более 10 лет, мы убедились, что не все заказчики в полной мере осознают важность дублирования основных коммуникаций. Космические корабли и те падают, а оборудование в ЦОД в идеале должно работать 365 дней в году и 24 часа в сутки. Любая вышедшая из строя или нуждающаяся в профилактике деталь должна быть заменена без остановки работы всех критичных сервисов.

Как справедливо отметили наши читатели, далеко не всем компаниям нужен надежный ЦОД. Для некоторых его бесперебойная работа не предмет переживаний, а многие предпочтут хранить свои данные в публичном облаке. Данный паблик предназначен в большей степени для тех, кто по тем или иным соображениям безопасности или проходимости каналов связи сделал свой выбор в пользу собственного дата-центра и работы сервисов с уровнем доступности не менее трех девяток (простоя не более 1,6 часов в год).

Отказоустойчивость и резервирование: что говорит мировой опыт?

Согласно стандартам Uptime Institute выделяют четыре уровня отказоустойчивости инфраструктуры ЦОДа:


Использование классификации Tier подразумевает, что все инженерные системы и компоненты ЦОД, вплоть до запаса топлива для дизель-генератора, воспринимаются как единое целое. Наличие хотя бы одного нерезервированного компонента приводит к снижению уровня отказоустойчивости и увеличению возможных часов простоя ЦОД. Количество таких компонентов, а также статистика по плановым и внеплановым отказам дата-центров в год влияют на допустимое время простоя. Например, для ЦОД уровня Tier I характерно внеплановое отключение 1,2 раза в год. Плюс, из-за отсутствия резервных систем дата-центр не будет работать еще два раза по двенадцать часов во время планового обслуживания. В итоге суммарное время простоя будет рассчитываться как: 12+12+4х1,2=28,8 часов.

Для расчета уровня отказоустойчивости в процентах нужно: ((t работы — t простоя )×100%)/ t работы, где

t работы – максимальное количество часов работы ЦОД в год (24 часа в сутки 365 дней в году).
t простоя – это время планового простоя ЦОД в год.

Классифицируя способы резервирования, принято выделять следующие схемы: N+1, 2N и 2(N+1). Применение схем N+1 и N+2 по сравнению с 2N дают значительную экономию бюджета и при неплохом уровне отказоустойчивости (разом все элементы системы вряд ли выйдут из строя). Однако, нужно помнить, что с ростом числа рабочих единиц (N), согласно теории вероятности, доступность системы ухудшается. В ситуации большого количества элементов (большого N, например, источников бесперебойного питания) уместнее использовать схему 2N, когда каждый компонент системы полностью задублирован. Это позволит в разы увеличить отказоустойчивость и снизить время простоя. В то же время, ни N+1, ни 2N не резервируют систему в целом, а потому не исключают опасность аварии на участке между зарезервированными элементами системы. Поэтому Tier IV рекомендует использовать 2 независимые схемы, каждая из которой полностью задублирована, 2(N+1).

Неиссякаемая энергия

Основой надежной работы ЦОД является электроснабжение: бесперебойное (источники бесперебойного питания – ИБП) и гарантированное (дизель-генераторные установки – ДГУ). В момент исчезновения напряжения городской сети ИБП должны поддержать питание оборудования до полного запуска ДГУ, который сможет обеспечить электроэнергией весь ЦОД.
Для того чтобы ЦОД не встал в отсутствии электроснабжения, крайне важно, во-первых, зарезервировать ИБП, а, во-вторых, проводить регулярные сервисные работы.

К каким рискам может привести наличие только одного ИБП – в целом понятно. В лучшем случае мы не сможем провести тестирование источника, в худшем – получим простой ЦОД. Но порой даже наличие нескольких ИБП не дает свободу действий. Так в одной организации источников в ЦОДе было два, но каждый питал только свою группу серверов, а не служил резервом друг для друга. При проведении технического обслуживания у сервис-инженера прихватило спину. Падая, он каким-то образом умудрился обесточить выход ИБП. И, по закону подлости, выключившийся в разгар рабочего дня источник обесточил группу серверов с наиболее критичными приложениями.

«Боевой» запуск дизель-генератора (ПБ) – проверка возможности запуска дизель-генератора в автоматическом режиме при пропадании внешней сети. Производится с помощью имитации полного отключения внешнего питания ЦОД. Время от отключения питания до запуска дизель-генератора серверное оборудование работает от батарей ИБП (обычно 1-3 минуты).

Запуск дизель-генератора под нагрузкой (ПН) – проверка способности дизель-генератора поддерживать питание подключенного к нему оборудования. Производится ручным переключением нагрузки на генератор (с помощью панели управления) после его запуска и выхода на нормальную работу. На время переключения АВР серверное оборудование работает от батарей ИБП (около 0,3-1 сек.). Кстати, для переключения нагрузки на ДГУ лучше использовать мотор-приводы, они хоть и работают медленнее, но срок службы и надежность у них выше.

Для предотвращения нежелательных простоев нужны регулярные комплексные сервисные работы. В одном из ЦОД проверки проводились только в отношении ДГУ. ИБП исправно показывал 10 минут автономии, но его никто не обслуживал. Возраст батарей к тому времени перевалил за 5 лет, и во время одного из боевых запусков они смогли проработать лишь 29 секунд. В то время как ДГУ завелась и смогла принять на себя нагрузку спустя только 33 секунды. Ко всему прочему, все оборудование было запитано от одного ИБП (от второго было решено отказаться еще на этапе реализации из-за бюджетных ограничений). В итоге – падение ЦОД. Полное восстановление всех вычислительных систем заняло около 12 часов.

Основные ошибки:
• Отказ на стадии реализации от второго ИБП. Трудные времена закончились, но второй ИБП так и не был приобретен.
• Отсутствие комплексного обслуживания всех инженерных систем ЦОД. При регулярном сервисном обслуживании ИБП об их неудовлетворительном состоянии стало бы известно заранее.
• Отсутствие регламентов планового обслуживания ЦОД и хаос при его эксплуатации.

Пути миграции тока

Ваши ИБП зарезервированы и вы регулярно их обслуживаете? Молодцы, но не вздумайте на этом останавливаться! Зарезервируйте еще и кабельные линии электроснабжения ЦОД, и установите 2 АВР, которые полностью резервируют друг друга. В идеале, они должны быть подключены к разным независимым электрощитам. В крайнем случае можно протянуть две линии и от одной щитовой, чтобы не получилось ситуации, как у одного из наших заказчиков.

При внедрении системы диспетчеризации в небольшой, но значимый ЦОД необходимо было поставить трансформаторы тока на основной ввод. Проблема была в том, что ввод был только один, а обесточить дата-центр было нельзя. После всех подготовительных работ питание было отключено. Пока оборудование ЦОД работало от батарей, монтажники трудились не покладая рук, а инженер, вытирая пот со лба, считал минуты на дисплее ИБП.

Основные ошибки:
• Система диспетчеризации была незаслуженно забыта при проектировании.
• Линия питания ЦОД не была зарезервирована.

Стало жарко

Система «чиллер-фанкойл» – система кондиционирования воздуха, в которой теплоносителем между центральной холодильной машиной (чиллером) и локальными теплообменниками (фанкойлами) служит охлажденная жидкость, циркулирующая под относительно низким давлением – обыкновенная вода (в тропическом климате) или водный раствор этиленгликоля (в умеренном и холодном климате).

Не стоит забывать и о резервировании систем кондиционирования. За последние два месяца довелось увидеть два проекта охлаждения ЦОД с использованием системы чиллер-фанкойл без резервирования трассы между чиллерами и сухими охладителями. Использование данного решения в реальной жизни с высокой долей вероятности приводит к простою ЦОД. В случае замены теплоносителя (что не редкость), только резервная трасса может сохранить работоспособность системы охлаждения, а значит и всего дата-центра.

Еще очень важный момент – разделение внешнего и внутреннего контуров охлаждения. Так в одном проекте на кровле седьмого этажа предлагалось установить два двухтонных чиллера, бак аккумулятор холода, мощную подкачивающую насосную станцию. Подача и обратка длиной двести метров была запланирована напрямую с крыши до блоков охлаждения в ЦОД, который находился в цоколе. В итоге, при даже небольшом прорыве трубы или неплотных соединениях внутренних блоков охлаждения все десять тонн этиленгликоля под давлением могли затопить ЦОД и электрощитовую заказчика.

Не забывайте о резервировании не только вычислительного оборудования, но и основных инженерных систем, и пусть ваш ЦОД работает вечно!

habr.com

Схемы резервирования инженерных систем ЦОД

Схемы резервирования инженерных систем ЦОД

Что такое схема с N элементами в системе резервирования и как разобраться с, казалось бы, сложной таблицей Менделеева дата-центра?

Прежде всего, необходимо сказать, что обозначение N происходит от английского слова «need», что в переводе обозначает «необходимость». А для ЦОД необходима его бесперебойная работа, то есть системы резервирования прежде всего отвечают за отказоустойчивость источников бесперебойного питания и систем охлаждения.

Для системы резервирования этот символ N является обозначением необходимой нагрузки для эффективной работы оборудования. В одной системе, как правило, используются несколько N элементов. Их принцип работы зависит от схем, по которым они были воспроизведены. Существует несколько основных видов резервирования: N, N+1, 2N, 2N+1, 2(N+1), 3/2N.

В зависимости от установленной схемы резервирования можно говорить об отказоустойчивости системы: чем система сложнее, тем она дороже и, соответственно, более устойчива к отказам и ошибкам.

N. Отличительная черта такой схемы резервирования в том, что как такового резервирования в ней нет, а надежность зависит от каждого отдельного элемента N. При сбое в работе одного из них незамедлительно будет прекращена вся работа системы. Причина в том, что, когда один из элементов выходит из строя, его нагрузку перераспределить будет некуда. В результате такого сбоя данные могут быть безвозвратно утеряны, и это повлечет за собой, соответственно, материальные убытки. Эта схема уже давно не эксплуатируется как раз по причине того, что цена простоя всего ЦОД в случае неполадок слишком высока. По сути, при данной схеме зачастую отсутствует сам ИБП или генератор, а если даже они и есть, то представлены одномодульными системами.

N+1 – схема с одним резервным элементом N. В системе N+1 резервный элемент остается незадействованным в работе до тех пор, пока в системе не произойдет сбой одного из основных элементов. В случае возникновения такого сбоя, резервный элемент примет на себя всю его нагрузку. Таким образом, система продолжит работать, но необходимость отключать всю систему для проведения ремонтных работ все еще возникнет.

Для этого предусмотрены вариации: N+2, N+3 и т.д., в зависимости от требований уровня надежности и безопасности. Но стоит учитывать, что в этом варианте усложнение схемы может привести к большему простою.

2N – это две полные параллельные системы для каждого элемента N. То есть каждый элемент N в такой схеме дублируется, а нагрузка одинакова на двух элементах. При этом ни один из них никогда не нагружается полностью, и системы делят нагрузку 50/50, но эффективность работы при этом значительно снижается. Однако, при такой системе резервирования сбой одного или нескольких элементов N или выход из строя одной из систем не повлияют на работу всей системы в целом.

 

 

2N+1 - это параллельная система резервирования, схожая с системой 2N, но с одним дополнительным резервным элементом.

Таким образом, если ЦОД выйдет из строя или потребуется техническое обслуживание, то всю нагрузку можно перенести на параллельный блок, в то время как сам дата-центр продолжит работу без остановок.

Схема 2(N+1)

– это параллельная система резервирования с дополнительным элементом N, в которой резервный элемент дублируется, то есть это две полные системы по схеме N+1. При возникновении сбоя или необходимости технического обслуживания резервные элементы N остаются в любом случае, резервируются и ИБП, и системы охлаждения, ДГУ ждет своего часа на отдельной площадке. Эта система считается самой отказоустойчивой.

Схема 3/2N включает в себя все преимущества системы 2N, но такая система загружена на 2/3, а не на 50/50 как в системе 2N, соответственно и производительность у 3/2N будет намного выше, а счета за электричество – значительно меньше. При отказе одного из элементов минимальна вероятность потери нагрузки. Даже если выйдет из строя один из ИБП, то его нагрузку подхватит соседняя система. Как и в любой другой схеме, здесь возможны вариации: к примеру, если добавить четвертую группу ИБП, то схема уже будет называться 4/3 N. Как ни странно, данная схема пришла их сетей передачи данных и большой популярности у дата-центров не пользуется.

 

 

N

Схемы резервирования

N

N+1

2N

2(N+1)

Вероятность отказа

Длительность простоя

Вероятность отказа

Длительность простоя

Вероятность отказа

Длительность простоя

Вероятность отказа

Длительность простоя

1

0.23%

20ч

0.0005%

0.046ч

0.0005%

0.046ч=164сек 

2.7·10-9

0.0009сек 

2

0.46%

39.9ч

0.0016%

0.137ч

4.7·10-6%

 1.5сек

2.4·10-5

0.008сек 

3

0.68%

59.7ч

0.0031%

0.273ч

 4.0·10-8%

 0.013сек

 9.7·10-5%

 0.03сек

4

0.90%

79.5ч

0.0052%

0.454ч

3.5·10-10

 0.0001сек

 2.7·10-7%

 0.08сек

5

1.13%

99.1ч

0.0077%

0.679ч

2.9·10-12

 0.000001сек

 6.0·10-7%

 0.20сек

6

1.35%

118.6ч

0.0108%

0.948ч

 2.5·10-14%

 0.8·10-8сек

 1.2·10-6%

 0.37сек

7

1.58%

138.1ч

0.0144%

1.261ч

 2.1·10-16%

 0.7·10-10сек

 2.1·10-6%

 0.65сек

8

1.80%

157.5ч

0.0185%

1.618ч

 1.9·10-18%

 0.6·10-12сек

 3.4·10-6%

 1.08сек

9

2.02%

176.7ч

0.0230%

2.018ч

 1.7·10-20%

 0.5·10-14сек

 5.3·10-6%

 1.67сек

10

2.24%

195.9ч

0.0281%

2.460ч

 1.4·10-22%

 0.5·10-16сек

 7.9·10-6%

 2.49сек

 

 

www.alldc.ru

принцип резервирования N+1 - это... Что такое принцип резервирования N+1?

 

принцип резервирования N+1
Системы бесперебойного электроитания (СБЭ), использующие принцип резервирования N+1, представляют собой системы с так называемым "горячим" (т. е. находящимся под нагрузкой) резервом.
[А. Воробьев. Классификация ИБП http://www.osp.ru/lan/2003/10/138056/ с изменениями]

EN

N+1 redundancy
A redundant method based on one module more than needed to fulfill the required performance. For instance, three parallel systems, each rated 2KVA, form a 2+1 redundant system for a 4KVA consumer. Failure of a single UPS will not affect systems operational performance.
[http://www.upsonnet.com/UPS-Glossary/]

Параллельные тексты EN-RU

N+X redundancy
Load remains secure in the event of a module failure.
One Ensuring a high level of availability while reducing the initial investment.
(N+1) or more (N+X) redundant modules could be added to the system

[GUTOR Electronic LLC]

Резервирование по принципу N+X
Электропитание нагрузки в случае выхода модуля из строя не прерывается.
Обеспечивается высокий уровень эксплуатационной готовности при сокращении первоначальных затрат.
В системе может быть один (резервирование по принципу N+1) или Х (резервирование по принципу N+X) резервных модулей.

[Перевод Интент]

 

 

N + 1 Redundancy ensures maximum uptime and continuous availability

Резервирование по принципу N + 1 минимизирует время простоя и обеспечивает постоянную готовность оборудования

Symmetra Power Array achieves N+1 redundancy and higher through proven power sharing technology.

Power sharing means that all of the power modules in a Power Array run in parallel and share the load evenly.

N+1 redundancy means running one extra module than will support your full load.


В ИБП семейства Symmetra Power Аггау резервирование по принципу N+1 или с более высокой избыточностью реализуется на основе проверенной практикой технологии распределения нагрузки.

Все модули электропитания работают параллельно и несут одинаковую нагрузку.

Резервирование по принципу N+1 означает, что число модулей электропитания превышает на 1 необходимое для питания защищаемых устройств при их работе на максимальную мощность.

In this way, all of the modules support one another.

Таким образом, каждый модуль подстраховывает другие модули

For example, if your computer load is 15kVA, you achieve N+1 with five 4kVA Power Modules.

Например, если максимальная потребляемая мощность компьютерной системы составляет 15 кВА, то для резервирования по принципу N+1 требуется пять модулей электропитания по 4 кВА каждый.

If a module fails or is removed, the other modules instantaneously begin supporting the full load.
It does not matter which module fails because all of the modules are always running and supporting your load.

В случае аварии или отключения одного из модулей нагрузка мгновенно перераспределяется на остальные модули.
Не имеет значения, какой именно из модулей прекратит работу - каждый одновременно выполняет функции и основного и резервного.

technical_translator_dictionary.academic.ru

принцип резервирования N+1 - это... Что такое принцип резервирования N+1?

 

принцип резервирования N+1
Системы бесперебойного электроитания (СБЭ), использующие принцип резервирования N+1, представляют собой системы с так называемым "горячим" (т. е. находящимся под нагрузкой) резервом.
[А. Воробьев. Классификация ИБП http://www.osp.ru/lan/2003/10/138056/ с изменениями]

EN

N+1 redundancy
A redundant method based on one module more than needed to fulfill the required performance. For instance, three parallel systems, each rated 2KVA, form a 2+1 redundant system for a 4KVA consumer. Failure of a single UPS will not affect systems operational performance.
[http://www.upsonnet.com/UPS-Glossary/]

Параллельные тексты EN-RU

N+X redundancy
Load remains secure in the event of a module failure.
One Ensuring a high level of availability while reducing the initial investment.
(N+1) or more (N+X) redundant modules could be added to the system

[GUTOR Electronic LLC]

Резервирование по принципу N+X
Электропитание нагрузки в случае выхода модуля из строя не прерывается.
Обеспечивается высокий уровень эксплуатационной готовности при сокращении первоначальных затрат.
В системе может быть один (резервирование по принципу N+1) или Х (резервирование по принципу N+X) резервных модулей.

[Перевод Интент]

 

 

N + 1 Redundancy ensures maximum uptime and continuous availability

Резервирование по принципу N + 1 минимизирует время простоя и обеспечивает постоянную готовность оборудования

Symmetra Power Array achieves N+1 redundancy and higher through proven power sharing technology.

Power sharing means that all of the power modules in a Power Array run in parallel and share the load evenly.

N+1 redundancy means running one extra module than will support your full load.


В ИБП семейства Symmetra Power Аггау резервирование по принципу N+1 или с более высокой избыточностью реализуется на основе проверенной практикой технологии распределения нагрузки.

Все модули электропитания работают параллельно и несут одинаковую нагрузку.

Резервирование по принципу N+1 означает, что число модулей электропитания превышает на 1 необходимое для питания защищаемых устройств при их работе на максимальную мощность.

In this way, all of the modules support one another.

Таким образом, каждый модуль подстраховывает другие модули

For example, if your computer load is 15kVA, you achieve N+1 with five 4kVA Power Modules.

Например, если максимальная потребляемая мощность компьютерной системы составляет 15 кВА, то для резервирования по принципу N+1 требуется пять модулей электропитания по 4 кВА каждый.

If a module fails or is removed, the other modules instantaneously begin supporting the full load.
It does not matter which module fails because all of the modules are always running and supporting your load.

В случае аварии или отключения одного из модулей нагрузка мгновенно перераспределяется на остальные модули.
Не имеет значения, какой именно из модулей прекратит работу - каждый одновременно выполняет функции и основного и резервного.

technical_translator_dictionary.academic.ru

Теория вероятностей: резервирование и время безотказной работы ЦОД

Данная статья — первая в своём роде и посвящена применению теории вероятностей для сравнения различных схем резервирования оборудования в ЦОД, вычислению достигаемого времени безотказной работы, а также финансовым рискам.

Известно, что каждое оборудование имеет такие характеристики, как ресурс, время безотказной работы и средняя длительность простоя за год использования. Также заметим, что уровни надежности ЦОД (Tier), являясь одной из основных характеристик ЦОД, зависят от времени простоя за год. Это неспроста: именно от длительности простоя зависит успешность бизнеса компании и её непредвиденные убытки.

Итак, при построении ЦОД вкладывают деньги для реализации той или иной схемы резервирования с целью сократить время простоя и, следовательно, сократить и убытки от простоев. Всегда ли оправдываются эти вложения? Всё зависит от схемы резервирования. Именно по этому критерию будет разделен последующий материал.

Схема резервирования отсутствует: N

В данном случае ни одна система не  резервируется (Tier I) и  простой каждой единицы оборудования означает простой всего ЦОД. Общий простой ЦОД за год составляет 28.8ч (Коэффициент отказоустойчивости 99,671%). Эта схема была характерна для ЦОД 60-70х годов прошлого века и полностью изжила себя к настоящему моменту по причине предельной убыточности: сегодня убытки компании от пары часов простоя если и не превышают стоимость дополнительной (резервной) единицы оборудования, то как минимум равны ей.

Схема резервирования N+1

Схема резервирования N+1 наиболее распространена на сегодняшний день. Согласно ей, к N рабочим единицам добавляется одна резервная. Здесь всегда важно правильно определить значение N. Рассмотрим этот аспект, условно приняв, что штатный простой одной единицы оборудования составляет S0 часов в год (вероятность отказа равна P0=S/(24ч/дн*365дн)=S/8760).

Очевидно, если N=0, то время простоя в год S(N=0)=S0, а вероятность отказа P(N=0)=S/8760= P0.

Если N=1, то вероятность отказа соответствует случаю, когда одновременно не работают обе единицы оборудования. P(N=1)=P1=P0*P0, S(N=1)=S1=P0*P0*8760.

При N≥2 система неработоспособна, если одновременно отключилось не менее двух любых единиц оборудования. Таким образом, в случае N=2 должны отключиться (1 и 2), (2 и 3), (1 и 3) единицы оборудования (вероятность каждого события равна P1=P0*P0) при условии работоспособности третьей единицы (вероятность 1-P0) или все три (1, 2 и 3) вместе (вероятность равна P0*P0*P0). Получаем следующую вероятность отказа системы: P2=3*P0*P0*(1-P0)+P0*P0*P0.

Для N=3 имеем три случая отказа:

  • вышли из строя любые две единицы оборудования (шесть вариантов с вероятностью P1=P0*P0 каждый) при условии работоспособности оставшихся двух единиц (вероятность (1-P0)*(1-P0)),
  • вышли из строя  любые три единицы оборудования (четыре варианта вероятностью P0*P0*P0 каждый) при условии работоспособности оставшейся единицы (вероятность 1-P0),
  • вышли из строя все четыре единицы оборудования (вероятность P0*P0*P0*P0).

Итоговая вероятность P3=6*P0*P0*(1-P0)*(1-P0)+4*P0*P0*P0*(1-P0)+ P0*P0*P0*P0.

Существует и общая формула для любого N, состоящая из N слагаемых. Однако, заметим, что, ввиду малости P0, первое слагаемое наиболее велико, а остальные практически не дают вклада в итоговую вероятность. Таким образом, немного потеряв в точности можно сократить число слагаемых до одного — первого. Тогда:

P1=P0*P0,

P2=3*P0*P0*(1-P0),

P3=6*P0*P0*(1-P0)*(1-P0),

…………

P(N)≈С(N+1,2)*P0^2*(1-P0)^(N-1), где B(2,N+1) — количество вариантов выборки 2 элементов из N+1 (на языке комбинаторики: сочетание из N+1 по 2), С(N+1,2) = (N+1)! / (2!·(N+1-2)!) = (N+1)! / (2·(N-1)!) = N*(N+1)/2. Итак,

P(N)≈N*(N+1)*P0^2*(1-P0)^(N-1)/2; S(N)=P(N)*8760.

Рассмотрим применение полученных формул на примере.

Пример №1. Штатный простой оборудования в год составляет 100 часов. Каков будет простой оборудования без резервирования и при схеме резервирования N+1 с различными N?В данном случае S0=100, P0=100/8760=0.0114=1.14%. Используя формулу для P(N) заполняем таблицу 1:
Конфигурация Вероятность отказа, % Время простоя за год, ч
1 1.14% 100
1+1 0.0130% 1.14
2+1 0.0335% 2.93
3+1 0.0764% 6.69
4+1 0.1260% 11.03
5+1 0.1867% 16.35

Вывод: Вероятность отказа и время простоя на порядок ниже при использовании схемы резервирования N+1, чем при отсутствии резерва вовсе. Однако, вероятность отказа и время простоя растет с ростом N, т.е. с ростом общего числа элементов в системе. Тем самым выполняется принцип “чем сложнее система, тем она менее надежна”. Интересно, что в этом примере вероятность отказа при N=14 сравняется с конфигурацией без резерва.

Данные, приведенные в примере, характерны, например, для ИБП. Если учесть, что простой системы бесперебойного питания означает отсутствие питания как такового, а, значит, и простой всего ЦОД. По данным Berkeley Internet Week 2000 Contingency Planning Research, приблизительные потери, которые могут быть вызваны простоем продолжительностью в 1ч на предприятиях различных типов в США составляют (таблица 2):

Тип предприятия Стоимость часа простоя
Биржевые транзакции Несколько млн. долл.
Авторизация кредитных карт (банки) $2 000 000
Amazon $180 000
Бронирование билетов на самолеты $89 000
Резервирование (отелей, автомобилей и т.п.) $41 000
Банкоматы $14 000

Поэтому разница между конфигурациями 1+1 и 3+1 для компании по бронированию билетов может обойтись в __________$45 000.

Схема резервирования 2N

Согласно схеме резервирования 2N каждый элемент системы дублируется аналогичным.

Вероятность отказа ИБП и российские электросети

Большинство ИТ-оборудования, устанавливаемого в ЦОД требует высокого качества питания. Именно такое электропитание призваны обеспечить источники бесперебойного питания. При расчете рисков, связанных с обесточиванием ЦОД, огромное значение имеет доступность ИБП. В интернете можно найти следующие данные по доступности ИБП при различных конфигурациях системы бесперебойного питания (таблица 3 (Журнал сетевых решений “LAN”, №10 за 2008г.)):

Конфигурация ИБП Доступность (с байпасом), % MTBF
1+1 99.99999932 2182.9
2+1 99.99999899 1455.3
3+1 99.99999865 1091.5
4+1 99.99999831 873.2
5+1 99.99999797 728.4
6+1 99.99999763 624.3
7+1 99.99999730 545.3
8+1 99.99999696 485.6
9+1 99.99999662 437.0
10+1 99.99999628 397.3

Как видно, доступность системы весьма велика, а время простоя для случая “1+1″ составит всего 0.2 секунды в год. Означает ли это, что Заказчик может рассчитывать на простой ЦОД в течение 200 миллисекунд в год?

Конечно, ответ “нет”! Но он скрыт в словах “с байпасом” во второй колонке таблицы. Оказывается, что в течение 0.2с ЦОД будет просто без питания, а всё остальное время он хоть грязное питание из сети (по линии байпаса), но получит. Обратимся к первоисточнику: что нам обещают предоставить электросети?

Согласно ГОСТ 13109-87 п.6.2, качество электрической энергии не должно выходить за рамки допустимого диапазона в течение 95% времени (438 часов в год). А длительность подачи электроэнергии пониженного качества не должна превысить 90 часов за год.

Таким образом, порядка 90 часов в год ЦОД будет запитан низкокачественной электроэнергией, что по сути можно приравнять к его простою (если ещё не выходу из строя некоторого (наиболее чувствительного и, как правило, наиболее дорогого) серверного оборудования). Следовательно, вместо доступности 99.99999932% получаем доступность 99.99999932%*95%=94.999999354%≈95%.

Вывод: в течение 438 часов ежегодно ЦОД будет лишен требуемого качества электропитания, а убытки компании по резервированию отелей, согласно таблице 2, составят $17.5 млн.

Автор: Хомутский Юрий / alldc.ru

telecombloger.ru

принцип+резервирования+n+1 — с английского на русский

 

принцип резервирования N+1
Системы бесперебойного электроитания (СБЭ), использующие принцип резервирования N+1, представляют собой системы с так называемым "горячим" (т. е. находящимся под нагрузкой) резервом.
[А. Воробьев. Классификация ИБП http://www.osp.ru/lan/2003/10/138056/ с изменениями]

EN

N+1 redundancy
A redundant method based on one module more than needed to fulfill the required performance. For instance, three parallel systems, each rated 2KVA, form a 2+1 redundant system for a 4KVA consumer. Failure of a single UPS will not affect systems operational performance.
[ http://www.upsonnet.com/UPS-Glossary/]

Параллельные тексты EN-RU

N+X redundancy
Load remains secure in the event of a module failure.
One Ensuring a high level of availability while reducing the initial investment.
(N+1) or more (N+X) redundant modules could be added to the system

[GUTOR Electronic LLC]

Резервирование по принципу N+X
Электропитание нагрузки в случае выхода модуля из строя не прерывается.
Обеспечивается высокий уровень эксплуатационной готовности при сокращении первоначальных затрат.
В системе может быть один (резервирование по принципу N+1) или Х (резервирование по принципу N+X) резервных модулей.

[Перевод Интент]

 

 

N + 1 Redundancy ensures maximum uptime and continuous availability

Резервирование по принципу N + 1 минимизирует время простоя и обеспечивает постоянную готовность оборудования

Symmetra Power Array achieves N+1 redundancy and higher through proven power sharing technology.

Power sharing means that all of the power modules in a Power Array run in parallel and share the load evenly.

N+1 redundancy means running one extra module than will support your full load.


В ИБП семейства Symmetra Power Аггау резервирование по принципу N+1 или с более высокой избыточностью реализуется на основе проверенной практикой технологии распределения нагрузки.

Все модули электропитания работают параллельно и несут одинаковую нагрузку.

Резервирование по принципу N+1 означает, что число модулей электропитания превышает на 1 необходимое для питания защищаемых устройств при их работе на максимальную мощность.

In this way, all of the modules support one another.

Таким образом, каждый модуль подстраховывает другие модули

For example, if your computer load is 15kVA, you achieve N+1 with five 4kVA Power Modules.

Например, если максимальная потребляемая мощность компьютерной системы составляет 15 кВА, то для резервирования по принципу N+1 требуется пять модулей электропитания по 4 кВА каждый.

If a module fails or is removed, the other modules instantaneously begin supporting the full load.
It does not matter which module fails because all of the modules are always running and supporting your load.

В случае аварии или отключения одного из модулей нагрузка мгновенно перераспределяется на остальные модули.
Не имеет значения, какой именно из модулей прекратит работу - каждый одновременно выполняет функции и основного и резервного.

Тематики

EN

translate.academic.ru

принцип резервирования n 1 — с русского на все языки

 

принцип резервирования N+1
Системы бесперебойного электроитания (СБЭ), использующие принцип резервирования N+1, представляют собой системы с так называемым "горячим" (т. е. находящимся под нагрузкой) резервом.
[А. Воробьев. Классификация ИБП http://www.osp.ru/lan/2003/10/138056/ с изменениями]

EN

N+1 redundancy
A redundant method based on one module more than needed to fulfill the required performance. For instance, three parallel systems, each rated 2KVA, form a 2+1 redundant system for a 4KVA consumer. Failure of a single UPS will not affect systems operational performance.
[ http://www.upsonnet.com/UPS-Glossary/]

Параллельные тексты EN-RU

N+X redundancy
Load remains secure in the event of a module failure.
One Ensuring a high level of availability while reducing the initial investment.
(N+1) or more (N+X) redundant modules could be added to the system

[GUTOR Electronic LLC]

Резервирование по принципу N+X
Электропитание нагрузки в случае выхода модуля из строя не прерывается.
Обеспечивается высокий уровень эксплуатационной готовности при сокращении первоначальных затрат.
В системе может быть один (резервирование по принципу N+1) или Х (резервирование по принципу N+X) резервных модулей.

[Перевод Интент]

 

 

N + 1 Redundancy ensures maximum uptime and continuous availability

Резервирование по принципу N + 1 минимизирует время простоя и обеспечивает постоянную готовность оборудования

Symmetra Power Array achieves N+1 redundancy and higher through proven power sharing technology.

Power sharing means that all of the power modules in a Power Array run in parallel and share the load evenly.

N+1 redundancy means running one extra module than will support your full load.


В ИБП семейства Symmetra Power Аггау резервирование по принципу N+1 или с более высокой избыточностью реализуется на основе проверенной практикой технологии распределения нагрузки.

Все модули электропитания работают параллельно и несут одинаковую нагрузку.

Резервирование по принципу N+1 означает, что число модулей электропитания превышает на 1 необходимое для питания защищаемых устройств при их работе на максимальную мощность.

In this way, all of the modules support one another.

Таким образом, каждый модуль подстраховывает другие модули

For example, if your computer load is 15kVA, you achieve N+1 with five 4kVA Power Modules.

Например, если максимальная потребляемая мощность компьютерной системы составляет 15 кВА, то для резервирования по принципу N+1 требуется пять модулей электропитания по 4 кВА каждый.

If a module fails or is removed, the other modules instantaneously begin supporting the full load.
It does not matter which module fails because all of the modules are always running and supporting your load.

В случае аварии или отключения одного из модулей нагрузка мгновенно перераспределяется на остальные модули.
Не имеет значения, какой именно из модулей прекратит работу - каждый одновременно выполняет функции и основного и резервного.

Тематики

EN

translate.academic.ru

0 comments on “Резервирование n 1 что это – резервирование инженерных систем / Группа Компаний ХОСТ corporate blog / Habr

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *