Датацентр Воля

Авария в ДЦ Воля

Я умышленно перешел на русский язык ибо кроме мата и ругани у меня практически нет слов.
Третий час два сервера недоступны и как минимум один сервер упал по питанию.
Счастливые 467 дней аптайма когда-то должны были закончиться...

Перегрів raid-контролера

Ось таку бяку сьогодні отримав поштою:
[RAID-SYSTEM ALARM]
2012-6-19 12:14:16 Controller # 1 (PCI) Ctrl Board Temp. Over Temp.
Консольна утиліта управління рейд контролером показала:
[Controller H / W Monitor]
 CPU Temperature: 62 C
 Controller Temp. : 70 C
 CPU Fan: 2743 RPM
 12V: 12.403 V
 5V: 5.160 V
 3.3V: 3.392 V
 DDR-II +1.8 V: 1.872 V
 PCI-E +1.8 V: 1856 V
 CPU +1.8 V: 1.872 V
 CPU +1.2 V: 1.232 V
 DDR-II +0.9 V: 0.912 V
 Battery Status: 100%

Час в UTC, відповідно, аларм спрацював в 15:14 і закінчився в 16:01
[RAID-SYSTEM ALARM]

Авария в дата-центре ВОЛЯ!

Сегодня ночью в 00:41 потух мой сервер размещенный на площадке дата-центра Воля.

По телефону выяснил, что произошла авария и когда киевэнерго починит - неизвестно.

Ура! В 1:42 пришло уведомление что авария устранена + бонус )