Вечером 30го апреля у нас отказал один из серверов паркфлаера. Авария достаточно серьезная. База была на другом сервере, так что с заказами всё в порядке. Временно не работает создание новых заказов.
Сейчас переустанавливаем сервер, надеемся восстановить полную работоспособность 2-3го мая.
Сейчас переустанавливаем сервер, надеемся восстановить полную работоспособность 2-3го мая.
Насчет аварий если делается бекап там и там то не особо и серьезная, даже если сгорит основной SSD.
Был софтвенный RAID10 на 4 диска. Произошло следующее. Отказал один из дисков и система целиком зависла. В виду зависания система почему-то не обновила данные половинки страйпа на рабочем диске.
После перезагрузки система перестала подниматься вообще потому-что решила что половинка страйпа устаревшая.
Сборка массива с параметром force не работала. Был странный факт, в одной последовательности система писала что-то типа 'Invalid argument' на диск с отстающим времнем, а в другой - не ругалась, но и не включала диск в итоговый RAID10 и он поднимался inactive.
После всех попыток решили пересоздать (mdadm --create) RAID10 с параметром --assume-clean и missing диском. Перепробавали кучу последовательностей. Это ничего не дало, fs не монтировалась.
Сейчас переустановились и восстанавливаемся из бакапов.
Но есть и хорошие новости, в силу исторических причин система работала на RAID10 из 4хHDD, а теперь заменили RAID10 на 2xRAID1 один из которых запустили под базу на серверных SSD а статика и система на HDD. Всё будет работать сильно быстрее.
В общем, RAID10 в линуксах оказался глючен. Разобраться и всё исправить, конечно, было бы неплохо. Но в силу ограниченного времени пришлось переустановиться.
Если вам так или иначе дорого обходится время простоя техники, поставьте аппаратный рэйд-контроллер (варианты: Adaptec 8405+AFM-700 или LSI 9361-4i + FlashModule). И самое главное - сгенерите RAID-6. Это единственный уровень массива, который фиксит, какой именно диск помер или начал выдавать неверные (искажённые) данные.
На 4-х дисках вы получите эффективную ёмкость двух. Ёмкости остальных двух дисков уйдут на хранение контрольных сумм.
Единственный недостаток шестого рэйда - тормозной он на запись. Так у вас, по идее, записи не должно быть много. В основном чтение.
Программные массивы (типа LVM и т.п.) более менее ровно поддержаны только под виндами (Intel Storage Rapid Manager).
По супермикре - правильный выбор. Это правильное оборудование и разумное ценообразование.
По оптеронам - наша статистика продаж показывает, что АМД в России не канает вообще. Это я в плане гарантийного обеспечения. Фирмы-поставщики серверного оборудования держат гарантийную замену на складе, разумеется, только по массово-продаваемым компонентам. Так что не приведи господи у вас мать ляжет (что бывает !!!), можете вляпаться в долгую гарантию.