|
Re: lug-bg: Мистериозно изключване на сървър ...
- Subject: Re: lug-bg: Мистериозно изключване на сървър ...
- From: Georgi Genov <ggenov@xxxxxxxxxxx>
- Date: Thu, 01 Sep 2005 05:12:37 +0300
- Delivered-to: lug-bg-list@xxxxxxxxxxxxxxxxxx
- Delivered-to: lug-bg@xxxxxxxxxxxxxxxxxx
Ivan Adams wrote:
Здраейте група,
много истории съм чувал за всякакви интересни случки от типа спрял
wireless заради микровълнова или чистачка спира сървър с цел да си
направи кафе ...
Така и не предполагах че такова нещо (или подобно) може да ми се
случи. Накратко - от Събота тази седмица мистериозно се спира ДВА ПЪТИ
(shutdown) един от сървърите (който е доста важен). Стаята където се
помещава е сървърно помещение и само 2ма души имат достъп, а те НЕ СА
направили нищо. Също там има други сървъри които нямат никакви
проблеми и не са спирали. Сървъра е на ЮПиЕс, и преди 3 дни обвиних
въпросния ЮПиЕс (много е малък, но не помня колко ампер/часа е ... -
сигурно държи не повече от 10 мин.) че не е пуснал тока след като е
дошъл. Това си го помислих по следната причина - когато отидох да видя
какъв е проблема забелязах че ЮПиЕс-а е превключил тока (не беше на
батерия) и не пищеше, а самият сървър беше изключен (за мое учудване
му светеха светлодиодите на лан картите! - не мога да си го обясня
това все още). Това което направих е да му измъкна кабела и да го
намъкна пак (не съм пипал копчето) при което въпросното желязо тръгна.
Поради тези причини си помислих че нещо не е от ПиСи-то.
Втория случай бе снощи. Тъй като бях махнал ЮПиЕс-а от веригата на
тока, си мислех че може да има спирания но компютъра трябва да се
пусне след това. За мое най-голямо учудване 2 дни след като беше
тръгнал пак угасна. При отиването (пак) на място виждам че пак е
изключен. Няколко пъти проверяваш биос-а, но всичко ми се видя наред.
Пък и тествах "спирането на ток" около 30 минути, като пъхах и
измъквах захранващия кабел както на сървъра така и на ЮПиЕс-а и при
всичките ми опити всичко тръгваше.
Реших да изследвам времето по което става случката и логовете около
това време. В единия случай е ~ 18 45, а по скорошния е ~ 23 00 часа.
Логовете мълчат по въпроса. Единственото което се логва е crontab-a.
Няма никакви грешки, от типа че ядрото мрънка или че някой даже се е
опитвал да влезе през ssh няма никакви логове за спиране на компютъра.
Просто спира всякаква информация по същото време. Паролата е знам САМО
аз ... никъде не съм е писъл и на никой не съм е казвал. Ползвам е на
няколко други места но там никой не знае 1 че е същата, 2 едва ли ще е
разбие с Джак изкормвача защото е доста символи.
Нещата които се сещам е случайно батерията на биоса да е сдала багажа,
но при този случай би трябвало да ми даде че биос-а не си знае датата
и пак да го настройвам.
Ако нещо започне систематично да става ми се върти из главата да
направя една нощна там, но бих желал да се реши проблема без такива
процедури. Всякакви препоръки приемам и ви благодаря предварително.
Ако ви трябва някаква информация, само я поискайте :)
Проблемите може да са ти няколко:
1. Новите захранвания имат добра защита от пренапрежение или т.н. токов
удар. Едно захранване е по-добро когато тази защита е по-чувствителна и
по бърза. Случвало ми се е при лек токов удар една машина да угасне а
други 10 да не разберат, че е имало такова нещо. Обикновенно след
задействане на защитата машината не тръгва сама. Най-вероятно UPS-а ти
няма защита от пренапрежение щом каза, че е малък предполагам и ефтин.
Спасението е или да се молиш това да не се случва често или да си купиш
външна защита или UPS тип Online такъв, който когато има ток не включва
байпас а работи през батерии (винаги). Има и още едно спасение а именно
да си купиш по смотано захранване което не е толкова чувствително на
токови удари.
2. Възможно е ако машината консумира много ток в даден момент мощността
на захранването да е не достатъчна. Това зависи от натоварването на
процесора до натоварването на дисковете и вентилаторите. Всички те
динамично променят консумацията си и слава богу, че е така за да
икономисват ток. Спасението е по-мощно захранване.Този вариант е малко
вероятен тъй като след такова рестартиране няма логика машината да не
стартира отново.
3. Възмовен е и още един случай ако имаш окисление крачета на процесора
или слота/сокета. По старите дъна ги правеха с медни пластини особенно
тип Слот. При много годишна работа те се окисляват и тогава контактното
съпротивление нараства или на кратко имаш ограничение на тока преминаващ
през тези пластини. Както знаем консумираната от процесора енергия е
динамично променяща се в зависимост от натоварването. Възможно е пак в
час пик просто да не му достига ток и той да заспива. Този вариант е
малко вероятен тъй като след такова рестартиране няма логика машината да
не стартира отново.
Според мен вариант 1 е отговора на проблема ти.
|
|
|