Sida 1 av 1

Felsökning av Server

Postat: 15 sep 2009, 17:33
av walle
I natt inträffade ett allvarligt fel på min server hemma. När jag skulle logga in via SSH så gick inte det, utan anslutningen stängdes ned varje gång jag försökte koppla upp mig. Som tur var så har jag tillgång till datorn fysiskt så att jag kunde koppla in skärm och tagentbord för att se vad det var för något som strulade. Då var allt så uppskrivat att det gick inte att använda något. Den svarade, men även om jag var root så vägrade den att starta datorn (är inte ens säker om den överhuvudtaget mottog komandot). Hur som helst, efter att jag manuelt startat om datorn (genom att trycka reset) verkade allt som vanligt till en början, men sedan kom det följande meddelande när den körde diskkoll på sda6:

Bild

Sedan fick jag följande uppmaning:

Bild

Efter att jag loggat in som rot, kört komandot "fsck -f", svarat Ja på alla frågor, gjort manuel omstart (det gick inte starta om med komandot heller, men den svarade åtminstonde och "smimulerade" en omstart) och gjorde diskkoll så verkar serven må fint nu (förutom att felmeddelndet dyker upp igen, men den verkar må bra ändå som sagt).

Allt är frid och fröjd igen, men jag vill förstås förhindra att detta händer igen eller åtminstonde veta vad felet beror på. Alltså är en ordentlig felsökning på sin plats och bör kunna besvara frågan, dock vet jag inte vilken ända jag ska börja i. Dock har jag konstaterat att det har någonting med någon av hårddiskarna att göra, förmodligen systemhårddisken.

All form av hjälp uppskattas!

Re: Felsökning av Server

Postat: 16 sep 2009, 23:20
av webaake
Är det fel på root filsystemet är det säkrast att boota från en Live CD och köra fsck på den omonterade partionen (sda6) därifrån. T ex detta:

sudo e2fsck -f -y -v -C0 -D /dev/sda6

Re: Felsökning av Server

Postat: 16 sep 2009, 23:40
av walle
Ska jag köra den även om den är igång och (till sysnes) fungerar bra? Går det bra att välja vilken linux live-cd som helst (har ubuntu desktop 8.10 på skiva, men ubuntu server installerat på serven)?

Sedan jag postade inlägget har jag funderat på hur felet har kunnat uppstå. Det som ligger närmast till hands är att hårddisken gjorde något fel när den skrev till disken, vilket skulle kunna tyda på att hårddisken kan vara dålig. Finns det något bra sätt att kolla detta? Det finns olika program som analyserar hårddisken och utifrån det berättar den i vilken kondition den är i. Finns det något motsvarande till linux?

Re: Felsökning av Server

Postat: 17 sep 2009, 06:38
av webaake
Det spelar ingen större roll vilken distro du bootar från e2fsck är väl det enda verktyg som finns och ett terminalprgram lär ju finnas också. Du kan ju noga studera vad e2fsck meddelar i terminalen så kanske du får ledtrådar där. Du kan också börjha med att bara köra "e2fsck -c" för endast leta efter dåliga block t ex. Mer info här:
http://linux.derkeiler.com/Mailing-List ... 01386.html

Ta backup på det viktiga!

Re: Felsökning av Server

Postat: 19 sep 2009, 00:36
av walle
Så, nu när jag äntligen fick lite tid över så kunde jag äntligen köra kommandorna. Tydligen så fanns det hal 16 dåliga block och av någon typ av meddelande i stil med "Program error? Block #NNNNN claimed for no reason in process_bad_block". Jag körde scanningen två gånger och den andra gången så verkar det som allt var fixat. Men jag är ändå orolig för om detta är tecken på att hårddisken håller på att gå sönder, även om den i övrigt verkar som att den beter sig normalt.

Edit: Upptäckte nu att jag får samma typ av felmeddelande som första bilden igen. Varför håller den på så här?

Re: Felsökning av Server

Postat: 19 sep 2009, 07:37
av webaake
Tyvärr ser det ut som om den börjar bli dålig. Ett typiskt tecken är att de dåliga blocken ökar. Har du garanti på den disken?

Re: Felsökning av Server

Postat: 19 sep 2009, 08:27
av dmz
Jag kan av egen, bister erfarenhet säga dig att när du inte längre litar på disken; byt.

Re: Felsökning av Server

Postat: 19 sep 2009, 15:54
av walle
Disken är mindre än ett år gammal så garanti bör fortfarande vara giltigt, men frågan är om garantin inte gäller först när hårddisken har gått helt sönder eller om det räcker att man säger att det är dåliga block på den. Men ska det här vara normalt om hårddisken har sått och gått dyngnet runt, året om?