dépannage (que faire en cas de gros problème ?)

table des matières

  1. consulter les log système
  2. planté (impossible de se connecter)
  3. impossible de redémarrer normalement
  4. problème de loader
  5. impossible de passer root
  6. un problème pour démarrer X
  7. certains démons s'arrêtent
  8. perte des partitions
  9. problèmes mémoire
  10. outils disque
  11. analyse crash système
  12. récupération de disques hs

consulter les log système

elles sont sur /var/log
une bonne idée est de rediriger l'affichage des syslog vers une console (la 9 par exemple)
grâce a la ligne suivante dans le fichier /etc/syslog.conf :
# tout sur la console == console virtuelle 9
*.* /dev/tty9
cela permet de savoir ce qui se passe sans avoir a se connecter ...

planté (impossible de se connecter)

rebooter par alt+ctrl+del
et surveiller les écrans de démarrage

impossible de redémarrer normalement

démarrer sur une disquette de sauvegarde (Redhat) ou distribution tomsrtbt

et FAITES DES SAUVEGARDES

problème de loader

suite a une modification de partition par exemple, si on a oublie de relancer lilo ...
  1. rebooter sur tomsrtbt
  2. monter la partition de boot sur /mnt/toto par exemple
  3. modifier le fichier /mnt/toto/etc/lilo.conf
  4. relancer lilo par chroot /mnt/toto lilo -v

impossible de passer root

causes : perte mot passe, mauvais shell dans /etc/passwd ...
solutions :
  1. essayer de booter en single user
  2. disquette "rescue"

un problème pour démarrer X

Si vous ne démarrez pas :
  1. booter en single user
  2. passer en mode console : init 3
  3. lancer X par : startx > /tmp/x.output 2>1
  4. examiner le fichier /tmp/x.output

certains démons s'arrêtent

si on reçoit le message suivant dans /var/log/messages
inetd[9170]: pop3 server failing (looping), service terminated for 10 minutes
il suffit de modifier la config dans inetd.conf : augmenter le nombre max de demons que peut lancer inetd pour ce service

perte des partitions


problèmes mémoire

pour tester ses barrettes mémoire : memtest86

outils disque

analyse utilisant S.M.A.R.T. (Self Monitoring Analysis and Reporting Technology)

  1. smartsuite
  2. smart suite for linux
  3. ide-smart : un autre test SMART
est-ce que ça marche ?

analyse crash système

une documentation pour analyser les causes d'un plantage système

récupération de disques hs

récupération des données sur des disques "hs" avec ddrescue


version 0.55 du 24/04/2009
Eric Gerbier tux
documentation sous licence GNU Free Documentation License