Be Silent! 〜 ミニサーバ日記 〜 19. 突然、壊れた


 やっと設定が一段落したと思った矢先に、突然ミニサーバが無応答に。(^_^;
 pingは届くが、sambaもDNSもメールも無応答になってしまってる。
 せっかく外したモニタとキーボードを、もう一度繋いでログオンを試みたが、こちらも無応答。
 あらら、Linuxでも突然ハングすることなんてあるのか・・・(いやそりゃあるだろうが) とか思いながら、電源切って再起動するより他に選択肢はないので、そうした。
 普通に立ち上がった。何だろう、たまたますごく運が悪かったのかな?とか思いながら、 念のため、fsck(ディスクチェック)をかけてみた。そしたらなんと、エラーがボロボロと。(^_^;
 あっれー、クラッシュに強いext3で使ってたハズなんだけどなー(^_^;
 うわーっ、それも100や200のエラーじゃないよ(^_^; あまりにエラーの数が多いので、fsck -y で全自動で やらせたら、途中でマシンごとハングアップしてしまった。おいおい(^_^;
 ログ見たら、ディスクI/Oエラーが、都合300MBほど書き出されていた(笑)。こりゃ、ディスクが 死んでるっぽいですね(買ってまだ日が浅いのに・・・)。 とはいえディスクは消耗品です。傷が浅いうちに、さっさと見切りをつけて、交換してしまいましょう。

 というわけで突発で会社休んでディスク買ってきた。ついでにバックアップ用に、 外付け用HDDとそのガワも買ってきた。
 ついでに冷却用にUSBファンも買ってきた。

 んで早速USBで繋いでフォーマットして、まだディスクが生きてるうちにバックアップを ・・・と思ったのだが、フォーマットの途中でハングアップしてしまう。(^_^; こっ、これは一体(^_^;。USBだからだろうか。しょうがないのでIDE接続で試してみようと思い、 もう一度でかけてIDEケーブルを買ってきて、それはもう苦労して取り付けて、 フォーマットしてみたのだが、それでもハングアップしてしまう。(泣)
 USBでもダメ、IDEでもダメ、ということは・・・HDDの初期不良かな。 というわけで、別のHDDを同じ接続方法で繋いでみて、さっきと同じ方法でフォーマットを試みる。

 げっ、またしても同じようなエラーが。ということは、HDDの初期不良の可能性も ゼロに近い。ひょっとして本体の故障かも。他に確認できるコンポーネントは・・・メモリ!
 というわけで、メモリチェックプログラムを 使ってテストしてみた。
 でるわでるわエラーが。(^_^;;;;;;
 2時間で20万超のエラーがレポートされました。うわぁ、こりゃダメだ。(^_^;
 どうも、64MB〜128MBの区間のメモリが死んでるらしく、OS立ち上げるだけなら そこまでのメモリは使わないので、普通に動いてたらしい。 しかし、ということは、メモリが異常な状態で、ディスクチェック&修復をかけてしまったということで、 復元するつもりが、実は壊してしまっていた可能性が高い。とほほ・・・。
 確認のため、近くの別なマシンからメモリを取り出して、壊れたメモリと差し替えて メモリチェックをしてみた。むぅやはりこちらはエラーが出ない。やはり一連の 不具合の原因はメモリが死んでいたためのようだ。熱死かな・・・(泣)

 数千円をケチって、そんなに変わらないだろうと思って、安いノーブラのメモリに したのがいけなかったのだろうか。ということで今度は由緒正しいI/Oデータの メモリを買ってきた。
 で、再びメモリチェック。(もう私、これからはマシンとかメモリとか買ったら 最初にメモリチェックかけますよ(笑))
 すると、前ほどではないにしろ、またもエラーが。(^_^;
 しかもしかも、ファンで冷やしながらだと、エラーが出ない。どうやら 温度が高いときにだけ、稀にエラーが出るようだ・・・!
 これは不良か否か、判断が分かれるところだ。元々こちらはベアボーンマシンで メーカーの動作保証は全く受けられないに等しい。仕方がないので情に訴えることにする。

「あのうすいません(似非初心者)、(状況説明)、どうかなんとか(誠実)一度だけで結構ですので (恐縮)交換してもらえないでしょうか(平身低頭)・・・」

 交換して貰えたよ!ラッキー!頼んでみるもんだね!
 で、交換してもらったメモリで、再度メモリチェックしてみた。今度は冷却なしの 高温恒常状態で一晩回しても、エラーは出ない。良かった!

 結局、最初に疑ったディスクは、無実で無傷だったようだ。(^_^;


トップ もどる