1か月ほど前、仕事先でのこと。
自分のマシンではないが、一緒に仕事をしている人のノートパソコンが起動しなくなった。
原因はこの時点で不明。 Windows の読み込み中になにか失敗しているようだった。
つまり、ハードディスクのデータが壊れたのだろう。
このノートパソコン、自分持仕事先で同じものを使っていたのだが、もう5~6年前のもの。
Windows 8 入れようとしたが「性能が足りないよ」と言われて入れられない。そんなシロモノ。
もうかなり遅いマシンなのだが、僕は少しでも快適に使えるように、頻繁にデフラグしたり、不要なファイルを消去したりしていた。
一方、壊れたマシンではそういう作業はしていなかったようだ。
壊れたマシンは、その後の調査でセクタリードエラーが出ていたようだ。
仕事で使うのに不安定では困る、ということで、ハードディスクごと入れ替えて再インストールとなった。
で、自分のマシン。同時期に買ったものなので気になる。
とりあえず、全セクタチェックしておいた。非常に時間がかかるので、仕事終了後にチェックをかけてほおっておく。
(終了すると電源が切れる設定)
ハードディスクのデータは、磁気で記録されているが、徐々に磁気が失われる。
チェックする、と言う名目で読み出しを行うと、その際に磁気の強さも測定され、弱っていたら再書き込みされる。
これでしばらくは安心のはず。
(頻繁にデフラグしていたのも、デフラグによる高速化も目的ではあるが、セクタにアクセスしてほしいため。
ただ、デフラグの場合は「問題ない」セクタまでは読んでくれないため、時々全セクタチェックした方が良いのだろう)
さて、今週の話だが、その仕事先で使っているサーバーを、都合があって別の部屋に移動した。
まず、すべてのサーバーを停止する。
xen のバーチャルサーバーの停止から始める。
…いくつか、正常に停止しないサーバーがある。
調べてみると、xen にバグがあって、システム終了を正しく認識してバーチャルサーバー終了を行えないことがあるようだ。
バーチャルサーバー起動後にマシン設定を変えたり、サーバーの OS をアップグレードしたりするとなりやすいバグだ、とのことだが、今回うまく動作しなかったのは、古い(Xenの準仮想化対応でない) Linux を、完全仮想化で動かしていたサーバー。
さて、全部停止したら、移動後再起動。
…再起動しないサーバーがいくつか。
物理的にはハードウェア4台なのだけど、バーチャル化したものが十数台ある。
このうち数台が起動しない。
再起動しないバーチャルサーバーが、ある1台の物理サーバーに集中していた。
念のため、物理サーバーのファイルシステムをチェックする。
結構時間がかかり、サーバー移行作業が予定時間よりもオーバーしてしまったのだが、大きな問題はないようだった。
(いくつか、不整合の修正は行われたようだ)
もっとも、fsck では全セクタチェックしてくれるわけではないし、ファイル情報に矛盾がなければ OK になってしまうのだけどね。
再起動すると問題なくバーチャルサーバーも起動。
fsck したから起動した、というだけでなく、他に設定がおかしくて起動しない部分もあったので修正したりしたのだけど。
#自分がやったように書いているが、サーバーの再起動関連は全部サーバー管理者がやったこと。
僕は念のためのダブルチェックや、再起動しなかった時の設定確認などを手伝ったけど、それだけ。
これらのサーバーも古いので、移行作業で思わぬトラブルが発生する危惧もあったのだが、それほど大ごとにならず終了。
先に書いた完全仮想化で動く古い Linux サーバーなどは、停止できるようにしばらく前から準備している。
この面では今後の問題はないだろう。
同じテーマの日記(最近の一覧)
別年同日の日記
申し訳ありませんが、現在意見投稿をできない状態にしています。 |