なーお さんの日記
2007
4月
21
(土)
06:24
本文
やはりこの日が来ました。
VineLinux4.0で運用中の、公開サーバー用ホストPCのHDD(Linux-Raid1) 80GB、 2台中の1台が「IOerror」をログに大量に吐き出して、お亡くなりになりました。 4年前から使っていたものの流用ですんで、仕方ありません。 予想より早かったと思えばそうですが、案外持ったほうかも。
それでも、エラー後もサーバー自体は稼動を継続しておりました。 (boot側のHDDでは無かったので、助かった。 boot側だったら即停止でした。)
1、公開エリアの仮想マシンの最新バックアップ(HDD→HDD)。 健在の方のDISKに復旧作業中に万一のことがあっても、他のマシンで立ち上げられます。 ( 6:45 →完了!)
2、故障したHDDを予備ディスク(これも古い)と交換(仮対策)。
- 7:00 交換用HDDを外付USBケースで接続し、FDISKでパーティションを作成。(本当は事前にやっておくべき) (^^;;;
- 7:15 シャットダウン?リブート時、/etc/fstabの記述にゴミがあって立ち上がらず一瞬慌てたが、viで編集して無事に立ち上がっ た。 公開エリアの仮想マシンも起動しサービス再開。 現在、/sbin/mdadm /dev/md0 -a /dev/hdc3 で再sync中。63Gb分で延べ約1時間。
- 8:15 sync完了。
dd if=/dev/sda2 of=/dev/sdc2 で/bootエリアをコピー。
dd if=/dev/sda1 of=/dev/sdc1 でwindowsエリアをコピー。 - 8:30 Grubで新DISKのMBRに書込み。 → 全作業完了。
3、 数日後、全ディスクを新品の250GBに交換予定。
(予備も含め3台)
会社としても痛い出費ですが、仕方ないですね。 消耗品ですから。 でも自分が出張中に発生しなくて、良かった。
追記: Linux-Raid1で組んだホストOS上に、仮想OSで公開するという構成は、構築の際に悩んで決めたものですが、今回トラブルで真価を実証してくれました。 何といっても復旧中の安心感が違います。
閲覧(23278)
コメント一覧
2件表示
(全2件)
すべてのコメント一覧へ
投稿ツリー
-
Re:[Linux] 公開鯖のHDD1台死亡
(thinkpad-lover, 2007/4/21 7:40)
-
Re^2:[Linux] 公開鯖のHDD1台死亡
(なーお, 2007/4/21 7:45)
thinkpad-lover
投稿日時 2007/4/21 7:40
サーバーの HDD が飛ぶのは結構つらいですよね。
公開サーバーはまだそういう状態になったことはありませんが、クライアントマシンでは、数台が HDD クラッシュを頻発しています。どれも結構な期間(3?4年)使用しているので、ある意味必然といえますが。
我が家の Fileserver は RAID0 なので、非常に怖い状況となっています。今年中に RAID 5 に切り替える予定ですが、それまで持つことを祈っています。
公開サーバーはまだそういう状態になったことはありませんが、クライアントマシンでは、数台が HDD クラッシュを頻発しています。どれも結構な期間(3?4年)使用しているので、ある意味必然といえますが。
我が家の Fileserver は RAID0 なので、非常に怖い状況となっています。今年中に RAID 5 に切り替える予定ですが、それまで持つことを祈っています。
なーお
投稿日時 2007/4/21 7:45
おお、thinkpad-loverさんからコメントが。 (嬉しいです。)
今回は、ダウンタイムは1時間程度で済みました。運が良かった。
でもLinux-RaidもRaid-tools→mdadmに変わって、滅多に触らないからこういうときに戸惑いますね。
thinkpad-loverさんはRaid-5に移行ですか。 でも電気代が・・? うちは当面、Raid-1+LVMで行きます!
今回は、ダウンタイムは1時間程度で済みました。運が良かった。
でもLinux-RaidもRaid-tools→mdadmに変わって、滅多に触らないからこういうときに戸惑いますね。
thinkpad-loverさんはRaid-5に移行ですか。 でも電気代が・・? うちは当面、Raid-1+LVMで行きます!
2件表示
(全2件)
すべてのコメント一覧へ