Skip to main content.

Monday, November 14, 2005

 写真をはじめ我が家すべてのデータを保存しているサーバーのネットワークドライブが突然読めなくなってしまった。サーバーのストレージはPROMISE FastTrak SX4000に120GBのIDE HDDを4台接続したRAID5で構成し360GBの容量をもっている。このデータが消失してしまうと大変だ。予期せぬ事態に復旧は手間取った。  原因はHDDの1台が故障したことであった。しかし、PROMISE FastTrak SX4000(以下SX4000という)のメンテナンス画面ではなにやら訳のわからない状態を示していた。HDDの2台だけが正常で、1台は認識出来ず、残る1台に不具合があるという。別のPCにこれらのHDDを繋いでみたりしたが原因は判らなかった。WindowsXPのドライバを最新のものにしても駄目だ。まさかと思いながらSX4000のBIOSを最新のものに換えてみたら状況が変わった。4台のHDDのうち、3台は正常で1台が故障していると表示された。WindowsXPを起動するとデータが読めるようになった。システムはクリティカルな状態になっているが、取りあえずデータを別のPCにコピーする作業を開始した。データのほとんどは正常にコピーできたが、一部のデータは読込途中でエラーを起こしてしまうものがあった。試行錯誤の間、何度も起動・停止を行ったことが原因だったのだろうか。
 HDDの故障とBIOSのバージョンが古かったことが重複して復旧に手間取ってしまった。この経験から次の2点、教訓を得た。
 実運用を始める前に故障をシミュレートしておくことが必要である。具体的にはRAIDを構成するHDDのうち1台の電源を抜いて起動し、システムの状態を確認してみることだ。電源を外したHDDに異常のあることをシステムが告げるか否かを確認する。システムが的確に異常を告げれば、電源を落とし先に外したHDDの電源をつないでリビルド出来るか確認する。この操作を各HDDで試し、どのHDDでも正常にリビルド出来ればまずは安心だ。
 専用コントローラを使う場合は互換性のある予備のコントローラを用意しておく必要がある。なぜなら、HDDの故障ならば容量や機種が異なっても再構築は可能である。しかし専用のRAIDコントローラはメーカーや機種が異なると利用できないし、コントローラが故障した時に同じものを入手するのが困難であるからだ。
 このことから、専用のコントローラによるRAID5を運用するのはリスクが大きいと判断し、LinuxのソフトウェアRAIDでサーバーを再構築することにした。これならばI/Fを選ぶことはないので安心であり、ドライブの構成と順番を変えなければ別のPCに移行することも可能だ。

 デジタルカメラは画素数が増えた。動画もDVテープからHDDやDVDそしてメモリなどに代わり、パソコンへの取り込みが容易になった。これらの背景から、ストレージの大容量化に対するニーズはますます高まってきている。データの保全には今後も悩まされそうだ。


◆関連書籍◆

ハード・ディスク装置の構造と応用―記録・再生の原理とメカニズム&インターフェース


ATA(IDE)/ATAPIの徹底研究


PCカード/メモリカードの徹底研究―規格の概要からカード/ホストコントローラ/ドライバの設計/製作


玄箱の本
玄箱の本
米田 聡吉川 敦川井 義治
毎日コミュニケーションズ



玄箱で遊ぼう!!―玄箱/玄箱HG対応


<%TrackBack(url)%> <%TrackBack(count)%>

Comments

No comments yet

Add Comment