RAID(Redundant Arrays of Inexpensive Disks)は、データの冗長性確保や、読み書き速度の向上などを目的に、さまざまな場所で使用されています。
RAIDには、RAID5やRAID6、RAID10(RAID1+0)といった3台以上のHDDにデータを保存して冗長性を高めているモードもありますが、HDD自体の故障によってデータに問題が発生する恐れも捨てきれません。
そのような際に役に立つのが、「ホットスペア」と呼ばれる機能です。
今回は、RAIDにおけるホットスペアの概要についてご紹介します。
1 RAIDにおけるホットスペアの概要
ホットスペアとは、RAID構成内にあらかじめ予備のHDD(ホットスペアディスク)を、稼働状態で格納しておくことです。「ホットスタンバイ」や「オンラインスタンバイ」と呼ばれることもあります。
ホットスペア機能を有効にすることで、RAIDを構成している1台のHDDに何らかの障害が発生した際に、自動でRAIDの再構築(リビルド)が行われるのが特長です。
例えば、格納した4台のHDDのうち3台にデータを保存し、残りの1台を予備(ホットスペアディスク)として待機させておくRAID5を構築したとします。
データを保存しているHDDの1台に障害が発生した際に、稼働状態で待機していたHDDがRAID構成に組み込まれることで、即時復旧が可能となるのです。
2 ホットスペアを使用しないとどうなる?
ホットスペアを使用できる場合は、万が一に備えて稼働させておくことがおすすめです。
ホットスペアを使用しないと、どのようなデメリットが発生するのでしょうか。
2-1 故障した際に手間がかかる
RAID1やRAID5を組んでいれば、RAIDを構成しているHDDが1台故障しても、保存しているデータは失われずに残り続けます。
故障したHDDを交換してRAID構成を復元すれば、元の状態を保つことが可能です。
この時、ホットスペアを使用していないと、HDDの交換作業を手動で行わなければいけません。HDDを交換する前に他のHDDが故障したり、交換するHDDを間違えたりすると、保存したデータの復元が困難になります。
HDDの交換作業中に、システムが停止して使えなくなる「ダウンタイム」が生じる点も問題です。
ホットスペアを使用すれば、障害が発生してもすぐに別のHDDにデータを引き継げるため、サーバーの復旧作業にかかる手間の軽減につながります。
2-2 データ消失のリスクが上がる
予備のHDDを用意したり、通電し続けたりするコストがかかる点は、ホットスペアのデメリットといえます。
しかし、ホットスペアを使用していないと、データ消失のリスクが上がってしまう点に注意が必要です。
RAIDを構成しているHDDに何らかの問題が発生した場合、正常なHDDに交換するまでは、冗長性が確保されない状態でRAIDシステムを運用しなければいけません。
交換作業のミスや遅れが原因でデータの消失・破損が生じると、復旧により多くのコストがかかります。
結果的に、ホットスペアを稼働させた方が、大きなリスクを回避することにつながるのです。
3 ホットスペアとコールドスペアとの違いは?
ホットスペアと同じように、サーバー/NASなどの冗長化を実現する方法に「コールドスペア(コールドスタンバイ)」があります。
コールドスペアは、予備のHDDを用意しておくものの、故障が発生するまでは起動させずに停止した状態で保管する方法です。障害が発生した際に予備のHDDを起動し、必要に応じて設定やデータの移行といった切り替え作業を行います。
ホットスタンバイより構成が単純で、予備機を常に動かし続ける必要もないため、ホットスペアより運用コストを抑えられるのがメリットです。
その反面、故障が発生してから予備機を起動することから、システムが一時的に停止するなど、耐障害性はホットスペアよりも劣ります。
それぞれメリット・デメリットが異なるため、常時稼働が求められるシステムはホットスペア、数時間の停止なら問題ないシステムはコールドスペアなど、適切な使い分けが求められます。
4 ホットスペアと併せて活用したいホットスワップ
ホットスペアと併せて覚えておきたい用語に「ホットスワップ(ホットプラグ)」があります。ホットスワップとは、通電した状態を保ったままHDDやファンなどの周辺装置や部品を取り外しできる機能のことです。
電源を入れて通電している状態の電気回路は、突然配線を切り離すと故障する可能性があります。一方で、ホットスワップ対応のシステムは、電源が入った状態でも問題なく機器を抜き差しすることが可能です。
5 ホットスペアは万全ではない点に注意
データの冗長性確保につながるホットスペアですが、データを守る対策として万全なわけではありません。
例えば、読み書きの高速化が目的のRAID0(ストライピング)は耐障害性を持たないため、ホットスペアを構成すること自体が不可能です。
RAID1やRAID5の場合も、ホットスペアを使用中に別のHDDでも問題が発生すると、障害の復旧ができなくなります。問題が発生したらすぐにHDDを交換し、再構築を行うことが重要です。
また、再構築の最中に何らかの問題が発生して、データが完全に消失してしまう恐れもあります。
重要なデータを保存しているHDDに何らかの障害が発生していたり、データが読み取れなかったりする場合は、データ復旧の専門業者に依頼することがおすすめです。
6 注意点を意識してホットスペアを活用しよう
ホットスペアを活用すれば、RAIDを構成しているHDDに問題が発生しても自動で再構築が行えます。
RAIDの冗長性を高め、データの安全な保存につながる点がメリットです。
復旧の際にシステムを停止させる必要がないため、ダウンタイムを防ぐことにもつながります。
とはいえ、ホットスペアはデータを100%守ることができる機能ではありません。RAID1やRAID5の場合、ホットスペアディスクを使用中に別のHDDでも障害が発生すると、データの復旧ができなくなってしまいます。
「ホットスペア機能があるから安心」と考えるのではなく、他の対策と組み合わせて使用することが大切です。