RAID障害の種類
RAIDは「Redundant Arrays of Inexpensive Disks」の略で、比較的安価で入手しやすいハードディスクを用いて、いかに大容量で速度が速く信頼性の高いストレージを構築しようというものです。 最近は安価なディスクを意味する”Inexpensive”に替わり、独立したディスクを意味する”Independent”を用いる事が多い様です。
RAIDの目的は、主に信頼性の向上を考えたものですが、複数の方式があり速度や信頼性、利用効率など何を重視するかによって導入方式が異なってきます。(中には速度を最優先し、障害耐性を持たないものもあります。)
しかし、どのようなシステムでも障害は付きもので、RAIDもこの例外ではありません。
いくら「耐障害性」があるとはいえ、適切に構成され、かつ正しい運用と保守が行われていなければ、部品点数が多い分、障害率は逆に高くなります。
これまでに当社で取り扱ったRAID復旧の代表的な障害事例をご紹介します。
1:単一ドライブの障害
多くのRAIDシステムは信頼性向上の観点から障害耐性を持ち合わせている為、構成するドライブの1台に障害が発生してもデータを再生することが可能です。
しかし、中にはRAID-0の様に、信頼性と引き換えに速度と利用効率を重視したシステムもあります。
このRAID-0システムの場合、複数台の安価なドライブで大容量のストレージを構成する事ができるうえデータ書き込みも分散して行われるので速度向上のメリットがありますが、構成ドライブのうち1台でも障害が発生してしまうとストレージ全体のデータを失ってしまいます。
このシステムの場合、元々障害耐性を持ち合わせていない為に通常のRAID機能でデータを再生する術はありません。データ復旧サービスでの対応が必要となります。
2:複数ドライブの障害(RAID-5の障害)
読み出し速度や障害耐性に重点が置かれるサーバー用途では、主にRAID-5が利用されています。 最低3台以上のドライブで構成されるRAID-5最大の特色は「単一ドライブに障害が発生しても問題なく動作する」点です。
このRAID-5は各ドライブに「パリティ」と呼ばれる情報を分散して保存することで、構成するドライブが故障した場合でも交換後に欠損したドライブのデータを再生することが可能となっています。
ただし、あくまで「単一(1台)ドライブ」の故障である事が前提であり「複数ドライブ(2台以上)」に障害が発生した場合、RAID機能によるデータ再生は不可能です。
単一ドライブに障害が発生した時点では、アラートのみで動作には一見問題がない為、1台目のドライブに障害が発生しているのを気づかず運用し続け、2台目の障害発生に至ってしまうケースが多くみられます。
こうなった場合は安易に再起動やRAID構成の再設定、OSの再インストールなど復旧処置を試みるのは非常に危険です。最悪、データ消失などの被害拡大に繋がる恐れもあります。
3:再構成(リビルド)作業での障害
RAID-1や5であれば、構成するドライブのうち1台が故障しても交換後に”リビルド”と呼ばれる再構成作業を行うことで、欠損したドライブのデータを再生する事ができます。この機能により障害耐性が確保されシステムの信頼性向上につながっています。 しかし、本来の状態に復旧するはずの作業によって、逆に障害が発生してしまうケースも少なくありません。 リビルドに失敗してしまう主な要因としては以下のものがあります。
B)異なるドライブを交換してしまった
C)他のドライブにも障害が発生していた
"A","B"に関しては、単純なミスでありマニュアルの熟読や手順確認、ドライブステータスの確認など十分な注意を払って作業することで避けられるので当社に依頼される案件もそれほど多くはなく、実は"C"のケースが一番多いのです。
故障したドライブは1台だけのはずなのに一体なぜなのでしょう?
リビルドを成功させる為には「残りのドライブ全てが完全な状態」である事が大前提なのです。この「完全な状態」がカギになります。ドライブの大容量化に伴い不良セクタなど部分的に読み取ることができない部分(=故障)がある程度の頻度で発生します。問題となる故障箇所は、通常読み書きが行われない部分であることが多く、エラーも検出されにくいため、、ステータスでは表向き問題のないドライブでリビルド作業を行っていても、読み出せない部分に差し掛かった途端にリビルド失敗となります。
一度リビルド処理に失敗したものは、繰り返し行っても成功する見込みは無く、データ消失など被害拡大に繋がります。アレイにアクセス可能な状態であれば速やかに可能な限りのバックアップを行い、なるべく早めにご相談下さい。
4:誤削除/誤フォーマット
これは、HDDのデータ障害では「論理障害」に相当するケースです。
ドライブ故障に対する障害耐性を持つRAIDシステムでも、削除操作などで失われたデータの再生機能は持ち合わせていません。
特にファイルサーバーなどの用途で使用されている環境では、データの読み書きが頻繁に行われている為、障害発生後いかに短時間で安全にシステムを停止できるかに復旧可否の明暗が分かれます。なぜなら、削除/フォーマット後にデータが上書きされた部分の復旧は不可能となるからです。RAIDシステムの場合、市販の一般的な復旧ソフトでは対応していないものも多いのでご注意ください。
5:RAIDコントローラの障害
ハードウェア方式のRAIDシステムでは、マザーボードやRAIDカードにディスクの管理を行うRAIDコントローラが実装されています。RAIDシステムの具体的な処理を担っている為、コントローラ自体に障害が発生した場合にはドライブに故障が発生していなくてもRAIDシステムにアクセスできない状態となってしまいます。
ベンダーやコントローラ、BIOSバージョン毎に制御が異なる場合もあり、復旧には同一環境の再構築が基本になります。スペアのRAIDコントローラをお持ちであればご自身で復旧を試みる方法もありますが、コントローラ以外にも障害が発生していた場合にはデータ消失などの被害拡大に繋がる恐れがありますので、ログやステータスに現れない障害も把握できる環境が整っていない限りお勧めはできません。
対応メディア
- サーバー内蔵RAIDユニット
- RAIDアレイユニット
- NAS
- LAN接続ハードディスク(LinkStation LANDISKなど)
対応OS
Windows系サーバOS
- WindowsServer 2003
- Windows2000 Server
- WindowsNT Server
UNIX/Linux系OS
下記はいずれも当社にて復旧実績のあるシステムのみ掲載しています。
このほかにも対応可能ですのでお問い合わせ下さい。
- Digital Unix
- Solaris
- SCO Unix
- HP/UX
- AIX
- RedHat Linux
- Vine Linux
- Turbo Linux
- Fedora Core Linux
- 386BSD
- Free BSD
Novell Netware
- Netware3.x~6
対応機器
各種RAID
下記はいずれも当社にて復旧実績のあるシステムのみ掲載しています。
このほかにも対応可能ですのでお問い合わせ下さい。
- IBM xSeries/ServeRAID
- DELL PowerEDGE/PERC
- HP Proliant/RAID
- NEC Express
- Fujitsu PRIMERGY
- Adaptec
- PROMISE
ネットワークハードディスク(LAN接続型ハードディスク)
下記はいずれも当社にて復旧実績のあるシステムのみ掲載しています。
このほかにも対応可能ですのでお問い合わせ下さい。
- Buffalo TeraStation
- Buffalo LinkStation
- IO-DATA LANDISK Tera
- IO-DATA LANDISK
- Logitec NetPocket
RAID復旧の注意事項
RAIDに障害が発生した場合、無理な復旧や誤った操作を進めるとデータを復旧できる可能性が著しく低下する恐れがございます。可能な限り現状を維持した状態で速やかに調査をご依頼いただくことをお勧めします。
代表的なRAIDの種類
RAIDとは複数のハードディスクを組み合わせてあたかも一台のハードディスクとして機能させるものです。
RAIDの効用は「高速化」と「信頼性」の二つの側面があり、組み合わせ方法により効能が異なります。この組み合わせ方法は「RAIDレベル」と呼ばれています。
RAID0(ストライピング)
複数台のハードディスクを組み合わせ同時に書き込みを行わせて高速化を図ったRAID。
ハードディスクディスク容量は台数分の和となります。ただし、1台のハードディスクが故障するとデータ全てが失われしまうので信頼性が低いというデメリットがあります。
RAID1(ミラーリング)
複数台のハードディスクに同じデータを書き込み、信頼性を向上させたRAID。
ハードディスクが1台故障してもすぐに復旧できます。ただし、データ保存容量はハードディスク1台分の容量しかなく、同時に書き込みを行う為、速度は遅くなります。
RAID0+1・RAID1+0
RAID0とRAID1の両方を組み合わせたRAID。
高速で大容量なRAID0と信頼性の高いRAID1を組み合わせることにより、速度、容量、信頼性の向上を図ることができます。ただし、ハードディスクが最低でも4台必要となります。
RAID5
最低3台のハードディスクを組み合わせて「パリティ」と呼ばれる付加情報とともに構成されているハードディスク全てに分散して記録するRAID。
容量はハードディスク総台数の和から1台分を引いたものとなります。ハードディスクの故障時にはリビルドを行うことにより失ったデータを復旧させることができますが、2台以上のハードディスクが同時に故障した場合はリビルドができなくなります。
※データSOSではリビルドができなくなってしまったRAID5からのデータ復旧にも対応しておりますので、是非ご相談ください。
RAID6
最低4台のハードディスクを組み合わせて「パリティ」を2つ作成し、RAID5よりも信頼性を向上させたRAID。
容量はハードディスク総台数の和から2台分を引いたものとなります。パリティを2重に作成する為、ハードディスクが2台同時に故障した場合でもリビルドが可能となります。ただし、RAID5よりも書き込み速度が低下し、3台以上のハードディスク故障してしまうとリビルドができなくなります。
※データSOSではリビルドができなくなってしまったRAID6からのデータ復旧にも対応しておりますので、是非ご相談ください。



