RAIDの不具合(解決)
記録がないので詳しいことは分からないが、しばらく前にsmartdからエラーメールが届いたことがあった。自前サーバmeadowsageは2つのHDDでRAID1を組んでいるのだが、どうやら片方のHDDの特定パーティションに不具合があり、それ以降、いわゆる「片肺」になってしまっていた。しばらく経ってからRAID設定用の上級ツール「mdadm」がFedora Coreにインストールされていることを知り、検証と修復を試みた。が、これがどうにもうまくいかない。
# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 hda2[0]
38089984 blocks [2/1] [U_]
md0 : active raid1 hdb1[1] hda1[0]
104192 blocks [2/2] [UU]
unused devices: <none>
この[U_]という表現方法は、単純なアスキーアートながら状況が一目で分かってよいと思う。当時はe2fsckコマンドによるパーティション修復と、mdadmコマンドを--addオプション付きで実行してみたのだが、エラーが出て先に進めなかった。しかしながら昨夜、怪我の功名(顛末は下記リンクを参照)でこの不具合はあっさり解決した。お恥ずかしながら、処置すべきパーティションを間違っていただけであった。前述のステータスの「md1 : active raid1 hda2[0]」の部分に、hda2のみがRAIDアレイmd1(「/」にマウント)のアクティブなメンバーであることが記されているが、これをどう読み違えたかhda2に不具合があるものとして処置を行なっていたのだ。処置すべきはhdb2のほうだとようやっと気づき、以下のような処置を行なった。
# mdadm /dev/md1 -add /dev/hdb2 mdadm: hot added /dev/hdb2
hot addに成功し、問題なくメンバーに戻された模様。ステータスを確かめてみる。
# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 hdb2[2] hda2[0]
38089984 blocks [2/1] [U_]
[>....................] recovery = 0.8% (314880/38089984) finish=35.9min speed=17493K/sec
md0 : active raid1 hdb1[1] hda1[0]
104192 blocks [2/2] [UU]
unused devices: <none>
依然として片肺ではあるのだが、着々とリカバリ中だということが分かる。一夜明けると、以下のとおり正常な構成に戻っていた。
# cat /proc/mdstat
Personalities : [raid1]
md1 : active raid1 hdb2[1] hda2[0]
38089984 blocks [2/2] [UU]
md0 : active raid1 hdb1[1] hda1[0]
104192 blocks [2/2] [UU]
unused devices: <none>
トラックバック(0)
このブログ記事を参照しているブログ一覧: RAIDの不具合(解決)
このブログ記事に対するトラックバックURL: http://somin.heteml.jp/mt/mt-tb.cgi/4266
コメントする