SSDが突然認識しなくなる理由は多岐にわたります。静電気やストレス、水没などが影響し、NAND寿命やデータ破損、システム損傷も考えられます。
この記事では、SSDが突然認識しなくなる理由についてご紹介します。
ESD(静電気)
静電気(ESD:Electrostatic Discharge)によるダメージは、電子部品に共通する脅威です。静電気は湿度の下がる冬場に発生しやすく、クルマのドアノブやセーターなどの衣服などで経験ある方も多いかと思います。SSDではコンタクト(接点)が剥き出しになっているmSATAやM.2タイプのSSDが特にダメージを受けやすく、PCへの装着時などSSDに触れる際には静電気対策が必要です。静電気によって搭載部品がダメージを受けた場合、ただちに使えなくなる場合もあれば、使っているうちに認識しなくなる(遅延故障)場合もありますので注意が必要です。
写真1 NVMe SSD
衝撃や温度ストレス
SSDはその名のとおり半導体部品のみで構成されたストレージですので、HDD(ハードディスク)のような可動部品が存在せず、比較的衝撃や振動によるダメージに強いデバイスです。しかし非常に強い衝撃や急激な温度ストレスを受けると、内部の基板とその搭載部品などを結合しているハンダづけ部分にクラック(割れ)が発生して故障の原因となる場合があります。SSDだからと過信せず、精密機器として取り扱うことが大切です。
図2 SDの断面構造
水没や腐食
SSD内部に水や飲み物などの液体が入り込むと、内部の基板と搭載部品の間でショートが起きて故障の原因となります。また水分が蒸発した後の残留物によって、回路の接触不良やサビなどの原因になります。USBメモリやSSDなどは小型のものが多く、うっかり衣類などのポケットなどに入れたまま洗濯したり雨などで濡らしてしまうケースがありますので注意が必要です。また一度水分に晒されてしまうと、表面上は乾燥しているように見えても、SSD内部や基板と搭載部品の間に入り込んだ水分はなかなか抜けません。したがって一度でも水没したSSDは、たとえ乾いていても使用しないことをお勧めします。
NANDフラッシュメモリの寿命
SSDの記録媒体であるNANDフラッシュメモリは、書き込みと消去によって損耗する有寿命部品です。これをセル寿命と言いますが、SSDには見かけ上の書き換え寿命を延ばすための仕組み「ウェアレベリング」が組み込まれています。(詳細はコラム「メモリセルの寿命を延ばすウェアレベリング」を参照)セルの損耗が進むと記録データを保持できなくなり、その記録ブロック(セルの集合体で消去可能な最小単位)は寿命と判断されます。
寿命を迎えた記録ブロックの置き換えのために、SSDには必ずスペア領域(スペアブロックの集合体)が用意されています。SSD内部では寿命を迎えた記録ブロックは自動的にスペアブロックと置き換えられ、SSDを引き続き使用することができます。しかしこのスペアブロックをすべて使い果たしてしまうと、SSD全体が寿命を迎えます。寿命を迎えたSSDの挙動は製品の設計によって異なり、アクセス速度が低下する、リードエラーが発生する、読めるが書き込めない、全く認識しない、といった問題が発生する場合もあれば、しばらくの間は継続的に使用できる場合もあります。しかしスペア領域が尽きたということは、そのSSDはこれ以上の書き込みに耐えられないことを意味しますので、継続的な利用は危険です。
例えばNVMe SSDの場合では、S.M.A.R.T.情報の「Available Spare」項目にスペアブロックの残存率が示されています。未使用時は100%ですが、スペアブロックをすべて使い果たすと0%になります。本項目はセルの損耗に比例して下がるわけではなく、寿命の尽きたブロックが実際に発生するまで変化しません。また記録ブロックの損耗(書き込みと消去回数)はウェアレベリングによって平均化されていますので、寿命が尽きたブロックが発生する頃には、他の記録ブロックの損耗もかなり進んでいます。つまり「Available Spare」項目に変化が出始める頃には、その後この項目の値が急速に低下するリスクがあります。したがって本項目の値が下がり始めた場合には、バックアップなどによりデータの保全を行うことが重要です。
一方、SSDメーカーによる寿命指標としてS.M.A.R.T.情報の「Percentage Used」項目があります。未使用時は0%で、メーカー想定寿命を終えると100%になります。この項目は、NVMe仕様で規定された「使用状況とメーカー予測に基づく寿命の使用率」です。したがって、本項目の推移を確認することで、SSDが「現在の使い方を続けるとどのくらいで寿命を迎えるか」を、おおよそですが確認することができます。
図3 記録ブロックとスペアブロック
データの破損
SSDの障害の1つとして、データを読み出したときにエラーが発生する場合があります。これは前述のセル寿命によるケースもありますが、SSDの故障とは無関係のケースもあります。
SSDに書き込まれたデータは記録ブロックに保存されますが、記録ブロック内のセルに蓄えられた電荷(エネルギー)は時間経過とともに失われていきます。記録ブロックにはエラー補正機能が設けられているため、セルに記録された情報が一定量損傷しても正しいデータが自動的に復元されます。しかしエラー補正機能の能力を超えたエラーが発生した場合には、補正できずにリードエラーになります。
一般的な市販のSSDではメーカー指定条件下で1年以上のデータ保持期間を有するものがほとんどですが、実際には利用環境や記録ブロックの損耗程度によって保持期間が大きく変わります。データ保持期間を短縮(悪化)させる要因としては、高温環境(動作時および非動作時)、高頻度のアクセス、読み出し専用(Read Only)での運用などがあげられます。またSSDの記録ブロックの損耗が進むと、データ保持期間は短くなります。
図4
SSDは各記録ブロックの内部エラー量がエラー補正機能の限界を迎える前に、そのブロックのデータを他のブロック(スペアブロックなど)にコピーして入れ替えることで、データの消失を予防します。しかし長期間アクセスしなかった記録ブロックでは、エラー補正機能の限界を超えてデータが失われる場合があります。
SSDシステムの損傷
SSD内部の記録ブロックには、ユーザによって書き込まれたデータ(ファイル)の他にも、SSD自身が動作するためのプログラム(ファームウェア)や、記録ブロックを管理するためのシステム情報(アドレス変換テーブル、エラー補正情報、消去カウンタなど)が記録されています。このシステム領域が損耗あるいはデータが破損すると、SSDは正常に動作することができなくなりアクセス不可能になります。このため、これらのシステム領域は、疑似SLC動作(MLCをSLCのように動作させる)や、多重化により冗長性を持たせるなど、信頼性を向上させる仕組みが盛り込まれているのが一般的です。
以上のように、SSDはHDDとは大きく異なる特性を持つことから、故障の状態や要因も異なっています。 しかしSSDも有寿命部品であることに変わりはないため、重要なデータのバックアップが必要な点は変わりありません。 転ばぬ先の杖」として、不測の故障に備えて確実なバックアップの確保をお勧めします。
記事の一番下に、関連性が高そうなリンクを設置ができるパーツです。