システムの信頼性や保守性を表す
システムの信頼性や保守性を表す際に使われる単語に、MTBFやMTTRがあります。
MTBFやMTTRの数値から、そのシステムが平均してどのぐらいの間隔で故障するか?復旧や修理にかかる時間はどのくらいか?を知ることができます。
またMTBFとMTTRから、そのシステムの稼働率を知ることもできます。
- MTBF・・平均故障間隔。故障と故障の間の時間。
- MTTR・・平均修理時間。復旧・修理にかかる時間
このページでは、MTBFやMTTR、稼働率、関連する用語について解説しています。
MTBF
Mean Time Between Failuresの略。Mean Timeが平均の意味。
故障と故障の間の時間、つまり稼働している時間になります。平均故障間隔といいます。Betweenが間という意味なので、Bが付いていると覚えることができます。
稼働している時間を合計して割り算すると、平均故障間隔を出すことができます。
(600+200+400)/3=400
この場合 400時間が、平均故障間隔になります。
MTBFが大きいほど 故障までの時間や稼働している時間が長く、信頼性が高いといいます。
一回故障すると それで使えなくなるという場合は、MTTF 平均故障時間が使われます。
Mean Time To Failureの略で、機器の寿命がどれくらいかを示す指標です。ハードディスクやSSDなどのストレージで使われることがあります。
MTTR
Mean Time To Repairの略。
故障から復旧までの時間、修理が終わるまでの時間になります。平均修理時間といいます。Repairが修理という意味なので、Rが付いていると覚えることができます。
復旧中の時間を合計して割り算すると、平均修理時間を出すことができます。
(1+3+2)/3=2
2時間が平均修理時間になります。
MTTRが小さいほど 復旧や修理が早く、保守性が高いといいます。
稼働率
稼働率とは、すべての時間の中で稼働している時間の割合を表します。
稼働率は、MTBF/(MTBF+MTTR)で出すことができます。
総合計で算出すると、
- MTBF=1200
- MTTR=6
- 稼働率=1200/(1200+6)=約0.995
平均で算出しても同じです。
- MTBF=400
- MTTR=2
- 稼働率=400/(400+2)=約0.995
×100で 約99.5%です。
稼働率が高いほど、機器やシステムを使用できる時間の割合が高く、可用性が高いといいます。
このようにシステムは、MTBF、MTTR、稼働率を調べることができ指標とすることができます。
信頼性(Reliability)・可用性(Availability)・保守性(Serviceability)の頭文字をとって RASといいます。
直列システムの稼働率
直列システムでは、AかBいずれかが故障すると全体のシステムは停止します。
複数のシステムが直列で接続されている場合は、それぞれの稼働率を掛け合わせることで計算することができます。
例えば、Aの稼働率 0.9、Bの稼働率 0.8なら、
全体のシステム稼働率=0.9×0.8=0.72となります。0.72がこの直列システムの稼働率です。
またA・Bの他にCが接続されている場合は、A×B×Cと計算します。
並列システムの稼働率
並列システムでは、AかB両方とも故障すると全体のシステムは停止します。一方が故障しても稼働できるので 直列システムより稼働率は高くなります。
計算方法は、全体の稼働率=1-(1-Aの稼働率)×(1-Bの稼働率)です。
例えば、Aの稼働率 0.9、Bの稼働率 0.8なら、
全体の稼働率=1-(1-0.9)×(1-0.8)=1-(0.1×0.2)=1-0.02=0.98
0.98がこの並列システムの稼働率となります。
バスタブ曲線
一般的に機器やシステムは、時間の経過とともに以下のように故障率が変動する傾向があります。これをバスタブ曲線といいます。
- 初期故障期間・・機器の初期不良や設計ミス・バグなど。
- 偶発故障期間・・故障率は低く安定します。
- 摩耗故障期間・・機器の摩耗から故障率は高くなります。
パソコンなどでもよく当てはまります。ハードディスクをはじめとした初期不良で返品したり、5~6年と経つと故障率が高くなってきて買い替え時期になってきます。