trouble-shooting

インターネットは軍事目的?システム構成と故障対策の基礎知識5選

インターネットは元々は軍事目的のネットワークと言われている。どこに爆弾を落とされても寸断されることなく稼働するために、分散型のネットワークが形成されたという。ここでは、問題が起きたとしても稼働を続けるためのシステム構成と故障対策についてまとめる。

情報処理推進機構のシラバスにおいては「43.システムの構成」「44.システムの評価指標」に対応している。

 

1 コンピュータを働かせるカタチ

集中処理、分散処理、クライアントサーバシステムなど、コンピュータが組み合わさって働くカタチは様々である(コンピュータ同士がつながることネットワーク基礎知識7選参照)。現在はクライアントサーバシステムが主流となっている。

 

シンクライアントとピアツーピア

  • シンクライアント(Thin Client):サーバ側への依存度を高くしたもの。クライアント側の端末は入力や表示部分を担当するだけなので、情報漏洩のリスクを回避することができる
  • ピアツーピア(Peer to Peer):完全分散型のシステム。ネットワーク上で協調動作するコンピュータ同士が対等な関係でやりとりするもの。IP電話やファイル交換ソフトなどで用いられる

 

オンライントランザクション処理とバッチ処理

  •  オンライントランザクション処理:要求に対して即座に処理を行い、結果が反映されるもの(銀行ATMなど)
  • バッチ処理:一定期間ごとに処理をまとめて実行するもの(給与計算など)

 

2 システムの性能指標

システムの性能を評価する指標には、スループット、レスポンスタイム、ターンアラウンドタイムがある。こうした処理性能を評価する手法としてベンチマークテストがある。

 

スループットはシステムの仕事量

単位時間あたりに処理できる仕事(ジョブ)量のこと。例えば給与明細印刷システムの場合、1秒に何件のデータが処理できるか(件/秒)が指標となる。

 

レスポンスタイムとターンアラウンドタイム

前者はコンピュータに処理を依頼し終えてから、実際に何か応答が返されてくるまでの時間。後者はコンピュータに処理を依頼し始めてから、その応答がすべて返されるまでの時間をさす。

 

3 システムを止めない工夫

企業内のシステムでは、障害が発生したときにも業務を継続できるような信頼性が、強く求められる。

 

デュアルシステム

全く同じ処理を行うシステムを2組用意すること。信頼性は高いがコストがかかる。

 

デュプレックスシステム

同じ処理を行うシステムを2組用意し、正常運転中は片方を待機状態にしておくもの。コストパフォーマンスは高いが対応に時間がかかる。デュプレックスシステムにおける従系システムの待機方法には、次の2つがある。

  • ホットスタンバイ:主系の処理を引き継ぐために必要なプログラムを起動しておくことで、いざというとき瞬時に切り替えられる待機方法
  • コールドスタンバイ:従系は出番が来るまで別の作業をしていたり電源をオフにしているため、コストダウンできるが瞬時には切り替えられない

 

4 システムの信頼性と稼働率

システムの信頼性は、故障する間隔やその修復時間から求められる稼働率によって評価される。

 

平均故障間隔(Mean Time Between Failures:MTBF)

故障と故障の間隔を表すもの。間隔が大きいほど信頼性が高くなる。

 

平均修理時間(Mean Time To Repair:MTTR)

修理に必要な時間を表す。短いほど保守性が高いシステムといえる。

 

システムの稼働率

正常稼働できている割合を示すもの。100%に近いほど品質が高くなる。

 

直列につながっているシステムの稼働率

直列システムの稼働率 = 稼働率A × 稼働率B

 

並列につながっているシステムの稼働率

並列システムの稼働率 = 1 − 全体の故障率

 

「故障しても耐える」という考え方

壊れても大丈夫なように対策をはかる考え方をフォールトトレラントという。

  • フェールセーフ:故障が発生した場合、安全性を確保するために壊れるよう仕向けておく方法(例:信号機、石油ストーブなど)
  • フェールソフト:故障が発生した場合、一部機能を切り離すなどして、動作の継続をはかる方法(例:ジェット機、PCなど)
  • フールプルーフ:操作の不慣れな人が扱っても誤作動しないよう安全対策をしておくこと(例:電子レンジ、洗濯機など)

 

バスタブ曲線

故障の発生頻度と時間の関係をグラフにしたときに表れる傾向。

  • 初期故障期間:導入初期は、製造上の欠陥などによる故障率が高くなる。時間の経過とともに故障率は下がる
  • 偶発故障期間:故障率がほぼ一定で安定した状態。操作ミスなどによる突発的な故障が発生する程度
  • 摩耗故障期間:ライフサイクル末期の製品寿命がきた状態。装置の摩耗などにより故障率が時間とともに増大する

 

システムに必要なお金の話

初期コストと運用コストをすべて含めたものをTCO(Total Cost Ownership)と呼ぶ。初期コストにはハードウェアやソフトウェアの購入費用やシステムの新規開発費用などが含まれ、運用コストには電気代や人件費や消耗品の交換などが含まれる。

 

5 転ばぬ先のバックアップ

人為的なミスも含む様々なトラブルからデータを守るには、バックアップをとっておくことが有効である。以下の3点に留意することが必要である。

  • 定期的なバックアップを行う
  • バックアップ媒体は分ける
  • 業務処理中にバックアップしない

 

バックアップの方法

フルバックアップ、差分バックアップ、増分バックアップという3種類の方法がある。

  • フルバックアップ:保存されているすべてのデータをバックアップすること
  • 差分バックアップ:前回のフルバックアップ以降に作成、変更されたファイルだけをバックアップすること
  • 増分バックアップ:バックアップの種類に関係なく、前回のバックアップ以降に作成、変更されたファイルだけをバックアップすること

 

最後に

システム構成と故障対策の基礎知識として、クライアントサーバシステム、性能指標、システムを止めない工夫、信頼性と稼働率、バックアップについてまとめた。システム開発の基礎知識とともに、確認しておきたい項目である。

インターネットが軍事目的かどうかはについては、誤りだとしているものも多い。先端技術を応用するネットワークの形成が目的であり、技術的な裾野を広げることが国家にとって必要であるということである(真偽はここでは問わない)。最新技術がその後の経済に大きな影響を与えることは間違いないため(GPSや人工知能など)、軍事技術に注目することは有効であると言える。

デュプレックスシステムを学ぶ中で、ワークライフバランス社の小室淑恵氏が実践・提唱しているリーダー・サブリーダー制を思い出した。この制度の前提として仕事内容をオープンにすることが挙げられているが、システムではそもそも役割が公開されているので問題はない。システム管理の知識を働き方に活かすことで、より付加価値の高い仕事をすることができるだろう。

次回は経営戦略のための業務改善と分析手法についてまとめる。

キタミ式イラストIT塾 「ITパスポート」 平成24年度 CBT対応


コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

次のHTML タグと属性が使えます: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>