こんにちは![]()
寒さもさらに厳しくなり、朝に布団から出る勇気を振り絞っている よっしーです。
早速ですが今回は、【PDCAサイクル】について紹介します。
PDCAサイクルは、品質管理等をうまくまわすために提唱された手法となります。
ただ、このPDCAサイクルは、プロジェクト運営やシステム運用などいろいろなものに
応用ができる非常に優れた手法になります![]()
そもそもPDCAとは?
ということになりますが、以下のようなものになります。
P : Plan(計画を立てる)
D : Do(実行する)
C : Check(評価する)
A : Action(改善する)
サイクルというようにこれらを繰り返し行うことで現在の状況を
常に把握しながら改善を行い、発生しうる障害やリスクの回避を
行っていくことになります。
もちろんインフラでもたくさんのリスクがあります。
■想定されるリスク例
ストレージの故障やオペレーションミスによるデータ喪失のリスク
稼動システムの障害による業務継続不能のリスク
その他も多々あります。。。
例えば「
」の場合は、
【Plan】
システムで障害が発生した際の状況を想定してシステム構築計画を立てます。
ここがとても重要です。
どのようにするかの計画がしっかりとできていないとその後の「Check」で
大量の修正を行うことになり、結局負担が大きくなります。
■計画内容例
・システム上でサーバ等をどのように構成するのか。
・このシステムはどの程度停止するとリスクとなってしまうのか。
そもそも止まってしまってはいけないのか。
・バックアップの取得はどのデータを取得すればよいのか。
また、どの時点のデータがあれば業務に支障がないのか。
・取得したバックアップからのリカバリはどのようにするのか。
・ハードディスクなどの障害に備えて、RAIDはどのように組むのか。
それともサーバ自体を冗長構成にして、1台が壊れても業務を継続できるようにするのか。
まずはこのような内容を検討し、稼動システムの構築計画を立てます。
【Do】
「Plan」で検討し、決定した内容を正しく理解し、実際にシステムの構築を行います。
【Check】
実際に構築したシステムが正常に稼動できているか確認します。
このチェックをしっかりやって、正しくシステムが動作していることを確認しないと
結局、大きなリスクを背負うことになります。
■チェック内容例
・バックアップするデータに誤りはないか。
障害発生時にシステムを戻すためのバックアップが正しく取れていなければ、
リカバリそのものの意味がなくなります。
・システムの冗長構成は正しく動作しているか。
お互いの死活監視が行えており、システムダウン時に別のサーバで
業務を引き継ぐことができる状態かを確認します。
【Action】
「Check」で確認した内容で不具合があった場合は、その修正を行い、正しくシステムが
動作できるようにする必要があります。
この改善の繰り返しでリスクを低減し、プロジェクトやシステム運用を成功に導きます。
■改善例
・取得すべきシステムのバックアップデータで一部データの指定が抜けていた場合。
障害時に正しくシステムが戻らない状態になので早急にバックアップ対象に設定して、
正常にバックアップが取得されていることを確認する必要があります。
上述のように何事もやったらやりっぱなしでなく、過去と現在を正しく把握して、
定期的に見直すことでリスクの低減が可能です![]()
また、作業工数の削減や無駄の排除によってさらにクオリティ高い業務を行っていくことも可能です![]()
ヘキサドライブでもPDCAサイクルをまわし、同じ失敗を2度繰り返さないように失敗から学び、
さらに良い環境作りを行っていければと思います。
では![]()
