企業のICTを見守る監視システム。
自動化推進で進化を続けるPFUの監視センターのご紹介

日々、テクノロジーが進化する現代において監視システムは非常に重要です。多くの企業がICTの活用を進める中で、セキュリティ対策やトラブル対応など、システム運用に関する課題を持つ企業も少なくありません。円滑なシステム運用があるからこそ、安心して事業を推進し、顧客満足度も向上するというものです。

PFUでは、お客様の高い要望に応える運用管理サービスを提案しています。その中の一つが「リモート監視サービス」です。日夜、事業を推進するお客様の裏方として、システムの安心と安全を担うリモート監視サービスは、24時間365日システムの稼働を見守り、万一のトラブルに備えています。

ビジネスでもプライベートでもICTが欠かせなくなった現代において、万が一のトラブルが発生した場合、対応が遅れてしまうと事業自体が止まってしまう可能性もあります。それを避けるために「リモート監視サービス」を取り入れ、安定稼働を維持する企業が増えています。

今回は、普段ではなかなか知ることのない、システムの“裏方”である「監視サービス」についてご紹介します。

かゆいところに手が届くPFUの監視センター

PFUの監視センターは自社システムの運用管理業務で培ったノウハウを基に、顧客のネットワーク機器を監視するサービスとしてスタート。2001年のIDC(インターネット・データ・センター)開設を機に本格的に24時間365日の監視体制を構築してきました。“24時間”ならではの課題も多く、これまでに「監視人員の確保・教育」「緊急時の対応体制」「システムの可用性向上」などで創意工夫し、問題解決をしてきました。
また、 “ISMS認証の取得”や“ITILの活用”をすることで作業プロセスを整備し、セキュアかつ安定した運用を図ってきました。 2014年、横浜みなとみらいへの拠点集約を機に「UMC(Unified Management Center)」の一員となり、全国のエンジニアとの連携を強化し、より良いサービスを届ける場所として生まれ変わりました。
2020年12月現在、監視対象ノード数は約11,000、受信アラート数は月に約10万件、対応インシデント数は月に約2,500件といった規模にまで成長。顧客システムのリモート監視、障害検知のエスカレーション、初期復旧オペレーション、月次レポートの提供といったサービスを提供しています。

PFUの監視センターは、お客様がコアビジネスに集中できるようにシステム運用のパートナーとして、ICT基盤の安定稼働を支えています。

特長としては、自社システムの運用管理を通じて培ったノウハウを盛り込んだ自社開発の監視システムを多く利用しています。既製品であればカスタマイズが難しい場合でも、自社開発であれば、お客様の“かゆい所に手が届く”細やかな提案が可能になります。システム運用の成否はお客様の事業の発展を左右する重要な要素であり、細やかな提案ができることは、PFUの監視センターが多くのお客様に支持されている理由の一つです。

「監視サービスとは何か?」

PFUの監視センターで長年お客様対応をしながら監視システムの可能性を探る、ネットワークセキュリティサービス部担当部長中村さんに話をうかがいました。中村さんが語る監視サービスとは。

「監視サービスは、簡単に言えばお客様のICT機器の不調を検知し、サービスを止めないようにエンジニアと連携し問題解決を担う部門です。エラーの通知が来た際に、それを分析しお客様へ連絡しています。

流れとしては、まず監視サーバーという仕組みがお客様のICTシステムの状態を監視し、エラーが出た際はメールやアラートが監視センターに通知され対応しています。メール自体は自動ですが、実に様々な通知が来るため、それらを一つひとつ処理しなければなりません。元々は全ての通知に対して、人が判断していたのですが、現在は自社開発したシステムに通知を取り込んでから、エラーを自動で判断するようにしています。」

「監視サービスでは24時間、多種多様なフォーマットの通知が多数送られてきます。お客様の要件によっては数十分以内での初期対応が求められるケースもあります。これに応えるには対応すべきエラーを迅速に特定し、的確に対応手順を判断しなければなりません。そのためにPFUでは必要な仕組みを自社開発し、瞬時の応答性を確保しています。」

「エラーとその対応手順が明確になった後は、決められた手順やロジックに基づきながら進めます。その際、セキュリティの分析も行い、お客様のセキュリティに問題がないかもしっかりと確認します。

これらは高度なスキルと正確な対応を求められますが、短時間での復旧も必要なため、少しでもミスを減らすには、人力だけではうまくいきません。後ほど自動化についてもお話させていただきますが、ミスを減らすための取り組みに日々、取り組んでいます。」

お客様に寄り添うPFUのリモート監視サービスとは

中村さんは、リモート監視サービスで重要なのは、迅速な対応による業務への影響の最小化だと語ります。

「対応は、お客様の業務も理解した上で、優先順位や緊急度を変えています。例えば、3台のWEBサーバーが動作しているうちの1台が落ちても優先度は低い。月末しか動作しないサーバーなら、それまでに復旧すればよいといったようなことです。」

「リモート監視サービスは、土日夜間も含めて24時間365日監視しています。例えば、金曜日の夜に何らかのトラブルが起きた際、土日で対応できればトラブルは解消して月曜日の始業に支障はでませんが、月曜日の始業まで気付かなかった場合、システムが使えなくなってしまうこともあります。そうなると多くの人に影響が出てしまうかも知れません。予期せぬトラブルを回避するためにも、24時間監視は必要です。お客様のシステムの可用性に対する意識も高いので自分達もそれに応えたいと思っています。」

運用の自動化推進により進化する監視サービス

続けて、PFUの「寄り添い」の良さを踏襲した上で、監視サービスのさらなる安定稼働とサービス自体の高度化のためには、自動化が欠かせないと中村さんは語ります。

自動化推進でミスの発生をゼロに

「これまでは全てを人力で対応し、お客様毎に全く違う手順書を作成し、管理してきました。お客様によってエラーも違うため、現場での人による判断が欠かせないものでした。また、監視サービスは100回のうち1回でもミスがあってはいけません。しかし人間が操作する限り、ゼロにはなりません。もちろん、ダブルチェックを行ったり、指差しチェックなどは実行していますが、それでもミスが発生する確率が減るだけです。そこで、ミスを無くすために、自動化を進めています。今も毎月2,000通のメールを送っていますが、人間だとどうしてもミスのリスクが残ります。しかし、それを自動化することでミスの発生を0%にすることが可能です。」

自動化推進で事業の拡張性と継続性を強化

「また、これまでの対応だと監視サービスの事業拡大にも支障をきたすと考えていました。お客様の要件に応えようとするとオペレーターやそのオペレーターを管理するマネージャーの人数を増やすなど人を増やすしか手がなくなりますからね。」

「監視サービス事業の継続性を確保するという点でも自動化の推進は重要です。たとえば、エラーの復旧は、これまでは人がいないと対応できない状況でした。昨今、これは品質以外の面でも大きな課題となっています。例えば、災害等によりやむを得ず出社できない場合なども考えられる中、人に頼りきったシステムでは、今後、長期にわたる運用に支障が出る可能性もあります。そのためにも、現在PFUは積極的に自動化を推進しています。」

自動化推進はお客様の負担も軽減

「手始めに、最も多く行われていた手順である、お客様へのメールや電話での連絡を自動化しました。これによりセンターの人員はエラー対応を優先できるため、対応時間の削減に繋がりました。電話での連絡に関しては夜間やお客様が会議中などにより1度で繋がらないこともあり、再コールが必要となることもあります。人と人のやりとりだとお客様も申し訳ないという気持ちが大きかったようですが、自動化により心苦しさが軽減されたという想定外の声もいただきました。」

現場から見る「監視サービス」について

続けて、自動化の推進における苦労や課題について、開発担当者である伊藤さんに伺いました。

自動化の苦労~人による“臨機応変”を言語化しロジックに落とし込む

「自動化推進においては人間が頭の中で“良い感じにやっていたこと”を言語化しロジックに落とし込む作業が重要となります。これにとても苦労しました。例えば、人間であったら手順書に“メールを返信する”と書いてあっても、一気に100通送られてきたら、まとめて一通で返信するといった融通が利きます。しかし機械は100通来たら100通で返してしまう。人であれば「まとめて返したほうがいいな」「拠点が違うからこれは違うところに返信しよう」など、臨機応変にやっていたことを、機械はできません。機械を動かすためにはきちんとロジックに落として、手順に落とさなければなりません。見えない部分をロジック化すること、これが一番の課題ですね。PFUではお客様ごとにカスタマイズした監視サービスを提供する中で、人が適宜判断をしながら運用をおこなっていることもあり、業務手順書には書かれていないことが多々あります。自動化に取り組み始めた当初は、こういった手順書に書かれていない業務を細かく確認をしながらシステムの要件定義書に落とし込むのに3、4ヶ月も要するといったこともありました。あまりにも人の判断が多く介在する業務は自動化をしても業務効率が上がらないから自動化の対象から除外する等、自動化する業務の見極めも自動化推進で悩むところです。」

開発側と現場の意見の相違に苦労~ツール活用で要件確認を高速化

「また、現場と開発側の意見の相違もあります。現場としては「この機能が欲しい」という声が出ますが、開発側としては、出来る・出来ないの判断をしなくてはなりません。実際には開発が難しい場合もありますし、逆にこれを現場でどう対応すべきなのか、一つひとつ確認しています。どこを自動化すべきなのか、という判断は難しい所です。

そのため実際に自動化システムをリリースしてから、現場から追加の開発要件が出てくることもあります。現場との開発要件定義は泥臭く、相当の時間をかけて実施しています。ですが、やはり追加要件は出てきますし、現場で不具合が出てから手直しの開発をしているというのが実態です。この点については今後改善していきたいと考えています。たとえば、最近では業務分析を高速におこなうマイニングツールも出てきています。このようなツールを活用することで、業務フローを短い期間で可視化し開発の要件確認を短期間に正確におこなっていくという取り組みを進めていきたいと考えています。」

今後の目指すべき姿。これまで培ったデータを活用し、予想した提案を行う

今後のUMCが目指すのは、AIを活用した無人センターへの移行だ。現在は設備と従業員を2箇所(横浜市と石川県)に集中配置し、ワンストップ対応が可能なセンターとして全国を統制して

「自動化を推進するにあたり、人ができないこともやりたいと考えています。それは、これまでの監視に関するビッグデータを学習データとして利用し、AIを活用することで障害予兆を事前に検出、未然に防止することです。

例えば、耐用年数のデータから“そろそろ故障の可能性もある”など、先回りした提案をすることが出来ます。今は起きてしまったトラブルの対応をしていますが、そもそもトラブルを防ぐための提案も行えればと思っています。お客様にとっても、事前にトラブルが回避できるのであれば、それが最善ではないでしょうか。まだまだ活かしきれていないデータがあるので、しっかりと分析し、お客様の事業がより発展できるようなスムーズな監視サービスを運用してきたいと思っています。」

これまで人が行っていた業務を自動化することで、人はより高度な運用業務(サービス範囲拡大)に取り組むことも可能となります。全てはお客様のために、PFUの監視センターは24時間365日対応しています。次のフェーズに向けて、着々と準備を進めている監視センターは、自動化を進めるにあたり、アナログの良さも残しながらお客様へ最適な提案が出来るように日々、試行錯誤を重ねています。

テクノロジーが進化するにあたり、そのシステムの監視も重要です。決して表には出てきませんが、事業を陰で支える重要な部分。導入を検討している方は、ぜひ一度PFUのリモート監視サービスを検討してはいかがでしょうか。長年の実績から、お客様の事業をしっかりとサポート致します。

SHARE