AIOps

Blog

 

この記事では、AIOpsの基本情報から、注目される理由、要件、代表的なAIOpsツール、導入のポイントなどを解説します。

 

そもそもなぜAIOpsが求められるのか、またAIOpsを実現するためにどのような機能が必要なのかも解説するので、「とりあえずAIOpsについて知りたい」という方はもちろん、実際にAIOpsの導入を検討している方もぜひ参考にしてください。

 

AIOpsとは

まずAIOpsの基本的な情報について解説します。

AIOpsとは

AIOps(エーアイオプス)は英語でArtificial Intelligence for IT Operations(あるいはAlgorithmic IT Operations)と称され、直訳すると「IT運用のための人工知能」「アルゴリズムによるIT運用」を指します。

 

AIOpsをより端的に表現するなら、「AI活用により運用管理システムをアップデートする手法」と言ったところでしょう。

 

AIOpsでは、ビッグデータの統合・集約からデータ分析に活用するまでの一連のフローをAIにより自動化して、将来的に起こり得る問題の特定や予測、既存の問題の原因究明に役立てることを目指します。

 

AIOpsの定義

AIOpsを提唱したリサーチ&アドバイザリ企業・ガートナーは、AIOpsを次のように説明しています。

 

「AIOpsは、ビッグデータと機械学習(ML:machine learning)を組み合わせて、イベント相関、異常検出、因果関係の判断など、IT運用プロセスを自動化します」 ※カッコ内は補足

 

AIやMLによる学習機能を持ち、運用管理をサポートする監視・分析機能を備え、各種業務の自動化を実現すること、とも表現できます。

 

参考:

Definition of AIOps (Artificial Intelligence for IT Operations)|Gartner

https://www.gartner.com/en/information-technology/glossary/aiops-artificial-intelligence-operations

AIOpsの必要性

AIOpsが注目される背景には、過剰なデータやアラートによる運用管理業務の負荷増大があります。

 

近年のIT運用の現場では、ビッグデータ活用のために、構造化・非構造化を問わずあらゆるデータが収集される一方で、増えすぎたアラートによるいわゆる「アラート疲れ」が問題視されています。

 

そんなIT運用の現状に対して、AIの速さと正確さを取り入れることにより、過剰なアラートの削減などを実現できるAIOpsが注目されているのです。

 

これは大企業ほど顕著であり、ガートナーのレポートによれば「2022年までに大企業のうち40%が、監視・サービスデスク・自動化できるタスクを、ビッグデータと機械学習機能の組み合わせ(=AIOps)により部分的に置き換える予定」であるといいます。

 

2022年までに大企業の半数近くがAIOpsを導入するという試算からも、AIOpsの必要性がうかがえます。

 

参考:

Gartner Report: Market Guide for AIOps Platforms|sumo logic

https://www.sumologic.jp/brief/market-guide-aiops-platforms/

マーケット・ガイド2019年-2020年|Gartner

https://www.gartner.com/jp/promo/market-guide-report-list

AIOpsが求められる理由

AIOpsが求められる理由は、従来の管理体制・運用ツールでは、ユーザーの求める品質に答えられなくなりつつあるためです。

 

近年、ユーザーからシェアを獲得しているITサービス・システムの中には、ユーザーにとってもはや社会インフラの一部として認識されているものもあります。そんな現代において、AIやビッグデータを活用しないまま、品質を維持・保証することがそもそも難しくなってきているのです。

 

従来の管理体制・運用ツールは「集める・まとめる・平均化する」ことを重視しており、現在のようなデータ量の収集や、現在求められるようなデータ分析を行うのには適していません。

 

そのため、エッジ端末の発達によって爆発的に増加した収集データを適切にさばき切れず、運用負荷は増大する一方となっています。

 

それら運用負荷を軽減するため、ビッグデータを取り込んで余さず活用して最適な環境を構築するツールがAIOpsツールです。

 

AIOpsツールの導入で実現できること

AIOpsツールを導入すると、次のことが実現できるようになります。

①異なるソースからデータを取り込むことができる

AIOpsツールを導入すると、サーバー、クライアント、ネットワーク機器、クラウドプラットフォーム、仮想マシン、周辺機器など、多岐にわたるソースからデータを取り込むことができます。

 

またAIOpsツールが従来のシステムと異なる点は、ただ集めてまとめるだけではなく、それらを大規模なデータセットとして取り込み、その後の分析をスムーズにできる点です。

②業務を自動化して生産性を高める&人的ミスを削減できる

AIOpsツールにより環境が構築されれば、単純な業務のほとんどは自動化が可能になります。AIに可能な業務はAIに任せ、より複雑性や重要性の高い業務に人的リソースを集中させることができるのです。

 

具体的には、ビルドやテストの自動化に加え、サーバ構築・デプロイ、さらにITリソースのサイジング、運用データにもとづくリソースの使用効率とパフォーマンスの両立支援なども自動化することができます。

 

AIにより業務を自動化するメリットは、人的コスト削減ばかりではありません。AIの大きな強みのひとつである正確性を活かし、人的ミスの削減にもつながります。

③データ分析の自動化&リアルタイム性の確保

さまざまなソースからデータを集約する機能に加え、データを分析に活用しやすい形に整形する機能により、従来から自動化されていた業務に加え、データ分析業務も自動化することができます。

 

また、AIOpsツールはストリーミングデータを扱いながらデータ分析を行えるため、リアルタイム分析が可能です。

④復帰スピードが速まり顧客満足度が向上する

リアルタイム分析が可能になると、エラー発生からの立ち上がり速度が向上するため、結果的に顧客満足度の向上につながります。また余計なノイズとなるアラートの発生も減らせるので、アラート疲れの回避による従業員満足度向上も見込めます。

 

リアルタイムで分析することで、アラートの発生要因となるイベントが発生した際、ただちにアラートを発生させるのではなく、まず各データの相関関係をもとにAIが解析を行い、生成されるアラートに優先順位をつけることで、アラートそのものの数を減らすことができるのです。

 

またアラートが発生した場合も、従来は問題が起こってから検証を行っていたのに対して、発生時点である程度の解析が済んでいるため、検知から問題解決までがスムーズになります。

⑤データをビジネス領域にフィードバックできる

リアルタイム分析のもうひとつの恩恵として、これまでインフラで障害検知・予測にしか活用できていなかったデータを、ビジネス領域にフィードバックすることが可能となります。

 

データをビジネス領域に活用できるようになると、IT部門がビジネスにもたらす価値を証明し、存在感を示すことにもつながります。

 

 

AIOpsツールの3つの要件

AIOpsの実現をサポートするツールには、次の要件が求められます。

①リアルタイム分析が可能であること

AIOpsを実現するためには、リアルタイム分析機能が必須です。

 

具体的には、ストリーミングデータを扱いながら、任意の履歴データの検索、データの保存、分析が可能であることが求められます。

 

②非構造化データも扱えること

AIOpsは、企業が収集するあらゆるデータを集約して分析することに意味があります。

 

扱えないデータがあるツールでは、結局その他のツールに頼らざるを得なくなり、自動化がうまく行かなくなってしまいます。

 

③パターン検出や相関分析などの機能が備わっていること

収集したデータをもとに、パターンを検出したり各種ソースのデータ同士を相関分析にかけたりといった機能も、データ分析を自動化する上で必須となる機能です。

 

これらの機能がなければ、AIOpsツールを信頼することができず、結局ツールの監視・管理に人的リソースが必要になってしまいます。

 

参考:

AIが明らかにする「運用管理者の役割」|ITmedia

https://www.atmarkit.co.jp/ait/articles/2001/09/news004.html

 

 

 

AIOpsツール5選

ここまで解説したAIOpsツールの要件を満たす、AIOpsの実現を手助けするツールを紹介します。

なお、AIOpsの実現に必要なツール・環境は、各社のサービス・インフラ・プロセスによっても異なるため、それぞれの仕様をしっかり確認しましょう。

①Splunk:ダウンタイムを82%削減

splunk_logo

Splunk(スプランク)は、2003年に創立されたアメリカの企業Splunk社が提供するAIOpsツールです。

 

フォーチュン100社(※)のうち91社に選ばれており、金融サービス・公共機関・医療とさまざまな業種で導入されています。AIOpsツールの中で、信頼性が高く代表的なもののひとつと言えるでしょう。

 

ダウンタイムを82%削減、データ漏洩・不正行為のリスクを70%低減、リリース時間を50%迅速化するとしています。

 

※フォーチュン100とは……ビジネス雑誌「フォーチュン」が発表する「100 Fastest-Growing Companies(急成長企業100社)」のこと。

 

参考:

Splunk(スプランク)とは | Splunk

https://www.splunk.com/ja_jp/about-splunk.html

②OpsRamp:Saas型IT運用管理プラットフォーム

opsramp

OpsRampは、アメリカ・カリフォルニア州に本社を置くOpsRamp社が提供するSaas(Software as a Service)型のIT運用管理プラットフォームです。

 

1000社以上の企業ユーザーに使われており、Splunkに並び代表的なAIOpsツールのひとつと言えます。

 

特徴はSaaSベースのプラットフォームである点で、AIOpsツールとして運用管理に必須となる各種機能を持っているのに加え、ハイブリッドクラウド環境を統合的に管理するのに適しています。

 

参考:

OpsRamp – SaaS型 IT 運用管理プラットフォーム|JBS 日本ビジネスシステムズ株式会社

https://pages.jbs.co.jp/opsramp_index.html

会社概要|VistaNet(ビスタネット)株式会社

http://www.vistanet.jp/company.html

③IBM Watson OpenScale:AIのライフサイクル全体を管理

IBM_logo

IBM Watson OpenScaleは、世界170か国以上で事業を展開するアメリカのコンピュータ関連企業・IBM社(アイビーエム: International Business Machines Corporation)の提供するAIOpsツールです。

 

Watson OpenScaleの特徴は、企業が自社のAIシステムをきちんと把握できるようにするための機能を備えている点にあります。AIのライフサイクル全体で、パフォーマンスのモニターと調整ができ、AIが判断の拠り所とした文書やデータをプロセスごとに追跡して遡ってチェックすることが可能です。

 

これらの機能により、導入した企業ごとに異なるビジネス結果にマッチしたAIへと調整し続けるフィードバックループを形成します。

 

参考:

IBM Watson OpenScale|IBM

https://www.ibm.com/jp-ja/cloud/watson-openscale

日本IBM|Wikipedia

https://ja.wikipedia.org/wiki/IBM

④SysTrack AIOps:最小限のサーバーでも運用が可能

Lakeside_logo

SysTrackは、アメリカに本社を置くグローバル企業・Lakeside Software社の提供するAIOpsツールです。

 

SysTrackは、ユーザーからは見えないエージェントをエンドポイントに配布することで、パフォーマンス情報、ログ、レジストリキーなどあらゆるデータを収集します。

 

エンドポイントに配布されたエージェントの核となる機能は、「Lakeside Software DataMineエンジン」。シンプルな階層型アーキテクチャーを採用することで、最小限のサーバーでも運用が可能かつ、拡張性に優れたツールです。

 

参考:

ヘルプデスクのためのAIOps|Lakeside Software

https://www.lakesidesoftware.com/jp/solutions/ai-ops

SysTrackが選ばれる理由|レイクサイド ソフトウェア株式会社

https://www.lakesidesoftware.com/jp/why

⑤Red Sky Ops:Kubernetes環境向けAIOpsツール

Red Sky Ops_logo

Red Sky Opsは、アメリカのCarbon Relay社が提供する、Kubernetes環境向けAIOpsツールです。

 

Kubernetes環境でコンテナ化されたアプリケーションをデプロイ、スケーリング、管理するためのAIOpsプラットフォームで、Kubernetes環境におけるパラメーター最適化に適したソリューションと言えるでしょう。

 

参考:

国内初、AIOpsツール「Red Sky Ops」の取り扱いを開始 ~米Carbon Relay社とパートナー契約、Kubernetes運用をAI/機械学習により最適化。パフォーマンス50%以上の向上、クラウドコスト30%以上の節約を実現~|プレスリリース | サイオス株式会社

https://i.sios.com/news/press/20191023-redskyops.html

Red Sky Ops|Carbon Relay

https://www.carbonrelay.com/red-sky-ops

 

AIOpsを取り入れるポイント

AIOpsを実現するためには、まずできることからスモールスタートではじめることが重要です。

 

AIOpsツールはあらゆる業務の自動化をサポートするソリューションであるものの、すべての業務を速やかにAIで代替できるわけではありません。

 

そのため、すべてのデータを対象として導入を推し進めると、AIの学習効率が悪くなるだけでなく、かえって業務の品質を損なう可能性があります。

 

AIは人の仕事を奪うライバルではなく、人の能力を拡張するツールです。しかし、どんなに便利な道具も使い方を誤ればその本領を発揮することはできません。AIを信頼して業務を任せるためにも、安心して任せられる状態まで丁寧に整備しましょう。

 

DevOps(Development Operations)の例でもわかるように、AIOpsが完全に浸透するには5年、10年と長い時間がかかることが予想されます。ツールの導入を検討するなら、始められる範囲からすぐに始めると良いでしょう。

 

参考:

Artificial Intelligence for IT Operations|Wikipedia

https://en.wikipedia.org/wiki/Artificial_Intelligence_for_IT_Operations