この記事では、AIOpsの基本情報から、注目される理由、要件、代表的なAIOpsツール、導入のポイントなどを解説します。
そもそもなぜAIOpsが求められるのか、またAIOpsを実現するためにどのような機能が必要なのかも解説するので、「とりあえずAIOpsについて知りたい」という方はもちろん、実際にAIOpsの導入を検討している方もぜひ参考にしてください。
まずAIOpsの基本的な情報について解説します。
AIOps(エーアイオプス)は英語でArtificial Intelligence for IT Operations(あるいはAlgorithmic IT Operations)と称され、直訳すると「IT運用のための人工知能」や「アルゴリズムによるIT運用」を指します。
AIOpsをより端的に表現するなら、「AI活用により運用管理システムをアップデートする手法」と言ったところでしょう。
AIOpsでは、ビッグデータの統合・集約からデータ分析に活用するまでの一連のフローをAIにより自動化して、将来的に起こり得る問題の特定や予測、既存の問題の原因究明に役立てることを目指します。
AIOpsを提唱したリサーチ&アドバイザリ企業・ガートナーは、AIOpsを次のように説明しています。
「AIOpsは、ビッグデータと機械学習(ML:machine learning)を組み合わせて、イベント相関、異常検出、因果関係の判断など、IT運用プロセスを自動化します」 ※カッコ内は補足
AIやMLによる学習機能を持ち、運用管理をサポートする監視・分析機能を備え、各種業務の自動化を実現すること、とも表現できます。
参考:
Definition of AIOps (Artificial Intelligence for IT Operations)|Gartner
https://www.gartner.com/en/information-technology/glossary/aiops-artificial-intelligence-operations
AIOpsが注目される背景には、過剰なデータやアラートによる運用管理業務の負荷増大があります。
近年のIT運用の現場では、ビッグデータ活用のために、構造化・非構造化を問わずあらゆるデータが収集される一方で、増えすぎたアラートによるいわゆる「アラート疲れ」が問題視されています。
そんなIT運用の現状に対して、AIの速さと正確さを取り入れることにより、過剰なアラートの削減などを実現できるAIOpsが注目されているのです。
これは大企業ほど顕著であり、ガートナーのレポートによれば「2022年までに大企業のうち40%が、監視・サービスデスク・自動化できるタスクを、ビッグデータと機械学習機能の組み合わせ(=AIOps)により部分的に置き換える予定」であるといいます。
2022年までに大企業の半数近くがAIOpsを導入するという試算からも、AIOpsの必要性がうかがえます。
参考:
Gartner Report: Market Guide for AIOps Platforms|sumo logic
https://www.sumologic.jp/brief/market-guide-aiops-platforms/
マーケット・ガイド2019年-2020年|Gartner
AIOpsが求められる理由は、従来の管理体制・運用ツールでは、ユーザーの求める品質に答えられなくなりつつあるためです。
近年、ユーザーからシェアを獲得しているITサービス・システムの中には、ユーザーにとってもはや社会インフラの一部として認識されているものもあります。そんな現代において、AIやビッグデータを活用しないまま、品質を維持・保証することがそもそも難しくなってきているのです。
従来の管理体制・運用ツールは「集める・まとめる・平均化する」ことを重視しており、現在のようなデータ量の収集や、現在求められるようなデータ分析を行うのには適していません。
そのため、エッジ端末の発達によって爆発的に増加した収集データを適切にさばき切れず、運用負荷は増大する一方となっています。
それら運用負荷を軽減するため、ビッグデータを取り込んで余さず活用して最適な環境を構築するツールがAIOpsツールです。
AIOpsツールを導入すると、次のことが実現できるようになります。
AIOpsツールを導入すると、サーバー、クライアント、ネットワーク機器、クラウドプラットフォーム、仮想マシン、周辺機器など、多岐にわたるソースからデータを取り込むことができます。
またAIOpsツールが従来のシステムと異なる点は、ただ集めてまとめるだけではなく、それらを大規模なデータセットとして取り込み、その後の分析をスムーズにできる点です。
AIOpsツールにより環境が構築されれば、単純な業務のほとんどは自動化が可能になります。AIに可能な業務はAIに任せ、より複雑性や重要性の高い業務に人的リソースを集中させることができるのです。
具体的には、ビルドやテストの自動化に加え、サーバ構築・デプロイ、さらにITリソースのサイジング、運用データにもとづくリソースの使用効率とパフォーマンスの両立支援なども自動化することができます。
AIにより業務を自動化するメリットは、人的コスト削減ばかりではありません。AIの大きな強みのひとつである正確性を活かし、人的ミスの削減にもつながります。
さまざまなソースからデータを集約する機能に加え、データを分析に活用しやすい形に整形する機能により、従来から自動化されていた業務に加え、データ分析業務も自動化することができます。
また、AIOpsツールはストリーミングデータを扱いながらデータ分析を行えるため、リアルタイム分析が可能です。
リアルタイム分析が可能になると、エラー発生からの立ち上がり速度が向上するため、結果的に顧客満足度の向上につながります。また余計なノイズとなるアラートの発生も減らせるので、アラート疲れの回避による従業員満足度向上も見込めます。
リアルタイムで分析することで、アラートの発生要因となるイベントが発生した際、ただちにアラートを発生させるのではなく、まず各データの相関関係をもとにAIが解析を行い、生成されるアラートに優先順位をつけることで、アラートそのものの数を減らすことができるのです。
またアラートが発生した場合も、従来は問題が起こってから検証を行っていたのに対して、発生時点である程度の解析が済んでいるため、検知から問題解決までがスムーズになります。
リアルタイム分析のもうひとつの恩恵として、これまでインフラで障害検知・予測にしか活用できていなかったデータを、ビジネス領域にフィードバックすることが可能となります。
データをビジネス領域に活用できるようになると、IT部門がビジネスにもたらす価値を証明し、存在感を示すことにもつながります。
AIOpsの実現をサポートするツールには、次の要件が求められます。
AIOpsを実現するためには、リアルタイム分析機能が必須です。
具体的には、ストリーミングデータを扱いながら、任意の履歴データの検索、データの保存、分析が可能であることが求められます。
AIOpsは、企業が収集するあらゆるデータを集約して分析することに意味があります。
扱えないデータがあるツールでは、結局その他のツールに頼らざるを得なくなり、自動化がうまく行かなくなってしまいます。
収集したデータをもとに、パターンを検出したり各種ソースのデータ同士を相関分析にかけたりといった機能も、データ分析を自動化する上で必須となる機能です。
これらの機能がなければ、AIOpsツールを信頼することができず、結局ツールの監視・管理に人的リソースが必要になってしまいます。
参考:
AIが明らかにする「運用管理者の役割」|ITmedia
https://www.atmarkit.co.jp/ait/articles/2001/09/news004.html
ここまで解説したAIOpsツールの要件を満たす、AIOpsの実現を手助けするツールを紹介します。
なお、AIOpsの実現に必要なツール・環境は、各社のサービス・インフラ・プロセスによっても異なるため、それぞれの仕様をしっかり確認しましょう。
Splunk(スプランク)は、2003年に創立されたアメリカの企業Splunk社が提供するAIOpsツールです。
フォーチュン100社(※)のうち91社に選ばれており、金融サービス・公共機関・医療とさまざまな業種で導入されています。AIOpsツールの中で、信頼性が高く代表的なもののひとつと言えるでしょう。
ダウンタイムを82%削減、データ漏洩・不正行為のリスクを70%低減、リリース時間を50%迅速化するとしています。
※フォーチュン100とは……ビジネス雑誌「フォーチュン」が発表する「100 Fastest-Growing Companies(急成長企業100社)」のこと。
参考:
Splunk(スプランク)とは | Splunk
https://www.splunk.com/ja_jp/about-splunk.html
OpsRampは、アメリカ・カリフォルニア州に本社を置くOpsRamp社が提供するSaas(Software as a Service)型のIT運用管理プラットフォームです。
1000社以上の企業ユーザーに使われており、Splunkに並び代表的なAIOpsツールのひとつと言えます。
特徴はSaaSベースのプラットフォームである点で、AIOpsツールとして運用管理に必須となる各種機能を持っているのに加え、ハイブリッドクラウド環境を統合的に管理するのに適しています。
参考:
OpsRamp – SaaS型 IT 運用管理プラットフォーム|JBS 日本ビジネスシステムズ株式会社
https://pages.jbs.co.jp/opsramp_index.html
会社概要|VistaNet(ビスタネット)株式会社
http://www.vistanet.jp/company.html
IBM Watson OpenScaleは、世界170か国以上で事業を展開するアメリカのコンピュータ関連企業・IBM社(アイビーエム: International Business Machines Corporation)の提供するAIOpsツールです。
Watson OpenScaleの特徴は、企業が自社のAIシステムをきちんと把握できるようにするための機能を備えている点にあります。AIのライフサイクル全体で、パフォーマンスのモニターと調整ができ、AIが判断の拠り所とした文書やデータをプロセスごとに追跡して遡ってチェックすることが可能です。
これらの機能により、導入した企業ごとに異なるビジネス結果にマッチしたAIへと調整し続けるフィードバックループを形成します。
参考:
IBM Watson OpenScale|IBM
https://www.ibm.com/jp-ja/cloud/watson-openscale
日本IBM|Wikipedia
https://ja.wikipedia.org/wiki/IBM
SysTrackは、アメリカに本社を置くグローバル企業・Lakeside Software社の提供するAIOpsツールです。
SysTrackは、ユーザーからは見えないエージェントをエンドポイントに配布することで、パフォーマンス情報、ログ、レジストリキーなどあらゆるデータを収集します。
エンドポイントに配布されたエージェントの核となる機能は、「Lakeside Software DataMineエンジン」。シンプルな階層型アーキテクチャーを採用することで、最小限のサーバーでも運用が可能かつ、拡張性に優れたツールです。
参考:
ヘルプデスクのためのAIOps|Lakeside Software
https://www.lakesidesoftware.com/jp/solutions/ai-ops
SysTrackが選ばれる理由|レイクサイド ソフトウェア株式会社
https://www.lakesidesoftware.com/jp/why
Red Sky Opsは、アメリカのCarbon Relay社が提供する、Kubernetes環境向けAIOpsツールです。
Kubernetes環境でコンテナ化されたアプリケーションをデプロイ、スケーリング、管理するためのAIOpsプラットフォームで、Kubernetes環境におけるパラメーター最適化に適したソリューションと言えるでしょう。
参考:
国内初、AIOpsツール「Red Sky Ops」の取り扱いを開始 ~米Carbon Relay社とパートナー契約、Kubernetes運用をAI/機械学習により最適化。パフォーマンス50%以上の向上、クラウドコスト30%以上の節約を実現~|プレスリリース | サイオス株式会社
https://i.sios.com/news/press/20191023-redskyops.html
Red Sky Ops|Carbon Relay
AIOpsを実現するためには、まずできることからスモールスタートではじめることが重要です。
AIOpsツールはあらゆる業務の自動化をサポートするソリューションであるものの、すべての業務を速やかにAIで代替できるわけではありません。
そのため、すべてのデータを対象として導入を推し進めると、AIの学習効率が悪くなるだけでなく、かえって業務の品質を損なう可能性があります。
AIは人の仕事を奪うライバルではなく、人の能力を拡張するツールです。しかし、どんなに便利な道具も使い方を誤ればその本領を発揮することはできません。AIを信頼して業務を任せるためにも、安心して任せられる状態まで丁寧に整備しましょう。
DevOps(Development Operations)の例でもわかるように、AIOpsが完全に浸透するには5年、10年と長い時間がかかることが予想されます。ツールの導入を検討するなら、始められる範囲からすぐに始めると良いでしょう。
参考:
Artificial Intelligence for IT Operations|Wikipedia
https://en.wikipedia.org/wiki/Artificial_Intelligence_for_IT_Operations
2021年1月18日