分散トレースは、ユーザのトランザクション実行を追跡する手段です。分散トレースにより、アプリケーションのマイクロサービス間のトランザクションを追跡し、トランザクション存続期間をわかりやすく可視化することで、マイクロサービスに対する応答速度の低下やエラーをピンポイントで突き止められます。
私は Illuminate で行ったプレゼンテーションで、アプリケーション パフォーマンスのさまざまなユース ケースに対応するよう拡張された Sumo Logic のプラットフォームをご紹介しました。この拡張プラットフォームを使用すれば、チームは Sumo Logic の分散トレースの価値を直接実感できるでしょう。これは、エンドツーエンドかつ全体から細部に至る信頼性ニーズに対応する選り抜きの可観測性プラットフォームです。
Sumo Logic のエンドツーエンド可観測性プラットフォームのメリットを理解するには、ほとんどの組織がマイクロサービスとインフラストラクチャの完全な可視性を得ようと努力している現状に目を向けることが重要です。
トレース データを収集する際の課題
ほとんどの企業は、トレースによってアプリケーション パフォーマンス データの完全な可視性を得ることの重要性を理解していますが、その目標を達成する上で阻害要因となっているのが、トレース データを収集する際にブラックボックスのような特殊なインスツルメンテーションをベンダーから強いられることです。こうしたベンダー ロックインにより、統合が遅々として進まず、アプリケーションの構築方法もモニタリング方法も制限されてしまいます。
Sumo Logic のお客様とお話しすると、トレース データの収集に関しては圧倒的な数の組織がオープンソースの手法を望んでいます。業界の傾向として、この先数年の間に、新しいマイクロサービスベースのアプリケーションの半分がベンダー固有のエージェントではなくオープンソースのインスツルメンテーションを使用するようになるでしょう。この傾向の中、第一線に立つアナリストたちは、OpenTelemetry をできるだけ早く導入するようアドバイスしています。OpenTelemetry はトレース収集の新しい標準であり、無料、柔軟、セキュリティにも優れています。
分散トレースに対応するよう拡張された Sumo Logic のプラットフォームは、従来の OpenTracing 標準や OpenCensus 標準とともに OpenTelemetry も完全サポートするので、この新しいトレース収集標準を簡単に導入できます。Sumo Logic の OpenTelemetry コレクタを指すようにエクスポータ構成を変更するだけで、Sumo Logic 内の新しい UI でデータ オンボーディングを開始できます。
エンドツーエンドの可視性を 1 つのプラットフォームで提供
このデモで示すように、トレース データを使ってアプリケーション パフォーマンスの問題をモニタリングして解決するには、エンドツーエンドの可観測性プラットフォームが鍵となります。リリース済みの機能とベータ版として使用できる機能の両方が組み込まれた Sumo Logic の可観測性プラットフォームは、
1 つの UI で完全な可視性を提供します。つまり、たった 1 つの製品でアプリケーションに関するすべての責任に対処できるのです。[Infrastructure (インフラストラクチャ)] タブを使えばいつでもシームレスに他のダッシュボードや、ログ、トレース、メトリクスに移動できます。これらすべてのシグナルを相関付けるのは難しいタスクですが、Sumo Logic はこの困難なタスクを自動的にバックエンドで処理します。さらに Sumo Logic は、ブラウザ モニタリングやスパン分析などの機能も近日中に提供できるよう取り組んでいます。
私たちの見解では、これらの機能は、この包括的な可観測性プラットフォームにおける現在のユース ケースの延長線上にあります。プラットフォームにスタンドアロンとして追加される製品機能ではありません。オープンで、柔軟性、拡張性、セキュリティに優れたこの製品は、Sumo Logic ですでにご利用いただいているのと同様の卓越した、ログとメトリクスに対する統合アナリティクス機能を備えています。
必要なものをすべて 1 か所に揃え、全体から細部に至るあらゆる可観測性を備えたこのプラットフォームがあれば、皆様のチームは次のことができます。
- ダッシュボードを使用してデータを集約し、マイクロサービスの健全性に関する完全な可視性を確保する
- フロー図またはトポロジ マップ (現時点ではベータ版) を使用して、インフラストラクチャの KPI を相関付け、アプリケーションの依存関係を追跡する
- 失敗したトランザクションや低速のトランザクションを検索し、ログとインフラストラクチャ KPI を掘り下げて調べ、トラブルシューティングを行う
この製品についてさらに詳しく調べるには、こちらをご覧ください。
Sumo Logic のベータ版を試した Elementum 社の感想
Norberto Kueffner 氏は、サプライ チェーン管理ソフトウェアを開発している Elementum 社でサイト リライアビリティ エンジニアリング部長を務めています。
大まかに言うと、同社は DC/OS および Kubernetes オーケストレータでサポートされる複雑なマイクロサービス アーキテクチャを扱っています。さまざまなチームが配送情報から場所、地図上の地点に至るまで大量の顧客データを処理しているので、複数のインターフェイスを使って多数のデータ取り込みパイプラインを扱う必要があります。また、ユーザがさまざまな企業と連携できるよう、同社のアプリケーションはマルチテナント型となっていますが、企業によって要件はさまざまに異なります。たとえば、オーケストレータでサポートされるすべてのマイクロサービスのコアごとに署名を検証するという要件のため、大量のデータが生成されてプラットフォームにかなりの負荷がかかります。こうした状況により、同社にとってトレースは大変な作業です。
同社は、アプリケーションに対するエンドツーエンドの可視性を高める目的で Sumo Logic ベータ版を試すようになる前、別々のベンダーでトレース、アプリケーション パフォーマンス モニタリング、メトリクスを行っていました。この仕組みでは、次のような問題に絶えず対処しなければなりません。
- 複数のベンダーとの数々の契約
- 重複する開発者トレーニング
- 複数のインターフェイス/構成
- トレース/ログ/ホスト/問題を関連付けるのが難しい
- 複数のエージェント、コレクタ、設定を管理する
これらの問題に取り組むことを念頭に、Elementum 社の SR チームは分散トレースに可観測性をもたらす拡張機能の早期導入者として Sumo Logic を試しました。
チームの体験によると、この拡張機能をデプロイするのに苦労はまったく伴わず、OpenTelemetry を使ってトレース イベントを収集できるようになりました。Norberto 氏は、ベンダーベースのコレクタを使う必要がなくなったことで物事がそれまでより遥かに簡単でシンプルになったと話してくれました。Sumo Logic では、1 回の試みで、EKS クラスタからデータを取り込んでダッシュボードを構成するまでのプロセスを自動的に完了できました。
開発者たちはこのプラットフォームがもたらす統合レベルの価値をすぐに実感しました。特に、Sumo Logic 内でスパン可視化と検索がとても直感的になったことが画期的です。イベントの追跡/ロギングから、インフラストラクチャの障害/ボトルネックの特定に至るまで、あらゆる操作をわずか 2 回のクリックで行うことができます。しかも他のベンダー スタックでは経験したことのないレベルの可視性です。
チームはこのプラットフォームから簡単に新しい機能や修正、改善を展開できます。チームは現在、これまでになく短時間で統合の問題やボトルネックの根本原因を簡単に突き止められるようになっています。以前は 2~3 の異なるプロバイダのプラットフォーム間で操作を行わなければなりませんでしたが、Sumo Logic ではポイント アンド クリックだけでトレースを追跡できます。
ベータ版での素晴らしい体験により、Elementum 社のチームはステージング環境と本番環境を Sumo Log に移行しました。これで、さまざまなベンダーのソリューションを使って可観測性のニーズに対処する必要がなくなりました。
Complete visibility for DevSecOps
Reduce downtime and move from reactive to proactive monitoring.