For Your ISHIO Blog

データ分析や機械学習やスクラムや組織とか、色々つぶやくブログです。

Elastic Cloudの無料トライアルで5分でデプロイしてKibana最新版のグラフ機能を利用してみた

検索エンジンElasticSearchや可視化ツールKibanaをクラウド上で容易にデプロイして利用できるSaaS製品「Elastic Cloud」がリリースされています(結構前に)。現在、14日間の無料トライアルが可能であり、最新版のElasticSearchやKibanaをAWSGCP上で利用できます。今回は、Kibanaの最新版にしか入っていないグラフ機能を試したく、デプロイしてみました。

Elasticの製品は、非構造化データを蓄積・検索・可視化する上での有力な選択肢の1つと考えます。サンプルデータもついてますし、めちゃくちゃ簡単にお試し利用できるので、触ったことがない方は一度試してみることをお勧めします。

Elasticsearchの パワーを利用した SaaS製品群 | Elastic

デプロイは5分で終わる

Elasticsearchの パワーを利用した SaaS製品群 | Elastic」のページ左のElasticsearch Serviceにメールアドレスを入力し「今すぐトライ」します。受信メール上のリンクをクリックすると、デプロイの設定が開始します。(※2018年10月30日時点)

f:id:ishitonton:20181030232106p:plain

デプロイまでの設定は以下の通りです。

  1. deployment nameを決める。(何でもよい)

  2. AWSGCPを利用するかを決める。どちらでも良いと思うのですが、AWSにはregionに「Asia Pacific (Tokyo)」があったので、私はAWSを選択しました。

  3. regionの設定。上記の通り。

  4. set up your deployment。何も変更せず。

  5. デプロイメントの最適化。いくつか最適化のプランがありますが、Elastic側っで推奨している「I/O Optimized」を選択しました。

最後に「Create deployment」をクリックしてデプロイがスタートです。

f:id:ishitonton:20181030233456p:plain f:id:ishitonton:20181030233602p:plain

デプロイはおそらく5分くらいで完了します。終了後のマイページの画面は下記になります。デプロイしたElasticc Cloudのdeploymentが表示されており、KibanaとElasticSearchのロゴが確認できます。これらをクリックしてみましょう。 f:id:ishitonton:20181030234558p:plain

AWS上にデプロイした詳細情報が表示されています(一部黒塗り)。インスタンスはElasticSearchがmasterとSlaveで計3台、Kibanaが1台立っています。シャーディング2でElasticSearchは負荷分散を行っているものと考えられます。また、赤枠部分にElasticSearchとKibanaのエンドポイントのリンクが記載されています。Kibanaの部分をクリックすれば、Kibanaの画面に移ります。

f:id:ishitonton:20181030235122p:plain

サンプルデータをインポートする。

さっそくKibanaにログインしてみます。最初の状態は、ElasticSearchにデータが何も入っていない状態です。ただ、このトライアルでは、Add Data to Kibanaと記載してあるとおり、サンプルのデータが用意してあるので問題ありません。log分析やMetrics監視、セキュリティ解析等、いくつかデータを用意してくれていますが、今回はフライトデータを利用したいと思います。画像赤枠の「Sample DataLoad a data set and a Kibana dashboard」をクリックします。Sample flight dataがありますので、Addしていただくと、データのインポートは完了します。

f:id:ishitonton:20181031000641p:plain

ダッシュボードを見てみる

すでにElasticSearchには、サンプルのFlight Dataがインポートされた状態であり、Kibanaには既にサンプルのグラフと作成済みダッシュボードがあります。試しにDashboardの項目を選択してください。今回は個別の説明は省きますが、以下のように地図へのプロッティング、ワードクラウド、ローデータの表示まで実に多彩な表現方法があるようです。

f:id:ishitonton:20181031001050p:plain

グラフ機能を試してみる!

今回は、インポートしたフライトデータから、「出発地の国(OriginCountry)」と「目的地の国(DestCountry)」の関係性をグラフ機能で可視化していきたいと思います。前提条件として、グラフ分析には、頂点(Vertex)と頂点間を結ぶ線(Node)があります。今回は、Vertexが「国」を表しており、出発地⇔目的地の関係性が強いほど、より太いNodeで結ばれることになります。

まず、左側のメニューより、「Graph」を選択すると、グラフ分析画面に移ります。 f:id:ishitonton:20181031001701p:plain

次に、左上の「New Graph Workspace」の下にあるタブから、今回の対象データである「kibana_sample_data_flights」を選択してください。その右にある十字マークからVertexとなるデータを選択することができます。今回は下記2つのフィールドを選択してください。

  • OriginCountry
  • DestCountry

それぞれ、Vertexのマーク、色、描写する件数を指定できます。マークや色は好きなようにしていただき、描写件数(Max terms per hop)は、それぞれ100としましょう。

f:id:ishitonton:20181101000104p:plain

その右側では、Kibanaでの検索クエリを入力することができます(「foo AND bar NOT baz」と記載されているところ)。今回はデータ数はそれほど多くないので、全てのデータを対象とする「*」を入力し、検索を実行(🔎クリック)してください。下記のようなグラフが生成されると思います。

f:id:ishitonton:20181101000801p:plain

簡単に考察すると、「MX(メキシコ)」と「IN(インド)」間のNodeが非常に太くなっており、両国間のフライトデータが多く存在することがわかります。右側にあるSelectionsと書かれたパレットを使用すると以下のようなことができますので試してみてください。

  • 例えば、JP(日本)のVertexを選択して、JPを中心としたグラフを再構成する。
  • JP(日本)とリンクするVertexを抽出する。
  • JP(日本)のVertexに関するローデータを出力(Drill Down)する。

f:id:ishitonton:20181101001530p:plain

色々いじってみると面白いので、無料トライアルできる間にぜひ試してみてください。

以上です。