Taste of Tech Topics

Acroquest Technology株式会社のエンジニアが書く技術ブログ

Elastic{ON} 2017 2日目 |X-pack Machine Learning の内部に迫る! #elasticon

Elastic{ON}2017 レポートのまとめはこちら!!

こんにちは!菅野です。
Elastic{ON}2日目!
最新情報、ユースケースの講演、海外エンジニアとの交流と
脳汁ダバダバな一日でした。

それでは、早速本題のElastic{ON}2日目のレポートです。

参加セッション

私が本日参加したセッションは次の通りです。

  1. Sustainable Harvesting: How a Few Geeks Learned to Elastic Stack Logs
  2. Localizing Kibana for the Global Language Landscape
  3. This Paper Has Been Plagiarized: How Blackboard Curbs Cheating with Elasticsearch
  4. How Warner Bros. is Using Elastic to Solve Entertainment and Media Problems at Scale
  5. Elastic Cloud Inside Out
  6. BoF: Alerting Use Cases
  7. Machine Learning and Statistical Methods for Time Series Analysis
  8. Elastic{ON} Party

その中でもMachine Learning and Statistical Methods for Time Series Analysis
が面白かったので紹介しますね。

Machine Learning and Statistical Methods for Time Series Analysis

f:id:acro-engineer:20170309164301j:plain:w500

概要

PrelertがX-packに追加されたことにより、
Elastic Stackで機械学習、異常検知ができるようになります。

今回のセッションでは、どのように
時系列データでの機械学習を実現するかのコア技術を紹介していました。

面白かったポイント

機械学習の基礎から知る

本セッションでは、機械学習とは、
異常値とは何かといった基礎的な話からスタートしました。

機械学習アルゴリズムの種類は教師あり学習と教師なし学習に分かれます。

教師あり学習

教師あり学習は与えられたデータと正解のペアから、
新しいデータが与えられた際にそのデータのタグを予測します。

例えば、機械学習で犬と猫を判定する問題を解きます。
この場合、2種類のデータを準備します。1つ目は犬の写真とそれが犬であるデータの組み合わせ、
2つ目は猫の写真とそれが猫であるというデータの組み合わせです。

そのデータからデータの特徴を学習し、犬か猫を判定します。

f:id:acro-engineer:20170309164152j:plain:w500

たとえが可愛い😍

教師なし学習

教師なし学習では教師を与えずに学習します。
例えば、クラスタリングがその1つです。データのみが与えられ、それらのデータのグルーピングを行います。

先ほどの犬猫の例だと、犬と猫のデータから、
猫っぽいグループと犬っぽいグループに振り分けるグルーピングをします。

f:id:acro-engineer:20170309164408j:plain:w500

やはりかわいい😍

異常値とは?

教師なし学習でクラスタに分類を行いました。
しかし、グルーピングされたデータの中に、いかにも外れているデータがあることもあります。
これを、異常値と呼びます。

犬、猫で例えると馬の写真は全く異なる特徴がみられますね。

f:id:acro-engineer:20170309164435j:plain:w500

そういった以前までと異なる特徴を持つデータを見つけるのが
異常値検知というものになります。

X-pack Machine Learningでの異常検知

X-pack Machine Learningでは過去のデータの傾向や周期を学習しています。
それら、過去のデータから未来を推定します。
過去のデータと傾向と未来の傾向が同じだと殆ど同じ予測になりますよね!
しかし、過去のデータにない傾向の場合は未来の予測があたらない(=過去にデータがない)ので、これを
異常とみなすアルゴリズムを使っています。

f:id:acro-engineer:20170309164459j:plain:w500

X-pack Machine Learningのデモ

セッションの後半では
X-pack Machine Learningのデモを行っていました。

今回利用したデータは、ニューヨークのタクシー利用データです。
利用者数をキーとして、異常検知を行いました。

Machine Learningのjobを作成し
Elasticsearchのインデックスを選択して、解析対象のキーを選び、jobを実行します。

たったこれだけで、X-pack Machine Learningで異常検知を行えます。
f:id:acro-engineer:20170309164636j:plain:w500

今回のデモでは、普段より利用者が少ない日、多い日を割り出すことができていました。
利用者が多い日はクリスマスの日です。ディナーに出かけたり、プレゼント買ったりで利用者が増えるようです。
また、利用者が少ない日はニューヨークマラソンが行われた日、交通規制等で利用者が減ったみたいですね。

手軽に異常検知が行えるX-pack machine learningはバージョン5.4からのリリースです。
いまから使えるのが楽しみ!!

おまけ

Elastic{ON}Partyにて

博物館を貸切ってのパーティ。こんな感じでもりあがりましたーー

f:id:acro-engineer:20170309160518j:plain:w500

最後に

明日がいよいよ最終日!
次回もHotな情報を提供するのでぜひ見てみてください!

Elastic{ON}2017 レポートのまとめはこちら!!

Acroquest Technologyでは、キャリア採用を行っています。

  • ビッグデータHadoop/Spark、NoSQL)、データ分析(Elasticsearch、Python関連)、Web開発(SpringCloud/SpringBoot、AngularJS)といった最新のOSSを利用する開発プロジェクトに関わりたい。
  • マイクロサービスDevOpsなどの技術を使ったり、データ分析機械学習などのスキルを活かしたい。
  • 社会貢献性の高いプロジェクトや、顧客の価値を創造するようなプロジェクトで、提案からリリースまで携わりたい。
  • 書籍・雑誌等の執筆や、対外的な勉強会の開催・参加を通した技術の発信、社内勉強会での技術情報共有により、エンジニアとして成長したい。

 
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。

Elasticsearchを仕事で使いこみたいデータ分析エンジニア募集中! - Acroquest Technology株式会社のエンジニア中途・インターンシップ・契約・委託の求人 - Wantedlywww.wantedly.com

Elastic{ON} 2017 2日目| BoF: Pythonista Unite!に挑戦しました

Elastic{ON}2017 レポートのまとめはこちら!!

こんにちは。@です。
Elasitc{ON}でMachine LearningやLuceneの新機能紹介など
興味深いイベントが多くあり、楽しんでいます!詳しくは今晩までお待ち下さい。

ところで本題ですが、セッションの途中でBoFと呼ばれるイベントが
あったのでいってみました。

BoFとは

BoFBag of FeaturesBirds of a featherのことで、似ている人を集めて行う会です。
参加者皆で特定のトピックに関するディスカッションをします。
この会場はエントランスの近くにあります。

f:id:acro-engineer:20170309082655j:plain:w500

Pythonistas, Unite!

私が行ってきたBoFはこのPythonistas Unite!です。
自称Pythonistaなので、世界のPythonistaと
ディスカッションしてみたいと思って参加しました。
参加者は大体20名ほどでした。

このBoFでは、参加者が円形に座ってディスカッションをします。
Elastic社の人がディスカッションをファシリテートをしています。
ディスカッションの内容として、具体的にPythonとElasticsearchを使って
何をしたか、どんなものを作ったかといった話をしました。

f:id:acro-engineer:20170309082715j:plain:w500

参加者はPythonを検索用途とデータ分析用途で使っている人が多いようで、
PySparkやJupyter(IPython)Notebookのイケてないところ。
自分で前処理を書いて投入した話など様々なPythonユースケースが聞けました。

私も頑張ってPythonのライブラリの話をしました。
外国人の中で自分ことを話すことはなかったので、非常に緊張しました。
ただ、自分の考えていることを伝えるのは楽しかったです!

最後に

セッションよりも話についていくのが大変でしたが、
面白かったです!また、参加したいと思いました。

今日、最後まで頑張ります!!

Elastic{ON}2017 レポートのまとめはこちら!!

Acroquest Technologyでは、キャリア採用を行っています。

  • ビッグデータHadoop/Spark、NoSQL)、データ分析(Elasticsearch、Python関連)、Web開発(SpringCloud/SpringBoot、AngularJS)といった最新のOSSを利用する開発プロジェクトに関わりたい。
  • マイクロサービスDevOpsなどの技術を使ったり、データ分析機械学習などのスキルを活かしたい。
  • 社会貢献性の高いプロジェクトや、顧客の価値を創造するようなプロジェクトで、提案からリリースまで携わりたい。
  • 書籍・雑誌等の執筆や、対外的な勉強会の開催・参加を通した技術の発信、社内勉強会での技術情報共有により、エンジニアとして成長したい。

 
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。

Elasticsearchを仕事で使いこみたいデータ分析エンジニア募集中! - Acroquest Technology株式会社のエンジニア中途・インターンシップ・契約・委託の求人 - Wantedlywww.wantedly.com

Elastic{ON} 2017 Men's breakfastもとい、Elastic{ON}の朝食紹介

Elastic{ON}2017 レポートのまとめはこちら!!

皆さんこんにちは。@です。
Elastic{ON}は2日目となりました。

2日目からはElastic{ON}会場に朝食があります。先程まで、その朝食を食べていました。
因みに、女性陣はWomen's breakfastと呼ばれるイベントがあり、そちらにいっています。
そのため、男性陣しか残っておりません。まるで、Men's breakfastです。

朝食会場はElastic{ON}会場であるPier48の前にあります。
雰囲気はこんな感じになっています。朝食会場は野外でテントの下で食べることになります。

f:id:acro-engineer:20170309022904j:plain:w500

この朝食会場の周囲に屋台があり、その屋台から好きな朝食を選択します。

f:id:acro-engineer:20170309022656j:plain:w500

1つ1つの屋台はトラックになっており、各屋台の近くにメニューを表示しています。

f:id:acro-engineer:20170309023718j:plain:w500

そして、テント下に飲み物がありました。これはセルフサービスです!
水やコーヒーなどがあります。

f:id:acro-engineer:20170309024119j:plain:w500

最後に朝食の写真です。左側の私が食べた朝食の写真が少しわかりにくいですね。
朝食はチキンと目玉焼きをワッフルではさむサンドです。
甘いのとチキンな味でおいしかったです!
右側の画像は私のではないですがなんだかおいしそう・・・

f:id:acro-engineer:20170309023844j:plain:h300f:id:acro-engineer:20170309023936j:plain:h300

最後に朝食を受け取りに行ったメンズが集合して、写真を1枚。

f:id:acro-engineer:20170309025128j:plain:w500

そして、皆で朝食を食べました。
本日も頑張ってElastic{ON}行ってきます!今晩も報告書きますので、お待ち下さい!

Elastic{ON}2017 レポートのまとめはこちら!!

Acroquest Technologyでは、キャリア採用を行っています。

  • ビッグデータHadoop/Spark、NoSQL)、データ分析(Elasticsearch、Python関連)、Web開発(SpringCloud/SpringBoot、AngularJS)といった最新のOSSを利用する開発プロジェクトに関わりたい。
  • マイクロサービスDevOpsなどの技術を使ったり、データ分析機械学習などのスキルを活かしたい。
  • 社会貢献性の高いプロジェクトや、顧客の価値を創造するようなプロジェクトで、提案からリリースまで携わりたい。
  • 書籍・雑誌等の執筆や、対外的な勉強会の開催・参加を通した技術の発信、社内勉強会での技術情報共有により、エンジニアとして成長したい。

 
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。

Elasticsearchを仕事で使いこみたいデータ分析エンジニア募集中! - Acroquest Technology株式会社のエンジニア中途・インターンシップ・契約・委託の求人 - Wantedlywww.wantedly.com

Elastic{ON} 2017 1日目 | General Mills のElasticsearchを使ったWebサイト検索の工夫! #elasticon

Elastic{ON}2017 レポートのまとめはこちら!!

こんばんは!PlNOKlOです!
サンフランシスコは夜中でございます!!


本日参加したセッションについてご説明したいと思います!

参加セッション

  1. Opening Keynote
  2. Near Real Time Retail Analytics @ Walmart
  3. Elastic @ General Mills: The Journey Continues
  4. Streamlining Healthcare and Research: The Story of Elasticsearch at UCLA Health
  5. Welcome Reception


いやー、キーノートすごかったですね!
同僚がそこは詳しくブログを書いているので割愛しますが、
Kibana大好きな私は興奮しっぱなしでした!!

ぜひこちらのブログもご覧ください😊


本日はキーノート以外にはUse Caseをたくさん聞いてきました。

Walmartはアメリカの世界最大のスーパーマーケットで、
売上額でも世界最大の企業です。
General Millsは食品の加工 / 販売をしている会社で、
子会社にハーゲンダッツなど有名な企業を80ほど持つ、大手企業です。

食品業界、流通業界に関連する分野でのElasticsearchの活躍範囲を聞けたのは大きかったですね!!


それでは私はGeneral Millsの事例をご紹介します!

f:id:acro-engineer:20170308090731j:plain:w700

General Millsは昨年のElastic{ON} シカゴでも発表していて、
その発表では精度の高いサイト内検索をするために
EndecaからElasticsearchへの置き換えを行った内容が紹介されていました。

https://www.elastic.co/elasticon/tour/2016/chicago/the-trix-to-creating-a-totally-new-customer-experience-elastic-at-general-mills
こちらが昨年の発表内容です。

ちなみにEndecaというのは、「Oracle Endeca Information Discovery」のことであり、
構造化データと非構造化データの紐づけを簡単に実現し、DBの構造設計が不要、
検索中心の操作感で誰でもすぐに利用可能な「ビジネスアナリスト」向けの製品です。


こちらをElasticsearchに置き換え、
以下のサイトの検索を行いたいと紹介されていました。

http://www.bettycrocker.com/
https://www.pillsbury.com/
http://tabelspoon.com/

f:id:acro-engineer:20170308173256j:plain:w700

今年の発表では、Webサイト内の複雑なデータの検索を行うために、
データの持ち方に工夫をしたようで、
それをデモも交えて紹介していました。

まず構成としては、
5データノード、2クライアントノード、3マスターノードでクラスタを組み、
1秒あたり350レコードを取得しながら、約3500個のシャード検索をしています。


f:id:acro-engineer:20170308173301j:plain:w700

そして、Simple Search DTOを間に挟むことで検索の実装を行っています。


f:id:acro-engineer:20170308173309j:plain:w700

General Millsのサイトを検索するには、
レシピ、記事、ビデオ、製品、クーポンなど、
多種にわたるデータを検索できるようにしなくてはなりません。

そこでGeneral Millsが行ったのは
商品カテゴリや、商品までさまざまな要素を対等なドキュメントとして扱う、
シンプルに検索する仕組みだそうです。

発表で説明されていたのは、
ItemID、Title、Metadataを共通のフィールドにしていました。

ItemIDは要素を判別するためのIDで、
Titleは検索するために最も必要な要素、
Metadataは固有の情報を格納するための要素です。


f:id:acro-engineer:20170308173308j:plain:w700

Metadataは
 ・Label:カテゴリ
 ・Value:サブカテゴリ
 ・Groupes:LabelとValueを論理的にグループ化する要素
 ・Parent-child groups:Groupの階層構造を持つ要素
を保持しています。

そうすることで検索の際、
Metadataを検索すればよいことになります。


f:id:acro-engineer:20170308173311j:plain:w700

そしてここで出てくるのは、
ドキュメントベースから情報ベースの考え方です。

一つのDocumentがたくさんのフィールドを持つという
Documentベースで考えではありません。

Documentを汎用的な型のように考え、
商品カテゴリ、商品、タイムスタンプをそれぞれ
1Documentとして表す、というものです。

各Documentは
 ・ItemID(Guid)
 ・Title(string)
 ・Values(List)
 ・Attachments(List)
を保持しており、ValuesやAttachmentsに
各ItemIDを入れて、商品カテゴリ-商品-タイムスタンプなどの
関連づけをおこなっています。


このようなデータの管理をすることで、
サイト内でItemID検索をすると、
そのItemIDを持った商品と、それを子(Attachments)に持つ商品カテゴリ
の両方のドキュメントが取得できるのです。

そうすることで多種多様なデータでも、等しいドキュメントとして検索が可能になったのです。


ただ、同じドキュメントでも構造が変わるので、
データの入れ方、取り出し方などが難しいと思いますよね?
そこで、自前で出し入れするメソッドを実装し、
それを利用してデータの管理を簡単に行っているそうです。


f:id:acro-engineer:20170308174343j:plain:w700
f:id:acro-engineer:20170308174401j:plain:w700


実はどういうコーディングもしているか紹介してくれていて、
これがその紹介Demoになります。


私も営業でお客様とお話しすると、
自社Webサイトの検索をElasticsearchでしたいと相談をしてくださる方が多いです。
そういった方々には少しヒントになるのではないでしょうか?

ということで、General Millsの紹介でした!



General Millsの発表はDemoの解説が多く、
技術者には楽しい内容という感じでした。

私は営業なので、かなり技術的に詳しい話になると、
情報の処理が追い付かなくなり大変でした😭


かなりの集中力を使って疲れ切ってしまったので、
明日に備えて寝ることにします😅


明日は以下のセッションを聞いてきます!

  1. What's the Latest in Logstash?
  2. What's X?citing in X?Pack?
  3. Strengthen your SIEM: Using Logstash to Connect ArcSight to the Elastic Stack
  4. Browse Raw Logs in One Place: Open Source Plug-in for Kibana
  5. 'Elasticsearch as a Service' in eBay
  6. Ballerina
  7. Elastic{ON} Party


この中から面白かったものを明日もあげるので、
お楽しみにしてください!!


"Please enjoy using Elasticsearch !"


Elastic{ON}2017 レポートのまとめはこちら!!

Acroquest Technologyでは、キャリア採用を行っています。

  • ビッグデータHadoop/Spark、NoSQL)、データ分析(Elasticsearch、Python関連)、Web開発(SpringCloud/SpringBoot、AngularJS)といった最新のOSSを利用する開発プロジェクトに関わりたい。
  • マイクロサービスDevOpsなどの技術を使ったり、データ分析機械学習などのスキルを活かしたい。
  • 社会貢献性の高いプロジェクトや、顧客の価値を創造するようなプロジェクトで、提案からリリースまで携わりたい。
  • 書籍・雑誌等の執筆や、対外的な勉強会の開催・参加を通した技術の発信、社内勉強会での技術情報共有により、エンジニアとして成長したい。

 
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。

Elasticsearchを仕事で使いこみたいデータ分析エンジニア募集中! - Acroquest Technology株式会社のエンジニア中途・インターンシップ・契約・委託の求人 - Wantedlywww.wantedly.com

Elastic{ON} 2017 1日目 | ダウンタイム0秒で大規模システムのアップグレードを実施可能に #elasticon

Elastic{ON}2017 レポートのまとめはこちら!!

こんにちは。
3年目エンジニアのたなけんです。

日々、お客様のビジネスデータを、
Elastic Stackを活用して分析しています。

今日はElastic Stackの最新情報を入手するために、
サンフランシスコで開催中のElastic{ON}に参加しています。

年に1度のElasticsearchの祭典です^^

参加セッション

私が本日参加したセッションは次の通りです。

  1. Opening Keynote
  2. The Evolution of Log Insight at MZ Games
  3. Cisco's Journey to Cloud Native
  4. The Hotel NERSC Data Collect: Where Data Checks In, But Never Checks Out

特に面白かったCiscoのプレゼンについて、
大規模システムのダウンタイムを0秒にするためにどのようなことを行ったのか、
聞いてきたことを共有します!

Cisco's Journey to Cloud Native

Cisco Systems, Inc.は、
世界最大のコンピュータネットワーク機器開発会社で、
ルーター、サーバー、セキュリティ製品などの提供を行っています。

f:id:acro-engineer:20170307160338j:plain:w700

Ciscoでは、
自社の製品を売るためのECサイトを構築しており、
そこで使用しているプラットフォームが、Cisco commerceです。

Ciscoの提供しているサービスのアーキテクチャは以下の通りです。
f:id:acro-engineer:20170307161208j:plain:w700

こちらはCisco Commerceの使用状況を数字で表現しています。
f:id:acro-engineer:20170307161218j:plain:w700

Ciscoのプラットフォームには、いくつか弱点がありました。
f:id:acro-engineer:20170307161614j:plain:w700

本日扱う重要な弱点はインフラ、ストレージ、ネットワークに障害が発生した際に、
プラットフォームが停止することです。

この問題を解決するために、
Cloud Nativeへの移行を実施しました。

インフラのCloud Nativeへの移行にあたって、
目標はいくつかのステップに分けました。
次のように定めています。
f:id:acro-engineer:20170307161647j:plain:w700

非常に複雑なシステムとなるため、
5ステップに分けて作業を実施しました。
全体構成図は以下の通りです。
f:id:acro-engineer:20170307162533j:plain:w700

実施したこととその詳細をまとめたものがこちら。

loggingをElasticsearchで行うようにし、
トランザクションデータはMongoDBに分配するように構築を行ったそうです。
MongoDBではSQLを大量に書かなければならず、非常に苦労したとのことでした。

f:id:acro-engineer:20170307162638j:plain:w700

取り組みの結果、ダウンタイムが発生することなく、
ソフトウェアアップグレードが可能になりました。
f:id:acro-engineer:20170307163058j:plain:w700

明日以降も、
さらに盛り上がりを見せるカンファレンスの様子、
発信していきます!

それでは!

Elastic{ON}2017 レポートのまとめはこちら!!

Acroquest Technologyでは、キャリア採用を行っています。

  • ビッグデータHadoop/Spark、NoSQL)、データ分析(Elasticsearch、Python関連)、Web開発(SpringCloud/SpringBoot、AngularJS)といった最新のOSSを利用する開発プロジェクトに関わりたい。
  • マイクロサービスDevOpsなどの技術を使ったり、データ分析機械学習などのスキルを活かしたい。
  • 社会貢献性の高いプロジェクトや、顧客の価値を創造するようなプロジェクトで、提案からリリースまで携わりたい。
  • 書籍・雑誌等の執筆や、対外的な勉強会の開催・参加を通した技術の発信、社内勉強会での技術情報共有により、エンジニアとして成長したい。

 
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。

Elasticsearchを仕事で使いこみたいデータ分析エンジニア募集中! - Acroquest Technology株式会社のエンジニア中途・インターンシップ・契約・委託の求人 - Wantedlywww.wantedly.com

Elastic{ON} 2017 いよいよ開始!!レポートのまとめもこちら #elasticon

どうもこんにちは!
Acroquestで機械学習のエンジニアをやっている菅野です!

現在、Elastic{ON}参加のためにサンフランシスコに来ています。

f:id:acro-engineer:20170308193751j:plain:w500

Elastic{ON}はElasticsearch社主催のElastic Stackを中心とした
テクニカルカンファレンスです。
Acroquestから総勢10人以上の人が参加しています。

その参加者から日々、現地のセッションや会場の様子のレポートをお届けします。

Elastic{ON} 3日目

Elastic{ON} 2017 3日目 |Timelionで時系列データの可視化、分析をその場で実行! #elasticon - Taste of Tech Topics
Elastic{ON} 2017 レポート 3日目 | What will be improved with new Elasticsearch releases #elasticon - Taste of Tech Topics
Elastic{ON} 2017 レポート 3日目 | 劇的Before&After!@Walgreens #elasticon - Taste of Tech Topics
Elastic{ON} 2017 3日目 | Beatsの拡張・カスタマイズ #elasticon - Taste of Tech Topics
Elastic{ON} 2017 3日目 | UberがElasticsearchを使って、苦労した話 #elasticon - Taste of Tech Topics
Elastic{ON} 2017 3日目 | Salesforce+Elastic Stack #elasticon - Taste of Tech Topics
Elastic{ON} 2017 3日目 | Elastic Cloud活用で運用効率化するために気をつけるべきこと #elasticon - Taste of Tech Topics
Elastic{ON} 2017 3日目 | 感動必至のKibanaの新機能!!#elasticon - Taste of Tech Topics
Elastic{ON} 2017 3日目 | Closing Keynote:Elasticsearch活用で、よりよい世界を作る #elasticon - Taste of Tech Topics

Acroquest Technologyでは、キャリア採用を行っています。

  • ビッグデータHadoop/Spark、NoSQL)、データ分析(Elasticsearch、Python関連)、Web開発(SpringCloud/SpringBoot、AngularJS)といった最新のOSSを利用する開発プロジェクトに関わりたい。
  • マイクロサービスDevOpsなどの技術を使ったり、データ分析機械学習などのスキルを活かしたい。
  • 社会貢献性の高いプロジェクトや、顧客の価値を創造するようなプロジェクトで、提案からリリースまで携わりたい。
  • 書籍・雑誌等の執筆や、対外的な勉強会の開催・参加を通した技術の発信、社内勉強会での技術情報共有により、エンジニアとして成長したい。

 
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。

Elasticsearchを仕事で使いこみたいデータ分析エンジニア募集中! - Acroquest Technology株式会社のエンジニア中途・インターンシップ・契約・委託の求人 - Wantedlywww.wantedly.com

Elastic{ON} 2017 1日目 | バナナとElasitcsearch@Walmart #elasticon

Elastic{ON}2017 レポートのまとめはこちら!!

Hello SanFrancisco!
Yanagiharaです。

昨年12月のElastic{ON}Tokyoに参加した勢いそのままで
本場のElastic{ON}にも参加しております!

サンフランシスコは、学生時代に学会で来て以来、4年ぶり2回目になります。

セッションを持つのは世界の名だたる企業・・・!
個人的に、そのような企業がElasticsearchをどのように活用しているかが
気になってワクワクが止まりません!
おもに、EC系検索のセッションを中心に聴講、紹介していきます!

参加セッション

私が本日参加したセッションは次の通りです。

  1. Opening Keynote
  2. Near Real Time Retail Analytics @ Walmart
  3. Elastic @ General Mills: The Journey Continues

Opening KeynoteではElasticsearch SQL/Kibana Canvasなど、
サプライズ!な発表があり、いきなりテンション上がりました😝

そして、その流れで、個人的に面白かった、
「Near Real Time Retail Analytics @ Walmart
を、簡単に紹介したいと思います。

Near Real Time Retail Analytics @ Walmart

Walmartとは

Walmartは11500店舗、4859億円の収益を誇る、
世界で最も売上が大きい(!)企業です。
(日本には直接お店はないものの、西友Walmartの傘下みたいですね。)

ElasticsearchがそんなWalmartのデータ分析基盤に使われています。

Elasticsearchの使われ方

WalmartはPOSデータのリアルタイムに近い解析をしています。
解析する用途によって、データ格納先のアプリケーション(Hadoop, Cassandora)をわけています。

Elasticsearchを選んだ理由は、解析の柔軟性と、可視化によりセレンディピティが得られるからです😃

面白かったポイント!

1. バナナとElasticsearch!?

Walmartには1秒間に156ものバナナが売れている...というウワサ(バナナ神話😅)があるそうです。

ウワサが本当なのか、それをElasticsearchで可視化してみると・・・

時間ごとにバナナの売れ行きが変わっているのがわかりますね。
(バナナの売れ行きの傾向が曜日によっても変わっているのがわかります😄)

具体的に売れている数を計算してみると、

重さにして、約9000ポンド、カバ1頭分!
そして、数にして、360本のバナナが売れていることになりました!
なんと神話を超えていました😇

さらにみてみると・・・

ある1日には461万ポンド、自由の女神10体分に相当する数が売れているそうです!

Elasticsearchで可視化することで、バナナの売り上げだけでも面白い結果がわかりますね😊

2. ユースケース

小売情報に関して4種類の実用的なユースケースの紹介がありました。


 

  1. 店舗ごとの価格の異常値
  2. ギフトカードの売れ行き
  3. 保証をつける際の利益計算
  4. 店舗ごとに使える現金の管理

いくつか、少し説明します。
1)店舗ごとの価格の異常値

ある商品に関しての各店舗ごとの価格を可視化することで、
特定の店舗の商品の値段が跳ね上がっていることがわかりました😯

2) ギフトカードの売れ行き
Thanksgiving Dayとクリスマスの後にギフトカードの売れ行きが上がる、
という傾向が見えたそうです。
その原因を分析すると、商品の置き場所の影響の情報があることがわかったそうで、
他の商品に対しても応用できました😁

商品データ、売上データを解析すると、より有効な戦略がたてられそうですね。

3. Elasticsearchの設計のはなし

Elasticsearchの設計の話をします。
Walmartではレシート情報から1会計ごとにElasticsearchのドキュメントを2つ作成しているそうです。

Elasticsearchで扱うノード数は18、総ドキュメント数は60億にもなります。
そのデータをKafkaを使って、毎時間Elasticsearchにいれているそうです。

このドキュメント数を処理できるのもElasticsearchならではですね。

最後に

Walmartでは、企業の規模に合わせた、Elasticsearchの活用をしており、
面白いデータがわかりつつ、小売業の戦略などに使えそうな事例がたくさんありました。

明日は、ECサイト検索を紹介する、Dellのセッションがあります!
ワクワクして今日も眠れません!

Elastic{ON}2017 レポートのまとめはこちら!!

Acroquest Technologyでは、キャリア採用を行っています。

  • ビッグデータHadoop/Spark、NoSQL)、データ分析(Elasticsearch、Python関連)、Web開発(SpringCloud/SpringBoot、AngularJS)といった最新のOSSを利用する開発プロジェクトに関わりたい。
  • マイクロサービスDevOpsなどの技術を使ったり、データ分析機械学習などのスキルを活かしたい。
  • 社会貢献性の高いプロジェクトや、顧客の価値を創造するようなプロジェクトで、提案からリリースまで携わりたい。
  • 書籍・雑誌等の執筆や、対外的な勉強会の開催・参加を通した技術の発信、社内勉強会での技術情報共有により、エンジニアとして成長したい。

 
少しでも上記に興味を持たれた方は、是非以下のページをご覧ください。

Elasticsearchを仕事で使いこみたいデータ分析エンジニア募集中! - Acroquest Technology株式会社のエンジニア中途・インターンシップ・契約・委託の求人 - Wantedlywww.wantedly.com