Archive for ビッグデータ/IoT

データ分析&人事制度

先月まで、ある大手企業のお客様のデータ分析人材の人事制度構築を支援していました。データ分析は、ビジネス、数学、OR、機械学習、統計、ITなどの合わせ技であり、個人が複数のエリアに精通する必要があります。組織の点で見ると、さらに複雑で、それらの分析人材を適正に評価し、うまく育成し、足りない人材は採用し、そのキャリアパスを考える必要があります。

最近は、AI・IoT・ビッグデータのプロジェクトが本当に増えました。それに伴い、
→データ分析人材(データサイエンティストやデータエンジニア)の需要が増える
→組織の中でデータ分析人材が増える
→それをマネジメントする仕組みの需要が増える、ということが起きています。

しかし、データ分析者は、まだ新しい職種であり、育成や評価で多くのお客様が悩んでいます。
→専門職としてのキャリアパスが社内に整備されていない
→そもそもデータ分析人材のスキル定義や評価ができない
→データ分析人材の育成方針や採用方針がない

そのために最近では、データ分析コンサルティングだけでなく、データ分析人材の育成・採用ご支援のご依頼をいただくようになりました。私自身があまり稼働が取れないので、お請けできる仕事にも限りがあるのですが、やはりお客様自身が真のデータ分析活用企業になるために、人事制度は重要です。時間の取れる限り、支援を続けたいと思います。

 

誰もが当たり前にデータを分析・活用できる社会

KSKアナリティクスは、Data Analysis for Everyone! (誰もが当たり前にデータを分析・活用できる社会)をビジョンにしています。私たちは、高価で使いづらい分析ツール、分析人材の不足、分析ノウハウの欠如の課題を解決し、日本のビジネスパーソンが真の意味でデータを活用できるようにしたいと思っています。これを2025年までに行うのが目標です。それはゆっくりと、しかし確実に進んで行きます。

例えば、2025年のビジネスミーティングは以下のようになっているでしょう!

meeting

見た目は今と何も変わっていません。。。多分PCやスマホ、タブレットなどのハードウェアはそれほど変わらないでしょう。しかし、その中で動作するツールは、表計算ソフトやBIツールに加えて、機械学習ツールが活躍しています。ツールはより使いやすく、低価格になり、業務と一体化することで、現場のビジネスパーソンが当たり前に使うようになります。また機械学習の概念もより一般化し、データ分析のスキルも広く行き渡るようになります。当然今よりも生産性は格段によくなります。

AIにより、仕事を奪われる・・などの議論がありますが、ディープラーニングも機械学習の一つにすぎません。業務や課題により、どのアルゴリズムが最適なのかは変わって来ます。2025年のビジネスミーティングは、機械学習による仮説発見&検証と、人間の経験を合わせたハイブリッドな意思決定が当たり前になっていると思います。

また、オフィス街にあるお弁当屋さんは、以下のようになっているでしょう!

bento

こちらも見た目今と何も変わっていません。。。しかし、ここに並んだお弁当は、ほぼ欠品なく、廃棄ロスなく売り切れるようになります。そしてそのお弁当屋のおばちゃんは翌日の弁当仕入れ量をスマホのアプリを通して勘案し、発注決定できるようになります。発注システムは、シンプルなインタフェースの後ろで洗練されたアルゴリズムが動くことで、効果的な意思決定支援を可能にします。

KSKアナリティクスでは、現場の方が使えるデータ加工&機械学習ツールを現在開発しており、今年後半にリリースする予定です。また時期が来ましたら発表させていただきますので、ご期待ください!

 

Bigdata & Analytics Innovation Summit, Singapore

3月1日-2日とSingaporeで行われたBigdata & Analytics Innovation Summitに参加してきました。主催はInnovation Enterprise、主に米国&EU各国で同様のイベントを開催しています。Singaporeの参加者は約200名、講演者はユーザー企業が多く、ヘルスケア、IT、製造、政府、医療などグローバル企業からベンチャーまで約20社ありました。土地柄かDBSなどの銀行・金融が多かったです。参加者のバックグラウンドはビジネス側が半分、テクノロジー側が半分ということで良いバランスになっていたと思います。

Day1:
・DBS Bank CIOによる銀行でのデータ活用例:ATMでの効率的な配置で8000時間削減、機械学習での現金の必要量の予測、ATMのUIの改善での待ち行列の解消など

・BP データアナリストによるアーキテクチャ紹介、明細を明細のまま保存しておき、必要に応じて集計する、集計ロジックをコマンドとして保存しておき、組織で共有する。
KSKで考える分析プラットフォームの考えに非常に近く、やはりどこも次世代にはこのアーキテクチャが求められることを改めて実感。

・Gov Tech シンガポール政府のデータサイエンティストによる事例紹介、図書館ユーザーのクラスタリング、国会のディベートトピックモデル、国営住宅のセールス、投薬の効率化、オープンデータの提供、Beeline(データのKickstarter)のような仕組み、やはり規制緩和が進んでおり、国を挙げて活用する姿勢が強い。

その他、ANZ Bank, Spotify, Standard Charter Bankの講演など。

午後からはMachine Learningのセッションを中心に参加。Roll’s Royce、Indeed、ALIBABなどこちらは日本のセミナーやイベントで語られる内容と大きく違いなかった。

Day2:
・UBER のチーフデータサイエンティスト、タクシーの需要予測、自動運転の研究、現在300人のデータ分析チームを統括。単純にアナリストの数に驚いた。

・Johnson & Johnson、社内でのデータ活用例、・JLL(不動産)でのMeeting room最適化

・GoogleによるCloudMLの紹介、・ALLianz データサイエンスチームの育て方

・Sapho(シンガポールの大手小売店)Retail&ECのデータ分析

技術的な内容は、最近の日本のトレンドとほぼ同じであるものの、データの活用方法や分析チームの育成についていくつか先進的な取組みがあり、大変参考になりました。ただやはりシンガポールはファイナンスとサービスの国であることを再認識、やはり同じASEANでもベトナムやマレーシアとは市場やニーズがまったく異なるので、国ごとにマーケティングは変える必要があると改めて実感しました。

 

 

企業はIT部門を捨て、分析部門を作れ!

アグレッシブなタイトルですが、要は企業は「早く自社内に分析部門を早く作ったほうが良い」ということを言いたいのです。

現在のような目まぐるしく変わっていくビジネス環境では、自社の強み(コア・コンピタンス)を磨くとともに、それ以外は効率的に運営する(アウトソーシング等外部を活用)ことが求められるのは、皆さんご存知のところです。

テクノロジーは、劇的に変化を遂げています。IT(ICT)は業務に不可欠な存在になりましたが、この20年で一気にコモディティ化が進んでいます。

これらを提供するハードウェア/ソフトウェアベンダーから見ると良く分かります。
40年前、ネットワークハードウェアを持つ企業がIT業界をリードしていました。
30年前、OSを持つ企業が覇者となりました。
20年前、その上で動くソフトウェアデータベースが重要になりました。
10年前からそれらはクラウドとなり、さらにその上に乗るデータやコンテンツ、ビジネスが競争優位の源泉となっています。

企業組織の観点から見てみましょう。企業は自社のコアとなる経営資源には、投資を行い自社で抱えねばなりません。一方で、代替の効くもの(コモディティ)はアウトソースしたほうが効率的です。ITはどんどん下のレイヤーからコモディティ化していっています。

今、巷で「データ分析」や「人工知能」が話題となっています。なぜなら、IT基盤に乗る「コンテンツ」や「ビジネス」は通常他の企業が真似できないオリジナルのものだからです。これらは、従来のIT部門だけで作り出すことは難しく、IT力+現場力+分析力をもつ部門横断的な組織「分析部門」が必要になります。

最近、多くの企業で分析プロジェクトチームや、分析グループの方とお会いするようになりました。ここで成功事例が数多く生まれ、分析部門が企業の中でメジャーな存在なることを願っています。

AI(人工知能)は善か?悪か?

最近は一般の新聞やメディアでも、シンギュラリティ(技術的特異点)が語られるようになり、コンピュータが人類の知性を超えることに関する否定的な意見を見ることがあります。

例えば、
ある人は、人工知能により将来XX%の仕事が奪われる、といいます。
ある人は、分子レベルのナノボットで人工内蔵が作られる(倫理に反する)、といいます
ある人は、すべての行動が管理され、監視される社会になってしまう、といいます。

しかし、数十年前インターネットが広がる以前、世界規模の通信ネットワークの実現も、それを通じてのソフトウェアウィルスの蔓延も現実になるとは思われていませんでした。

今日、それらの出現によって、私たちは恩恵を受けた反面、弱点をさらすことにもなりました。しかし、ウィルスの危険の高まりに合わせて、技術的な免疫システムも登場しました。結果として、今日私たちは「害」よりもはるかに大きな「益」を得ています。

人工知能は、上記のリスクは存在するにせよ、テロの防止、貧困の撲滅、美しい環境の回復、病気の克服、寿命の伸長など、人類の世界的な課題を解決する大きな可能性を持っています。それであれば、これらをインターネットのように使いこなしていくことが、私たち人間の取るべき道だと思います。

 

データ分析はBeforeとAfterが重要!?

最近は、ほぼ毎週のようにIoTやデータ活用を始めたいので、相談に乗ってほしいというお声掛けをいただき、さまざまな業種・業界のお客様を訪問しています。その中で、よく課題に上がるのが、「データ分析前の問題」と「データ分析後の問題」です。

データ分析前の問題:Before Data Analysis
1.そもそも、何を分析してよいか分からない(課題設定の問題)
当然ながらデータで問題を解く前に、まず何を問題とするかが重要です。そして、その問題が、「データを使って解決できるものなのか」「解決した時のビジネス価値が高いのか」をお客様自身が判断しなければなりません。ブームに乗ってやみくもにデータ解析を行う前に、自社にとっての価値を決めなければなりません。これがないと期待したROIが得られません。

2.分析する人材がいない(分析人材の問題)
最近はデータサイエンティストの求人は完全な売り手市場です。なかなかビジネススキル、分析スキル、ITスキルを兼ね備えた人材の獲得は困難です。しかし、一人のスーパーマン獲得は難しくても、チームで協働することはできます。現場部門の人+IT部門の人+外部の分析コンサルタントにより、現場主導型の分析プロジェクトは可能です。

3.どのように分析してよいか分からない(分析ノウハウの問題)
データ分析はどれだけ引き出し(方法)を知っているかです。こういう問題にはこういう手法が使える、こういう見方もできる、優秀なデータアナリスト程、多くの引き出しを持っているものです。まったく初めてデータ分析に取り組む際には、外部の分析コンサルティングを使う価値は高いと言えます。なぜなら、業務スキルやITスキルは社内人材で見つけられますが、データ分析を経験した社内人材はまだ少ないからです。良い分析コンサルタントと活動することでスキルトランスファーが進み、自立的に分析ができるようになります。

4.分析ツールの購入費用が高い、または使いづらい(ツールの問題)
データ分析を阻むものの一つは高額なツール費用です。多くの場合、分析プロジェクト初期には潤沢な予算は得られません。そこではオープンソース・ソフトウェア(OSS)が役立ちます。OSSは初期コストを抑えるだけでなく、コミュニティによる素早い開発やカスタマイズ、またコミュニティメンバーやお客様と分析機能や結果を共有できるなど、データ分析に相性が良いと言えます。

 

データ分析後の問題:After Data Analysis
1.分析結果をどのように現場に適用してよいか分からない(データサイエンティストの現場感覚の欠如の問題)
XX社の有名なデータサイエンティストにお願いしたのに、結局現場で使えなかった。。。という声を聞いたりします。PhDを持つデータサイエンティストでも業務知識では現場の人には勝てません。良い分析結果が出ても、それを解釈して実際の施策や新たな課題解決を提起するには、そのビジネスを深くを知ることが必要です。そのため、分析をデータサイエンティストに任せるのではなく、現場の方が自ら分析を行うことが重要です。

2.せっかく施策を提示しても現場が使ってくれない(現場の職長を巻き込むマネジメントの問題)
営業現場や製造現場など、現場が強い組織ほど、一方的に分析結果を提示しても使ってもらえません。使ってもらう工夫が必要です。例えば、こうした故障予測のレポート1つでも工夫ができます。”XXX機種 1週間以内の故障A 発生確率 82%” だけでなく、エビデンスとしてのセンサー時系列チャートや対処方法ヘルプへのリンクなど、「現場(あなた)の意思決定をサポートします」という意図が入らないと使ってもらえません。

3.データ分析を継続できない(PDCAが回っていない問題)
コンサルタントにすべて依存した場合、そのコンサルタントが去った後は、元の状態に戻ってしまいます。必要なのは、コンサルタントを活用しながら、スキルトランスファを行い、自立的な分析チームを作ることです。そのためKSKアナリティクスでは、少し変わったデータ分析コンサルティング(データ分析チーム育成支援)を行います。OSSを使い、お客様と一緒に分析しながら、スキルトランスファーを行っていきます。すべてのビジネスパーソンが当り前にデータを分析・活用できた時、日本の生産性は飛躍的に向上すると思っています。

 

 

 

世界のデータサイエンティストが好きなツールの組み合わせ

2015年のKDnuggetによるデータ分析ツールの人気投票の結果がでました。1位はR、2位にはRapidMiner、3位がSQLになっています。詳細は製品ブログでも紹介されています。

http://www.blog.rapidminer.jp/2015/06/rapidminer.html

 

面白かったのは、それらの投票数だけでなく、ツール同士のアソシエーション(関連性)を分析していることです。上位のツールがそれぞれ何と組み合わせて使われているかが分かります。

 

出典:KDnuggets

さらに面白いのは、商用ツールとOSSツールに分けた時の組み合わせです。TableauとR、RapidMinerとWekaの関連性が高く、現在のデータサイエンティストの志向が分かります。TableauとR派はビジュアライズと統計目的、RapidMinerとWeka派は機械学習モデル目的といったところでしょうか。

出典:KDnuggets

詳細の記事は以下で確認できます。

http://www.kdnuggets.com/2015/06/data-mining-data-science-tools-associations.html

 

ソレイユデータ道場

今年からNYSOLのサブプロジェクトとして、ソレイユデータ道場が大阪でスタートしています。当社も協力企業としてご支援させていただいたり、また当社若手社員が教育講座で学習したりしています。データ分析を欧米型のデータサイエンティストに任せるのではなく、日本型のデータ分析者(すなわち現場で実際に課題に直面するビジネスユーザー)を支援するコンセプトは、とても共感できると思います。

NYSOLのメンバーはビッグデータがブームになる前から地道にこれらの活動を続けてこられました。それらの活動、OSSソフトウェアやアルゴリズム等の資産に敬意を表すとともに、より使いやすいツールや方法論を広めていくのが当社の貢献でもあります。

今年大阪からスタートしていますが、ものすごく良い取組みなので、ぜひ全国に広めていきたいですね。ホームページやFBもありますので、ぜひ見てみて下さい!ソレイユデータ道場

 

IoTシンポジウム@Intelマレーシア


インテル マレーシア ペナン工場で行われたIoTシンポジウムに参加してきました。日経新聞にも公開されましたが、昨年Intel IoTチーム、三菱電機、Revolution Analytics、Clouderaで、予防保全や不良品削減ソリューションがインテル ペナン工場に導入され、大きなビジネス価値を創出しました。シンポジウムでは、実際に分析やモデル構築を行ったデータアナリストや現場メンバーとの少人数ディスカッションは、非常に内容の濃いものになりました。
当社はRevolution Analytics&Clouderaの日本パートナーとして、来年からはインテル様・三菱電機様とともに、本ソリューションを日本国内の製造業様に提供してまいります。

日本発のビッグデータ解析OSS NYSOL.bizをオープンしました

日本発のオープンソースであり、利用者が急速に広まりつつあるビッグデータ解析ツールのNYSOL(http://www.nysol.jp)は、本日、メジャーアップデートとなるNYSOL 2.0をリリースしました。プレスリリースはこちら。

KSKアナリティクスは、このNYSOLプロジェクトを積極的に支援しており、この度NYSOLをビジネス面から支援するサイト「www.nysol.biz」をオープンしました。

本サイトでは、初心者の方の疑問点にお答えできるポータルサイトを開設しました。疑問が生じたら誰でも無料でに記載することができます。また、NYSOLの教育トレーニングや、ソフトウェアの商用サポート、NYSOLを使ったデータ分析サービスなどのビジネス支援の情報を配信しています。皆様、ぜひご利用してコミュニティメンバーになってください。大規模データ解析 NYSOL.biz

特に統計解析のRを使用されているデータ分析者の方や、パフォーマンスで困っておられる技術者の方からのNYSOLへの評価や反響は大きいです。当社メンバーも積極的に関わっております。ぜひこの素晴らしい日本発のオープンソースを世界に広げていきたいと思います。