Archive for ビジネスアナリティクス

データサイエンティストに必要なスキル、IT+統計+ビジネス、さらに語学

最近、データアナリストやデータサイエンティストの数が足りないなどの記事が多くあります。これは日本だけではなく、グローバルで同じ傾向があり、企業や大学などを含めてこうした人材を育成していこうとする動きが活発です。

個人的には、データ分析に関わる人や成功例が増えて、市場が大きくなるのはとてもうれしいことです。またそういうシーンに主体的に関われる状況にあることにワクワクします。

海外でも大学が無料で公開するデータサイエンティスト養成講座が増えました。KSKアナリティクスのメンバーも一部受講していますが、特に結構質の高い内容で「えっ、これが無料!」と驚いてしまいます。

Courseraのデータサイエンティストコース
https://www.coursera.org/course/datasci

udacityの統計コース
https://www.udacity.com/course/st095

North Western Univの予測分析(これはMasterコースなので有料)
http://www.scs.northwestern.edu/program-areas/graduate/predictive-analytics/

 

データサイエンティストに求めるスキルとして、最近は特に1) ITスキル、2) ビジネススキル、3) 数学統計スキルの3つが必要といわれています。さらに我々日本人にとっては、4)語学スキルが必須と思います。なぜなら、特にITや統計分野の情報量は圧倒的に、英語のものが多く、また優良な書籍やソフトウェアもほとんどが英語で書かれているためです。

第一線のデータサイエンティストには、上記3つのスキルを補強するための語学、コミュニケーションスキルが必要となると思います。

たしかに、今は上記を兼ね備えたスーパーマンは数少ないかもしれませんが、数年先にはかなり多くのデータサイエンティストが増えてくると思います。例えば、我々がやっているオープンソースのデータマイニングソフト RapidMinerのダウンロードが最も多い国は、実はアメリカではなくインドです。オープンソース・ソフトウェアや数学統計には国境はありません。個人の能力がそのままダイレクトに成果に結びつく世界です。

データサイエンスの分野でもグローバル競争は、どんどん起こってきます。でも私は悲観していません。日本人には語学のハンデはあるものの、コツコツと作業を行う勤勉さとユニークな創造性があります。日本初のアナリティクスをもっと世界に発信していきたい、最近特にそういう想いを強くしています。

 

製品を選ぶ上で大切にしていること

KSKアナリティクスは、特にオープンソースのアナリティクス製品に特化した製品提供とコンサルティングサービスを提供しています。特にPentahoは、現在ものすごい勢いで、国内・海外ともに成長しています。Pentaho社との付き合いももう5年がたちました。お互いの信頼感も醸成され日本市場を任されています。

良くお客様やお取引先に「森本さんはどうやって取扱う製品を見つけたんですか?」と聞かれることがあります。私は、製品を選ぶのも、就職や恋愛と同じようなものだと感じています。つまり、最初は外見やスペック上のことから入りますが、長続きするためにはコンセプトや考え方に共感することが必要です。そして、一旦、共感したら、どんなことがあってもとことん付き合う、味方としてフォローし、内部から貢献するチームの一員になる。。。

特に製品を評価するときには、現在時点でどんな機能がそろっているかより、製品としてのコンセプト、将来性、もっというとそれらを作っている人々がどんなチームなのかが重要に思います。

弊社がPentahoとのパートナーシップを持ったのは2007年、当時まだビッグデータの言葉もなく、オープンソースのビジネスアプリケーションをエンタープライズで使用するには抵抗感がありました。バージョンは1.Xで機能は貧弱、インストールすらもままならない、他の商用BIツールの方が機能的にははるかに上を行っていました。

しかし、コンセプトとチームは素晴らしかったのです。個別のETLやレポートのOSSをJavaのプラットフォーム上で統合することで、エンタープライズでも十分使えて、しかもユーザー数無制限で使うことで情報活用を促進する、ソースは公開して開発者やベンダーが触れるようにする、Wow! これは一つのイノベーションだと思いました。そして、こんなことをチームと一緒に実現したいと。

もちろんビジネスですので、経済的な面も重要です。ソフトウェアを販売して利益を得る。競合他社にコンペで勝つ。きれいごとだけでは語れません。しかし、売れればなんでも良いというのは、短期的、局所的にはうまくいっても、長期的、大局的には継続しないと思います。

有名なジムコリンズの「ビジョナリーカンパニー2」でハリネズミの考え(事業選択の基準)があります。

1.情熱をもって取り組めるものは何か
2.自分が世界一になれる部分はどこか
3.経済的原動力になるのは何か

KSKアナリティクスは、オープンソースに特化したアナリティクス事業で上記を実現します。弊社では、製品と事業が密接に関係しますので、製品を選択する際にも参考にさせていただいています。

 

 

 

「データ分析の基本と業務」を読みました


2013年1月に出たばかりの書籍です。データ分析の基礎、加重平均や幾何平均といった基本的な内容から、統計的な手法や機械学習の手法が網羅されています。また後半では、ビジネスインテリジェンス、データウェアハウスやETL、ビッグデータやのNoSQLにも触れられており、これからデータ分析を始める方にとっては、最適な一冊だと思います。

またすでにHadoop等のスキルを持っているエンジニア系のデータアナリスト、データサイエンティストの方にもイメージを持つうえで良い参考書になるのではないでしょうか。

基本的な考えを簡単なサンプルデータをもとに解説されているので、実践的でイメージがわきます。私も普段何気なく話している内容の復習になりました。

弊社でも、新たに入社するメンバーに最初の一冊としてぜひ薦めたいです。個人的には個別のテーマにさらに突っ込んだ続編を期待したいですね。

 

 

2013年にビッグデータ関連分野で起こりそうなこと

2012年は、日本でも本格的にHadoop導入が進んだことを実感した1年でした。2013年は、さらにビッグデータ周辺でさらにいろんなイノベーションが起こりそうです。起こりそうなことを書きたいと思います。

1.Hadoopのリアルタイム化が進む

先日ビッグサイトで行われたHadoop Conference Japan2013でもHadoop生みの親Don Cutting氏がメッセージをしていました。Hadoopをデータウェアハウスとして利用するために課題になってくるのは、レスポンスです。Map/Reduceの場合、どうしてもレイテンシーの問題が起きます。2013年は、このあたりを解決するソリューションがいろいろと出てきそうです。dremel論文やSpanner論文をもとにしたImpalaDrillなどのテクノロジーがより一般的になるものと思われます。

2.クラウドベースのビッグデータソリューションがいろいろ出てくる

amazonのElastic Map Reduceが、これの走りだと思いますが、EMRではすべてを網羅することはできません。弱点を補うさまざまサービスが一般的になると思います。Amazon自体も2012年11月にクラウドのDWH、Redshiftを発表しました。特に欧米でこうしたベンチャー企業が多くでてきており、今後が楽しみです。個人的には、同じ日本人のベンチャー企業であるTreasureDataさんに頑張ってもらいたいですね。

3.データマイニング&アナリティクスOSSの成長

統計のRはすでに有名ですが、HadoopファミリーであるMahautも、さらに使われるようになるかと思います。またこの技術的なハードルを下げるオープンソースのデータマイニングRapidMiner、Hadoopとの連携を行うRadoop(Rapid Miner+Hadoop)も成長すると思います。日本でも分散&リアルタイム機械学習のOSS Jubatusが2011年に公開され注目されています。さらに使用例が増えてくるものと思います。

このように見てみると、今年は、さらに「ビッグデータ」、「クラウド」、「オープンソース」がキーワードになるように思います。どのようなイノベーションが起きるか楽しみです!

 

 

 

 

Pentahoソフトウェアの成長

PentahoのETLツールであるPentaho Data Integrationが、Ventana Reserch2012調査で、製品成熟度とサポート品質で”hot”にランクされました。かれこれ、もう5年くらいこの製品を見ていますが、アグレッシブな機能追加とともに、製品クオリティが年々良くなっていくのを感じます。

またPentahoのフロント側のレポート・ダッシュボード・OLAP機能ですが、こちらもMap統合やヒートマップ、ループフィルター、モバイル対応などビジュアル部分をさらに強化していっています。次期バージョン4.8は11月頃に米国でリリースされる予定です。日本でのリリース予定が確定次第、ご案内したいと思いますので、楽しみにお待ちください。

以下、9分ほどのご紹介ビデオです。

 

Jedoxロードショー開催

Jedox社のワールドツアーJedox Road Showがついに東京でも開催されます。

ドイツよりCTO、COOが来日して、説明やデモンストレーション等を行います。私も最後に登壇させてもらいます。まだ若干ご参加可能とのことですので、ぜひご参加ください。

詳細はこちら。http://jedox-partner.jp/seminar/

■オープンソースBI 「Jedox」とは?

Jedoxとは、計画・分析・レポートに特化したExcel(エクセル)ベースのオープンソースのビジネスインテリジェンス・ソフトウェアです。営業・マーケティング部門の予算実績管理や財務部門の管理会計、製造部門の原価計算など、あらゆる計画立案や分析、シュミュレーションを使いなれたスプレッドシート(ExcelやOpen Office Calc)のインタフェースを通して実現します。これにより、ユーザーは素早くかつ容易にBIシステムやパフォーマンス管理システムを構築することができます。

詳細はこちらをご覧ください。http://jedox-partner.jp/

 

 

 

「ビッグデータ」は「ビッグウェーブ」となる得るか?

Bigwave Mixer Brush
昨今、ビッグデータがバズワードになっており、メディア等でも特集が組まれています。先週NHKのクローズアップ現代でビッグデータの特集している番組を見て、もう一般的な言葉になりつつあるんだな、と実感した次第です。

まるで夢の魔法箱のように語られる時もあれば、90年代のデータウェアハウスブームを例に一過性のものと冷静に見る向きもあります。

私はというと、ちょうど中間のスタンスでしょうか。残念ながら、ビッグデータはいわゆる1度きりのビッグウェーブ(千載一遇のチャンス)といったものではないと思います。ただ、大きな時代の流れは、ビッグデータからもたらされるアナリティクス(分析力)を求めていますし、企業も他社と差別化し、成長していくためにそれを必要としています。

その意味では、少しずつ波が大きくなっている、といった方が良いかもしれません。根拠のない夢物語にすがらず、かといってみやみに批判的にならず、現実的な分析力の活用方法でお客様を支援していきたいと思います。

「データ」を価値ある「情報」へ  株式会社KSKアナリティクス