Archive for オープンソース

2017下期MeetUpを開催しました

先週7月14日(金)東京オフィスで社員MeetUpを行いました。ご参加いただいた皆さんお疲れ様でした。いろいろと準備調整いただいた皆さんありがとうございました。

【KSKは何のために在るのか?KSKはどこへ向かうのか?】
社員総会での私が多くの時間を使ってお伝えしたこと、それは、「何のためにKSKアナリティクスは存在するのか?(この航海の目的)」、「何を目指すのか?(この航海の目標)」ということでした。

1.航海の目的=経営理念
繰り返しになりますが、KSKアナリティクスは、
K:お客さまに「感動」を与え、
S:社員が「成長」し、
K:コミュニティや地域に「貢献」するために、この世に存在しています。
これは、当社がこの世に存在し続ける理由であり、この航海の続ける目的です。

2.航海の目標=ビジョン
私たちが作り上げようとする世界、それは、「Data Analysis for Everyone!(誰もが当たり前にデータを分析・活用できる社会)」、です。

「近所のお弁当屋のおばちゃんが明日の弁当の仕入れ需要予測をスマホを通して行える」
「一般のビジネスパーソンが表計算ソフトのように機械学習技術を活用できる」
「製造現場の工程改善にディープラーニングが当たり前に使われている」

そんな世の中になった時に、企業の生産性、ひいては人間の生産性は飛躍的に向上し、自ら課題を解決できるより良い世の中になると信じています。

松下幸之助氏が家電の民主化により豊かな生活を作ったように、MicrosoftやGoogleが情報の民主化によりIT/Webという新たな世界を作ったように、データ解析を民主化することで、大きなイノベーションが起こると考えます。
(AIを民主化することとは少し違います。AIはあくまで一つの技術手段です。AIを含む様々なデータ解析技術や思考方法を世の中に広く行き渡らせることで、人々が自らの意思でより良い意思決定が行えます)

KSKは、オープンソースによる分析サービスを提供する国内唯一の企業として、この世界を作っていくことができます。そして我々にしかできない仕事です。この機会に感謝し、使命感を持ちながら、でも楽しくこの航海を皆さんと一緒に進めていきたいと思います。

下期もよろしくお願いいたします!

「データ分析」と「料理」に共通の3要素

素晴らしい料理には、新鮮な食材、磨かれた調理器具、調理スキルや経験が必要です。データ分析も同じように3つの要素が必要となります。

「データ」は、いわば「食材」です。その量はもちろんですが、質の良い食材が必要です。その鮮度も重要です。古すぎてメンテナンスされていないものは有効に使えません。統合化されたオリジナリティのあるデータは素晴らしい資産となります。

「ツール」は、いわば「包丁」です。切れ味の良い包丁は、使い手の意のままに食材を加工することを可能にします。データ分析プロジェクトの80%はデータ加工に費やされると言われます。データを分析しやすい形にするために、使いやすいデータプレップ(前処理)ツールが必要です。(現在当社でも開発中、また近々ご紹介いたします)

「分析ノウハウ」は、料理人の「スキルや経験」です。優れた料理人はさまざまなノウハウやレシピの引き出しを持っており、顧客ニーズを理解して美味しい料理を提供します。優れた料理人がチームとして活躍できることも重要です。

お客様は「データ」をお持ちです。当社は、オープンソースの「ツール」と、アジャイル型での「分析ノウハウ」を提供しています。そして、プロジェクトを通して、分析ノウハウをお互いに高めます。(スキルトランスファー)。OSSとスキルトランスファーを通して、お客様社内でデータ分析チームを作ることを目指しています。これによって、Data Analysis for Everyone!(誰もが当たり前にデータを分析・活用できる社会)を実現しようとしています。

データ分析はBeforeとAfterが重要!?

最近は、ほぼ毎週のようにIoTやデータ活用を始めたいので、相談に乗ってほしいというお声掛けをいただき、さまざまな業種・業界のお客様を訪問しています。その中で、よく課題に上がるのが、「データ分析前の問題」と「データ分析後の問題」です。

データ分析前の問題:Before Data Analysis
1.そもそも、何を分析してよいか分からない(課題設定の問題)
当然ながらデータで問題を解く前に、まず何を問題とするかが重要です。そして、その問題が、「データを使って解決できるものなのか」「解決した時のビジネス価値が高いのか」をお客様自身が判断しなければなりません。ブームに乗ってやみくもにデータ解析を行う前に、自社にとっての価値を決めなければなりません。これがないと期待したROIが得られません。

2.分析する人材がいない(分析人材の問題)
最近はデータサイエンティストの求人は完全な売り手市場です。なかなかビジネススキル、分析スキル、ITスキルを兼ね備えた人材の獲得は困難です。しかし、一人のスーパーマン獲得は難しくても、チームで協働することはできます。現場部門の人+IT部門の人+外部の分析コンサルタントにより、現場主導型の分析プロジェクトは可能です。

3.どのように分析してよいか分からない(分析ノウハウの問題)
データ分析はどれだけ引き出し(方法)を知っているかです。こういう問題にはこういう手法が使える、こういう見方もできる、優秀なデータアナリスト程、多くの引き出しを持っているものです。まったく初めてデータ分析に取り組む際には、外部の分析コンサルティングを使う価値は高いと言えます。なぜなら、業務スキルやITスキルは社内人材で見つけられますが、データ分析を経験した社内人材はまだ少ないからです。良い分析コンサルタントと活動することでスキルトランスファーが進み、自立的に分析ができるようになります。

4.分析ツールの購入費用が高い、または使いづらい(ツールの問題)
データ分析を阻むものの一つは高額なツール費用です。多くの場合、分析プロジェクト初期には潤沢な予算は得られません。そこではオープンソース・ソフトウェア(OSS)が役立ちます。OSSは初期コストを抑えるだけでなく、コミュニティによる素早い開発やカスタマイズ、またコミュニティメンバーやお客様と分析機能や結果を共有できるなど、データ分析に相性が良いと言えます。

 

データ分析後の問題:After Data Analysis
1.分析結果をどのように現場に適用してよいか分からない(データサイエンティストの現場感覚の欠如の問題)
XX社の有名なデータサイエンティストにお願いしたのに、結局現場で使えなかった。。。という声を聞いたりします。PhDを持つデータサイエンティストでも業務知識では現場の人には勝てません。良い分析結果が出ても、それを解釈して実際の施策や新たな課題解決を提起するには、そのビジネスを深くを知ることが必要です。そのため、分析をデータサイエンティストに任せるのではなく、現場の方が自ら分析を行うことが重要です。

2.せっかく施策を提示しても現場が使ってくれない(現場の職長を巻き込むマネジメントの問題)
営業現場や製造現場など、現場が強い組織ほど、一方的に分析結果を提示しても使ってもらえません。使ってもらう工夫が必要です。例えば、こうした故障予測のレポート1つでも工夫ができます。”XXX機種 1週間以内の故障A 発生確率 82%” だけでなく、エビデンスとしてのセンサー時系列チャートや対処方法ヘルプへのリンクなど、「現場(あなた)の意思決定をサポートします」という意図が入らないと使ってもらえません。

3.データ分析を継続できない(PDCAが回っていない問題)
コンサルタントにすべて依存した場合、そのコンサルタントが去った後は、元の状態に戻ってしまいます。必要なのは、コンサルタントを活用しながら、スキルトランスファを行い、自立的な分析チームを作ることです。そのためKSKアナリティクスでは、少し変わったデータ分析コンサルティング(データ分析チーム育成支援)を行います。OSSを使い、お客様と一緒に分析しながら、スキルトランスファーを行っていきます。すべてのビジネスパーソンが当り前にデータを分析・活用できた時、日本の生産性は飛躍的に向上すると思っています。

 

 

 

Cloudera World Tokyoに出展

11月10日、目黒雅叙園で行われたCloudera World Tokyo2015にゴールドスポンサーとして参加しました。最近Hadoop、Sparkとの連携のお話しが増えてきました。今後、当社でも積極的にキャッチアップしていきたいと思います。

Hadoopの生みの親、Doug Cutting氏に当社ブースに来ていただき、記念撮影してもらいました♪ 背が高いので、当社メンバーみんな小人に見えます(笑)

Pentaho World 2015

pworld2015.JPG

2015年10月14日-16日と米国オーランドで行われたPentaho World2015に参加してきましたので、以下報告します。数年前のPartner Conferenceの規模と比べると、会場・参加者・講演者などとても豪華になり、企業として成長し、経営陣も変化していること、市場の盛り上がりなどを肌で感じました。

詳細のレポートを読まれる場合には、以下のPentahoブログにPentaho World 2015参加レポートを記載しましたので、こちらを参照ください。

http://www.pentaho-partner.jp/blog/2015/10/pentaho-world-2015.html

 

 

 

世界のデータサイエンティストが好きなツールの組み合わせ

2015年のKDnuggetによるデータ分析ツールの人気投票の結果がでました。1位はR、2位にはRapidMiner、3位がSQLになっています。詳細は製品ブログでも紹介されています。

http://www.blog.rapidminer.jp/2015/06/rapidminer.html

 

面白かったのは、それらの投票数だけでなく、ツール同士のアソシエーション(関連性)を分析していることです。上位のツールがそれぞれ何と組み合わせて使われているかが分かります。

 

出典:KDnuggets

さらに面白いのは、商用ツールとOSSツールに分けた時の組み合わせです。TableauとR、RapidMinerとWekaの関連性が高く、現在のデータサイエンティストの志向が分かります。TableauとR派はビジュアライズと統計目的、RapidMinerとWeka派は機械学習モデル目的といったところでしょうか。

出典:KDnuggets

詳細の記事は以下で確認できます。

http://www.kdnuggets.com/2015/06/data-mining-data-science-tools-associations.html

 

ソレイユデータ道場

今年からNYSOLのサブプロジェクトとして、ソレイユデータ道場が大阪でスタートしています。当社も協力企業としてご支援させていただいたり、また当社若手社員が教育講座で学習したりしています。データ分析を欧米型のデータサイエンティストに任せるのではなく、日本型のデータ分析者(すなわち現場で実際に課題に直面するビジネスユーザー)を支援するコンセプトは、とても共感できると思います。

NYSOLのメンバーはビッグデータがブームになる前から地道にこれらの活動を続けてこられました。それらの活動、OSSソフトウェアやアルゴリズム等の資産に敬意を表すとともに、より使いやすいツールや方法論を広めていくのが当社の貢献でもあります。

今年大阪からスタートしていますが、ものすごく良い取組みなので、ぜひ全国に広めていきたいですね。ホームページやFBもありますので、ぜひ見てみて下さい!ソレイユデータ道場

 

Pentaho World 2014開幕

Pentaho社の初めてのワールドイベント Pentaho World 2014が本社オーランドで開催されました。残念ながら私は参加できなかったのですが、弊社メンバーが参加していますので、ぜひレポートをご覧ください。

同日Pentahoの最新版5.2がリリースされました。また近々にメジャーバージョンアップとなる6.0も予定しております。お楽しみに。

11月6日には、Pentaho社メンバーも来日するCloudera World Tokyo2014への参加も決まっております。こちらもお時間ありましたら、ぜひご参加ください。

 

 

 

日本発のビッグデータ解析OSS NYSOL.bizをオープンしました

日本発のオープンソースであり、利用者が急速に広まりつつあるビッグデータ解析ツールのNYSOL(http://www.nysol.jp)は、本日、メジャーアップデートとなるNYSOL 2.0をリリースしました。プレスリリースはこちら。

KSKアナリティクスは、このNYSOLプロジェクトを積極的に支援しており、この度NYSOLをビジネス面から支援するサイト「www.nysol.biz」をオープンしました。

本サイトでは、初心者の方の疑問点にお答えできるポータルサイトを開設しました。疑問が生じたら誰でも無料でに記載することができます。また、NYSOLの教育トレーニングや、ソフトウェアの商用サポート、NYSOLを使ったデータ分析サービスなどのビジネス支援の情報を配信しています。皆様、ぜひご利用してコミュニティメンバーになってください。大規模データ解析 NYSOL.biz

特に統計解析のRを使用されているデータ分析者の方や、パフォーマンスで困っておられる技術者の方からのNYSOLへの評価や反響は大きいです。当社メンバーも積極的に関わっております。ぜひこの素晴らしい日本発のオープンソースを世界に広げていきたいと思います。

 

RapidMiner World2014@ボストン

オープンソースのデータマイニング&ビジネスアナリティクス、RapidMinerのワールドカンファレンスに参加してきました。昨年はポルトガルでしたが、今年は彼らの本社をドイツから米国に移したこともあり、本社のあるボストンで行われました。旧来のRapidMinerを創業してきたマネジメントメンバーや開発メンバーに加えて、ビジネス推進する新たなマーケティングやセールスのメンバーも増えていて、フレンドリーな雰囲気を残しつつ成長の勢いを感じさせました。以下、簡単ながら報告です。

プレカンファレンス:前日にMeet Upと初心者のためのRapidMinerトレーニング&上級者向けのハッカソンが開催されました。

カンファレンスDay1

・オープニング:RapidMiner CEOのIngoによるご挨拶。GartnerでのLeader評価、コミュニティメンバーは25万人に増えた。RapidMinerの歴史と今後のVisionや間もなくリリースするCloudについて。

・Keynote:BigData and Old Data: Challenges of Embedding Predictive Analytics in Real Applications and Processes:Barcleys Bankチーフデータオフィサー Usama Fayyad氏による基調講演、ビッグデータやチーフデータオフィサーの説明、Hadoop

・Case Study:Modern Marketing Concept、 コンサルタントBrian Tvenstrup氏によるクロスセルとレコメンデーションの実務事例の紹介

・Case Study:Dataminig for the massesの著者、Matthew Northk教授によるRapidMinerを使った学生へのデータマイニングの教育の紹介

・Case study:RapidMinerコンサルタント Tong Ji氏によるBIがどのようにPredictive Analyticsをサポートできるか

・アナリストセッション:アナリティクス分野のアナリストJohn Mayer氏による地域ごとの分析ニーズの違いや各ベンダーのアプローチなど

・パネルディスカッション:CEO Ingo, John Mayer, Microsoftの技術コミュニケーション管理部門ディレクターCathy Wissik氏によるビッグデータの活用、プライバシーの問題、データ分析の教育についてなどの対談、ディスカッション。

・Technicalセッション:1)Belgrade大学の方によるメタヒューリスティックベースの最適化、Extensionの紹介、2)Cork技術大学、Daryl O’Toole氏による気象データとマイクロ波通信ネットワークの関係、故障予測

その後、みんなでBostonダックツアー(水陸両用バス)とSeaport HotelでDinner

 

カンファレンスDay2

・Keynote2:Intelのパテント管理マネージャーMichal Skinner氏による特許情報のマイニング、エジソンのパテントレコードを例にしたSemantic Text、Patent Search,Visualizeの紹介

・RapidMiner RoadMap:Chief Product Officer Giuseppeによる今後のRapidMinerの紹介。キーワードは、Accelerate(より速く), Connect(より他のデータソースにつながり), Simplify(より簡単にする)こと。2014年テーマはCloud Analytics, All data&All enrironment、2015年はPrescriptive Analytics、High-performance Analytics、2016年はWeb Enablementを行う。

・Case Study:ALVIA Tech Kleber氏、医療ヘルスケア業界における不正検知の事例

・Partner session1:金融コンサルタント S.McGover氏によるFinancial Analytic、昨年のポルトでも発表したNASDAQやFEDデータ取得のRapidMinerAPIの紹介

・Partner session2:David WeismanによるPrescriptive Analyticsの紹介、今回のセッションの中で一番示唆に富んでいた。ハイプサイクルの初期の段階であり、今後ブレークする可能性もある。Predictive Analyticsをさらに一歩進めた考え方。IBM(CPLEX)などベンダーもまだ対応はこれから。同様のツールには原始的なものとしてはExcelのSolverがある、洗練されたものとしてはOR専用ツール(プログラム)があるが、汎用的なツールはまだない。RapidMinerはこのホワイトスペースを埋めれるのではないかというもの、実際にExtensionも紹介された。(MarketPlaceでDLも可能)

・RapidMiner with Hadoop, お馴染みZoltanによるRadoopの紹介、今回RapidMinerとの経営統合により正式にRapidMinerのVPとなった。

・Simon Ficherによる間もなく公開されるRapidMiner Cloudのデモ

・Game show:参加者によるRapidMinerを使った公開ゲーム

・CEO IngoによるEnding remark

 

参加国は20か国に及びアメリカ以外にもEU諸国、アジアからはインド、韓国、日本からパートナーが参加しました。製品自体は十分に普及していっています。あとはいかにビジネスをドライブしていくかが課題だと思います。しかし十分な資金と知名度を得たことで優秀な人材が集まってきており、今後のさらなる成長の予感を感じさせました。我々も日本パートナーとしてさらなる支援を続けていきたいと思います。