Jubatusを公開しました

岡野原 大輔
リサーチャー

2011-10-28 20:15:14

先日、NTTと共同研究開発したJubatusを公開しました。

OSSで公開されてますので、興味がある方は使ってみるなり、ソースコードを眺めるなり、できればプロジェクトに参加していただけたらと思います。


Jubatus(ユバタス)は、大規模分散上でリアルタイムで機械学習を行うためのフレームワークです。

このプロジェクトは元々、機械学習やデータ解析が好きなPFIと、ネットワークやシステム運用実績が豊富で技術力があるNTT情報流通プラットフォーム研究所と組んで何かできないかということで始めました。

「大規模分散」+「リアルタイム」+「深い解析」という三つの特徴を持った上でデータを分析するためにどのようなアーキテクチャが考えられて、その上でどのような解析ができるのかというのを日々試行錯誤して作っています。

今回はリリース第1段ということで、手法としては分類(教師有学習の多クラス分類)に絞ってOSS化しましたが、裏では既にいろいろ試していて、今後は推薦やマイニング、などなど様々な機械学習手法をカバーしていく予定です。
そして、これまでにないような新しい形の分析もできるように挑戦していきたいと思います。

Jubatusの内部技術や使い方、今後の展望などの情報については様々な機会で提供していきます。

まず、Jubatus Workshopを11/7(月)に行います。
(既に満席になってしまいました。すいません!)。
この会では、実際に開発したメンバーがそろって、内部技術の解説や、Jubatusを使ったアプリケーション例、今後の野望などについて話します。

また、11/4から開催されるWebDB Forum 2011ではJubatusの実験結果や、その考察についての発表を11/4(金)16:00〜に行います。
プレスリリース前に発表申し込みがあったので、Jubatusという名前は消していますが、生まれたて直後のJubatusの実験の話です。

これからやることはたくさんありますが、じっくり成長させていきたいと思います。

是非注目しておいてください。よろしくお願いします。

Leave a Reply