Projects

  • Jubatus: 大規模分散リアルタイム解析基盤

Talks

2013

  • SACISC チュートリアル「機械学習の理論と実践」 2013/5/23「機械学習の理論と実践」, 岡野原 大輔 [サイト]
  • 電気学会「ナノエレクトロニクス集積化・応用技術」調査専門委員会 2013/3/22, 「Edge-Heavy Data時代に向けた分散機械学習システム」, 岡野原 大輔

2012

  • 東北大学 JEITA特別講義:先端技術の基礎と実践「大規模データ時代に求められる自然言語処理 – 言語情報から世界を捉える -」, 岡野原 大輔, 2012/2/2 [ブログエントリ+スライド]
  • DEIM 2012, BoF Analytics meets databases, 岡野原 大輔, 2012/3/4
  • 情報処理全国大会 実世界自然言語処理への挑戦セッション「世の中を捉えるための言語処理技術」, 岡野原 大輔, 2012/3/6
  • 次世代共創フォーラム WS 特別セミナー「ビッグデータ処理技術・活用事例の動向とリアルタイム大規模分散処理技術Jubatusの紹介」, 岡野原 大輔  2012/4/4
  • 豊橋技術科学大学特別講義, 岡野原 大輔, 2012/06/12 [スライド]
  • 第三回 IPAB(並列生物情報イニシアティブ)セミナー、次世代ゲノム解析を支える文字列処理と機械学習, 岡野原 大輔, 2012/9/14  [リンク]
  • CEATEC JAPAN 2012, 電子情報通信学会東京支部シンポジウム, リアルタイム解析によるビッグデータ活用, 岡野原 大輔, 2012/10/5 [リンク]
  • Rakuten Technology Conference 2012: Jubatus Realtime deep analytics for BigData, 岡野原 大輔, 2012/10/20 [リンク]
  • 早稲田大学情報理工学部特別講義, 岡野原 大輔, 2012/10/24
  • SIG-DOCMASデータ志向構成マイニングとシミュレーション研究会招待講演, 岡野原 大輔, 2012/11/15
  • 情報処理学会連続セミナー ビッグデータに立ち向かう機械学習 「大規模データ分析基盤Jubatusによるリアルタイム機械学習とその活用」, 岡野原 大輔 2012/11/19 [リンク]
  • MLABリサーチネットワーク 2012 特別講演, 岡野原 大輔, 2012/11/27 [リンク]
  • 情報処理学会連続セミナー ビッグデータ時代の自然言語処理「大規模・高速・高精度な自然言語処理を支える技術」, 岡野原 大輔 2012/12/6 [リンク]
  • 第15回先端的データベースとWeb技術動向講演会 (ACM SIGMOD 日本支部第52回支部大会)「Jubatusによるビッグデータのリアルタイム分析とその応用」岡野原 大輔, 2012/12/7 [リンク]
  • 東北大学 JEITA特別講義: 岡野原 大輔, 2012/12/20

2011

  • MongoDB as Search Engine Repository, 太田一樹
    MongoTokyo2011@品川シーサイド楽天タワー, 2011/03/01 [スライド]
  • MapReduceによる大規模データを利用した機械学習, 岡野原 大輔
    Hadoop Conference Japan 2011@NTTデータ豊洲センタービル, 2011/02/22 [スライド]
  • LCCC2010:Learning on Cores, Clusters and Cloudsの解説, 岡野原 大輔
    NIPS2010読む会@東工大大岡山キャンパス, 2011/02/14 [スライド]
  • 情報科学若手の会 招待講演, 「研究・企業・生き方について」岡野原 大輔, 2011/9/17 [ブログエントリ+スライド]
  • 奈良先端コロキウム「自然言語処理の最前線: 今後の展開と新展望」, 岡野原 大輔, 2011/9/21 [スライド]
  • AdTech 特別セションパネリスト, 岡野原 大輔, 2011/10/27
  • WebDB Forum「大規模分散リアルタイム機械学習を支える技術と今後の展望」岡野原 大輔, 海野 裕也, 上西 康太, 小田 哲, 2011/11/4
  • Jubatus Workshop 「Jubatusの概要と今後の展開」 [スライド]
  • Jubatus Workshop 「Jubatusの特徴量変換と線形分類器の仕組み」 [スライド]
  • IBIS2011 オンライン予測セッション 招待講演, 岡野原 大輔, 2011/11/11 [ブログエントリ+スライド]
  • 東京大学創造情報学専攻特別講演, 岡野原 大輔, 大規模言語情報の解析 2011/11/18
  • 楽天研究開発シンポジウム, パネリスト, 岡野原 大輔, 2011/11/19
  • Jubatusにおける大規模分散オンライン機械学習, 海野 裕也
    大規模データ処理勉強会@NTTデータ, 2011/12 [スライド]
  • ALSIP 2011, Succinct Data Structures for Analyzing Document Collections, 岡野原 大輔, 12/1 – 12/2 [ブログエントリ+スライド(英語)]

Publications

論文誌

  • 圧縮したまま検索 – Succinct Data Structure -, 岡野原 大輔, 2012, 情報処理会誌 特集解説記事 Vol. 53, No. 5
  • 簡潔データ構造のオンライン構築とブルームフィルタによる検索性能の向上, 小柳 光生, 吉田 一星, 海野 裕也, 新城 靖, 情報処理学会論文誌データベース(TOD), vol. 4, No. 4, 2011/12. [link]
  • Gábor Ivanyos, François Le Gall, Yuichi Yoshida. On the Distance between Non-Isomorphic Groups. European Journal of Combinatorics, 33(4), pp. 474–476, 2012.
  • Ito Hiro, Teruyama Junichi, and Yoshida Yuichi, An Almost Optimal Algorithm for Winkler’s Sorting Pairs in Bins. Progress in Informatics, 9, pp. 3–7, 2012.
  • Francois Le Gall and Yuichi Yoshida, Property Testing for Cyclic Groups and Beyond. Journal of Combinatorial Optimization, to appear.
  • Yuichi Yoshida and Yusuke Kobayashi, Testing (s,t)-Disconnectivity of Graphs and Digraphs, Theoretical Computer Science, 434(25), pp. 98–113, 2012.
  • Yusuke Kobayashi and Yuichi Yoshida, Algorithms for Finding a Maximum Non-k-linked Graph. SIAM Journal on Discrete Mathematics, 26, pp. 591–604, 2012.
  • Yuichi Yoshida, Masaki Yamamoto, and Hiro Ito, Improved Constant-Time Approximation Algorithms for Maximum Matchings and Other Optimization Problems. SIAM Journal on Computing, to appear.

国際学会

  • Conjunctive Filter: Breaking the Entropy Barrier
    Daisuke Okanohara, Yuichi Yoshida, ALENEX 2010
  • Optimization Techniques at I/O Forwarding Layer
    Kazuki Ohta, Dries Kimpe, Jason Cope, Kamil Iskra, Robert Ross, Yutaka Ishikawa, Cluster 2010
  • Optimal Constant-Time Approximation Algorithms and (Unconditional) Inapproximability Results for Every Bounded-Degree CSP
    Yuichi Yoshida, STOC 2011
  • Lower Bounds on the Query Complexity for Testing Bounded Degree CSPs
    Yuichi Yoshida, CCC 2011
  • Property Testing for Cyclic Groups and Beyond
    Francois Le Gall and Yuichi Yoshida, COCOON 2011
  • Algorithms for Finding a Maximum Non-k-linked Graph
    Yusuke Kobayashi and Yuichi Yoshida, ESA 2011
  • Discriminative Method for Japanese Kana-Kanji Input Method
    Hiroyuki Tokunaga, Daisuke Okanohara and Shinsuke Mori, WTIM 2011 co-located with IJCNLP 2011
  • Syntactic Difference Based Approach for NTCIR-9 RITE Task
    Yuta Tsuboi, Hiroshi Kanayama, Masaki Ohno, Yuya Unno, NTCIR-9, 2011 [link]
  • Linear programming, width-1 CSPs, and robust satisfaction
    Gabor Kun, Ryan O’Donnell, Suguru Tamaki, Yuichi Yoshida, and Yuan Zhou, ITCS 2012
  • Testing List H-Homomorphisms
    Yuichi Yoshida, CCC 2012
  • Algorithms and Complexity of Generalized River Crossing Problems
    Hiro Ito, Stefan Langerman, and Yuichi Yoshida, FUN 2012
  • Constant-Time Approximation Algorithms for the Knapsack Problem
    Hiro Ito, Susumu Kiyoshima, and Yuichi Yoshida, TAMC 2012
  • Constant-Time Algorithms for Sparsity Matroids
    Hiro Ito, Shin-ichi Tanigawa and Yuichi Yoshida, ICALP 2012
  • Approximation Guarantees for the Minimum Linear Arrangement Problem by Higher Eigenvalues
    Suguru Tamaki and Yuichi Yoshida, APPROX 2012
  • Partially Symmetric Functions are Efficiently Isomorphism-Testable
    Eric Blais, Amit Weinstein, and Yuichi Yoshida, FOCS 2012
  • Constant-Time Approximation Algorithms for the Optimum Branching Problem on Sparse Graphs
    Mitsuru Kusumoto, Yuichi Yoshida and Hiro Ito, ICNC 2012
  • Exact and Approximation Algorithms for the Constraint Satisfaction Problem over the Point Algebra
    Yoichi Iwata and Yuichi Yoshida, STACS 2013
  • Testing Subdivision-Freeness: – Property Testing Meets Structural Graph Theory –
    Ken-ichi Kawarabayashi and Yuichi Yoshida, STOC 2013

国内学会

  • 全部分文字列のクラスタリングとその応用, 岡野原 大輔, 言語処理学会第17回年次大会(NLP2011), 2011/03.
  • 日本語かな漢字変換における識別モデルの適用とその考察, 徳永 拓之, 岡野原 大輔, 言語処理学会第17回年次大会(NLP2011), 2011/03. [pdf] [slide]
  • N-gram統計量からの係り受け情報の復元, 海野 裕也, 岡野原 大輔, NLP若手の会 第6回シンポジウム(YANS2011), 2011/09. [poster]
  • 簡潔なLatent Dirichlet Allocationの学習, 佐藤 一誠, 岡野 原大輔, NLP若手の会 第6回シンポジウム(YANS2011), 2011/09.
  • 水族館図鑑アプリケーションと画像認識エンジン, 対馬 かなえ, 阿部 厳, 岩田 陽一, 渡部 源太郎, 海野 裕也, 徳永 拓之, 第4回楽天研究開発シンポジウム, 2011/11.
  • LOUDSトライのオンライン構築のためのブルームフィルタ構築法, 小柳 光生, 吉田 一星, 海野 裕也, 新城 靖, 第23回 コンピュータシステム・シンポジウム (ComSys 2011), 2011/11. [link]

Awards

  • 吉田悠一, (平成23年度) 第2回日本学術振興会育志賞
  • 吉田悠一, (平成23年度) 京都大学総長賞

Softwares

  • bep – Associative arrays for very large collections
  • fujimap – A succinct associative map
  • ohmm – Online training for hidden Markov model
  • oll – Online-learning library
  • redsvd – Randomized singular value decomposition
  • tx-trie – Succinct trie data structure
  • ux-trie – More succinct trie data structure
  • wat-array – A wavelet tree library for myriad array operations
  • cprb – C++ preprocessor in Ruby flavor
  • AzaraC – 超高速なWebアプリケーションを開発するためのC++言語用テンプレートエンジン

Demos

  • reflexa(リフレクサ) – コトバとコトバのつながりを元に未知の情報を探索していくための連想検索エンジン