Blog

2012.02.17

【ステマでは】日本語入力を支える技術【ありません】

preferred

徳永です。

日本語入力を支える技術という本を書きましたので今回はその宣伝をします。なお、本自体は技術評論社から2/8に発売されております。

もう既に個人ブログで 2回 ほど 書いたのですが、なんとかそれとはかぶらないネタをひねりだいたいと思います。

まず、日本語入力を支える技術がどのような用途に使えるかをリストアップしてみます。

  • 日本語入力の入門書として
  • 自然言語処理の入門書として
  • 機械学習の入門書として
  • 鍋敷きとして
  • ちり紙として
  • 折り紙として
  • 胸ポケットに入れておくと銃弾を止められるかもしれない (大変危険ですので実験はおやめ下さい)

ちり紙以降はそのような利用も不可能ではない、という程度の利用可能性ではありますが、著者としてはすべての可能性を挙げておきたいと考え、記述しました。このように、色々な用途に役に立ちます。書名に「日本語入力」と入っていますが、日本語入力以外にも使いまわせる内容が大半ですので、自然言語処理に興味のある方、機械学習に興味のある方、幅広い方に読んでいただけたらと思っています。

日本語入力と書くとMS-IMEやATOKなどについての本かなと思われるかもしれませんが、そうではなく、それらをどうやって作るのかについて書いた本です。IMM32とかTSFとかそういうAPIの話はさておき、かな文字列をどうやって漢字かな交じり列に変換するのか、その裏側で使うと便利なデータ構造や機械学習のアルゴリズムを中心に説明しました。個々のかな漢字変換エンジンについての話は、あまり詳しいことはわからないのでほとんど書いてありません。少しだけ書いた紹介の中には地味に本邦初公開の情報もありますが、「このアルゴリズムを使い始めたのはこのバージョンからだったのね」みたいな感じで、マニアにはちょっと嬉しい、みたいな程度の話に留まっています。

次に、思い出話を書きます。

LOUDSのうまい説明がどうしても書けず、夜中に薄暗い部屋でディスプレイを前に一人うずくまっていたあの日、CRFの勾配の導出が一回やったことあるのに完全に頭から抜けてしまっていて時間もないのにもう一度最初からやり直したあの日、そういった出来事はたぶん忘れないでしょう。構造化SVMの説明が推敲を重ねるうちに逆に訳のわからないことになってしまい、校正の段階にまで行ってから半ページぐらい書き直してしまったことなどもありました。こういった記憶がいい思い出になるにはまだ時間が必要そうです。

嬉しかったこともあります。出版してからは多くの人に「買ったよ!」と言われました。これはとても嬉しいことです。本屋さんに行って自分が書いた本が売られているのを見るのもとても嬉しい経験でした。そもそも、多くの人に自分の書いたものを届けられる事自体が嬉しいことです。自分のブログで記事を更新して届くのがだいたい数百人の前半、こちらの会社ブログがその倍程度であることを考えると、桁違いの人に読んでもらえるわけです。

日本語入力の中身についての本というのは珍しく、特に21世紀になってからは私の知る限り書籍は出ていません。興味を持たれた方はぜひ書店や通信販売でお求め頂ければと思います。

  • Twitter
  • Facebook