2008-11-01から1ヶ月間の記事一覧

「日本語テキストを分類するベイジアンフィルタ」を簡単につくるyo

数週間前の話になりますが、「はてブのリニューアル会見」の記事を読んでいたところ、はてブにも「自動カテゴライズによる記事分類」の機能が搭載されるとか。。。同じようなタイミングで「似たようなモノ」というか「ほぼ同じようなモノ」を作っていたので…

名義尺度間の連関係数を算出するperlモジュール

データマイニングを行う際に、適当な2つの変数にどれだけの相関関係があるのか確かめたくなったとします。それらのデータはいわゆる「名義尺度」なデータ(地域別の野球チームの好き嫌いなど)だとしましょう。名義尺度なデータ間における連関係数と言えば…

手軽に関連語を取得するモジュール

1つ前のエントリで「特徴語を抽出するモジュール」のことを書いたらそこそこ好評だったみたいなので、調子に乗ってもう1本モジュールを紹介しておきます。 Lingua::JA::Expand - word expander by associatives http://search.cpan.org/~miki/Lingua-JA-Exp…