2008-01-01から1年間の記事一覧

Kamaitachi入門

Kamaitachiとは、typesterさんが鋭意開発中のperlによるRTMPサーバの実装( =~ Flash Media Server)です。RTMPサーバのオープンソース実装としてはRed5やWowza、RubyIzumiなどが知られていますが、「perl使いだったらKamaitachiだよ!」ということで、年の…

gitのインストールからgithubの登録まで

最近人気のgithubを試してみました。gitさわるの初めてだったのでインストールするところから書いて行きます! まずはgitのインストール 触ってるサーバがCentOS 5.1なので、yumってみることにしました。/etc/yum.repos.d/CentOS-Base.repo に以下を追記。 […

DBIでbindした後のSQL文を引っ張り出す方法

会社で隣の席にすわってるKさんから「DBIでexecuteする時に色々な値をbindするじゃないですか。その後で実際に投げられたSQL文を引っ張ってくる方法ないんですか?」と質問されちゃいました。そう言えばDBIx::Classとかだと環境変数でなんかセットするんだっ…

perlとactionscriptでオンラインチャットなブログパーツを実験中!

ブログ専用のオンラインチャットを「ブログパーツ」として実験的に作ってみました。本ブログの右サイドに貼付けています。仕様とか機能とかデザインとか、そこら辺の難しいことは全然真剣に考えていない状態でして、本当に単なる「実験」です。正直言ってま…

Q4Mをソースからインストールしてみたメモ

mysql5.1もようやくStableになったことですし、うれしいので話題のQ4Mをインストールしてみました。今回はソースからコンパイルしてみました。 以下、その際のインストールメモです。 今回インストールするのは各々このバージョンです。 * mysql-5.1.30.tar.…

「日本語テキストを分類するベイジアンフィルタ」を簡単につくるyo

数週間前の話になりますが、「はてブのリニューアル会見」の記事を読んでいたところ、はてブにも「自動カテゴライズによる記事分類」の機能が搭載されるとか。。。同じようなタイミングで「似たようなモノ」というか「ほぼ同じようなモノ」を作っていたので…

名義尺度間の連関係数を算出するperlモジュール

データマイニングを行う際に、適当な2つの変数にどれだけの相関関係があるのか確かめたくなったとします。それらのデータはいわゆる「名義尺度」なデータ(地域別の野球チームの好き嫌いなど)だとしましょう。名義尺度なデータ間における連関係数と言えば…

手軽に関連語を取得するモジュール

1つ前のエントリで「特徴語を抽出するモジュール」のことを書いたらそこそこ好評だったみたいなので、調子に乗ってもう1本モジュールを紹介しておきます。 Lingua::JA::Expand - word expander by associatives http://search.cpan.org/~miki/Lingua-JA-Exp…

手軽にTF/IDFを計算するモジュール

情報検索の分野でよく使われるアルゴリズムで「TF/IDF」というものがあります。ドキュメントの中から「特徴語」を抽出する、といったような用途でよく使われています。TF/IDFアルゴリズムのくわしい解説はこことかここを見てください。今回はこのTF/IDFの計…

Dartsを試してみた

ダブル配列なTrie構造を実装するためのライブラリであるDartsを試してみました。DartsはMeCabの作者として知られる工藤 拓氏の作品で、もともとMeCabに組み込まれていたDouble-Arrayのコード部分を、工藤氏が改めてリパッケージしてものだそうです。なおDart…

codereposにコミットしてみた

6月末にcodereposに参加してみようと思い、id:yappoさんにメールを送ってから、約2ヶ月。 ようやく先ほどcodereposにコミットしてみました。 HTML::Feature http://coderepos.org/share/browser/lang/perl/HTML-Feature Apache2::BalanceLogic http://codere…

Statistics::ZScore 書いた

うう、1日に3つ目のエントリ、だいぶ疲れてきた。なので手短に紹介します。 Statistics::Zscore - Simple scoring module that uses statistics STANDARD SCORE. http://search.cpan.org/~miki/Statistics-Zscore/ これは統計学で出てくる「標準化」とか「正…

Log::Analyze 書いた

ログ集計のタスクって人によって色々なやり方をしているみたいですね。結構目にするのが「まずログファイルをすべてDBに格納し、SQLでgroup by使って集計させる」というパターン。これだとログファイルが巨大な場合に、まずDBに入れるだけでディスクIOのため…

POE::Component::RemoteTail 書いた

ここのところ色々と忙しくてブログ更新できなかったんですが、久しぶりに時間がとれたので、ここ最近でCPANにうpしたモジュールをいくつか紹介しようと思います。さてさて、みなさん、サーバのアクセスログなどをリモートの環境からtailしたい。しかも同時…

HTTP::Request::FromLog 書いた

名前のまんまですが、ApacheのアクセスログからHTTP::Requestオブジェクトを作るモジュールをCPANにうpしておきました。http://search.cpan.org/~miki/HTTP-Request-FromLog-0.00001/ 利用用途ですが、開発環境と商用環境が分かれているような場合に、商用…

Cometでブラウザをgkbrさせてみる!

最近久しぶりにCometとかFlashのXML-Socketとかを調べています。Cometといえばチャットに代表されるように「テキストや画像の配信」が頭に思い浮かびますが、 今回はjsonpで任意のイベントを送り込む例として「サーバにアクセスしている人のブラウザを好き勝…

make testではまった件

CPAN風にperl moduleを書いてる人はtestコードをガンガン書いてmake testしながら、日々うっとりしてると思うんですが、 今日はちょっとそこでハマったので、忘れないようにメモメモ。 testコードの中で、簡易なHTTP Serverを起動したいとします。 サーバの…

HTTP::Request::AsCGIの使い方

今まで知らなかったんだが、HTTP::Request::AsCGIというのを使うとテストとかにスゴく便利らしい。 というわけで、早速いくつかのブログを見ながら触ってみた。 use strict; use HTTP::Request; use HTTP::Request::AsCGI; use CGI; use Data::Dumper; # HTT…

mecabがC++で文字化けするという件

久しぶりの日記〜。なにやらdaisuke makiがC++でmecabと戯れている模様。makiさん曰く、C++でmecab使うと文字化けするよ〜、とのこと。自分もC++勉強中につき、ちょっとだけ触ってみよっと。 さっそく本家サイトのサンプルから必要そうなところを抜粋。test.…

mysqlにperlインタプリタを組み込んでみる

以前「mysqlに独自関数を組み込む(UDF)」というエントリを書いてみましたが、今回はそれの延長で、mysqlのUDFとしてperlインタプリタを組み込んでみようと言う実験です。mysqlにperlを組み込んで何がうれしいかっていうと、簡単なperlスクリプトで自由にmy…