Posted in POPFile at 22:40:02 by ジュンヤ
POPFile の兄弟ソフトでこちらは今まで有料だった初心者用のクイック POPFile が、ライセンス無償配布キャンペーン中。
タコにちなんで、先着 8,888 名様限りとのことです。
» スパムメールにお困りの方に 迷惑メール対策-学習型のメール振り分けソフト「クイックPOPFile」
オープンソースの POPFile は難しそうだからちょっとなあ、でも初心者にやさしい方のクイック POPFile は有料だしー、と思っていた方には朗報だと思います。
なんで僕が POPFile を宣伝するのかについては、以下を参照していただければ。。
» POPFile の過去記事
この記事にリンク
POPFileカテゴリの最近の記事
Posted in POPFile at 13:20:43 by ジュンヤ
久々に POPFile をいじってみました。
POPFile のエンジンをスパムをよりわけるだけじゃなくて、たとえば Yahoo の評判検索 みたいなものを作るのに使えるんじゃないかと画策中。
そこで、Ruby on Rails から使えるかどうかということで、Ruby で POPFile を操作する実験をしてみました。
» XML-RPC [POPFile Documentation Project]
にあるように、POPFile は XML-RPC のインターフェースを持っています。
Perl や Python の例にならって、Ruby のサンプルを作ってみました。
require 'xmlrpc/client'
popfile = XMLRPC::Client.new2('http://127.0.0.1:8081/RPC2')
session_key = popfile.call('POPFile/API.get_session_key', 'admin', '')
puts popfile.call('POPFile/API.classify', session_key, 'spam.txt')
begin
popfile.call('POPFile/API.release_session_key', session_key)
rescue
end
セッションキーを開放するとき、返り値がないため、エラーが出てしまいます。begin rescue で囲っているのはそのためです。
POPFile のログで確認したところ、ちゃんとセッションを開放しているので動作的にはこれで問題ないはずです。
POPFile ですが、4年前に日本語化したオープンソースのメール振り分けソフトウェアで、おもにスパムフィルターとして使われていますが、今でもその精度の良さに定評があります。
» 自動メール振り分けツール POPFile
オープンソースはサポートがなくて不安という方には、自分が開発に携わったこちらをおススメします。
» スパムメールにお困りの方に 迷惑メール対策-学習型のメール振り分けソフト「クイックPOPFile」
去年度の「窓の杜」編集部員が選ぶ今年一番のお気に入りソフトとしても紹介されています。
» 窓の杜 - 【編集部員の“今年のお気に入り”】今年1年間で各編集部員がもっとも気に入ったソフトを紹介
この記事にリンク
POPFileカテゴリの最近の記事
Posted in POPFile at 2:57:20 by ジュンヤ
POPFile 0.23.0 からは完全マルチユーザー対応になる予定。かなり久々にCVS版をインストールしてみる。
ActivePerl に Crypt::Blowfish モジュールをインストールするのに手間取ったが、
http://popfile.sourceforge.net/cgi-bin/wiki.pl?VersionTwentyThreeCleanup
を良く読んで解決。
ppm rep add uwinnipeg http://theoryx5.uwinnipeg.ca/cgi-bin/ppmserver?urn:/PPMServer58
とやり、レポジトリに theoryx5.uwinnipeg.ca のがミソだった。これで ppm から Crypt::Blowfish も IO::Socket::SSL もインストールできるようになる。
さて、めでたく起動し、新しい UI を眺め、2つほどユーザーを追加したあと、試しに POPFile 経由でメールを受信したところ、受信はできたのだけれど、
2005/4/23 02:42:50 3016: bayes: 1512: Invalid session key 741bbc7a53789e70cf6865
04b74f3329441ea7b134ccdc9d491ee1e20b4b2449 provided in Classifier::Bayes @ 2854
2005/4/23 02:42:52 3016: history: 610: Couldn’t find bucket ID for bucket unclas
sified when committing 4635
と表示されて、受信したメールが POPFile UI の履歴に表示されない。
すんなりとは成功しなかった。今日は遅いのでここまで。この週末にでも原因を調べてみる。
この記事にリンク
POPFileカテゴリの最近の記事
Posted in Web, POPFile at 9:00:00 by ジュンヤ
オープン・アレキサンドリアはオープンソース・ソフトウェアを毎日紹介しています。
http://www.openalexandria.com/
現在(2007/08/10)は MOONGIFT というサイト名に変わり、まだまだ継続中。すごい。
» MOONGIFT::オープンソースを毎日紹介
オープンソース・ソフトウェアって本当に何でも揃っている。こんなものまであるんだという感じ。
百式もそうだけど、毎日更新するサイトには本当に頭が下がる。僕はたいがい三日坊主なので。
管理者の方に「POPFile も紹介して下さい」と頼んだら、7月12日分で紹介された。
POPFile スパム vs ベイズ
MOONGIFT に変わり、そちらで過去記事が閲覧できます。
» POPFile スパム vs ベイズ
感謝です。
この記事にリンク
Webカテゴリの最近の記事
Posted in プロジェクト, POPFile at 9:00:00 by ジュンヤ
POPFile の日本語化を進めてきて、オープンソースプロジェクトってすごく面白いと思うので、その面白さを形にして伝えようと思い、メールマガジンを発行することにしました。
http://popfile.sourceforge.jp/hacker/index.html
ハッカーへの道 ~ 僕がオープンソースプロジェクトから学んだこと ~
このメールマガジンではPOPFile(日本語化に関する情報はここ)というオープンソースソフトウェアのプロジェクトに関わる中で僕が学んでいること、学んだこと、それからオープンソースソフトウェアの魅力を伝えていきたいと思っています。
毎週月曜日発行です。11月17日創刊予定。
この記事にリンク
プロジェクトカテゴリの最近の記事
Posted in プロジェクト, POPFile at 8:59:59 by ジュンヤ
http://popfile.sourceforge.net
こちらがもう一つのプロジェクト。メールを統計的な手法を使って自動的に分類してくれるツール。来たメールをごみ・普通・重要のように分けてくれ、画期的なのは、このツールは最初はまるっきり馬鹿なのだが、ユーザーが「これはごみ」、「これは普通」、「これは重要だよ」と教えていくことによってどんどん賢くなっていくところ。
関わっているのは、このプロジェクトの日本語化の部分であり、少し修正を加えることによって日本語でも十分動く。
http://jishiha.hp.infoseek.co.jp/POPFile/ にまだ英語のみではあるが日本語化の説明を載せてある。
日本語化の部分を正式なバージョンに取り込んでもらうよう、作者にかけあっている最中。次のバージョンあたりで取り込んでもらえればいいのだが。
この記事にリンク
プロジェクトカテゴリの最近の記事
Posted in プロジェクト, POPFile at 8:59:59 by ジュンヤ
スパム、ごみメールのことだが、いつからか受け取るメールのほとんどがこのスパムメールになってしまった。何とかしたいな、と思っていたときに出会ったのが、POPFile というフリーのソフトウェア。受け取ったメールをベイズ推定という統計的な手法を使って、これはごみメール、これは大事なメール、というように自動的に振り分けてくれる。「ベイズ推定」なんて難しいことをやっていそうなのだが、要はメールに使われている言葉からごみメールか大事なメールかをソフトウェアが推測して振り分けるのだ。「今すぐ」とか「体験できます」なんてあったら、いかにも宣伝でごみメールっぽいと人間が思うようにこのソフトウェアも推測する。POPFile がすごいのは、いろいろ面倒なルールを人間が設定する必要がなく、代わりに「トレーニングして育てる」という作業で賢くなっていくというところだ。最初は大事なメールをごみメールに分類したり、逆にごみメールを大事なメールに分類したりと間違えることもあるのだが、「これはごみメールだよ。これは大事なメール」と間違いを指摘していくうちに、だんだんと正確に分類するようになる。最初100通ほど分類すれば、90% あるいはそれ以上の正確さで分類できるようになる。
こんなに便利な POPFile だが、残念ながらオリジナルは日本語には対応していない。そこで、日本語対応のパッチを作った。今、POPFile の最新版は v0.19.0 が出たばかりで、それに対応したパッチをここで公開している。まだベータ版といったところだが、それでも私のマシン上ではそん色なく動いていて、現在 98% という正確さでごみメールと普通のメールとをより分けてくれている。
このパッチは POPFile の作者に送ってあり、うまくすれば次の正式版にとりこまれるかもしれない。しかしあくまでもまだベータ版なので、このパッチと POPFile を日本語環境の上で試してみて、フィードバックをくれる人がいたら大歓迎だ。
この記事にリンク
プロジェクトカテゴリの最近の記事