[バシャログスタッフの道具箱]ユーザーの受信箱に最適化するスパムスパムフィルター POPFile
Spamこんにちは、シーブレインのtanakaでスパム。
・・・はい。失礼しました。
さて、エントリーをお読みの皆さんは1日に何通のメールを受け取りますか?僕は仕事上のやりとりメールから始まって、大量のバグレポート、サーバーログ、開発中に受け取るテストメール、そしてスパムを受信します。今回はこのスパムに効くPOPFileというソフトをご紹介します。
POPFileはスパムフィルタリングソフトです。無償で利用することができ、POPFileのダウンロードからダウンロードできます。(日本語ドキュメントのトップはこちら)
POPFileは何をするの?
POPFileは簡単に説明すれば、スパムメールとそうでないメールを振り分けるためのソフトです。ただし、初期状態ではまったく振り分けを行いません。ではどうすればよいかというと、一旦メールを受信したら、POPFileの画面からスパムメールとそうでないメールを「バケツ」に振り分けます。そうすると、POPFileは賢く学習して次からは自動でスパム/非スパムをより分けてくれます。
より分けたあとは?
より分けた結果、メールの件名に「spam」と文字列が追加され、ヘッダーにX-Text-Classification: spam という文字列が追加されたりします。(件名が変えられるのが嫌なときはインストール後に「バケツ」画面で設定してください)そうすれば、いつも使っているメーラーのフィルタリングでSpamフォルダに振り分ければOK。スパムと仕事のメールが混在した嫌な状態はすぐに解消されるでしょう。私の環境では99.5%以上の精度でスパムを分けてくれます。
バケツって?
最低2つのバケツを作る必要があります。例えば、spamとhamworkです。POPFileはメールを受信したら、一時的にこのバケツにメールをコピーしておきます。使う人が受信箱を確認して、spamが混入していたら、POPFileの画面でworkのバケツからspamのバケツに移します。そうするとまた一つ賢くなって分類精度が上がります。振り分けをチェックしたらPOPFileの画面からメールを削除してもOKです。それでも学習結果は残ります。
間違って仕事のメールをspamにしてしまったらどうなるんですか!?
ソフトウェアを使うかどうかは自己責任でお願いします!ですが、そういった間違いが起こりにくいように使うことはできます。まず、spam判定した物をゴミ箱行きにしないでspamフォルダ行きにすればよいです。そうして、昼休み前と一日の終わりにでもチェックすれば見逃しはほぼなくなるでしょう。また、仕事のメールですからなるべくチェックして返信しなければいけないことも多いでしょう。そのときは「マグネット」が使えます。これは特定の条件に合ったメールをあるバケツに強制的に振り分ける機能です。これを使えばPOPFileが誤判定することはなくなります。(ただし学習もしなくなりますが)メールの一覧から件名をクリックして一番下までスクロールして利用します。
まとめ
今回は私が使っているスパムフィルタのPOPFileをご紹介しました。僕はspam, workの他にserver_log, direct_mail, testなどのバケツを作っています。POPFileはspamとwork以外の振り分けにも使えます。もし使ってみたくなった方がいれば、POPFile のクイックスタートガイドを読んでみてください。Spam!Spam!Spam!