【MTプラグイン】Bayes Spam Filter Ver.0.20をリリースしました。

ベイズ理論を利用したMovable Type(以降MT)用のプラグイン『Bayes Spam Filter』のバージョン0.20をリリースしました。変更点は以下の通りです。

2011.04.24 v.0.20
・設定の保存処理を少し修正。
・デバッグログに表示する情報を詳細にした。
・わかち書きの処理を多少改善した。
・分かち書きの結果が1文字でもキーワードとして保存するようにした。
・スパム判定されてしまったハムコメントを気づかずにいることがあるため判定結果をメールで送信できるようにした。
・とりあえずトラックバック時には機能しないようにした。

今回のバージョンアップの大きな目的は、コメントが誤認識でスパムになった場合、そのまま気づかないで消えてしまう場合があり申し訳なかったので、コメントがスパム判定された場合にメールで通知出来るようにしました。MTには元々コメントがされるとメールで通知する機能がありますがスパム判定されたコメントは通知してくれないのでそれを補う為の機能です。

設定画面は以下のように通知するトリガと通知用のメールアドレスを設定する箇所が増えました。

20111125

それから、通常は使うことがないと思いますがデバッグログに情報を詳細に表示するようにしました。どの記事に対するコメントなのか今までは不明だったのが分かりやすくなります。投稿者のIPアドレスや記事のURL・記事のentry idなどがログに出力されるようになりました。

 

2011-04-25-11-11-39 ———-
2011-04-25-11-11-39 MT::Comment
2011-04-25-11-11-39 id:
2011-04-25-11-11-39 blog_id:1
2011-04-25-11-11-39 ip:8.8.8.8
2011-04-25-11-11-39 entry_id:1630
2011-04-25-11-11-39 author:くまっち
2011-04-25-11-11-39 commenter_id:
2011-04-25-11-11-39 email:text@example.com
2011-04-25-11-11-39 url:http://blog.kumacchi.com/
2011-04-25-11-11-39 visible:
2011-04-25-11-11-39 created_on:
2011-04-25-11-11-39 modified_on:
2011-04-25-11-11-39 title:玉川村 福島空港の放射線量がちょっと多くなってるんだけど大丈夫のなの?
2011-04-25-11-11-39 permalink:http://blog.kumacchi.com/2011/04/post_663.html
2011-04-25-11-11-40
ORIGINAL: くまっち
text@example.com
http://blog.kumacchi.com/
ベイズ理論によってコメントスパム・トラックバックスパムを判定する
Bayse Spam Filterの機能改善のための
コメント投稿のテストですご了承下さい。
これは通知されないはず
2011-04-25-11-11-40 getHash:plugins/BayesSpamFilter/ham/_ham_log.cgi
2011-04-25-11-11-40 getHash:plugins/BayesSpamFilter/spam/_spam_log.cgi
2011-04-25-11-11-40
WAKATI: くまっち text@example.com http: blog.kumacchi.com ベイズ 理論 によって コメントスパム ・ トラックバックスパム を 判定 する Bayse Spam Filter の 機能改善 のための コメント 投稿 の テスト ですご 了承下 さい これは 通知 されないはず
2011-04-25-11-11-40 01  ham = 0.998650225489199
2011-04-25-11-11-40 02 spam = 0.0519396489242267
2011-04-25-11-11-40 ハム判定
2011-04-25-11-14-57 設定画面表示 blog:1

 

通知されるメールの内容は以下のようになっています。これで今までは誤認識でスパム判定されてしまったまま気づかないで消えてしまうことがあったコメントを救済することができるようになります。

From:     anonymous@example.com
Date:     25 Apr 2011 11:10:20 +0900
To:       kumacchi@example.com
Subject:  Bayse Spam Filter 通知メール

くまっち
text@example.com
http://blog.kumacchi.com/
ベイズ理論によってコメントスパム・トラックバックスパムを判定する
Bayse Spam Filterの機能改善のための
コメント投稿のテストですご了承下さい。ちちち

コメントの付いた記事のURL:
http://blog.kumacchi.com/2011/04/post_663.html

コメント投稿者のIP:
8.8.8.8

判定: ハム(ham)

 

例によってスパム判定されたコメントはコメントの管理画面で右のクイックフィルタからスパムコメント選択すると表示されるので、誤認識であればチェックを入れてスパム解除のボタンをおしてスパム解除します。

20111123

 

コメントの編集画面で詳細を見るとどのプラグインによるスコア評価でスパム判定されたかわかります。

20111122

 

Bayes Spam Filterのダウンロードは以下のページから行なうことが出来ます。

【Movale Type】ベイズ理論を利用したスパムフィルタプラグインを作ってみた。【人柱用】 – KUMA TYPE

※以前のバージョンを使っていた人はフォルダごと上書きアップロードで大丈夫です。

 

関連記事:
【Movable Type】スパム対策プラグインBayesSpamFilterの今日の成果 – KUMA TYPE

タグ : , ,