[PR] 本ブログの商品紹介リンクには広告が含まれています
先月導入したベイジアンフィルター式スパムフィルターのCRM114ですが、着々と手になじんで来ました。
まず、最初の2、3日でめきめきと分類精度が上がりました。その後、一見スパムに見えそうで実は自分でOpt-inして送ってもらっていた商業メール(例えば、ユナイテッド航空からのHTMLメール)を「これはスパムじゃない」と教えたりするたびに、ぽろぽろと間違ってスパムを“目こぼし”することはありましたが、ここ5日ぐらいは思ったとおり(教えたとおり、と言うべき?)に分類してくれています。スパムと通常メール合わせて1,000通以上を“正しく”分類していますから、99.9%ぐらいの精度には育っているように思えます。higuchi.comに来るスパムはほとんど英語なのですが、日本語のスパムメール、例えば「5億9千万円収入者が続出しています」なんていう類のやつも、一度教えてやればきちんとより分けてくれるようになりました。
ためしに、ほかのメールアカウントにもCRM114を導入したところ、スパム以外にもいろんなメールの分類にCRM114が活用できることがわかりました。いくつかご紹介します。
■応用例その1
ITリテラシーの低さをさらけるようで恥ずかしいのですが、うちの会社(その1)では、一部の社員の間で、どこかに外出するときにいちいち全社宛てのメーリングリストに「何時ごろまでどこそこに行きます」とメールで知らせる変な風習が根付いてしまっています。私としては「本屋に行ってきます」とか「申し訳ありませんが定時で退社します」(おいおい)とかメールでいちいち送られてくるのはスパム以上に邪魔でしょうがなかったのですが、かといって全社宛てメーリングリストのメッセージを自動的にゴミ箱に入れるようにすると、本当に必要なメッセージも捨ててしまうのでそうもいきません。で、いらないタイプのメールをCRM114に“トレーニング”してやったところ、かなりの高精度でその手のメールだけを捨ててくれるようになりました。
■応用例その2
うちの会社(その1)で発行しているメールマガジンは、Fromアドレスとしてお客様のお問い合わせメールのあて先アドレスを使っています。質問のある人が、そのままメールに返信すればよいようにという配慮です。
ところが、それがあだとなって、そのメールアドレスには毎日何百通ものエラーメールが送られてきて、本物のお問い合わせメールが埋もれてしまいそうです。あて先アドレスがなくなってしまったためのあて先不明エラー、あて先のメールボックスがあふれているエラー、それに加えてロータスノーツやExchangeが送り返してくる「○○課の××は、本日出張しています」(そんなこと知らんわ!)という類のいわゆる“Out of Office”メールが山ほど。Out of Officeメッセージの標準化をRFCか何かに提案しなかったことを今になって悔やみます。
で、CRM114に各種エラーメールやOut of Officeメールを教えてやったところ、これまた気持ちよくその手のメールを自動的に捨ててくれるようになりました。
汎用のテキスト分類フィルタとして、いろいろ応用分野がありそうです。