迷惑メールが蔓延してかなりの時が過ぎた様に感じます。
Drive Network で メールフィルタ 機能の提供を開始するにあたり、課金体系や内部エンジンの選定には時間と力を注ぎました。
アンチウイルス
特にアンチウイルス対策は、すでにサービスインをしている同業他社では 1 メールアドレス毎に 200 円等の細かいオプション課金をするケースが散見していましたが、これも背景は Drive Network のこだわり (SSL 証明書) と同じで、エンジンを提供している事業者の都合が優先されていました。
ボリュームライセンス的に、メールアドレス数には依存せずインストールする台数に応じて一定の費用が必要とする課金体系であれば、何とかオプション課金をしなくとも提供が実現出来そうです。幸い要望に近い体系のエンジンを見つけることが出来ました。
Drive Network ではメールアドレス単位でのオプション課金はもちろんしませんし、1 ドメイン名毎や顧客毎にも追加課金はしていません。
これは、単なるアプリケーションの機能追加ではなく、インフラとして事業者が当然に提供すべきと考えたからです。
原価計算を考えるとすれば、ラック費用や回線費用に含めて考えるイメージで吸収することで、十分に可能です。このスタンスで 2004 年のリニューアル後から一貫しています。
迷惑メール対策
2006 年頃には、受信するメールの半分近くは "ゴミ" と解釈出来るメールになりつつありました。
内容が不定型・不特定なメールを自動的に選別する以上、100% の振り分けは実現出来ません。それぞれの事業者のエンジンも試しました。
が、この頃の迷惑メール対策エンジンは、自分の意図する学習が個人単位で出来ないのです。誤判定は事業者に通知することで、反映するかもしれません的なアプローチです。
ホワイトリスト・ブラックリストの様に、メールアドレス単位で遮断する場合ではなく、メールヘッダや本文を解析して受信すべき (clean) かゴミ (spam) とするかは、その判定基準となるべき元データが必要です。
極論を言えば、迷惑メール対策とはその元データ、学習型データベースを如何に精妙に作り上げるにかかっていて、そのデータベースの元となるデータ収集に尽きるのです。
しかしながら、A さんと B さんで職種が全く異なる場合、アダルト系のダイレクトメールは A さんにとっては迷惑ですが、B さんにとっては原稿作成の参考資料となる業務上必要なメールということは大いに考えられます。
このケースは、全員に共通のエンジンを使っている現在主流のサービスでは、必ずどちらかが立たないことになるのです。
そこで、Drive Network では以下のアプローチでサービス化に臨みました。
- 個人単位で簡単に学習させることが出来、結果が即反映する。
- 個人単位でのカスタマイズが前提となるので、迷惑メール対策エンジンの提供事業者の様な数百万通のサンプルを必要としない。小規模で一定の精度を目指してエンジンを自製する。
- もちろんオプション課金はしない。迷惑メール対策もアンチウイルス同様インフラと定義する。
"一定の精度を目指した" としていますが、それでも 95% 程度の検知率を実現しています。この状態から、数回学習させるだけで 98 – 99% の検知率まで向上することもまた確認しています。
95% の検知率は、某サービスが 90% 程度だったことを考えると大いにコストダウンしつつ、お客様には利便性が提供出来ることを意味しています。
試した限りでは、90% の検知率は見た目の数字以上に酷いです。私は 1 日に 1,000 件近く受信していますが、10% の誤検知ということは 100 通もゴミが紛れるのです。これはエンジンの恩恵を受けている様には感じ難い状況でした。
これが検知率 98 – 99% となると、10 – 20 通程度紛れるだけとなるので、格段に見通しが良くなることが実感出来ます。
若干の学習は必要であるものの、世界で最も自分にマッチした学習型データベースが簡単に作成出来て迷惑メールを軽減することが出来るサービスは、現在も Drive Network に大きなアドバンテージがあると考えています。