Depuis quelques années, ce phénomène empire de plus en plus. Non seulement par la quantité mais aussi par les moyens mis en place. En effet, les derniers bots spammeurs, tendent à imiter de mieux en mieux une utilisation "humaine" des sites et logiciels. Un exemple avec les entêtes HTTP qui ressemblent de plus en plus à celle soumises par un navigateur classique.

Il existe 2 grandes catégories de moyens pour contrer ces spams. Je citerai premièrement les Captcha. Ce sont des données que seul un humain est capable de comprendre. Cela se présente en général sous forme d'une image bruité à recopier ou d'une question simple à laquelle il faut répondre (dans ce cas, il faut penser à la localisation/traduction du la question dans la langue de l'utilisateur). Le principal problème de ce système est qu'il ennuie l'internaute dans sa démarche et l'empêche quelque fois de passer le Captcha (mauvaise vision, peu de courage...). J'ajouterai que récement, les bots sont quelques fois capables de déchiffrer les images bruitée.

A coté ce ça, d'autres filtres opérant uniquement coté serveur web existent et peuvent se baser sur une multitudes d'infos : l'ip du client, les entêtes HTTP (referent, agent...), et le contenu envoyé. Diverses méthodes existent comme comparer l'ip avec une liste d'ip white/black-listée (peu sûr), utiliser une liste de mots interdits... Un problème se pose si un commentaire correct est considéré comme indésirable. On a généralement pas le temps de passer en revue les 200 commentaires indésirables de la journée en revue pour vérifier leur indésirabilité.

Il y a quelques temps mon blog se basait uniquement sur le plugin Akismet pour faire le tri mais 5% des spams passaient tout de même. Depuis la sortie de la béta 6 de dotclear 2, j'utilise en plus d'Akismet une liste de mots bannis (étrangement, des noms de médicaments à utilisation en chambre). Désormais plus un seul spam ne passe mais je dois tout de même supprimer régulièrement 100 à 200 commentaires indésirables par jour. Je prévois de ne plus du tout les enregistrer s'ils sont considérés comme spamiques.

Sinon, il serait bien que les autorités pensent à faire quelque chose contre ça plutôt que de lutter bètement contre - par exemple - la copie illégale d'oeuvres numériques (qui est un combat perdu d'avance).