Pourriel, pollupostage et
référencement abusif : le spamming dans tous ses états
Par Eric Labbé
Agent de recherche au Centre de Recherche en Droit Public
Université de Montréal
email : labbee@crdp.umontreal.ca
Bien connu des citoyens du monde
cybernétique, le problème du courrier électronique non sollicité fait des ravages
médiatiques sous le nom de spamming. Pourtant, cette expression est tirée du
multipostage abusif, une activité affectant la fonctionnalité de la ressource Internet
Usenet.
Lemploi dun seul terme pour identifier plusieurs
concepts implique une référence à un dénominateur commun. La notion de spamming
doit donc être comprise comme une expression générique destinée à identifier une
activité généralement accomplie pour des raisons promotionnelles et affectant la
fonctionnalité d'une ressource Internet.
Dans une première partie (I), nous désirons identifier les
activités qualifiées de spamming et suggérer la notion dabus comme
principal dénominateur commun de cette expression. Puisque la fumée est souvent
lindicateur du feu, nous donnerons, dans une deuxième partie (II), une synthèse
des solutions techniques proposées par les différents acteurs du réseau.
I. Les activités abusives
Le spamming se manifeste sur trois ressources Internet,
soit les groupes de discussion Usenet, le courrier électronique et les outils de
recherche (1). La définition offerte par l'Office québécois de la
langue française considère la première de ces activités abusives sous l'appellation
proposée de pollupostage :
Spamming
Spamming : V. o. spaming (pollupostage n. m.;
inondation-réseau n. f.; arrosage-réseau n. m.; multipostage abusif n. m.). Action
d'inonder de nombreux groupes de nouvelles Usenet ou groupes de discussion utilisant
Internet, avec le même message, inutile, souvent provocateur et sans rapport avec le
sujet de discussion, causant ainsi une véritable pollution des réseaux (2).
Le spamming, selon cette définition, consiste à
expédier plusieurs messages identiques à un grand nombre de groupes de discussion
Usenet. Il s'agit du multipostage abusif (EMP) ou, selon la méthode employée, du postage
croisé abusif (ECP) (3). Le nombre de messages expédiés et la méthode
employée déterminent généralement le degré de nocivité des articles postés sur les
groupes de discussion (4).
D'abord associé aux groupes de discussion Usenet, le terme spamming
a également été employé pour décrire le courrier électronique non sollicité et le
bombardement d'une boîte de courrier électronique par l'envoi d'une quantité
astronomique de messages (mail bombing). Souvent qualifié de e-mail spam,
le courrier électronique non sollicité est la version française du junk e-mail.
Ce sens, l'Office québécois de la langue française le traduit par le mot pourriel :
junk e-mail : junk electronic mail,
Quasi-syn. junk mail (pourriel n. m.; courrier électronique-rebut n. m. Quasi-syn.
courrier-poubelle n. m.; publicité-rebut n. f.; pub-rebut n. f.) Courrier électronique
importun et souvent sans intérêt, constitué essentiellement de publicité, qui est
envoyé massivement à un grand nombre d'internautes et que l'on destine habituellement à
la poubelle (5).
Les auteurs de cette définition notent toutefois que le mot
"[p]ourriel est un terme générique pouvant aussi désigner les messages
électroniques envoyés par pollupostage (spamming) ou par bombarderie (mail bombing),
lesquels sont appelés plus spécifiquement pollu ou polluriel (spam) et bombard ou
bombarde (mail bomb)"(6). Le terme pourriel constitue donc la
version française du terme générique spam employé tant pour qualifier le
courrier électronique non sollicité que l'EMC ou l'ECP.
Enfin, le mot spamming est, depuis lannée
dernière, utilisé par plusieurs outils de recherche dont Alta Vista et Infoseek
pour qualifier l'indexation abusive exercée par les créateurs de sites Web auprès de
leurs robots de recherche, des logiciels permettant l'indexation automatique de sites dans
leurs base de données respectives. Motivés par le désir de faire connaître leurs
informations, créations, biens ou services, de nombreux internautes réussissent à
profiter des défaillances de ce genre de robot et se hissent au sommet des résultats
d'une requête adressée à un outil de recherche. Le professeur David E. Sorkin, auteur
d'une compilation sur le droit du Cyberespace, place ce type de comportement sous la
rubrique spamdexing (7). L'expression engine spamming a
également été proposée (8).
II. Les solutions techniques envisagées
Parmi les solutions techniques proposées par les différents
acteurs, aucune nest satisfaisante sans lobtention dun large consensus.
Seules quelques unes entendent régler le problème à sa source.
> Le pollupostage
Puisque le pollupostage a été la première activité
qualifiée de spamming, les remèdes techniques ont dabord recherché à
épurer les groupes discussion des milliers de messages commerciaux postés chaque jour.
La suppression automatique des messages expédiés par un tiers à laide dun
robot dannulation (cancelboots) a été la première solution technique
visant à enrayer le spamming sur la ressource Usenet. Cette solution technique est
généralement acceptée par les administrateurs de serveurs Usenet. Toutefois, elle pose
certains problèmes. Elle requiert dabord une parfaite maîtrise des paramètres de
programmation dun tel robot, une erreur pouvant engendrer lannulation de
messages non abusifs ou la multiplication de messages dannulation. Elle suppose
également une application stricte des raisons pour lesquelles un message peut être
supprimé sans lautorisation de son auteur et donc, une programmation capable de
discerner le postage dun pollupostage.
Sensible à ces difficultés, le légendaire suppresseur de
pollupostage CancelmooseCancelmoose
Spamming : V. o. spaming (pollupostage n. m.;
inondation-réseau n. f.; arrosage-réseau n. m.; multipostage abusif n. m.). Action
d'inonder de nombreux groupes de nouvelles Usenet ou groupes de discussion utilisant
Internet, avec le même message, inutile, souvent provocateur et sans rapport avec le
sujet de discussion, causant ainsi une véritable pollution des réseaux (2).
Le spamming, selon cette définition, consiste à
expédier plusieurs messages identiques à un grand nombre de groupes de discussion
Usenet. Il s'agit du multipostage abusif (EMP) ou, selon la méthode employée, du postage
croisé abusif (ECP) (3). Le nombre de messages expédiés et la méthode
employée déterminent généralement le degré de nocivité des articles postés sur les
groupes de discussion (4).
D'abord associé aux groupes de discussion Usenet, le terme spamming
a également été employé pour décrire le courrier électronique non sollicité et le
bombardement d'une boîte de courrier électronique par l'envoi d'une quantité
astronomique de messages (mail bombing). Souvent qualifié de e-mail spam,
le courrier électronique non sollicité est la version française du junk e-mail.
Ce sens, l'Office québécois de la langue française le traduit par le mot pourriel :
junk e-mail :
junk electronic mail,
Quasi-syn. junk mail (pourriel n. m.; courrier électronique-rebut n. m. Quasi-syn.
courrier-poubelle n. m.; publicité-rebut n. f.; pub-rebut n. f.) Courrier électronique
importun et souvent sans intérêt, constitué essentiellement de publicité, qui est
envoyé massivement à un grand nombre d'internautes et que l'on destine habituellement à
la poubelle (5). junk e-mail : junk electronic mail,
Quasi-syn. junk mail (pourriel n. m.; courrier électronique-rebut n. m. Quasi-syn.
courrier-poubelle n. m.; publicité-rebut n. f.; pub-rebut n. f.) Courrier électronique
importun et souvent sans intérêt, constitué essentiellement de publicité, qui est
envoyé massivement à un grand nombre d'internautes et que l'on destine habituellement à
la poubelle (5).
Les auteurs de cette définition notent toutefois que le mot
"[p]ourriel est un terme générique pouvant aussi désigner les messages
électroniques envoyés par pollupostage (spamming) ou par bombarderie (mail bombing),
lesquels sont appelés plus spécifiquement pollu ou polluriel (spam) et bombard ou
bombarde (mail bomb)"(6). Le terme pourriel constitue donc la
version française du terme générique spam employé tant pour qualifier le
courrier électronique non sollicité que l'EMC ou l'ECP.
Enfin, le mot spamming est, depuis lannée
dernière, utilisé par plusieurs outils de recherche dont Alta Vista et Infoseek
pour qualifier l'indexation abusive exercée par les créateurs de sites Web auprès de
leurs robots de recherche, des logiciels permettant l'indexation automatique de sites dans
leurs base de données respectives. Motivés par le désir de faire connaître leurs
informations, créations, biens ou services, de nombreux internautes réussissent à
profiter des défaillances de ce genre de robot et se hissent au sommet des résultats
d'une requête adressée à un outil de recherche. Le professeur David E. Sorkin, auteur
d'une compilation sur le droit du Cyberespace, place ce type de comportement sous la
rubrique spamdexing (7). L'expression engine spamming a
également été proposée (8).
II. Les solutions techniques envisagées
Parmi les solutions techniques proposées par les différents
acteurs, aucune nest satisfaisante sans lobtention dun large consensus.
Seules quelques unes entendent régler le problème à sa source.
> Le pollupostage
Puisque le pollupostage a été la première activité
qualifiée de spamming, les remèdes techniques ont dabord recherché à
épurer les groupes discussion des milliers de messages commerciaux postés chaque jour.
La suppression automatique des messages expédiés par un tiers à laide dun
robot dannulation (cancelboots) a été la première solution technique
visant à enrayer le spamming sur la ressource Usenet. Cette solution technique est
généralement acceptée par les administrateurs de serveurs Usenet. Toutefois, elle pose
certains problèmes. Elle requiert dabord une parfaite maîtrise des paramètres de
programmation dun tel robot, une erreur pouvant engendrer lannulation de
messages non abusifs ou la multiplication de messages dannulation. Elle suppose
également une application stricte des raisons pour lesquelles un message peut être
supprimé sans lautorisation de son auteur et donc, une programmation capable de
discerner le postage dun pollupostage.
Sensible à ces difficultés, le légendaire suppresseur de
pollupostage CancelmooseCancelmooseTM
a
proposé un logiciel destiné à remplacer l'annulation de messages (9).
Lobjectif de ce logiciel baptisé NoCeM (lire " no see them ")
est de communiquer aux autres utilisateurs lexistence de pollupostages. Suite à la
réception de messages dénonciateurs, l'utilisateur de NoCeM a la possibilité de choisir
le filtrage des multipostages abusifs. Bien qu'il ne puisse vérifier toutes les
dénonciations qu'il reçoit, lutilisateur peut prévoir l'acceptation automatique
de celles provenant dune personne de confiance. À cette fin, les messages envoyés
par ce logiciel doivent être signés avec la clef privée de l'expéditeur.
La solution que propose NoCeM risque toutefois de constituer un
moyen de censure s'il est mal utilisé par les opérateurs de serveurs qui sont les
principaux clients visés par le concepteur (10).
> Le pourriel
Une version de NoCeM a également été créée pour venir en
aide aux administrateurs désireux de filtrer le courrier électronique non sollicité (11). Celle-ci, plutôt que dopérer par courriers électroniques
chiffrés, détient ses informations de filtrage dune liste de distribution choisie
selon les critères de triage souhaités par ladministrateur.
Plusieurs logiciels de filtrage permettent aussi aux
utilisateurs de filtrer leur boîte de courriers électroniques. La plupart de ces
logiciels épurent les messages reçus en triant les pourriels dans le répertoire
poubelle du logiciel de courrier électronique. Certains dentre eux offrent à
lutilisateur le choix de ses propres critères de sélection et les actions
effectuées lors du triage des courriers. Toutefois, lutilité de ces logiciels ne
fait pas lunanimité. Sils parviennent à sauver quelques minutes de triage à
lusager, les logiciels de filtrage narrivent pas à empêcher le transfert des
coûts publicitaires aux destinataires.
Le système dépuration en réseau de la compagnie
Bright
Mail Technologies (12) éviterait ce transfert en effectuant
lopération de filtrage avant la réception des courriers par les serveurs SMTP des
destinataires. Ce système profite dun logiciel de filtrage mis à jour
continuellement par un centre dopération destiné à analyser et identifier les
pourriels. Ravitaillé de courriers électroniques par son propre réseau
dexploration, le centre dopération dispose de ressources humaines empêchant
la censure des courriers électroniques acceptables. Lefficacité du réseau
dexploration est assurée par la création dadresses électroniques fictives
chez dimportants fournisseurs daccès Internet dont AT&T WorldNet,
Concentric Network, Earthlink et USA.NET.
Également, le système Bright Light prévoit
doffrir aux destinataires le choix entre différentes catégories de publicités
quils désirent recevoir en transmettant des instructions spécifiques au logiciel
de filtrage de leur fournisseur daccès Internet. Notons cependant que cette
solution est payante et que les frais déboursés par les FAI seront probablement
supportés par les usagers.
Malgré cela, le système dépuration en réseau proposé
par Bright Light Technologies répond aux attentes particulières des fournisseurs
daccès Internet. Cette solution rend possible une opération de filtrage minutieuse
et, par conséquent, juridiquement moins risquée.
À lopposé, la pratique téméraire de retourner tout
courrier électronique à son destinateur, lorsque celui-ci est un polluposteur reconnu,
pose des difficultés reliées à la censure des courriers électroniques légitimes. Le
Mail
Abuse Prevention System Realtime Blackhole List (MAPS-RBL) en constitue le meilleur
exemple (13). Cette organisation rassemble les plaintes
dinternautes reliées au spamming et compile dans une liste (RBL) les
adresses IP retrouvées dans le code source des pourriels rapportés. Continuellement mise
à jour, cette liste est disponible sur le serveur de lorganisation (MAPS) et peut
être utilisée par un administrateur de serveur SMTP pour filtrer le courrier
électronique. Toutefois, lidentification de ladresse IP du destinataire comme
seul critère de filtrage rend impossible la détermination précise des véritables
pourriels et expose ladministrateur à linsatisfaction de ses propres usagers,
dès lors limités dans leurs échanges.
Plus que de tenter de réfréner le courrier électronique non
sollicité, les différents acteurs de lInternet ont jugé souhaitable de tuer le
spamming
dans luf et ont proposé quelques mesures préventives. Les usagers sont donc
invités à utiliser leur adresse de courrier électronique avec diligence. Par exemple,
ils doivent éviter de diffuser leur courriel sur un site Web et de le transmettre à la
demande. On recommande également d'ajouter l'annotation no-spam au nom de domaine
de leurs adresses électroniques. Bien intentionnées, ces mesures préventives viennent
toutefois limiter lusager dans lexercice de ses activités cybernétiques. Il
nest pas certain que cette entrave doive effectivement retomber sur les victimes du
spamming.
Toute balise posée à cet exercice devrait plutôt être supportée par les expéditeurs
de courriers électroniques non sollicités.
> Le référencement
abusif auprès des outils de recherche
Contrairement au courrier électronique et aux groupes de
discussion, la question de la censure ne sest pas présentée quant au contrôle du
référencement abusif auprès des outils de recherche. Sagissant dune
entreprise de services privés établie sur un serveur HTTP, un outil de recherche est
moins susceptible dêtre taxé de censeur. En effet, ses services ne dépendent pas
dautres serveurs décentralisés pouvant être gênés par les mesures techniques
entreprises pour enrayer le référencement abusif. Cependant, la programmation des
moteurs de recherche est susceptible de disqualifier certains sites ne pratiquant aucune
technique subversive de référencement. Pour ces raisons, les outils de recherche
nivellent généralement leurs critères par le bas. Par exemple, un site contenant plus
de sept mots identiques est automatiquement déclassé par le moteur de recherche dInfoseek,
laissant une marge de manuvre assez large aux webmestres.
Jusquà récemment, les solutions de contrôle du
engine
spamming ne tenaient pas compte des activités déloyales pratiquées par certains
compétiteurs. Ces derniers profitaient de la nouvelle programmation des moteurs de
recherche pour tenter de déclasser leurs concurrents. La stratégie consistait à
référencer les pages du site de la victime une multitude de fois sous les mêmes
mots-clefs. Loutil de recherche Infoseek semble avoir résolu ce problème en
rassemblant, sous un seul résultat de recherche, les pages hébergées sur un même
serveur (14).
Conclusion
D'apparence rassurante, la pluralité des solutions
techniques envisagées pour enrayer le spamming se meut finalement comme une
interminable et silencieuse guérilla numérique. Mis à part quelques invectives
ponctuelles d'internautes offusqués, les stratégies techniques de prévention autant que
les logiciels et réseaux de filtrage n'ont guère l'avantage de signifier à autrui une
interdiction. Larrivée des abus cybernétiques requiert plus que des solutions
techniques. Sans lobtention dune application généralisée dune ou
plusieurs de ces solutions par les acteurs de lInternet, les activités abusives
continueront de nuire au bon fonctionnement des ressources Internet. La communauté
est-elle prête à sautorèglementer ?
Régler un problème à sa source, cest aussi en interdire la cause. Les
législateurs auront un choix à faire.
E. L.
Notes
1. Le
terme spam est également utilisé sur les Multi-User Dungeons (MUDs) pour
exprimer linterruption dun programme dû à une surcharge de données, voire
un " excès de mots ". Lee-Ellen MARYIN, " Spoof, Spam, Lurk
and Lag: the Aesthetics of Text-based Virtual Realities ", (1996) Journal of
Computer-Mediated Communication, http://209.130.1.169/jcmc/vol1/issue2/marvin.html.
Cependant, il nexiste pas de coûts économiques associés à ce comportement sur
les MUDs et la question, à notre connaissance, na pas été abordée par les
principaux acteurs de lInternet.
2.
Matcel BERGERON, Corinne KEMPA et Yolande PERRON, Vocabulaire d'Internet : vocabulaire
anglais/français, 2e ed., Ste-Foy, Publication du Québec, 1997, p. 93.
Voir également le site Internet de l'Office de la langue française, http://www.olf.gouv.qc.ca/service/pages/internet2.html.
3. Le
postage croisé fait référence à l'envoi d'un seul message à plusieurs groupes de
discussion par l'inscription de leurs adresses dans le champ réservé aux destinataires.
J. D. FALK et Scott SOUTHWICK, "The Net-Abuse FAQ", http://www.cybernothing.org/faqs/net-abuse-faq.html.
4. Ce degré est
établi par le Breidbart Index : (vNb de groupes de discussion) X (Nb de
messages). Id.
5. M. BERGERON, C.
KEMPA et Y. PERRON, op.cit., note 2, http://www.olf.gouv.qc.ca/neuf/pages/vocinter2/internet_J.html.
6.
Id.
7.
Cyberspace
Law Subject Index, http://host1.jmls.edu/cyber/index/index.html.
8.
Whit ANDREWS, "Beating (Up) the System", (1997), 22 sept., Web Week 38,
41 disponible à http://www.internetworld.com/print/1997/09/22/industry/19970922-beating.html.
9. J. D. FALK et S.
SOUTHWICK, note 3
10. ANON.,
"NoCeM FAQ. VO. 93", http://www.cm.org/faq.html.
11. Don DOUMAKES,
" Net Abuse Links ", http://www.novia.net/~doumakes/abuse.
12. Bright Mail
Technologies, http://www.brightlight.com.
13.
Mail Abuse
Prevention System Realtime Blackhole List, http://maps.vix.com/rbl.
14. Lori PIQUET,
" Search Engines Battle the New Spam " (1998) 19 janv., ZDNet, http://www.zdnet.com/devhead/stories/articles/0,4413,1600389,00.html.
Voir également sur Juriscom.net :
- Email
publicitaires : tarir à la source (Espace "Internautes"), de Lionel
Thoumyre ;
- Spamming
et législation américaine : vers un projet fédéral décisif
(Espace "Professionnels"), de Eric Labbé.
|