LES LOGICIELS ANTI-PLAGIAT : détection ? formation ? prévention ? dissuasion ?

Posté par Jean-Noël Darde

 

Le plagiat de la recherche scientifique

Colloque international (CERSA-CNRS)

* * *

Les promoteurs des logiciels dits « anti-plagiat » prônent leur usage, non seulement dans la phase de détection des plagiats mais aussi dans celles de la formation, de la prévention et de la dissuasion. Commençons par évaluer l’efficacité de ces logiciels dans leur fonction de détection, puisque de cette efficacité dépend le rôle que peuvent jouer ces logiciels dans les autres phases.

I La détection des plagiats par les logiciels anti-plagiat : une efficacité limitée

Qu’est-ce qu’un logiciel anti-plagiat ? C’est un logiciel en mesure de comparer le texte qu’on lui soumet pour contrôle, d’une part à l’ensemble des textes en libre accès sur Internet et d’autre part à un stock de textes numérisés que les promoteurs du logiciel ont constitué —  notamment avec des travaux, thèses et articles déjà contrôlés.

Cette comparaison permet de détecter et signaler les séquences de signes identiques ou quasiment identiques. Mais le logiciel ne fait pas la différence selon la nature des séquences identiques repérées : plagiats ou citations faites dans le respect des règles.

Ces logiciels, que ce soit Compilatio, le plus répandu en France, ou ses concurrents, ne détectent pas LES plagiats. Ils distinguent au mieux des « similitudes » pour reprendre le terme adopté aujourd’hui par l’ensemble de ces logiciels (note 1).

Ces « similitudes » peuvent être parfaitement légitimes, ainsi les citations présentées comme telles dans le texte soumis au contrôle, ou si elles correspondent à des textes dont la présence sur Internet est postérieure à la rédaction du texte contrôlé (le doublon repéré sur Internet peut s’avérer être le plagiat du texte soumis au contrôle), ou encore parce qu’une copie du texte à contrôler a été mise en ligne par son propre auteur. C’est aussi le cas des thèses mises en ligne par les universités. Les logiciels commencent alors par afficher en rouge « 100% de similitudes » (mais une fonction de ces logiciels permet à l’utilisateur de neutraliser ce type de « similitudes »).

L’affichage par 3 des 4 logiciels que nous allons nommer plus loin de taux de similitudes associés à des couleurs — du vert au rouge ou même au noir — alors qu’aucun plagiat n’est encore prouvé est déjà problématique en soi.

Les logiciels facilitent la découverte de plagiats à la condition qu’il s’agisse de plagiats qui répondent à deux caractéristiques : être particulièrement grossiers — suite de phrases identiques (copier-coller strict) ou quasi identiques — et avoir été copiés depuis internet ou sur un document numérisé déjà stocké par les promoteurs des logiciels.

Des nombreux cas étudiés par Hélène Maurel-Indart dans son ouvrage Du plagiat, un certain nombre concernent le plagiat de travaux d’universitaires. Ceux de Denis Lopez sur le duc de Montausier, Patrick Rödel sur Spinoza, Mickaël Augeron sur la piraterie, ceux de Gérard Pouchain et Robert Sabourin biographes de Juliette Drouet, etc. Si l’ensemble des textes originaux avaient été accessibles sur Internet, aucun des logiciels anti-plagiat n’aurait été en mesure de détecter ces plagiats qui étaient pourtant suffisamment établis pour avoir tous fait l’objet de condamnations en contrefaçon.

Dès qu’un plagiat s’éloigne du simple copier-coller, il devient indécelable par les logiciels anti-plagiat.

Dans plus de la moitié des affaires de plagiat que j’ai traitées sur le blog Archéologie du copier-coller — thèses et articles — les plagiats avaient bien la forme d’emprunts serviles, quasiment à l’identique; mais les sources de ces plagiats étaient des documents papier (un livre d’Umberto Eco par exemple, des thèses et des articles qui n’étaient pas en ligne).

Signalons aussi le cas de sources plagiées depuis Internet mais traduites dans la langue du plagiaire comme j’en ai fait état dans un article intitulé Le briquet de Darwin. Là encore le logiciel se révèle impuissant à repérer le moindre plagiat, pourtant servile. Dans ce cas, seule une lecture attentive du document permet de détecter des indices qui conduisent à l’hypothèse du plagiat. Puis un travail sur les invariants trans-langues (un bonne part des noms propres, les dates, etc…en quelque sorte une application de la méthode de J. F. Champollion) permet avec l’aide de Google uniquement d’en établir la seule preuve indiscutable : la découverte du texte d’origine, à savoir, dans le cas évoqué dans cette étude, un texte sur le darwinisme en anglais.

Ajoutons encore que si le plagiat de la recherche en sciences humaines laisse le plus souvent des traces textuelles, cela peut ne pas être le cas dans beaucoup d’autres domaines scientifiques.

Les logiciels anti-plagiat, utilisés avec discernement, peuvent être d’une aide appréciable. Malheureusement, ils sont aujourd’hui présentés par de plus en plus d’universités comme LA solution efficace à mettre en œuvre aussi bien dans l’étape de formation au bien citer, celle de la prévention, l’étape de dissuasion, et comme arme de détection aux résultats garantis.

Nous allons montrer que si les logiciels anti-plagiat ont un rôle à jouer dans la lutte contre le plagiat universitaire, il n’est ni efficace ni raisonnable d’organiser cette lutte autour de leurs usages.

.

II Les logiciels anti-plagiat sont d’abord des produits à vendre

La première génération de logiciels anti-plagiat a été conçue au sein de quelques universités américaines dans la première moitié des années 90. Ces logiciels étaient mis gratuitement à la disposition des usagers. Une seconde génération lui a succédé avec des produits aux interfaces et fonctions plus sophistiquées mis au point par des entreprises. Ces entreprises se disputent un marché, le marché du plagiat universitaire dont les clients sont les universités. Cette génération de logiciels est accompagnée de prescriptions d’usages proposées par les entrepreneurs.

Notons que pour ces entreprises, le plagiat universitaire est d’abord, et même uniquement, le plagiat des étudiants. Les promoteurs de ces logiciels ont en effet le tact et peut-être surtout l’habileté de ne jamais évoquer le plagiat des universitaires, leurs clients.

De ces logiciels anti-plagiat dont l’utilisation est payante, Turn it in, lancé en 1998, est le plus connu aussi bien aux États-Unis qu’internationalement, la France où il est peu utilisé faisant exception. Urkund, créé en 2000 par des enseignants de l’Université d’Uppsala, est le premier produit européen à s’être imposé, suivi par Ephorus, créé lui aussi par des enseignants, en 2003, aux Pays-Bas. Enfin Compilatio, né en 2004 au sein d’une entreprise savoyarde répondant au nom de « Six degrés », est le logiciel le plus connu et le plus utilisé en France grâce à un service de communication très efficace, j’oserai dire trop efficace auprès d’universitaires trop crédules.

Revenons sur les conditions dans lesquelles Compilatio s’est imposé en France :

L’entreprise Six-Degrés lance à partir de fin 2005 des campagnes  pour faire connaître son produit phare, le logiciel anti-plagiat Compilatio.net. Si le site de Michelle Bergadaa a été le premier, dès 2004, à tenter de sensibiliser les universités francophones au phénomène du plagiat, il faut aussi reconnaître l’impact important des campagnes mediatiques de Six-degrés à partir de 2005. C’est souvent à travers les articles et reportages des médias à propos de Compilatio que les instances de nombreuses universités françaises vont découvrir le copier-coller-plagiat. Mais c’est aussi à travers les arguments de Compilatio, repris sans précaution dans la presse, que les universités sont sensibilisées.

.

III Les logiciels anti-plagiat : une arme de dissuasion ?

Fin 2005, le magazine Le Point, relayant fidèlement l’esprit de la campagne de Six-degrès, parle de ce logiciel, Arme de dissuasion contre la triche. Au printemps 2006 comme à la rentrée universitaire 2007-2008 l’entreprise Six-degrés a l’habileté de proposer à la presse des enquêtes sur mesure qui attestent de l’ampleur du phénomène du plagiat et à la fois le remède miracle à ce fléau : l’abonnement au logiciel Compilatio. Comme le met en avant une dépêche de l’AFP en avril 2006 :

(…) la solution à des fraudes aussi sophistiquées ne peut être qu’informatique, relève Frédéric Agnès de la société Six degrés, qui a lancé en mai 2005 compilatio.net, le premier et seul logiciel en France de détection de plagiat sur l’internet.

Une assertion trompeuse et d’autant plus surprenante que, comme nous l’avons vu, ces logiciels ne repèrent rien des plagiats sophistiqués.

Quel est l’argumentaire de l’entreprise Six-degrés pour promouvoir l’usage de Compilatio ?

La première des deux conclusions placées en tête de l’étude présentée en septembre 2007 par l’entreprise Six-degrés, et dont il est affirmé qu’elle a été menée en partenariat avec des universités de Lyon  surprend quelque peu :

Les étudiants favorables à une «formation à la documentation» plagient plus que les autres.

On comprend mieux l’intérêt de cette première conclusion, une fois lue la seconde conclusion de cette étude.

Effectuées sans contrôles anti-plagiat, les formations méthodologiques seules ne font que faiblement baisser le recours au « copier- coller ».

L’expression « contrôles anti-plagiat » doit naturellement se comprendre comme contrôle avec un logiciel anti-plagiat, de préférence Compilatio.

Des conclusions similaires apparaissent aussi aux pages 38 et 39 de l’étude :

La relation entre «avoir été formé à l’art de la citation» et «la quantité de plagiat dans un devoir» existe, mais elle est faible.

Les étudiants favorables à une «formation à l’art de la citation» sont ceux qui plagient le plus !

En résumé : rien à attendre de l’enseignement dispensé aux étudiants par les universitaires dans les universités. Une seule solution : l’abonnement à Compilatio.

Nous avons pour notre part une expérience très différente : la formation à l’usage des sources issues d’internet ou d’ailleurs et au référencement est efficace. Si elle n’exclut pas ultérieurement la fraude, qui peut et doit alors être traitée comme telle, elle diminue drastiquement le copier-coller par ignorance. Cette formation à l’art de la citation limite énormément la nécessité d’avoir à recourir aux logiciels anti-plagiat.

En 2007, Valérie Pécresse, toute nouvelle Ministre de l’enseignement supérieur, confie à Henri Isaac la rédaction du rapport «L’université numérique». Henri Isaac se tourne surtout vers Frédéric Agnes, le directeur de Six-degrés, pour nourrir sa réflexion sur le thème qui fera l’objet de la 10e des 12 propositions de son rapport : Développer une action forte contre le plagiat.

Si Henri Isaac, contrairement aux conclusions de l’étude diffusée par Six-degrés, suggère en terme de prévention une « sensibilisation » par des enseignements spécifiques sur les normes d’emprunt, de référencement et de citation, il s’affiche cependant en faveur d’une « politique de dissuasion » alignée sur l’emploi de Compilatio.net préconisé par  Six-degrès et certains autres promoteurs de logiciels anti-plagiat : une utilisation a priori et systématique qui justifie des coûts d’abonnement élevés.

Citons une des conclusions du rapport Isaac :

2) Une politique de dissuasion grâce aux outils de détection anti-plagiat.

Cette action vise à dissuader les étudiants de se livrer à des actes de plagiat en équipant les établissements d’une plate-forme de détection du plagiat. La remise systématique des travaux sur une telle plate-forme devrait fortement inciter les étudiants à éviter le plagiat dans la rédaction de leurs travaux.

Le ministère pourrait passer un accord-cadre avec les éditeurs de solution de détection de plagiat afin de fournir aux établissements d’enseignement supérieur un dispositif anti-plagiat. Il existe à ce jour une offre de solutions logicielles anglo-saxonne (TurnItIn, Urkund, etc…) et française (Compilation.net).

On notera ici l’absence du nom d’Ephorus, un des 4 logiciels que nous avons cités, alors que les promoteurs d’Ephorus se distinguent précisément en proposant des prescriptions d’usages plus modestes et raisonnables, assez éloignées de celles de ses trois concurrents qui prônent le « toujours plus » de contrôles.

En Septembre 2010 (voir illustration ci-contre), le site de Compilatio renvoyait encore à cette enquête de 2007. La négation de l’efficacité de la sensibilisation des étudiants dans le cadre du classique cursus universitaire est l’argument le plus constant avancé par les promoteurs de Compilatio. On s’étonne qu’il soit si facilement gobé par des universitaires.

Depuis la remise du rapport Isaac et jusqu’à son départ du Ministère, à chaque fois qu’elle interviendra sur le thème du plagiat Valérie Pécresse se contentera de répéter logiciel anti-plagiat, logiciel anti-plagiat (note 2).

Or l’emploi systématique d’un logiciel anti-plagiat dans le cadre universitaire, c’est à dire le soupçon a priori et généralisé, pose, me semble-t-il, d’abord un problème de déontologie. Il faudra y revenir et des spécialistes du droit sont peut-être mieux armés que moi pour y réfléchir. Peut-être faudrait-il que la décision d’un contrôle par un logiciel soit fondée sur l’existence d’indices relevés à la suite d’une première lecture du document ou encore d’un soupçon associé au contexte particulier de la remise du travail.

Outre l’efficacité limitée des logiciels que nous avons évoquée, le contrôle à priori et systématique revient non seulement à faire du soupçon la règle, mais à déléguer à ces logiciels ce qui est du ressort normal de la compétence des universitaires : compétence à diriger, lire, évaluer des travaux de recherche sur la base d’une connaissance des domaines dans lesquels tel universitaire accepte d’intervenir et d’être évaluateur.

Dans le domaine des colloques, donc celui de la recherche, on ne trouvera pas d’exemple plus caricatural de l’emploi a priori des logiciels anti-plagiat que cet « appel à communications » au début de l’année 2011 de l’Association internationale de management stratégique. Au prétexte du souhait louable d’un « apport de connaissance original »  à un colloque organisé en juin 2011 par l’école de management Audencia et l’Institut d’économie et de management de Nantes (IAE), L’AIMS précisait et exigeait :

– Les communications proposées devront obtenir une certification anti-plagiat Urkund pour soumettre leur projet de communication. La procédure d’obtention de ce certificat sera communiquée ultérieurement.

Peu importe qu’Urkund n’ait jamais prétendu délivrer aucune « certification anti-plagiat », on aura rarement vu plus grotesque, surtout de la part d’universitaires, que cette idée qu’il puisse exister une « certification anti-plagiat ». C’est pourtant, comme on va le voir plus loin, cette même lubie qui est reprise sous une forme très proche par certaines écoles doctorales. Une idée, il est vrai, induite par l’imagerie pieuse diffusée par Compilatio (illustration ci-contre).

De manière plus générale, il est choquant qu’avant même avoir parcouru un travail : devoirs d’étudiant, thèses, et bientôt communications soumises aux comités de lecture de colloques, celui qui a la charge de l’évaluer le reçoive dans une version où il est déjà accompagné d’une couleur significative associée aux « taux de similitudes » — du vert rassurant aux alertes exprimées par le rouge ou même le noir — alors qu’à ce stade rien ne permet encore d’affirmer l’existence de plagiats et de les quantifier. Notons qu’Ephorus se distingue de ses trois concurrents en refusant cette distinction chromatique qui, le taux de similitudes n’étant pas corrélé à un taux de plagiat, est la source d’un taux élevé de soupçons injustifiés induits par le rouge ou le noir et d’aveuglements au plagiat liés à la couleur verte qui peut être trompeuse.

Cette dissuasion par le tout logiciel est un mirage :  d’abord parce l’efficacité limitée de ces logiciels ne peut qu’encourager les plagiaires à adapter leurs plagiats, c’est assez facile, pour les rendre indiscernables par les logiciels anti-plagiat.

.

IV Les logiciels anti-plagiat : la formation à l’art de citer ou à l’art de mieux plagier ?

La même entreprise qui mettait Compilatio.net, aujourd’hui Compilatio Magister, à la disposition des universités pour exercer un contrôle anti-plagiat, a mis aussi Pompotron au service des étudiants depuis longtemps et plus récemment Compilatio Studium.

Sous couvert de l’apprentissage au bien citer, Pompotron, un nom qui ne trompe pas, ou Compilatio Studium permettent à l’étudiant de repérer ce que le contrôle par Compilatio Magister est en mesure de signaler. Ils poussent donc le plagiaire en puissance à faire quelques efforts pour mieux masquer ses plagiats en passant du simple copier-coller à la paraphrase, ou en se limitant à plagier des textes qu’il aura traduits ou empruntés à des documents imprimés, afin de les rendre indétectables par Compilatio Magister.

Citons un extrait du prêchi-prêcha de Six-degrès à propos de Compilatio Studium :

Compilatio Magister permet aux enseignants de mieux valoriser le travail personnel des étudiants en identifiant rapidement les travaux les plus originaux.

 

Désireux d’aller plus loin dans cette démarche, de nombreux enseignants pensent qu’il faut placer les étudiants au centre du dispositif de prévention du plagiat (souligné par nous).

Compilatio Studium a été conçu en réponse à cette demande, pour mieux responsabiliser les étudiants dans leurs habitudes de travail.

En réalité, la prévention proposée n’est pas la prévention du plagiat, mais se limite ici encore à la prévention des effets du futur contrôle annoncé dans la phase de dissuasion, le contrôle par les évaluateurs à l’aide de Compilatio.magister.

Compilatio.studium prétendument destiné à « diminuer les plagiats involontaires » (les plagiats à l’insu de son plein gré…) sera d’abord utilisé par les apprentis plagiaires, qu’ils soient étudiants ou universitaires, pour découvrir les menaces du contrôle et les plagiats qui vont être repérés dans la phase de dissuasion-détection et qu’il faut non pas retirer, mais mieux habiller, camoufler. Les logiciels Pompotron et Compilatio.studium servent alors d’outils d’apprentissage non pas au « bien citer » mais au « bien plagier » de manière à échapper aux contrôles.

Non seulement Compilatio studium est proposé par Six-degrés directement aux étudiants, mais cette entreprise pousse aujourd’hui les universités à prendre en charge cette mise à disposition de Compilatio studium aux étudiants sous le couvert de leur formation au bien citer.

Rien n’illustre mieux cette situation que cet extrait ubuesque du guide 2010-2011 rédigé sous l’influence de Compilatio auquel l’université Paris 8 s’est abonnée et destiné aux thésards de l’école doctorale Cognition, langage, interaction de cette université. En réalité, ce qui vaut pour CLI vaut aujourd’hui pour de nombreuses écoles doctorales de diverses universités qui  ont adopté sans le moindre recul critique les modus operandi proposés par certains des promoteurs des logiciels anti-plagiat. Dans le cas présenté ici, l’inspirateur est Six-degrès-Compilatio.

Page 7 de ce guide :

Hormis les parties explicitement présentées comme étant des emprunts à d’autres textes (références, guillemets, exemples explicites…), les textes non originaux peuvent être de deux sortes :

1. Le texte attribué à l’auteur de la thèse est la copie identique ou modifiée d’une ou plusieurs sources principales identifiables et protégées par la propriété intellectuelle.

2. Le texte attribué à l’auteur de la thèse est constitué par l’accumulation, sans élaboration personnelle, des transcriptions directes des fragments empruntés à des sources multiples protégées ou non par la propriété intellectuelle.

L’université propose aux étudiants des moyens techniques de diagnostic de leur manuscrit. Ils pourront ainsi savoir si leur texte court le risque de ne pouvoir être soutenu et le modifier en conséquence[sic]. Un logiciel d’alerte est donc mis à la disposition des étudiants à la coordination des Écoles doctorales [en gras et souligné par nous ].

Ce logiciel délivre un premier diagnostic confidentiel orientant le doctorant vers les mesures nécessaires à prendre en faisant appel, s’il le trouve pertinent, au directeur de thèse. Le doctorant recevra un document contenant des instructions lui permettant de :

a) Prendre les mesures nécessaires pour être la seule personne ayant accès aux informations fournies par le logiciel.

b) Interpréter les résultats quantitatifs et qualitatifs obtenus.

Dans la Charte des thèses publiée dans ce même guide de l’école doctorale Cognition, Language, Interaction, à la rubrique Soutenance, il est précisé page 13 :

Afin de lutter contre les pratiques de plagiat et de copié-collé, que facilite le développement des outils informatiques, l’Université Paris 8 s’est doté d’un logiciel d’identification des plagiats ; l’autorisation de soutenance ne sera délivrée qu’au vu du relevé statistique établi par le logiciel.

On ne saurait afficher plus clairement une incapacité radicale à comprendre le fonctionnement et le bon usage des logiciels anti-plagiat. Pour mieux comprendre cette cécité et cette incapacité à définir une politique anti-plagiat cohérente, il faut préciser que le président de l’université Paris 8 a pu écrire à propos de nos travaux sur le plagiat universitaire qu’ils «ne correspondent pas aux axes scientifiques de l’établissement et ne rélèvent des travaux d’aucune de ses équipes de recherche ni des enseignements d’aucune de ses formations».

Nous pensons qu’une formation à l’art de citer par Compilatio-studium est d’abord une formation à plagier de manière à rendre ses plagiats invisibles au contrôle de Compilatio-magister.

Pour en rester aux exemples de Pompotron et Compilatio.studium — mais d’autres sociétés proposent des solutions similaires —, il est à craindre que ces outils soient au plagiat et aux plagiaires ce que l’avertisseur radar Coyote est à l’excès de vitesse et aux chauffards.

Compilatio.studium permet d’abord, comme Coyote, d’échapper à la détection et donc à la sanction. Il s’agit d’affiner les stratégies pour échapper au contrôle, des stratégies par trop évidentes : pour les plagiats issus d’Internet, passer du simple copier-coller à la paraphrase, ou traduire depuis des textes en langues étrangères ou se limiter à des plagiats de textes imprimés qui ne sont pas accessibles en ligne.

.

V Les logiciels anti-plagiat : des outils utiles dans la phase d’enquête

La meilleure dissuasion consiste à convaincre l’étudiant ou l’enseignant-chercheur que son travail sera lu avec respect et attention, mais que si son lecteur attentif était conduit à douter de l’originalité de passages de ce travail, il consacrera le temps et les moyens nécessaires à faire une recherche approfondie afin de lever ou confirmer ses soupçons. Le plagiaire, étudiant ou enseignant-chercheur, doit aussi savoir que si ses plagiats étaient découverts, il subirait une sanction proportionnelle à la gravité des faits.

Pour les cas grossiers, quelques rapides et simples sondages sur Google, en prenant la précaution de vérifier l’antériorité de la « source », peuvent suffire à établir quelques exemples de plagiats. On peut alors, sur la base d’indices, après des essais sur Google ou dès le départ, confier ce type de recherche aux logiciels anti-plagiat.

Les cas les plus graves de plagiat universitaire concernent non pas de simples devoirs d’étudiants mais le domaine de la recherche, c’est-à-dire les thèses et les travaux des universitaires eux-mêmes. Dans ces cas, sur la base de soupçons fondés de l’évaluateur ou d’un destinataire de ces travaux, on peut défendre l’usage des logiciels anti-plagiat.  Il s’avère même utile d’utiliser plusieurs d’entre eux, et pourquoi pas les quatre principaux que nous avons cités.

En effet, non seulement il est  rare qu’un de ces logiciels ne repère pas au moins quelques «copier-coller» que les autres ignorent, mais de plus les 4 logiciels cités opèrent non seulement sur Internet mais aussi sur un stock de documents — notamment une part des documents qui ont déjà été soumis à son contrôle — dont l’importance et les exclusivités diffèrent d’une entreprise à l’autre. Turnitin dispose du stock le plus important de ressources en anglais et Compilatio en français.

Conclusion

Si nous pensons que les logiciels « anti-plagiat » sont, utilisés avec discernement, d’excellents outils (note 3) pour enquêter sur les plagiats les plus grossiers, nous pensons aussi que les usages de ces logiciels tels qu’ils sont prônés par certaines entreprises, dans une logique strictement commerciale, sont à la fois problématiques au regard de la déontologie universitaire, inefficaces et même à certains égards contre-productifs.

Nous craignons que l’usage inconsidéré des logiciels anti-plagiats ne soit bientôt plus que l’alibi des universités qui ne veulent pas traiter les problèmes de fond liés au plagiat des étudiants et des universitaires.

La lutte contre le plagiat universitaire se joue d’abord dans la prévention —formation à l’utilisation et aux normes de référencement des sources — et dans la dissuasion, non celle inefficace d’une promesse de contrôle systématique à l’aide de ces logiciels facilement contournables, mais par la certitude que le travail remis sera lu avec attention et celle d’une sanction adaptée, notamment l’annulation du diplôme associé à une thèse-plagiat, tôt ou tard, au cas où des plagiats seraient découverts.

En délaissant la prévention par la formation à l’usage des sources pour confier aux logiciels cette formation-prévention-dissuasion, on risque de favoriser l’art du bien plagier plutôt que celui du bien citer.

Une fois définies les conditions de leur usage, dans le respect d’une déontologie, ces  logiciels peuvent être très utiles. Sur la base de soupçons objectivement fondés par des indices sérieux, un texte universitaire, comme une thèse ou un article scientifique, doit pouvoir être soumis à l’analyse très imparfaite de ces logiciels en complément d’une expertise « humaine » compétente.

La formation et la prévention : Cela consiste dans le cadre du cursus universitaire en une formation à l’art de choisir ses sources,  de bien les utiliser et de les citer dans le respect des normes de référencement. Dans cette phase de prévention, les logiciels anti-plagiat n’ont pas de rôle significatif à jouer.

La dissuasion : c’est la certitude d’une sanction en cas de découverte de plagiat, et l’annulation du diplôme obtenu grâce au plagiat.

La détection et la sanction : En cas de soupçons fondés ou de découverte de quelques plagiats isolés, le temps et les moyens – dont les logiciels anti-plagiat —sont mis en œuvre pour expertiser l’ensemble du document concerné. Si les résultats se révèlent positifs, l’expertise est étendue à d’autres productions du plagiaire. La sanction est modulée selon l’importance des plagiats. Le plagiat est plus grave chez un enseignant-chercheur qu’un jeune doctorant qui n’a pas encore soutenu sa thèse..

* * *

Note 1 : Pendant plusieurs années, Compilatio a affiché des résultats en terme de « taux de plagiat ». Puis, sensibles aux critiques, ses promoteurs sont passés aux « taux de similitudes ».

Note 2 : Un tel remède miracle ne pouvait que séduire aussi Luc Chatel, Ministre de l’Éducation nationale : à la suite de la publication du rapport Fourgous, « Réussir l’école numérique » qui cite le seul logiciel Compilatio, Luc Chatel fait expérimenter en ce moment  l’usage de ce logiciel dans les lycées et collèges de l’Académie de Bordeaux. Le rapport « Réussir l’école numérique« , a été rédigé en 2010 par Jean-Michel Fourgous, député des Yvelines, à la demande de François Fillon et Luc Chatel.

Note 3 : Notons qu’une fonction de ces logiciels, l’organisation de la réception des travaux à contrôler, est à elle seule très intéressante en dehors même de leur fonction « anti-plagiat ». Ces plates-formes ont été particulièrement développées pour accompagner Urkund et Turnitin. Ephorus, dont nous avons dit que les préconisations d’usages nous paraissent les moins discutables, n’est malheureusement pas le plus efficace pour repérer les similitudes.

* * *

Vient de paraître : Le PLAGIAT DE LA RECHERCHE, Actes du colloque du 20 et 21 octobre 2011

Communiqué : Le plagiat universitaire compte parmi les dossiers les plus brûlants qui attendent le nouveau Ministre de l’Enseignement supérieur et de la recherche (suite… à www.guglielmi.fr/spip.php?article266).

Introduction : accès libre à www.lextenso-editions.fr/ouvrages/document/2337332.

Subscribe to Commentaires

3 réponses to “LES LOGICIELS ANTI-PLAGIAT : détection ? formation ? prévention ? dissuasion ?”

  1. Françoise PLET est professeur émérite (Département de géographie, université Paris 8 :
    Compilatio n’avait distingué que 4% de similitudes pour une thèse dont il s’est révélé par la suite qu’un chapitre au moins avait été plagié. La thèse source du plagiat était pourtant en ligne. Un des rapporteurs qui avait déjà donné un avis favorable à la soutenance, s’est rendu compte du plagiat quand la thèse plagiée lui est arrivée dans les mains par un heureux concours de circonstances : c’était celle d’un candidat au recrutement. La soutenance a été suspendue jusqu’à nettoyage de ses copier-coller.

     

    Françoise PLET

  2. Magnus Paulin, chargé de la diffusion du logiciel Turnitin en France et en Belgique.

    D’abord, je ne peux qu’exprimer notre accord avec les conclusions de l’auteur de cet article aux sujets de « la formation et la prévention » ainsi que « la dissuasion » et « la détection et la sanction »; quoique, avec quelques réserves :

    — En premier lieu, le « non-rôle » de ces services dans la formation. Il faut souligner que ce service – je ne m’exprime qu’au nom de Turnitin – est employé, pour des raisons évidentes, surtout dans une situation étudiant-enseignant (enseignement supérieur ou secondaire) même s’il est aussi fréquemment utilisé dans le milieu de la recherche. Nonobstant, pour le domaine de la recherche, on fait souvent appel à un autre de nos services, « iThenticate ».
    Nos expériences avec les enseignants nous ont convaincu que l’emploi de ce type de service est utile, à la fois pour visualiser le sujet, mais aussi quand un enseignant est confronté à un nombre d’étudiants importants (ou même pour l’enseignement à distance).
    Ici se trouve notre désaccord avec les services mentionnés dans cet article. Il faut que l’étudiant soit accompagné par l’enseignant et que ce soit fait en toute transparence, voilà pourquoi nos service sont axés sur cet usage, avec la possibilité de partager l’analyse avec l’étudiant/thésard, et ainsi faire des commentaires en ligne, etc.

    La deuxième réserve concerne le choix entre une utilisation systématique et celui d’une utilisation qui suit des soupçons. Ce dernier « mode de fonctionnement», qui d’ailleurs en France a été l’utilisation phare lorsque ce type de services a été introduit en 2004-2005, peut néanmoins avoir des conséquences néfastes, comme nos expériences nous le démontrent, ou plutôt celles de nos clients.
    Exemple : les documents bien écrits mais avec des manquements dans les références mentionnées ne sont souvent pas vérifiés et reçoivent une note/mention non méritée. On introduit aussi le risque de « profiling »…
    Et pour revenir sur le concept du radar mentionné dans l’article, on ne l’allume pas seulement quand on voit une voiture de sport, une moto performante ou, le Coyote ? Alors, pourquoi ce comportement dans un système censé être égalitaire où tout étudiant, ou chercheur, doit avoir les mêmes possibilités mais aussi les mêmes contraintes c’est-à-dire soumis aux mêmes contrôles ?

    Quelques autres sujets abordés dans l’article.
    L’efficacité : En premier lieu, il est tout à fait évident qu’un système comme Turnitin (ou ceux de nos confrères) ne détecte pas le plagiat mais seulement des « similitudes », des textes récrits, etc. Une utilisation correcte a normalement un effet préventif contre le plagiat (car ici on parle aussi d’une intention) mais c’est en effet tout autre chose.

    Les sources vérifiées : Il faut aborder deux aspects. D’abord souligner que tous les fournisseurs sont capables (il faut l’espérer) de vérifier les pages web et tout document reçu auparavant. Cependant s’ils font leurs requêtes via un moteur de recherche externe ils ne vont retrouver que les sources disponibles via ce moteur à ce moment là.
    Il y a aussi un troisième type de sources, les bases de données académiques et scientifiques, comme EBSCO, Elsevier, PubMed, Emerald, Springer, Gale, etc. La majorité des fournisseurs n’ont pas accès à ce type de sources, ou seulement une sélection restreinte.

    Le plagiat « traduit d’un texte étranger » – est évidemment un problème complexe auquel on est confronté de temps à autres. Nous aurons plus de nouvelles à ce sujet en décembre…

    Magnus Paulin
    Turnitin – iThenticate
    France & Belgique

    Rép. de Jean-Noël Darde :
    La présence pendant les deux jours du colloque Le plagiat de la recherche scientifique de Magnus Paulin pour Turnitin, et aussi d’Anne Hamel Pour Compilatio, est le signe encourageant qu’il est possible de faire avancer la discussion autour des conditions d’usage des logiciels dits « anti-plagiat » dans les universités.
    Nous reviendrons ici ultérieurement pour donner une réponse plus complète à Magnus Paulin. Mais je note d’abord une remarque qui ne peut être ignorée : si pour ma part je conteste l’usage a priori et systématique de ces logiciels, il n’en reste pas moins que Magnus Paulin a raison de vouloir éviter le « risque de « profiling » », c’est-à-dire, l’usage du logiciel à la tête du client, avec les dérives que cela peut entraîner. Par ailleurs, nous en sommes bien d’accord, l’accès du logiciel « aux bases académiques et scientifiques comme « EBSCO, Elsevier, PubMed, Emerald, Springer, Gale » est un avantage considérable sur le googolien lambda, comme vous et moi.
    JND

     

    Magnus PAULIN

  3. Anne HAMEL est responsable marketing et communication chez Compilatio, la société qui édite le logiciel anti-plagiat du même nom :

    Bonjour M. Darde,

    Suite à votre présentation au colloque sur le Plagiat de la recherche , je vous remercie de nous donner la parole sur votre blog.

    Je vais commencer ma réponse par une précision très importante : Compilatio Magister est un service d’alerte pour enseignants souhaitant corriger les travaux d’étudiants en toute connaissance de causes. Nous ne nous proclamons pas « miraculeux », nous proposons juste une aide, un outil performant pour que l’enseignant puisse gagner du temps pendant l’évaluation de travaux académiques. A aucun moment, nous ne voulons nous substituer au jugement du professeur. Nous faisons en sorte que l’enseignant puisse s’assurer de la transmission des connaissances ou non.

    Magister s’adresse aux étudiants du collège, lycée, école ou université et ne sont pas des professionnels de la publication/édition. Je pense qu’on ne peut pas demander la même chose à un enseignant-chercheur qui publie tout un travail élaboré pour qui cela aura des répercussions certaines sur sa carrière, et à un étudiant de deuxième année de droit en contrôle continu. Pour ces derniers, un logiciel de détection de similitudes est approprié.
    Pour les enseignants-chercheurs, et comme dirait Mme Koubi lors du colloque : « Seule la lecture intégrale du texte sera efficace ». On parle ici d’intention de dissimulation mais aussi de violation de brevet : c’est très complexe à détecter! (nous travaillons actuellement sur le sujet, d’où notre présence au colloque.)

    Certes, les étudiants d’aujourd’hui sont les doctorants de demain, mais je persiste à penser qu’une quantité non négligeable d’étudiants font du plagiat par manque d’attention, de repères et de méthodologie (référencé par Mme Bergadaa dans son étude sur le profil type des plagiaires). Au moins l’outil Studium peut les mettre en garde contre des pratiques quelque peu débutantes. Cet outil a bel et bien été créé pour répondre aux attentes de professeurs, notamment de Lyon et de Tunis.

    Comme vous l’affirmez, la formation des étudiants est indispensable, je vous rejoins sur ce point. Compilatio Studium n’est pas un pied de nez aux cours de méthodologie, au contraire ! Nous préconisons dans nos présentations, une implication de la part des établissements. Une campagne anti-plagiat s’accompagne de plusieurs outils, notamment d’un règlement intérieur, d’une communication des actions, d’affiches, et de formations pour étudiants. Il n’y a pas de « certificat de non-plagiat » chez Compilatio.net. L’image que vous montrez sur votre site concerne directement Compilatio.net: c’est notre « engagement de qualité » envers nos abonnés !

    Enfin, vous faites allusion à l’aspect payant du logiciel : il faut savoir que nous sommes une petite équipe dynamique avec des commerciaux, des professeurs et des ingénieurs qui développent les algorithmes du logiciel et toutes les évolutions techniques demandées par nos abonnés. C’est pour cette raison qu’il est payant. Plus nous avons d’abonnés, plus nous trouverons des similitudes avec d’autres documents, et plus nos ingénieurs devront s’assurer de la capacité des serveurs, de la puissance d’analyse, et de gérer toutes les données de manière sécurisée.

    Je vous remercie, M. Darde, pour cette tribune.

    Anne Hamel-responsable communication de Compilatio.net.

    Rép. de Jean-Noël Darde :
    La présence tout au long du colloque Le plagiat de la recherche scientifique, d’Anne Hamel pour Compilatio et de Magnus Paulin pour Turnitin, est un signe encourageant qu’il est possible de faire avancer la discussion autour des conditions d’usage des logiciels dits « anti-plagiat » dans les universités.
    Nous reviendrons ici ultérieurement pour donner une réponse plus élaborée à Anne Hamel.
    Répétons seulement pour le moment que nous apprécions la qualité de ces outils — que ce soit Compilatio et Turnitin, pour s’en tenir aux deux logiciels dont les représentants ont assisté aux travaux du colloque. Nous les utilisons fréquemment et nos désaccords ne portent pas sur la qualité de ces outils mais d’abord sur certains de leurs usages et certaines préconisations des entreprises qui les diffusent, notamment pour le cas de Compilatio.
    Dans certains cas même, nous pensons qu’ils ne sont pas assez utilisés. Un collègue belge, dont les résultats des travaux seront publiés sur ce blog au printemps prochain, confirmera à propos d’un cas emblématique que l’emploi successif de plusieurs logiciels à propos du même texte soupçonné de plagiat, apporte de meilleurs résultats. Comme nous l’avions déjà remarqué, il est rare que parmi les logiciels les plus renommés, l’un ne soit pas en mesure de faire valoir certaines « similitudes » et d’ouvrir ainsi des pistes que tous les autres logiciels ont ignorées.
    Nous sommes loin d’être d’accord avec tout ce qui est dit dans le livre blanc Thot-cursus / Compilatio mis en ligne ce 26 octobre, mais ce document nourrit le débat. Il est accessible ici, sur le site de Compilatio.
    JND

     

    Anne HAMEL