[1] L’excellence et les drôles d’expertises de la Commission déontologie de l’université Paris-8

Posté par Jean-Noël Darde

Suivez l’actualité avec : https://twitter.com/#!/archeocopcol

(article mis en ligne le 13 février 2012)

Avant propos

Le 18 janvier 2010, j’ai alerté Pascal BINCZAK, président de l’université Paris 8, par courrier recommandé à propos de deux thèses-plagiats soutenues et validées au sein du laboratoire Paragraphe. P. BINCZAK sera quelques mois plus tard alerté d’une troisième thèse-plagiat du même laboratoire. J’avais vainement tenté depuis octobre 2005 de sensibiliser mes collègues aux graves problèmes de plagiat qui sévissaient au département Hypermedia et au Laboratoire Paragraphe. Dans ce courrier adressé au président de Paris-8, j’insistais sur l’urgence qu’il y avait à affronter avec rigueur le problème du plagiat : « À l’heure de la création du pôle Condorcet, pôle d’excellence en sciences humaines et sociales, Paris-8 ne peut rester sans réagir à cette situation ».

Au moment où  la participation de Paris-8 au pôle d’excellence Condorcet était en jeu et où était donné le départ de la course poursuite aux labels et badges de l’excellence – LABEX, IDEX, EQUIPEX, etc. –, le président de l’université Paris-8 et les vice-présidents des conseils centraux ont fait, concernant les affaires de plagiat qui ont été l’objet de nos alertes, le choix qui leur semblait le mieux adapté aux intérêts de l’université-Paris 8 : minimiser, ou même oublier, ces affaires de plagiat afin qu’elles ne viennent pas ternir la réputation de Paris-8 et ne lui coûtent ainsi les médailles si prisées de l’excellence. La majorité des membres du Conseil d’administration et du Conseil scientifique se sont ralliés à cette stratégie.

Il faut reconnaître que, compte tenu des conditions de l’attribution par le ministère des  badges de l’excellence, cette stratégie adoptée par les instances de Paris-8 s’est révélée efficace (une autre stratégie aurait consisté à être excellent et à affronter le plagiat et les plagiaires, mais elle avait ses inconvénients). Non seulement Paris-8 fait aujourd’hui partie des membres fondateurs du pôle d’excellence Condorcet mais, comme en témoigne l’illustration ci-contre, le Laboratoire Paragraphe, pourtant familier des plagiats en série, peut se vanter d’être associé non pas à un seul mais à deux labels LABEX (LABoratoire d’EXcellence), une consécration que seuls de rares laboratoires en sciences humaines ont obtenue.

L’étude qui suit décrit donc la mise en œuvre du volet « plagiat » de cette stratégie gagnante de « l’excellence ». Elle comprendra trois parties. Nous évoquerons d’abord l’expertise d’une première thèse-plagiat commandée par la Commission déontologie de l’université Paris-8. Une seconde partie prochainement mise en ligne traitera des réactions de la Commission déontologie, de ses experts et de la présidence de Paris-8 à d’autres thèses-plagiats et mémoires dont ils ont été saisis. Pour achever cette étude, nous montrerons dans une troisième partie comment ces drôles d’expertises, concomitantes à des pressions suivies de représailles exercées à notre égard, ont été réalisées dans ce contexte particulier de la course effrénée à l’obtention des marques de l’excellence.

*

Le Professeur Khaldoun ZREIK, convaincu qu’il aurait été dit sur ce blog Archéologie du copier-coller qu’il serait aveugle au plagiat, tolérant au plagiat ou même plagiaire, nous a poursuivi en diffamation (assignation du 26 octobre 2011). Après l’ordonnance de référé du 28 novembre (lire Paris 8, Procès et Plagiats), l’affaire devrait prochainement être traitée au fond. Cette étude éclaire aussi cette situation.

*

Dans l’assignation de Khaldoun ZREIK et les pièces qu’il y a jointes – documents par ailleurs pour la plupart déjà publics – il est fait à de nombreuses reprises référence à la thèse de Majed SANAN qu’il a dirigée et fait soutenir. Il présente sa propre position au sujet de cette thèse dans les pièces n° 2, n° 5 et n° 6. Le professeur Imad SALEH en traite aussi (pièce n° 20 soumise par Khaldoun ZREIK), comme le professeur Pascal BINCZAK, président de l’université Paris-8 (pièce n° 19, toujours apportée par K. ZREIK); le président de Paris-8 y confirme à propos de la direction de cette thèse « toute sa confiance » à K. ZREIK.

Cette thèse de M. SANAN en informatique a été soutenue à l’université Paris-8 en septembre 2008 devant un jury qui réunissait, outre le directeur de thèse, les professeurs Mohammad HASSOUN (ENSSIB, Lyon) et Imad SALEH (Paris-8), et Saïd TAZI (MCF, Toulouse 1). Ce jury comprenait donc trois professeurs de la 71e section (Sciences de l’information et de la communication) – M. HASSOUN, I. SALEH et K. ZREIK et un Maître de conférences de la 27e section (Informatique), S. TAZI. Khaldoun ZREIK appartenait à la 27e section au moment de l’inscription de M. SANAN en thèse d’informatique sous sa direction.

Les trois articles-plagiats qui figuraient dans le CV ramassé que Khaldoun ZREIK a communiqué au tribunal en gage de sa compétence (articles présentés dans Paris 8, Procès et Plagiats), d’autres articles qui étaient sur son CV en ligne (http://khaldounzreik.free.fr/), et cette thèse de Majed SANAN seront à nouveau au centre des débats quand la plainte de K. ZREIK à mon encontre sera jugée au fond.

* *

LA COMMISSION DÉONTOLOGIE ET LA DÉONTOLOGIE

Cette thèse de Majed SANAN a été l’objet d’une expertise commandée par la Commission déontologie de l’université Paris 8. La mise en place de cette commission le 11 février 2010 avait été une conséquence directe de nos alertes adressées le 18 janvier 2010 à Pascal BINCZAK, président de l’université. Le Relevé des délibérations du Conseil scientifique du 11 février 2010 en témoigne :

QUESTION DES PLAGIATS.
Saisi à propos de cas de plagiats et de copié-collé dans des Masters et dans des thèses de doctorat au sein de l’université, le Conseil scientifique entend prendre des mesures rapides et rigoureuses, il rappelle qu’il est de la responsabilité des directeurs et co-directeurs de thèse d’assurer la vérification de l’originalité des textes produits. Il est également possible d’envisager des sanctions (conseil de discipline, suspension de la fonction de directeur de thèse…).
Le CS met en place une Commission de déontologie, et propose la composition suivante :
– les trois Vice Président(e)s

– les directeurs des Ecoles doctorales

– deux membres du bureau du CS.
Pourront être sollicités pour s’adjoindre à cette commission des spécialistes de la section concernée par les dossiers à traiter.
Il demande à l’université d’acquérir un logiciel de recherche de plagiats au plus vite de façon à ce que les directeurs de thèse puissent vérifier la validité de la thèse avant la soutenance.
Avis favorable à l’unanimité
Le CS propose d’autre part, qu’une information particulière concernant le plagiat et le copié-collé soit inscrite dans la nouvelle charte des thèses, document contractuel.
Avis favorable à l’unanimité.

Contrairement aux autres conseils et commissions de Paris 8, la composition nominale de la Commission déontologie n’apparaît nulle part sur le site de l’université. Sa présidente, Élisabeth BAUTIER, se refuse à la communiquer au prétexte que « l’anonymat évite les pressions, c’est important pour les collègues ». En l’espèce, cet anonymat est tout à fait injustifié. Pour s’en convaincre, il suffit de rappeler que les noms des membres du CNESER disciplinaire, instance d’appel de la « section disciplinaire » des universités, apparaissent systématiquement sur le site du Ministère de l’Enseignement supérieur et de la recherche associés à chacun des cas traités et chacune des décisions prises (noms cités aux rubriques « CNESER. Sanctions disciplinaires » des numéros du Bulletin officiel du Ministère mis en ligne sur son site; voir illustration ci-contre). On peut cependant déduire, d’après leurs fonctions, la composition de la Commission déontologie de l’université Paris 8 pour 7 de ses 9 membres : les 4 directeurs des écoles doctorales – Mario BARRA JOVER (Cognition, langage et interaction), Jean-Philippe ANTOINE (Esthétique, sciences et technologies des Arts) Laurence GAVARINI (Pratiques et théories du sens) et Alain BERTHO (Sciences sociales) –  les vice-présidentes du Conseil scientifique et du Conseil d’aministration, Élisabeth BAUTIER et Christine BOUISSOU, enfin Jean-Marc MEUNIER, le vice-président du CEVU. Restent deux vrais anonymes, deux membres du Bureau du Conseil scientifique. Une partie des directeurs d’écoles doctorales étant aussi membres du Conseil scientifique, la majorité de cette Commission déontologie est donc issue du Conseil scientifique. Notons aussi qu’avec Élisabeth BAUTIER et Laurence GAVARINI, cette Commission déontologie compte deux spécialistes de l’évaluation particulièrement qualifiés puisque experts de l’Agence d’évaluation de la recherche et de l’enseignement supérieur (AERES).

Les décisions de cette commission seront pourtant vouées à être contestées tant sa composition est discutable eu égard aux conflits d’intérêts : on confie à ceux qui ont in fine la responsabilité d’autoriser la soutenance des thèses le soin de juger du cas où certaines de ces thèses, une fois soutenues avec leur accord et validées, s’avèrent être des thèses-plagiats.

UNE RECHERCHE TOUT À FAIT ORIGINALE…

Le 25 mars 2010, Élisabeth BAUTIER (1), vice-présidente du CS et présidente de la Commission déontologie présente aux membres du CS les résultats de l’expertise de cette thèse et met au vote une décision d’annulation. Cette décision est présentée dans le relevé des délibérations (première version) de cette séance du Conseil scientifique :

PLAGIAT

Suite au cas de plagiat déjà abordé au CS, Elisabeth Bautier rappelle que le Conseil du 11 Février a voté la mise en place d’une Commission de déontologie et que par la suite une expertise a été faite sur la thèse en question. L’analyse de la thèse fait apparaître un pourcentage de texte original de l’ordre de 35%, en ce cas le diplôme peut être annulé.

La proposition d’engager une démarche d’annulation est mise au vote.

Le CS vote à l’unanimité l’annulation du diplôme.

La formule « L’analyse de la thèse fait apparaître un pourcentage de texte original de l’ordre de 35% » intrigue. On imaginait que des experts chercheraient d’abord à déterminer les textes non originaux plutôt que les textes originaux. S’il peut exister des preuves de la non-originalité d’un texte, ici des preuves de plagiats, il existe le plus souvent seulement la conviction qu’un texte est original. Une fois prouvés 65% de plagiats, on peut seulement en déduire, non pas que les 35% qui restent sont originaux, mais seulement, à moins de preuves en mesure d’être présentées, qu’il y a dans cette thèse « au moins » 65% de plagiats.

DES COPIER-COLLER… PAS GRAVE DU TOUT

Si la formule du Conseil scientifique présentée ci-dessus est d’une curieuse logique, constatons qu’elle est parfaitement adaptée aux récentes déclarations de Khaldoun ZREIK dans le cadre du procès qu’il m’a fait à propos de la thèse de M. SANAN qu’il a dirigée.

– Extrait d’une interview réalisée par Anne MASCRET et publiée le 3 novembre 2011 par l’Agence AEF, 4 jours avant l’audience de référé :

Khaldoun ZREIK : (…) Quant au détail du mémoire en question, ce n’est que dans la première partie consacrée aux généralités et à l’ « état de l’art », qu’il contenait un taux très élevé de copier-coller à partir du mémoire d’un autre doctorant, d’une université de province – celui-ci étant inconnu et peu présent dans les publications et colloques dans le domaine. En plus, pour les deux doctorants, la langue française était une langue étrangère. En revanche, la partie strictement informatique de la thèse était tout à fait originale (1) ! Il n’y avait pas de plagiat des idées. Or je rappelle que, dans une thèse en sciences dures, c’est essentiellement sur la contribution technique personnelle du candidat que se concentre l’évaluation des membres du jury.

(1) Selon le rapport de la commission de déontologie ayant examiné ce cas, que l’AEF a pu consulter, 67 % de la thèse était copiée-collée [cette note accompagne l'interview, elle a été rédigée par Anne Mascret, journaliste de l'AEF].

– Extrait de la pièce n° 5 produite par Khaldoun ZREIK devant le tribunal. Il s’agit de la copie d’un droit de réponse qu’il a adressé le 20 octobre 2011 à l’Agence AEF.

Quant au détail du mémoire en question, il présentait effectivement dans toute la partie consacrée aux généralités et état de l’art, un taux très élevé de copier-coller à partir du mémoire d’un autre doctorant, d’une université de province (celui-ci étant inconnu et peu présent dans les publications et colloques dans le domaine). En plus, pour les deux doctorants, la langue française était une langue étrangère. Ces deux éléments  expliquent donc que les membres du jury de thèse ne se soient pas rendus compte des parties plagiées. Et l’on comprendra encore davantage leur situation en apprenant que les experts indépendants nommés par l’université pour évaluer la thèse ont jugé par contre la partie strictement informatique tout à fait originale (il convient ici de rappeler que, dans une thèse en sciences dures c’est essentiellement sur la contribution technique personnelle du candidat que se concentre l’évaluation des membres du jury).

À ces déclarations récentes et précises de Khaldoun ZREIK concernant la nature de la  thèse de Majed SANAN, il faut en ajouter d’autres, et notamment prendre en compte celle-ci que K. ZREIK a aussi choisi de présenter au tribunal (pièce n° 6). Il s’agit d’un mail adressé le 7 octobre 2011 à Jean-Luc MICHEL, Arlette BOUZON et David DOUYERE, responsables de la liste sur laquelle il se présentait au dernières élections du CNU (Ensemble pour la valorisation et la promotion des SIC):

L’affaire n’est pas grave du tout, [JN Darde] l’utilise pour faire croire que c’est grave.

Un étudiant étranger a copier coller d’une thèse d’un étudiant étranger qui a jamais édité des livres ni gagner des prix (donc pas un problème) ce qui explique que ni le jury ne s’en est pas rendu compte. Cet étudiant a été sanctionné par Paris 8 et l’affaire est close pour nous depuis.

Précisons que le plagié « d’une université de province » évoqué plus haut par Khaldoun ZREIK qu’il insiste à décrire comme « inconnu » et ici comme « étranger » n’était ni inconnu, ni étranger à K. ZREIK. Ce dernier avait retenu la candidature du plagié inconnu sur un poste de maître de conférences et l’avait invité à présenter ses travaux, en premier lieu sa thèse, le 10 mai 2006 devant la Commission de spécialiste qu’il présidait à l’université de Caen. Avant cette audition, Khaldoun ZREIK avait eu l’occasion de parler et échanger des mails à plusieurs reprises avec ce même inconnu. Il est donc d’autant plus étonnant qu’aujourd’hui K. ZREIK prenne tant de peine pour faire croire qu’il ne connaissait ni le plagié, ni la thèse plagiée dont un « copier-coller » d’une vingtaine de pages d’un seul bloc constitue l’essentiel de la première partie de la thèse de Majed SANAN que K. ZREIK a dirigée, validée et dont il continue a vanter l’originalité… Voilà une situation que des « experts » moins complaisants auraient pu facilement découvrir et qui aurait dû les conduire à pousser leurs investigations.

L’abondance des déclarations et la répétition des arguments excluent toute erreur sur l’interprétation des positions du Professeur Khaldoun ZREIK concernant la thèse de Majed SANAN. Comment ne prendrait-on pas au sérieux ce spécialiste de l’évaluation, expert lui aussi de l’AERES (Agence d’Évaluation de la Recherche et de l’Enseignement supérieur) et donc chargé de noter les laboratoires, diplômes et par conséquent ses collègues (cf illustration ci-contre).

Compte tenu des indications de la Commission déontologie de l’université Paris 8 et des déclarations de Khaldoun ZREIK, il est facile de situer les 35% de texte que les experts indépendants ont jugé « tout à fait original ». La thèse de Majed SANAN, produit light, compte 109 pages auxquelles il faut ajouter des annexes où a été placée la bibliographie (bibliographie elle-même composée pour l’essentiel de « copier-coller » issus des différentes bibliographies des thèses et articles plagiés).

Remerciements (eux aussi plagiés depuis une autre thèse !), table des matières et introduction générale (dont toute la « problématique » est du « copier-coller ») occupent les pages de 1 à 20. Les deux premières parties, de la page 20 à 62, « Recherche des textes » et « Langue Arabe » comportent respectivement quatre et deux chapitres.

La partie III, « Expérimentation » et la conclusion générale de la thèse, « Conclusion et perspectives », constituent la partie « tout à fait originale » dont K. ZREIK et les « experts indépendants » désignés par la Commission déontologie de Paris 8 ont fait l’éloge. Cette partie, pp 63 à 109, commence par une très brève introduction, se poursuit par les chapitres 7, 8, 9 et 10 qui ont chacun leur propre conclusion, et s’achève par des « Conclusion et perspectives » qui occupent les pages 107, 108 et 109.

Les quelques lignes de la courte introduction de cette partie III ont probablement été écrites par M. SANAN. La toute première phrase aurait dû retenir l’attention du directeur de  thèse et des membres du jury : « Dans cette partie on va présenter notre travail et contribution dans cette thèse », l’aveu candide que les parties I et II ne devaient pas grand chose à son propre travail.

Les chapitres 7, 8, 9 et 10 donnent une impression de « déjà vu » pour ceux qui ont déjà lu les articles-plagiats, il est vrai en langue anglaise, présentés dans l’article « Paris 8, procès et plagiats ». En effet cette troisième partie « originale » reprend pour l’essentiel, « Conclusion et perspectives » mises à part, la série de communications et articles-plagiats rédigés antérieurement à la soutenance de la thèse et co-signés par Majed SANAN, Mahmoud RAMMAL et Khaldoun ZREIK.

De cette troisième partie « tout à fait originale », nous nous limiterons ici à présenter dans le détail des plagiats du chapitre 7, du chapitre 9 et des « Conclusion et perspectives ». Nous laisserons les experts de Paris 8 revisiter seuls les chapitres 8 et 10. Notons seulement pour les y aider que ces chapitres 8 et 10 et leurs plagiats sont déjà abondamment cités dans des articles précédents mis en ligne sur ce blog depuis 2010 : Serials plagiaires, Autopsie d’une thèse plagiat, Bibliographie alibi…, La 71e section du CNU et la tolérance au plagiat et Paris 8, procès et plagiat.

La mauvaise foi des plagiaires, de leurs parrains et de leurs soutiens ne connaît aucune limite. Cela oblige  à se lancer dans un travail fastidieux pour être précis dans la présentation des plagiats. En conséquence, les textes peuvent être d’une lecture un peu indigestes…

* *

PLAGIAIRES : L’IDIOT DE LA FAMILLE

Partie III, chapitre 7

Dans ce chapitre 7, nous ne présenterons ici que la conclusion dans la mesure où c’est là que l’on s’attend pour une recherche « tout à fait originale » à trouver les signes les plus flagrants de cette originalité.

.

.

.

.

.

.

.

La conclusion du chapitre 7 de la thèse de M. SANAN (ci-dessus à gauche), commence page 71 et s’achève page 72. C’est en réalité une traduction en français d’un plagiat antérieur : la conclusion de l’article Internet arabic search engines studies (ci-dessus au milieu). Cette communication en langue anglaise, co-signée par Majed SANAN, Mahmoud RAMMAL et Khaldoun ZREIK, a été présentée en avril 2008 à Damas à la troisième « International Conference on Information & Communication Technologies », l’ICTTA08, parrainée par l’IEEE puis mise en ligne sur le site IEEExplore.

Les co-signatures, avant la soutenance, par un doctorant et son directeur de thèse d’une communication ou d’un article sont courantes. Ce qui l’est moins est que doctorant et directeur de thèse co-signent de simples « copier-coller » ou autres formes de plagiats. C’est en ce sens, et seulement en ce sens, que cette troisième partie de la thèse de Majed SANAN est un travail « tout à fait original ».

Le choix des « copier-coller » qui font office de conclusion à ce chapitre 7 de la thèse de M. SANAN est aussi, comme on peut le constater, un choix original tant il fait preuve de sottise. Ces « copier-coller » à usage d’une conclusion d’un chapitre d’une thèse soutenue en 2008 ont en effet été choisis non pas dans la conclusion d’un article déjà ancien, de 2002 – Empirical Studies in Strategies for Arabic Retrieval de XU, FRASER et WEISCHEDE (voir illustration ci-dessus, fichier de droite) – mais au contraire dans son introduction ! Ce choix limite la possibilité d’afficher dans la thèse une conclusion qui pourrait ne serait-ce qu’un instant ressembler à un propos original, sauf aux yeux aveugles de Khaldoun ZREIK, des membres du jury de soutenance et des experts indépendants de la Commission déontologie de Paris 8.

La conclusion de ce chapitre 7 de la thèse de M. SANAN, soutenue en 2008, commence ainsi:

7.5    Conclusion
La langue arabe est l’une des langues les plus largement répandues dans le monde, pourtant il y a relativement peu d’études sur la restitution par des moteurs de recherche de documents pertinents en arabe.

Il s’agit la traduction des toutes premières lignes de l’introduction de l’article « Empirical Studies in Strategies for Arabic Retrieval », publié en 2002.

1    INTRODUCTION
Arabic is one of the most widely used languages in the world, yet there are relatively few studies on the retrieval of Arabic documents in the literature.

Quand on a une si bonne idée – plagier en mode de conclusion en 2008 une phrase très générale qui s’affichait en simple introduction en 2002 –, il serait dommage de ne pas exploiter le filon jusqu’au bout. C’est ce que va faire notre plagiaire tout le long de cette partie « tout à fait originale » pour lancer les conclusions des quatre chapitres, 7, 8, 9 et 10 de cette partie III (voir ci-contre).

C’est cette originalité à répétition qui a sans aucun doute séduit K. ZREIK et les experts indépendants de la Commission déontologie.

Avec une telle conclusion, on devine que le reste du chapitre est de la même veine. On peut en effet  faire facilement correspondre le texte en français de ce chapitre 7 de la thèse, les plagiats du texte en anglais co-signé SANAN, RAMMAL et ZREIK et les différentes sources de ces « copier-coller ».

Partie III, chapitre 9

Nous nous limiterons ici à présenter dans le détail une seule des sources de plagiat repérables dans ce chapitre, la plus importante : l’article publié en 2006 par Leila KHREISAT : Arabic Text Classification Using N-Gram Frequency Statistics A Comparative Study.

Pour les autres sources de plagiats de ce chapitre 9 de la thèse de Majed SANAN, on consultera l’article Arabic supervised learning method using N-gram, aussi signalé comme Arabic documents classification using N-gram, co-signé SANAN, RAMMAL et ZREIK et publié avant la soutenance de cette thèse (cf Paris 8, procès et plagiats). Ce chapitre 9 est en effet pour une grande part la traduction de cet article.

Dans ce chapitre 9, on retrouve du KHREISAT à 4 reprises : dans l’introduction (9.1), la présentation des formules mises en œuvre (9.5), dans la présentation de la méthode (9.6.3)  et dans la conclusion (9.7).

Introduction (9.1) :

.

.

.

.

Avant d’aborder la partie « expérimentation » rappelons la déclaration de Khaldoun ZREIK (déjà citée plus haut) à l’agence AEF.

En revanche, la partie strictement informatique de la thèse était tout à fait originale ! Il n’y avait pas de plagiat des idées. Or je rappelle que, dans une thèse en sciences dures, c’est essentiellement sur la contribution technique personnelle du candidat que se concentre l’évaluation des membres du jury.

Un point de vue qui tombe à pic avant d’apprécier l’originalité de la « contribution technique personnelle » de M. SANAN vantée par K. ZREIK et ses « experts indépendants » dans ce chapitre 9 .

La présentation des formules mises en œuvre (9.5)


.
.
.
.
.
.

.

.

On retrouvera ici encore le même processus qu’antérieurement : la présentation de la formule « précision et rappel » dans le chapitre 9 de la thèse de Majed SANAN est la traduction de cette même présentation dans l’article en anglais Arabic documents classification using N-gram, co-signé SANAN, RAMMAL et ZREIK, formule elle-même issue d’un « copier-coller » depuis l’article de Leila KHREISAT.

On remarquera que le « copier-coller » depuis l’article de Leila KHREISAT, vers l’article SANAN-RAMMAL-ZREIK, est d’autant plus indiscutable qu’il se fait coquilles typographiques comprises (absence d’espaces) :

CC  :number of correct categories(classes) found.

9.6.3 Expérience

.

.

.

.

.

Dans la thèse de Majed Sanan, toutes les étapes de l’opération (elles figurent ci-dessous en bleu) sont empruntés à l’article de KHREISAT :

Pour segmenter les textes de corpus nous avons utilisé le logiciel que nous avons programmé en VB.NET (voir Annexe B).

La génération du profil des N-grammes se résume dans les étapes suivantes :

1) Diviser le texte en “tokens” qui consistent seulement de lettres.

2) On calcule tous les N-grammes possibles, pour N=3 (Tri-grammes)

3) On calcule la fréquence des occurrences de chaque N-gramme.

4) Faire sortir les N-grammes dans l’ordre décroissant de leurs fréquences.

5) Cela nous donne le profil N-gramme d’un document. Les profils sont sauvegardés dans des fichiers textes.

Chaque document pour être classifié, passe par la phase de prétraitement, puis le profil N-gramme est généré comme décrit ci-dessus. Le profil N-gramme de chaque document texte (profil document) est comparé aux profils de tous les documents dans les classes d’apprentissage, du point de vue similarité.

Ce plagiat de la méthode pour mettre en œuvre « l’expérimentation », une partie en principe « tout à fait originale »  est le résultat du même processus que celui observé dans les cas précédents : traduction en français d’un premier « copier-coller » en anglais, co-signé SANAN, RAMMAL et ZREIK, depuis l’article de Leila KHREISAT.

Quant à la conclusion de ce chapitre 9, après la reprise du refrain emprunté à l’introduction de XU, FRASER et WEISCHEDE « La langue arabe est l’une des langues les plus largement répandues dans le monde, pourtant il y a relativement peu d’études sur la restitution par des moteurs de recherche de documents pertinents en arabe. », elle paraphrase la conclusion de l’article de Leila KHREISAT.

On trouvera dans les chapitres 8 et 10 les mêmes types de « copier-coller » que ce que nous venons de présenter dans les  chapitres 7 et 9.

Un avis …

Le Professeur Alain LELU s’est frotté aux N-grammes dans les années 1997-2001. Il a relu les 4 chapitres 7, 8, 9, et 10 de cette partie III. Comme il l’explique ci-dessous, un corpus qui prête à la « confusion » et une « funeste erreur » de SANAN-RAMMAL-ZREIK en plagiant une formulation ambigüe de Leila KHREISAT que l’on retrouve dans la thèse vont peser très lourds et produire des résultats « calamiteux » dans l’article collectif comme dans la thèse de Majed SANAN. Des résultats qui sont donc « originaux » au moins pour être à ce point dénués de tout intérêt. Que dit Alain LELU qui s’adresse ci-dessous à des familiers de ce domaine ?

Comment se situe le travail expérimental présenté par rapport aux travaux antérieurs ?

- Sous l’aspect du corpus utilisé :

Alors que les organisateurs de la campagne d’évaluation TREC 2001 avaient rassemblé 384 000 dépêches AFP du fil Arabic Newswire, corpus public qui fait référence depuis, l’auteur a extrait 2667 documents du Journal officiel libanais : c’est une bonne idée, le nombre de documents est conséquent, mais ceux-ci sont définis très vaguement – on ne sait s’il s’agit des minutes du Parlement, ou des textes de lois et décrets, ou des deux, et l’annexe A, censée nous éclairer, n’apporte rien, si ce n’est davantage de confusion.

L’expérience n’est donc pas vérifiable et reproductible pour des chercheurs qui auraient l’autorisation d’accès à cette base à accès restreint, encore moins pour les autres, alors qu’Ahmed Abdelali, dans son excellente synthèse de 2004 sur la recherche d’information en langue arabe, voyait les progrès en ce domaine venir en priorité de la diversification géographique et thématique des corpus mis à disposition des chercheurs, plus que des méthodes d’analyse.

Sous l’aspect des méthodes d’analyse :

Le chapitre 7, le premier de la partie III (expérimentation), mis à part ses passages copiés-collés, ne dit pas comment le corpus choisi s’est trouvé indexé par les 3 moteurs de recherche Idrisi, Google et Yahoo. Sa problématique et ses résultats sont très en retrait – on trouve un simple constat d’échec – par rapport aux publications [Moukdad 2002, 2004] qui analysent finement les comportements relatifs des moteurs généralistes et des moteurs spécifiques à la langue arabe confrontés à la variabilité morphologique des mots de cette langue.

Le chapitre 8 décrit l’utilisation de l’indexation du corpus par les N-grammes. Les résultats obtenus dans la campagne d’évaluation TREC 2001 avec la même technique sont confirmés (indice de qualité « F-score » autour de 35-40%), mais l’auteur n’apporte rien de plus. TREC 2001 et 2002 avaient montré aussi la supériorité de l’indexation de la langue arabe par lemmes (« F-score » autour de 50%), après analyse morpho-syntaxique. Pourquoi ne pas être parti du meilleur de l’état de l’art ?

Un gros contresens est fait sur la notion de « recherche booléenne », non décrite dans le texte, mais dont le tableau 8.6 apprend qu’elle met en jeu des caractères, et non des mots ! Avec quels opérateurs booléens ? Mystère. D’ailleurs les résultats avoués dans ce tableau sont calamiteux…

Le chapitre 9 comporte des généralités et définitions de notions banales en recherche d’information, largement copiées/collées, mais aussi une originalité : la notion d’« Inverse Class Frequency », définie aux sections 9.4.1 et 9.5. Hélas celle-ci provient d’un malentendu funeste issu d’une formulation elliptique de Leila Khreisat  (1) :

« CC = nombre de catégories (classes) correctes trouvées » , qu’il fallait comprendre :

« CC = nombre de documents de catégories (classes) correctes trouvés »

Pas étonnant que l’utilisation de cette notion donne des F-scores de l’ordre de 3 millièmes, contre 48% pour le brave vieux cosinus !

Le chapitre 10 présente une méthode naïve de construction de classes de mots arabes proches, par regroupement de ceux qui partagent un trigramme, 2 trigrammes, etc. Elle aboutit à des répartitions très déséquilibrées de mots dans les classes, typiquement : une grosse classe + plusieurs milliers de très petites. Si aucun tableau numérique ne nous est épargné, la conclusion est sans illusion sur la qualité de l’approche !

Visiblement l’auteur ignorait les travaux faits dans les années 1997-2001 au sein de son propre laboratoire d’accueil Paragraphe, et qui avaient abouti à la thèse de Mohamed Hallab en 2001, dans laquelle était décrite une procédure non-naïve de construction de classes de mots à partir des N-grammes. Ces travaux ont dû également échapper aux enseignants-chercheurs de ce même laboratoire de Paris 8 qui le suivaient et ont examiné sa thèse.

On a par ailleurs de gros doutes tout le long de cette partie III  sur la compréhension par l’auteur de notions de base de sa discipline : il définit le modèle vectoriel par le calcul de similarité dans l’espace des seuls mots communs à une requête et à un document (point de vue dangereux pour calculer des cosinus !) ; les requêtes booléennes ne semblent pas mieux comprises (cf. supra) ; on sent partout une hésitation sur les domaines respectifs de l’indexation par les mots, par les N-grammes de caractères, par les N-grammes de mots…

Conclusion :

Les parties expérimentales de cette thèse, quand elles ne sont pas copiées/collées, sont de grossières démarques des travaux antérieurs, un simple remplissage « scientifique » comme on en rencontre dans les mémoires de mauvais étudiants de master informatique, du n’importe-quoi-pourvu-que-ça-ressemble-de-loin-à-de-la-science… Le (non-)suivi de cette thèse est à blâmer autant, sinon plus, que le texte rendu.

En bref, les résultats et conclusions n’apportent rien par rapport aux travaux menés sur le sujet dans les années 2001-2004.


(1) Dans le texte de L. Khreisat, on lit :

Precision and recall are defined in [1] as follows:

Precision = CC /TCF

Recall = CC/TC

Where,

CC :number of correct categories(classes) found.

TCF : total number of categories found

TC : total number of correct categories

[1] R. Baeza-Yates, and B. Ribeiro-Neto, Modern Information Retrieval, Addison Wesley, 1999.


Le professeur Alain LELU, a été membre du laboratoire Paragraphe à une époque antérieure à l’arrivée d’Imad Saleh à sa direction (I. Saleh en est co-directeur depuis 2002 et directeur depuis 2004). Il a aussi attesté devant le tribunal d’autres incohérences de cette thèse et de celles de travaux co-signés SANAN-RAMMAL-ZREIK qui auraient dû à elles seules alerter les membres du jury. Il précisait notamment qu’écrire en 2008 « Testing the retrieval effectiveness of the Arabic language has not yet been undertaken », une phrase « copier-coller » depuis un texte de Charlotte Wien rédigé en 1996 aurait dû retenir l’attention de quiconque est un tant soit peu au fait du domaine des moteurs de recherche sur Internet. Il n’est pas si difficile de comprendre que les perspectives de recherche sur le traitement de la langue arabe par les moteurs de recherche ont quelque peu évolué de 1996 à 2008 !

Conclusion et perspectives

Les chapitres 7 et 9 plus particulièrement revisités par nous, les quatre chapitres 7, 8, 9 et 10 lus et évalués par Alain LELU, passons directement  aux « conclusion et perspectives » (pp. 107, 108 et 109) qui suivent les chapitres 7, 8, 9 et 10 et constituent la conclusion générale de cette thèse.

Dans la partie « tout à fait originale » de cette thèse, distinguée par Khaldoun ZREIK et les experts indépendants de la Commission déontologie de l’université Paris 8, on devrait s’attendre à ce que les « conclusion et perspectives » qui la terminent soient l’essence même de l’originalité.

On est un peu déçu…

Nous avons ci-dessous procédé au coloriage des « copier-coller » du texte de M. SANAN et inséré les sources des textes plagiés. Nous ne commettrons pas l’imprudence d’affirmer que le peu qui n’a pas été colorié (en bleu, vert, fushia et orange) est « original ». On conviendra que de voir qualifiées de « tout à fait originale » ces « conclusion et perspectives » alors qu’elles sont issues de « copier-coller » pour au moins 66 % conduit à s’interroger sur la qualité de la prétendue expertise de la Commission de déontologie évoquée par Khaldoun ZREIK.

page 107

Conclusion et perspectives

L’objectif d’un système de recherche d’information (SRI) est de retrouver parmi une masse volumineuse de documents ceux qui répondent précisément au besoin d’un utilisateur formulé par le biais d’une requête en langage naturel. La principale difficulté pour ces SRI est d’établir une correspondance entre l’information recherchée et l’ensemble des documents d’une collection. Pour y parvenir ils se fondent généralement sur un appariement entre les mots contenus dans la requête et ceux potentiellement pondérés qui représentent le contenu de chaque document. La pertinence d’un document est alors évaluée en fonction des termes communs qu’il possède avec la requête.

.

.

Ce travail se situe dans le cadre de la recherche d’information dans la langue arabe. En effet, la phase de recherche consiste à retrouver les documents les plus pertinents par rapport à une requête donnée. En général, les documents retournés sont ordonnés à l’aide d’une mesure de similarité calculée entre le document et la requête. La phase d’indexation consiste à construire au préalable une structure d’accès aux documents qui facilitera la phase de recherche. Plus la phase d’indexation est sophistiquée, plus la phase de recherche sera facile.

Dans ce manuscrit, nous avons essayé d’augmenter la performance de la recherche d’information dans les documents arabes en essayant plusieurs approches statistiques dans la phase d’indexation.

Après avoir choisi le corpus des documents du journal officiel libanais, et après avoir développé un logiciel qui pourra ultérieurement faire le but d’un moteur de recherche qui pourra être utile pour les laboratoires afin de tester les différentes méthodes de segmentation, nous avons commencé à étudier la performance des moteurs de recherche actuels (Google, Yahoo et Idrissi cas « keyword matching ») dans le cas des documents arabes. Le résultat était très insuffisant ce qui nous a poussé à changer la méthode d’indexation en utilisant l’approche statistique.

Notre approche principale était basée sur la méthode N-gramme. Avec cette méthode on a étudié la performance de la recherche d’information, la classification supervisée et non supervisée.

Le résultat était meilleur que celui des moteurs actuels utilisant le « keyword matching », mais reste toujours insuffisant.

Enfin, nous avons essayé de suivre une approche distributionnelle, qui est proche de « concept matching » mais en se limitant toujours à la distribution des mots dans les documents et les distances entre eux, ainsi que leur distribution dans les phrases. Même cette approche ne nous a pas aboutis à de bonne performance.

page 108

La conclusion principale de ce travail est que les méthodes d’indexation actuelles utilisées par les méthodes de recherche sont insuffisantes dans le cas des documents en langue arabe. Même toutes les approches se limitant à la statistique pure ou à la distribution ne sont pas suffisantes et n’amènent pas à de bons résultats et à de résultats acceptables surtout qu’il n’y a pas des relations linguistiques entre les termes.

Donc il est indispensable de faire intégrer l’approche linguistique, en réfléchissant à la forme et la structure de document électronique qui se rapproche de la notion du web sémantique.

Perspective 1 : Approche Sémantique

Le Web sémantique apparaît comme la prochaine génération du Web, dont le but est de donner à l’information sur le Web une représentation sémantique afin d’être accessible et compréhensible par des machines.

Les ressources sémantiques (thésaurus, ontologies, etc.) ont un apport considérable pour le traitement des documents textuels. Leur utilisation en Recherche d’Information (RI) peut intervenir lors de la phase de recherche ou lors de la phase d’indexation.

L’intérêt d’utiliser des ressources sémantiques en recherche d’information est de pouvoir retourner, lors d’une recherche par similarité, les documents qui partagent avec la requête le maximum de concepts plutôt que le maximum de mots-clés. Les réseaux sémantiques ont montré leur apport en expansion de requêtes [Lu & Keefer, 1994]. Le but de l’expansion de requête est soit d’élargir l’ensemble de documents retournés ou d’augmenter la précision. Dans le premier cas, la requête peut être étendue en ajoutant des termes similaires à ceux de la requête. Dans le deuxième cas, les termes peuvent être complètement changés pour reformuler la requête, une technique utilisée dans les retours arrières sur pertinence [Buckley et al., 1994].

Les documents peuvent être indexés par un groupe de concepts, où on sait qu’un tel document traite des concepts A et B mais où on ne connaît pas les relations entre eux dans le texte. Une autre méthode attribue à chaque document une description sémantique où les concepts sont représentés avec leurs relations sémantiques [Alhulou, Napoli & Nauer 2003]. Cette représentation confère un grand pouvoir d’expression mais peut par ce fait ralentir les traitements et la construction des descriptions sémantiques associées à chaque document n’est pas une tâche facile.

L’indexation automatique dans les deux cas pose des problèmes notamment celui de l’ambiguïté des termes (homonymie et polysémie) et on a généralement recours à des outils sophistiqués de Traitement Automatique des Langues (TAL). Mais ces techniques ne résolvent pas totalement le

page 109

problème et il faut toujours faire le compromis entre la finesse des traitements et la complexité des systèmes. [Krovetz, 1997] a montré la nécessité d’indexer par les concepts (i.e. sens des mots et leurs contextes) ainsi que les mots. Indexer les documents par les concepts uniquement peut induire des erreurs car les techniques de désambiguïsation ne sont pas complètement fiables et en se basant uniquement en dessus risque d’entraîner une perte d’information.

Perspective 3: Les ontologies dans la recherche d’information Face à l’explosion du nombre de sources d’informations potentiellement accessibles via le Web, il est crucial de faciliter l’accès aux données en les présentant à un niveau d’abstraction plus pertinent pour des interlocuteurs humains. L’utilisateur pose alors ses requêtes au travers d’une ontologie décrivant le contenu sémantique des sources de données disponibles. Les ontologies sont des spécifications explicites de conceptualisations souvent considérées comme des modèles réutilisables, partageables. La conception d’une ontologie est formée d’une abstraction et une représentation. Une abstraction afin de déterminer quelles connaissances représenter, avec quel niveau de précision, de granularité, etc… Et une représentation afin de déterminer le formalisme de représentation à adopter, et représenter les connaissances dans le formalisme retenu. Les connaissances qui composent une ontologie sont exploitables pour faciliter la recherche d’informations dans l’immense gisement de données réparties hétérogènes que constitue le Web.

Nous pouvons présenter au futur une approche basée sur l’analyse de concepts formels dans le but d’augmenter la performance de la recherche d’information. [N.Messai et al.]

* *

Sources des « copier-coller »

MOREAU Fabienne et SÉBILLOT Pascale (2005) Contributions des techniques du traitement automatique des langues à la recherche d’information. Rapport de recherche n° 5484 (INRIA) [En ligne sur le site d’archives ouvertes hal : http://hal.inria.fr/inria-00070523/PDF/RR-5484.pdf ].

ZARGAYOUNA Haïfa et SALOTTI Sylvie (2004) Mesure de similarité dans une ontologie pour l’indexation sémantique de documents XML [En ligne sur le site du Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS) : http://liris.cnrs.fr/~ic04/programme/articles/Zargayouna-IC2004.pdf].

MEDINA-RAMIREZ  Carolina (2003). Contribution à la recherche d’information sémantique : Capitalisation des connaissances dans une mémoire documentaire d’interactions géniques. Résumé d’une thèse de doctorat de l’université de Nice – INRIA Sophia Antipolis. [En ligne sur le site de l’IRIT (Institut de Recherche en Informatique de Toulouse) : www.irit.fr/GRACQ/article.php3?id_article=146 ].

REYNAUD Chantal (2000). Ontologies et recherche d’information (introduction au cours et support de cours ppt, séminaire du 10 octobre 2000). [En ligne. Document ppt accessible depuis le site de l’IRIT : http://www.irit.fr/GRACQ/article.php3?id_article=93].

Une thèse d’informatique soutenue en septembre 2008 sur la recherche d’information sur Internet, un sujet qui évolue à une vitesse phénoménale, qui propose en guise d’ultime « perspective » le « copier-coller » d’un support de séminaire proposé en octobre 2000, il fallait oser ! Force est de le concéder à Khaldoun ZREIK, à Élisabeth BAUTIER, vice-présiente du CS, aux experts désignés par la Commission déontologie de l’université Paris 8 et à son président Pascal BINCZAK : « c’est tout à fait original ».

*

LA COMMISSION DÉONTOLOGIE ET SES EXPERTS : LE DERNIER STADE DE L’AVEUGLEMENT  ORGANISATIONNEL  ?

D’autres caractéristiques de cette thèse ont étonnamment échappé, non seulement au directeur de thèse et aux membres du jury, mais aussi à ces « experts indépendants » de la Commission déontologie de l’université Paris 8 pourtant avertis de la nature particulière de cette thèse. Les mêmes caractéristiques ont pourtant immédiatement sauté aux yeux du professeur Jean-Hugues CHAUCHAT, directeur de la thèse de Radwan JALAM (juin 2003) qui constitue l’essentiel de la première partie de la thèse de Majed SANAN (septembre 2008). Une situation qui donne corps à sa remarque (voir le mail ci-contre de son intervention dans un forum du SGEN) : Bien sur, les solidarités internes de groupes universitaires freinent la mise à jour des cas de plagiat, même avérés.

Une fois en possession d’un fichier de la thèse de M. SANAN, Le professeur Jean-Hugues CHAUCHAT a aisément repéré les 17 pages d’un seul bloc (80% de la partie I de la thèse de Majed SANAN) volées à son ancien doctorant, Radwan JALAM (voir ci-contre la page 8 de la thèse de R. JALAM) J. H. CHAUCHAT a aussitôt repéré le premier indice qui met en cause non seulement la qualité de la direction de thèse de Majed SANAN mais permet de s’interroger sur le rôle des membres du jury de cette thèse. Il s’agit du premier paragraphe de l’introduction du chapitre 2 :

Catégorisation des textes

2.1    Introduction

La quantité d’information disponible sous format électronique sur Internet ou dans l’intranet des entreprises croît de façon extrêmement rapide. Par exemple, le 22 juillet 2002, Google avait recensés 2.073.418.204 pages ; le 16 mars 2003, ce nombre est passé à 3.083.324.652 pages, soit moitié plus en moins d’un an.

Cette comparaison de données chiffrées de Google entre juillet 2002 et mars 2003, parfaitement cohérente dans la thèse de Rawdam JALAM soutenue en juin 2003 (voir plus haut la page 8 de cette thèse), signe dans la thèse de Majed SANAN soutenue en septembre 2008 un plagiat. Ceci d’autant plus que M. SANAN, n’était pas même déjà inscrit en thèse en 2003.

L’autre remarque du Professeur CHAUCHAT qui éclaire non seulement l’attitude du plagiaire mais met en cause son directeur de thèse et la lecture des membres du jury, concerne la bibliographie du plagiaire (que nous avions déjà évoquée dans Serials plagiaires mis en ligne au printemps 2010) :

La bibliographie de M. SANAN ne comporte que 5 éléments postérieurs à 2003 [sur 83] dont 3 sont signés par le directeur de thèse. Une grande partie de cette bibliographie est issue de celle de R. JALAM dont la thèse n’est même pas citée !

Cette remarque est d’autant plus significative que la thèse est censée traiter en 2008 de la recherche d’information sur Internet à l’aide des moteurs de recherche. Un sujet d’actualité en pleine évolution. Trouver « tout à fait original » un travail sur ce thème qui reprend en 2008  des résultats de recherches  qui ne vont pas au delà de 2003 est un véritable tour de force que ce soit pour le directeur de thèse, pour les membres du jury comme pour les experts indépendants de la Commission déontologie de l’université Paris-8.

Le professeur CHAUCHAT concluait ainsi  son attestation transmise au tribunal :

La crédibilité de l’université française est en jeu. Nous devons remercier Jean-Noël Darde du travail sérieux qu’il réalise et des analyses factuelles des plagiats qu’il publie. La vérité sur certaines dérives ou certain laisser-aller doit se faire, même si cela heurte certaines défenses internes à notre corps universitaire.

Sauf à faire l’hypothèse, que l’on ne peut jamais totalement exclure, d’une incompétence abyssale, il est difficile de croire que des universitaires ne se soient pas rendu compte des incohérences et des plagiats de cette thèse. C’est pourquoi nous privilégions l’hypothèse que cette thèse n’a jamais été réellement lue ni par son directeur ni par les membres du jury de soutenance et pas même par des experts de la Commission déontologie de l’université Paris 8.

On remarquera que la première version du compte-rendu du Conseil scientifique de Paris 8 – « Elisabeth Bautier rappelle que le Conseil du 11 Février a voté la mise en place d’une Commission de déontologie et que par la suite une expertise anonyme a été faite sur la thèse en question. L’analyse de la thèse fait apparaître un pourcentage de texte original de l’ordre de 35%, en ce cas le diplôme peut être annulé » –, dont nous avons déjà souligné l’étrangeté, à été modifié dans une deuxième version en : « Elisabeth Bautier rappelle que le Conseil du 11 Février a voté la mise en place d’une Commission de déontologie et que par la suite une expertise anonyme a été faite sur la thèse en question. ». C’est aujourd’hui la seule version de ce relevé de délibérations accessible sur le site de l’université Paris 8. De l’expertise qui fait apparaître 35% d’original à l’« expertise anonyme », on reste dans le monde de l’étrange.

Dans une communication éclairante, « Le plagiat à l’université : un ‘‘aveuglement organisationnel » ? » présentée au colloque « Le plagiat de la recherche scientifique » (2), David DOUYÈRE, se référant aux travaux du sociologue Pierre TRIPIER dressait ce tableau de « l’aveuglement organisationnel » face aux plagiats à l’œuvre dans l’institution universitaire :

La question n’est pas seulement de savoir pourquoi et comment Untel a plagié la thèse ou l’article de Unetelle, mais comment l’institution rend cela possible, voire le tolère, ne se donne que peu la possibilité de le voir. Incitation à se taire, volonté de ne pas nuire, étouffement de l’affaire, ne pas choquer, « cela pourrait se retourner contre nous » : les mécanismes de dissuasion de l’incitation à révéler une affaire sont nombreux. « Peur du scandale », protection du puissant dans des logiques de renvois d’ascenseur, jeux relationnels et de réseau, protection répartie sur un collectif : ces mécanismes, courants dans les espaces universitaires, en viennent à étouffer une parole. Ceci touche bien évidemment la communication. Il s’agit de l’interdire. Un « silence organisationnel » se met en place. Le silence a ici une fonction d’action ; faire taire, empêcher que l’on dise, est un acte.

La présentation de cette communication le jour même où son propre auteur, David DOUYÈRE, aujourd’hui membre du CNU, était conduit à se solidariser (3) avec Khaldoun ZREIK, un de ses co-listiers sur la liste « Ensemble pour… » qui se présentait aux élections du CNU (71e section) et dont D. DOUYERE ne pouvait ignorer les plagiats, ne peut mieux illustrer la force de ces mécanismes qui étouffent et interdisent la dénonciation du plagiat à l’université dès qu’elle est associée au nom d’un enseignant-chercheur plagiaire. Et ceci, surtout si ce dernier occupe des positions d’influence, ce qui est le cas de K. ZREIK à travers ses nombreuses fonctions d’évaluation et la maison d’édition EUROPIA (http://europia.org/) propre à lui assurer une clientèle captive et fidèle.

*

On observera qu’une autre expertise a minima et toujours anonyme, comme c’est l’usage à la Commission déontologie, a permis de sauver la thèse de S-H S. Dirigée par Patrick CURRAN, la soutenance de cette thèse, autorisée dans des conditions déplorables par Imad SALEH, avait été présidée par Gilles BERNARD, ancien vice-président de l’université Paris 8 et toujours membre de son Conseil administration (voir Thèse-plagiat : le sixième juré et les félicitations). Cette thèse dont, selon les documents présentés par K. ZREIK au tribunal, la validation aurait été confirmée par les « experts » de la Commission déontologie de Paris 8 est pourtant surtout remarquable par l’étendue et la grande variété de ses plagiats. Cette thèse, ses plagiats et ses mystères qui restent à résoudre seront présentés sur ce blog dans la deuxième partie de cette étude.

Le plus choquant dans ces affaires n’est plus l’existence de plagiats et de médiocres plagiaires, mais bien les réactions à ces situations de la direction de l’université Paris 8 et de ses instances, tout particulièrement le Conseil scientifique et la Commission déontologie. Nous avons récemment saisi le Bureau de la 71e section du CNU et la présidente de la CP-CNU de ce dossier. Nous avons aussi sollicité auprès du président de l’Agence d’évaluation de la Recherche et de l’Enseignement supérieur l’évaluation des thèses et articles qui sont au cœur des débats du procès qui nous est fait par K. ZREIK, lui-même expert de l’AERES.

* * *

Notes

(1) La vice-présidente du Conseil scientifique de l’université, Élisabeth Bautier, exprime souvent un point de vue original sur le plagiat. Récemment, tout à la défense d’une courte notice nécrologie plagiée, signée et diffusée en interne par la présidence de l’université, elle écrivait à l’ensemble des membres du CA et du CS de Paris 8 : « l’originalité ou la créativité dans les notices nécrologiques est dépourvue de sens, en particulier lorsqu’elle est le fait d’une institution, et le recours à des sites n’a rien de choquant dans un domaine particulièrement factuel« .

(2) Le Plagiat de la recherche scientifique : ce colloque s’est déroulé à l’université Paris 2 (Panthéon-Assas) le 20 et 21 octobre 2011. Actes à paraître au premier semestre 2012 à Lextenso Éditions.

(3) Khaldoun ZREIK a produit ce document (pièce n° 16) devant la 17e Chambre correctionnelle. Il s’agit d’un mail où, quelques minutes avant l’ouverture du Colloque Le plagiat de la recherche auquel il participait, David Douyère rend compte à ses 32 co-listiers, dont K. Zreik, de la liste Ensemble pour la valorisation et la promotion des SIC des résultats médiocres du collège A (professeurs) aux élections du CNU (71e section) : « La campagne à caractère diffamatoire qui a visé dans la liste « Ensemble » certains collègues du collège A n’a sans doute pas servi la liste dans ce collège… » (Souligné par D. Douyère). Dans son assignation en référé, K. Zreik arguait de ce mail pour prétendre qu’il nous doit de ne pas avoir été élu au CNU… et pour, en conséquence, réclamer compensation aux préjudices subis (demande d’une provision de 10.000 euros pour ses préjudices professionnels).

* * *

https://twitter.com/#!/archeocopcol


Subscribe to Commentaires

5 réponses to “[1] L’excellence et les drôles d’expertises de la Commission déontologie de l’université Paris-8”

  1. Stephane Gachet (informaticien, ancien formateur) :
    « K. Zreik arguait de ce mail pour prétendre qu’il nous doit de ne pas avoir été élu au CNU… et pour, en conséquence, réclamer compensation aux préjudices subis (demande d’une provision de 10.000 euros pour ses préjudices professionnels). »
    Quelle est la relation entre le fait de ne pas avoir été élu au CNU et les préjudices subis, estimés à 10 000€ ?. Un élu au CNU perçoit-il une contre-partie financière pour l’exercice de sa fonction ?

    Réponse de JND : Comme je le précisais, la demande de 10.000 euros de provision valait pour l’ensemble des préjudices professionnels qu’il aurait subi, non pas tant pour être co-auteur de plagiats (à ce titre, il ne risque rien et garde toute la confiance du président de Paris 8 et de ses co-listiers aux élections au CNU, le Conseil national des universités), mais pour la publicité donnée à cette curieuse pratique sur mon blog.
    Ne pas avoir été élu au CNU (Conseil national des universités) était compris dans le lot des préjudices dont K. Zreik s’est plaint. L’assignation en référé ayant été rejetée, cette demande l’a aussi été. Il reste à connaître les décisions du tribunal quand l’affaire sera jugée au fond.
    Note cocasse : en 2008, la direction de thèses donnait encore droit au versement de la Prime d’Encadrement Doctoral et de Recherches (PEDR). Notre collègue a donc très certainement été primé pour la direction de la thèse mise en cause dans cet article.

     

    Stéphane GACHET

  2. Paulo de Carvalho (Professeur émérite; grammaire, et linguistique latine. Université Michel de Montaigne-Bordeaux 3) :

    Cher collègue Jean-Noël Darde,
    À mesure que je prends connaissance de vos différents textes consacrés à cette affaire, je suis à la fois admiratif et effaré, consterné, abasourdi :
    1. admiratif, oui, devant votre rigueur et votre minutie. Et je ne puis, une fois encore, que vous renouveler mon soutien. Oui, continuez, vous faites œuvre de salubrité publique.
    2. effaré, consterné, abasourdi: elle est tombée bien bas, notre pauvre Université. Et la fin de ce document est proprement renversante: depuis quand le fait de n’avoir pas été élu à une instance universitaire est cause d’un préjudice financier ? Quel aveu !
    Un dernier mot: avez-vous envisagé la possibilité d’un réseau, voire d’une mafia du copier-coller ? Une mafia dont l’origine ne serait peut-être pas trop difficile à identifier. Mais je le sais bien: ce que je viens de dire tomberait certainement sous les foudres du politiquement correct. Pour ma part, je n’en pense pas moins…
    Sursum corda,
    Bien à vous,
    Paulo

    Réponse JND : Je ne me risquerais pas à parler de mafia du copier-coller. Par contre, il y a bien un réseau qui se tisse mécaniquement dès que des plagiaires, ou ne serait-ce que des tolérants au plagiat, se trouvent dans des structures d’évaluation (CS, Comités de sélection, CNU, AERES…), ou encore des structures éditoriales, et sont conduits, par simple instinct de conservation, à éviter la promotion d’intolérants au plagiat. Il y a bien formation de réseaux clientélistes qui rendra de plus en plus difficile le traitement du problème.

     

    Paulo DE CARVALHO

  3. Vivien BADAUT, post-doctorant :
    Bravo pour ce travail de fond qui met en lumière des pratiques qui déshonorent la profession et qui sont pourtant bien plus communes qu’on ne pourrait le croire.
    Votre travail est salutaire, merci.

     

    Vivien BADAUT (post-doctorant)

  4. Benoît DUPONT, ingénieur. Diplômé de l’Université de Technologie de Compiègne (UTC) :

    J’ai lu en parallèle la déclaration indignée de Patrick Curran « LETTRE OUVERTE DU TREIZIÈME MOIS ».
    C’est pas bien ça, Mr Darde de dire que le roi est nu. Et pi, ça affecte gravement la fin de carrière de Mr Curran, hein. Pfff, encore un coup porté à l’Université, assiégée qu’elle est par les forces ultra-libérales.
    Plus sérieusement, heureusement qu’il y a des Darde pour maintenir allumée la petite flamme de l’exigence intellectuelle…

     

    Benoît DUPONT

  5. Gwenola Ricordeau est maître de conférences en sociologie à l’université Lille 1 (sciences et technologies).

    Bonjour,
    Je suis maître de conférences en sociologie et j’ai, il y a quelques mois, été plagiée : deux personnes ont publié un article, dans une revue scientifique, dont plus de la moitié était purement et simplement un copier-coller de ma thèse (et de mon livre).
    Votre blog m’a bien aidé à faire face à la situation et à trouver la meilleure manière de réagir.

    J’étais plus choquée par le non respect des enquêtés par les auteures (ces deux psychologues, travaillant en prison, ont utilisé des extraits d’entretiens que j’avais réalisés avec des personnes détenues) que par leur médiocre tricherie (elles n’ont pas pris la peine de reformuler et donc deux clics sur google suffisent à trouver l’origine de leur texte !).

    Je me permets de vous faire un rapide résumé de l’histoire :
    L’article en question a été publié dans la revue Dialogue. Lorsque j’ai découvert le plagiat, j’ai écrit aux auteures (qui m’ont répondu qu’il s’agissait d’une « erreur », etc.) et à la directrice de la publication.

    Cette dernière a fait retirer de Cairn l’article, et la rédaction vient de faire publier un avis [http://www.cairn.info/revue-dialogue-2012-1-page-3.htm, voir en bas de page] à ma demande (mon avocate ayant également écrit en ce sens aux éditions Eres).

    Bonne continuation à vous et à votre site,
    Gw.R.

    Rep. de J.N. Darde : Bravo pour cette affaire fermement et rondement menée (publication du plagiat en décembre 2011 et règlement de l’affaire en avril 2012).
    On ne peut que se féliciter de la précision et de la clarté de l’avis publié sur CAIRN.INFO.
    JND

     

    Gwenola RICORDEAU