Numérique

ChatGPT : le logiciel antiplagiat des universités contre-attaque

Par Marine Dessaux | Le | Équipements et systèmes d'informations

Avec la dernière version de ChatGPT, la désormais célèbre intelligence artificielle d’OpenAI, et ses textes réputés pour être indétectables, c’est le branle-bas de combat chez les fournisseurs de logiciels antiplagiat ! Les voilà obligés de faire évoluer leurs solutions, à l’instar de Compilatio, en bonne voie avec son démonstrateur qui distingue texte humain ou robot. Interview de Frédéric Agnès, son président.

Compilatio va faire évoluer son logiciel antiplagiat pour détecter ChatGPT. - © Rodnae production
Compilatio va faire évoluer son logiciel antiplagiat pour détecter ChatGPT. - © Rodnae production

ChatGPT, le robot conversationnel capable de rédiger des dissertations, forcera-t-il les enseignants de l’enseignement supérieur à repenser leurs modalités d’évaluation pour s’assurer de noter des productions originales ? Peut-être pas, explique Frédéric Agnès, président de Compilatio qui propose depuis 2005 Compilatio Magister, la solution pour la prévention et la détection du plagiat la plus utilisée des établissements d’enseignement supérieur et de recherche français. 

Quels établissements d’enseignement supérieur et de recherche utilisent Compilatio Magister ? 

Frédéric Agnès : Nous équipons à ce jour la totalité des universités françaises avec notre logiciel Compilatio Magister. À cela s’ajoutent d’autres types d’établissements académiques : écoles de commerce, d’ingénieurs, centres de recherches, lycées…. Au total, Compilatio est présent dans plus de 800 établissements d’ESR dans une quarantaine de pays.

Est-il possible de détecter ChatGPT avec votre logiciel antiplagiat ? 

Nous venons de trouver une solution qui permet de détecter l’usage de ChatGPT, mais elle n’est pas encore intégrée dans notre logiciel. Nous avons ouvert à tous un démonstrateur qui détecte si un texte en anglais a été écrit par une intelligence artificielle ou par un humain. L’idée est de prouver que notre technologie fonctionne, mais aussi de collecter les retours et de mesurer l’efficacité de ce démonstrateur sur un large nombre d’essais.

Il n’y a pas encore de nuance : le robot émet un avis sur un texte entier. Dans l’outil final, les passages soupçonnés d’être écrits par une IA seront surlignés.  

Le jeu du chat et de la souris à chaque fois qu’une nouvelle version sortira

Notre outil fonctionne avec la troisième version de ChatGPT qui est la plus récente. Mais c’est le jeu du chat et de la souris à chaque fois qu’une nouvelle version sortira. Ce qui crée autant d’émulation autour de cette version de ChatGPT est son niveau — bien plus performant pour écrire un texte que la V2 — mais aussi son ouverture gratuite au grand public.  

Pourquoi ChatGPT est-il si difficile à détecter ? 

ChatGPT produit un texte qui n’est pas du copié-collé et qui n’est donc pas détectable par nos robots. En effet, ces derniers cherchent des similitudes avec des textes sur internet ou des copies entrées sur une base de données. 

ChatGPT fonctionne grâce à la prédiction

ChatGPT fonctionne grâce à la prédiction : il évalue quel est le texte le plus probable dans un contexte. Cette intelligence artificielle ne restitue donc pas une source — d’ailleurs, si elle n’a pas eu d’entrainement sur un sujet, elle peut dire des choses complètement fausses ! Néanmoins, c’est cet aspect prévisible du texte sur lequel nous pouvons, nous aussi, entraîner une IA qui permettra d’analyser les compositions écrites.

Compilatio émet-il un avis de triche sur une copie ? 

Actuellement, notre logiciel rend un rapport d’analyse des similitudes. Il ne s’agit pas seulement de détecter les copiés-collés, mais aussi les reformulations lourdes (similitudes de sens et non de mots). Avec ChatGPT, il s’agira de scorer la probabilité d’usage de l’intelligence artificielle.  

Dans les deux cas, Compilatio ne juge et n’évalue pas les copies. Il revient à l’enseignant de comparer les différents documents et de lever le doute. Le dialogue entre correcteur et candidat reste le plus efficace pour éviter toute ambiguïté.  

L’enseignant doit donc systématiser l’usage d’un logiciel pour détecter le plagiat ou l’usage de ChatGPT, n’est-ce pas chronophage ? 

Une première barrière pour décourager la triche

Avec notre logiciel Compilatio Magister, l’enseignant doit seulement créer un lien de collecte à distance sur lequel les étudiants doivent rendre leurs devoirs, ce qui est très rapide. C’est passer en revue les rapports qui demande du temps. Mais ce n’est pas toujours nécessaire, car l’usage d’un logiciel antiplagiat constitue déjà une première barrière pour décourager la triche. C’est pourquoi nous recommandions déjà d’utiliser systématiquement Compilatio.  

L’important, ce n’est pas d’attraper les quelques d’étudiants les plus talentueux en fraude, mais de sauver ceux qui veulent effectuer un travail sérieux et pour qui la tentation est grande. Le logiciel est un moyen de marquer la limite, de montrer que c’est un point d’attention. 

Quel regard portez-vous sur cette nouvelle technologie et son impact sur l’ESR ? 

Frédéric Agnès, président de Compilatio - © Compilatio
Frédéric Agnès, président de Compilatio - © Compilatio

L’IA n’est pas qu’une menace, comme elle peut souvent être perçue. Elle s’apprête à changer notre rapport au texte, ce qui présente des opportunités. Désormais, nous allons écrire plus vite… mais nous allons aussi lire plus rapidement ! C’est notamment l’objectif de Submary, la petite sœur de Compilatio. Cet outil permet de surligner, en 30 secondes, les informations les plus importantes d’un texte et de mettre en avant d’autres éléments d’informations pour faciliter ou approfondir sa compréhension (lieux, noms, etc.).  

L’intelligence artificielle va automatiser les tâches de l’esprit. Aujourd’hui, le changement est inconfortable, car il est très rapide, mais cela peut nous apporter beaucoup.  

Quels sont les autres usages de Compilatio, pour la recherche notamment ? 

En tant qu’outil qui mesure et détecte les similitudes, Compilatio permet de trouver la littérature sur un domaine de recherche précis et de savoir si un sujet semblable est déjà paru. Il permet de détecter la fraude, mais aussi de repérer les chercheurs qui publient plusieurs fois un même article sous différentes formes. Il peut aussi servir d’outil de veille : à partir d’un communiqué de presse par exemple, on peut détecter les articles qui ont repris un sujet.