Avec l’évolution exponentielle de l’intelligence artificielle, les outils de générations de texte basés notamment sur le modèle GPT se sont révélés être un outil puissant pour générer du texte convaincant et réaliste.
Ces outils peuvent mener des conversations complexes, répondre à des questions et même écrire des articles. Cependant, avec leur capacité à imiter si fidèlement le langage humain, il peut être difficile de distinguer l’intelligence artificielle d’un véritable interlocuteur humain. Heureusement, il existe des outils qui permettent de détecter ces textes générés par l’IA.
Détection de contenu IA : comment ça marche ?
La détection de contenu IA est un processus qui utilise une combinaison de techniques d’apprentissage automatique et de traitement du langage naturel pour déterminer si le texte a été écrit par un humain ou généré par l’IA.
Les détecteurs de contenu IA sont formés sur de vastes ensembles de données de contenu écrit par des humaines et par des intelligences artificielles afin d’identifier des modèles dans chaque type d’écriture.
Comment avons-nous évalué ces détecteurs de ChatGPT ?
Afin de mesurer la pertinence et la précision des différents outils que nous avons testé, nous avons d’abord générés plusieurs articles à l’aide de la version GPT-4 de ChatGPT. Ensuite, ces articles ont tous étés soumis dans les différents sites pour évaluer de quelles manières ils analysent les textes et comment ils arrivent à détecter ChatGPT.
1. Lucide
Lucide est un outil français destiné aux experts SEO et éditeurs de site web qui offre des fonctionnalités avancées pour maintenir la qualité du contenu en ligne. Il permet de distinguer si un texte est généré par l’IA et va plus loin en évaluant la qualité de cette génération, ce qui le rend unique pour identifier la pertinence des textes issus de l’IA. Lucide propose également une analyse approfondie des textes, permettant aux utilisateurs de comprendre l’origine du contenu, qu’il s’agisse de ChatGPT, de rédaction offshore ou d’un professionnel expérimenté. L’outil joue également un rôle crucial dans la lutte contre le plagiat en identifiant le contenu dupliqué avant qu’il ne puisse causer de problèmes.
L’une des principales caractéristiques est son interprétation des résultats. Contrairement à d’autres outils, Lucide ne se limite pas à la simple détection. Il fournit une interprétation détaillée basée sur des algorithmes avancés, permettant une meilleure prise de décision. De plus, Lucide offre une API qui permet une intégration facile de ses fonctionnalités dans d’autres solutions professionnelles.
Le gros avantage de Lucide est que c’est un outil français et donc qui a été principalement entrainé sur des textes de la langue de Molière. En terme de pertinence et de précision, Lucide à eu 100% de réussite sur les différents textes (IA et écrit par un humain) qui ont été soumis dans l’outil.
Lucide est un outil très utile pour les professionnels du web soucieux de maintenir la qualité et l’authenticité de leur contenu afin de garder le contrôle sur les textes qui peuvent être fournis par des rédacteurs externes.
> Découvrez notre avis complet sur Lucide
Précision : Forte
2. Winston AI
Winston AI est une plateforme de détection de contenu IA développée spécifiquement pour les professionnels de l’éducation et les créateurs de contenu. Cet outil se distingue par sa capacité à analyser des textes dans plusieurs langues et à détecter le contenu généré par les principaux modèles d’IA, notamment GPT-3, GPT-4, Bard et Claude.
L’une des forces de Winston AI réside dans son interface utilisateur intuitive qui permet une analyse rapide et détaillée. L’outil propose un score de probabilité exprimé en pourcentage, indiquant la likelihood qu’un texte soit généré par l’IA. Il offre également une fonction de surlignage qui identifie les passages les plus susceptibles d’être artificiels.
Winston AI propose une version gratuite limitée ainsi que des plans premium adaptés aux besoins des institutions éducatives. L’outil intègre également des fonctionnalités de détection de plagiat, ce qui en fait une solution complète pour vérifier l’authenticité du contenu. Ses algorithmes sont régulièrement mis à jour pour s’adapter aux nouvelles versions des modèles de langage.
Précision : Forte
3. ZeroGPT
ZeroGPT est un détecteur de contenu IA entièrement gratuit qui a gagné en popularité grâce à sa simplicité d’utilisation et sa précision remarquable. Développé par une équipe d’experts en apprentissage automatique, cet outil utilise des algorithmes avancés basés sur l’analyse des patterns linguistiques pour identifier le contenu généré par l’IA.
L’interface de ZeroGPT est épurée et accessible, permettant aux utilisateurs de coller simplement leur texte et d’obtenir instantanément un résultat sous forme de pourcentage. L’outil peut analyser jusqu’à 15 000 caractères par requête et supporte plusieurs langues, bien que sa précision soit optimale pour l’anglais.
Une particularité de ZeroGPT est sa capacité à détecter le contenu mixte, c’est-à-dire les textes partiellement rédigés par l’IA et complétés par un humain. Il propose également une API pour les développeurs souhaitant intégrer la détection IA dans leurs propres applications. L’outil est régulièrement entraîné sur de nouveaux datasets pour maintenir sa précision face aux évolutions des modèles de langage.
Précision : Forte
4. Draft & Goal
Draft & Goal est un autre outil français qui se positionne comme une solution innovante qui va au-delà de la simple détection de contenu IA. Cette entreprise technologique a développé un écosystème complet qui combine détection intelligente et optimisation de la création de contenu, s’adressant principalement aux agences marketing et aux créateurs de contenu professionnels.
Leur outil AI Content Detector, bien qu’encore en phase bêta, utilise une approche multicritères pour identifier les « empreintes digitales » laissées par les différents modèles de génération de texte. L’algorithme analyse non seulement les patterns linguistiques, mais également la cohérence contextuelle et les nuances stylistiques qui caractérisent l’écriture humaine.
Ce qui distingue Draft & Goal de ses concurrents est son workflow intégré qui guide l’utilisateur depuis l’analyse du contenu existant jusqu’à la génération assistée de nouveau contenu. La plateforme propose des suggestions d’amélioration en temps réel et permet d’humaniser les textes détectés comme artificiels. Cette approche holistique fait de Draft & Goal un outil particulièrement adapté aux équipes de contenu qui cherchent à maintenir un équilibre entre efficacité et authenticité.
Précision : Forte
5. Scribbr
Scribbr, initialement connu pour son service de correction et de relecture académique, a étendu ses fonctionnalités en proposant un détecteur de contenu IA gratuit. Cet outil s’adresse principalement aux étudiants, chercheurs et professionnels de l’enseignement soucieux de vérifier l’authenticité de leurs contenus.
Le détecteur IA de Scribbr se base sur des modèles d’apprentissage automatique entraînés pour reconnaître les caractéristiques typiques du texte généré par l’intelligence artificielle. L’outil analyse la structure des phrases, le vocabulaire utilisé et les patterns récurrents pour établir son diagnostic.
Bien que Scribbr offre une interface claire et des résultats faciles à interpréter, sa précision reste variable selon le type de contenu analysé. Il excelle dans la détection de textes académiques générés par IA, mais peut présenter des faux positifs avec certains styles d’écriture humaine très structurés. L’outil est disponible en plusieurs langues et s’intègre naturellement à l’écosystème de services académiques de Scribbr.
Précision : Moyenne
6. Copyleaks
Copyleaks est une plateforme de détection complète qui combine vérification de plagiat et détection de contenu IA dans une solution intégrée. Fondée en 2015, l’entreprise a rapidement adapté sa technologie pour répondre aux défis posés par l’émergence des générateurs de texte IA.
L’outil utilise des algorithmes propriétaires basés sur l’analyse sémantique et syntaxique pour identifier les textes générés par l’IA. Copyleaks se distingue par sa capacité à traiter de gros volumes de documents simultanément, ce qui en fait un choix privilégié pour les institutions éducatives et les entreprises.
La plateforme propose plusieurs niveaux de service, depuis une version gratuite limitée jusqu’aux solutions enterprise avec API dédiée. Une fonctionnalité intéressante de Copyleaks est son système de rapports détaillés qui permet de comprendre les raisons de la détection et d’identifier précisément les passages suspects. Cependant, l’outil peut parfois générer des faux positifs, particulièrement avec des textes techniques ou très spécialisés.
Précision : Moyenne
7. Quillbot
Quillbot propose une gamme complète d’outils pour améliorer l’écriture. Il comprend entre autres : un reformulateur de texte, un correcteur grammatical, un traducteur dans plus de 30 langues, un vérificateur de plagiat, mais également un détecteur IA.
En effet, Quillbot a été entraîné pour repérer certains modèles de langage IA, comme ceux contenant des mots répétitifs, des phrases maladroites ou encore un style non naturel.
La présence de ces incohérences pousse l’outil à procéder à une analyse approfondie du texte. Offrant une interface simple et intuitive, Quillbot est facile à utiliser et est entièrement gratuite. Cependant, le détecteur IA est pour l’instant disponible uniquement en anglais.
Précision : Moyenne
8. Originality.ai
L’un des outils les plus efficaces pour détecter les chatbots GPT est Originality.ai. Conçu par une équipe d’experts en marketing de contenu et en intelligence artificielle, cet outil répond aux besoins spécifiques des éditeurs de sites web. Il offre plusieurs avantages significatifs.
Le plus notable est sa capacité à effectuer la vérification de plagiat la plus précise du marché. Il détecte avec une précision de 99 % le texte généré par GPT-4, 83 % celui provenant de ChatGPT, tout en gardant les faux positifs autour de 2 %.
En plus de cela, Originality.ai fournit un score de lisibilité pour votre contenu. Ce score est basé sur une étude de 20 000 résultats permettant d’identifier le score cible pour obtenir les meilleurs résultats sur Google.
Précision : Moyenne
9. Ai Detector Pro
Formé aux données développées par l’AI, AI Detector Pro il est capable de réviser les contenus générés par ChatGPT, Bard ainsi que d’autres modèles de langage moins connus, et ce, qu’ils soient en Anglais, Allemand ou Espagnol.
Complet et intuitif, il propose une suite d’outils automatiques et manuels pour produire des textes plus rapidement. Si son outil de réécriture AI Eraser aide l’utilisateur à humaniser le contenu généré par l’intelligence artificielle, l’AI Phraseology identifie le jargon et les phrases utilisées par cette dernière. Son Pinpoint Editor, lui, indique le passage où des modifications doivent être faites.
AI Detector ne se contente pas de mettre en évidence les passages d’un document qui ne sonnent pas humain, il effectue également une analyse de tonalité sur 11 dimensions différentes. Grâce aux plugins qu’il propose, il est possible d’écrire, de scanner et d’éditer directement du contenu sur Google Docs et Word.
Précision : Moyenne
10. Compilatio
Compilatio est une entreprise d’Annecy qui se spécialise dans la lutte contre le plagiat universitaire depuis 2005. Face à l’émergence de technologies d’IA comme ChatGPT, utilisées pour les devoirs universitaires, Compilatio a conçu un outil « IA Detector Evaluation ».
Cet outil est capable de détecter si un texte a été généré par une IA, avec une fiabilité actuelle de 90%. Il se base sur des critères tels que la longueur des mots, l’utilisation de certains termes ou leur répétition pour démasquer les textes générés par des robots. Compilatio préconise aussi la mise en place d’une réglementation et d’une sensibilisation autour des IA.
L’entreprise a pour ambition de s’étendre aux secteurs de l’édition et du journalisme, proposant une solution « Copyright » pour combattre le plagiat dans ces domaines. Son but ultime est de développer un dispositif garantissant que les manuscrits et les textes sont authentiquement rédigés par des humains.
Précision : Relativement faible
Pourquoi détecter les textes générés par IA
L’essor de ChatGPT et d’autres outils similaires soulève de nombreuses préoccupations quant à leur utilisation abusive dans différents domaines. Les éducateurs s’inquiètent notamment de l’utilisation de ChatGPT pour rédiger des essais et des devoirs présentés comme des travaux originaux, ce qui pourrait favoriser le plagiat et nuire à l’apprentissage des étudiants.
- Propagation de contenus inexacts ou inhumains sur les réseaux sociaux
- Difficulté à identifier les sources d’information fiables
- Risque de manipulation de l’opinion publique
C’est dans ce contexte il existe certains outils visant à détecter les textes écrits par des systèmes d’intelligence artificielle. L’objectif était de permettre aux utilisateurs de vérifier si un contenu a été généré par une IA ou par un humain, afin de lutter contre les abus et de préserver la qualité de l’information.
Quelles sont les limites des détecteurs de ChatGPT ou d’IA ?
Bien que les détecteurs d’IA puissent être utiles, il est essentiel de comprendre leurs limites afin de les utiliser de manière responsable. Ces limites comprennent :
- Faux positifs et faux négatifs : les détecteurs d’IA ne sont pas précis à 100 % et peuvent parfois classer un texte de manière erronée. Un faux positif se produit lorsque du contenu rédigé par un humain est signalé à tort comme généré par l’IA, tandis qu’un faux négatif se produit lorsque du texte généré par l’IA n’est pas détecté. Cela peut conduire à des accusations injustifiées ou à des cas non détectés d’utilisation de l’IA.
- Difficulté à détecter les modèles d’IA avancés : le contenu généré par l’IA s’améliore, ou devient plus humain, à mesure que la technologie évolue, et la détection de l’IA a du mal à suivre. Les modèles avancés génèrent des textes plus variés, ce qui rend la détection de plus en plus difficile. Les détecteurs d’IA sont souvent en retard par rapport aux dernières avancées en matière d’IA, ce qui réduit leur fiabilité.
- Incapacité à fournir des preuves définitives : les outils de détection de l’IA fournissent des résultats probabilistes, et non des preuves concrètes. Un score élevé de probabilité d’IA ne signifie pas que le texte a été généré par l’IA, mais simplement qu’il partage des caractéristiques avec l’écriture IA. Ces outils doivent être utilisés comme un guide plutôt que comme un
Pour déterminer si un texte a été généré par une IA comme ChatGPT, vous pouvez rechercher plusieurs indices. Voici quelques conseils pour identifier un texte généré par l’IA :
- Répétitivité et redondance : Les textes générés par l’IA peuvent parfois se répéter ou surexploiter certaines phrases ou structures de phrases.
- Manque de profondeur ou de détails contextuels : Les IA peuvent manquer de précision ou de détails spécifiques à un contexte ou à une situation personnelle. Le texte peut sembler générique ou peu profond.
- Incohérences ou erreurs factuelles : Les erreurs factuelles ou les incohérences dans le texte, surtout si elles sont en dehors du domaine de compétence habituel de l’auteur présumé, peuvent être un indice.
- Style et tonalité : Un changement soudain dans le style d’écriture ou la tonalité par rapport aux écrits antérieurs connus de l’auteur peut suggérer l’utilisation d’une IA.
- Utilisation étrange ou inappropriée de mots : Les IA peuvent parfois choisir des mots ou des phrases qui semblent inhabituels ou inappropriés pour le contexte.
- Manque de réponse émotionnelle ou personnelle : Les textes générés par l’IA peuvent manquer de la touche personnelle ou émotionnelle que l’on attendrait d’un humain.
Il est difficile et généralement déconseillé d’essayer de tromper les détecteurs de contenu généré par des IA comme ChatGPT. Ces détecteurs sont conçus pour identifier les caractéristiques typiques des textes générés par l’IA, comme des modèles de langage répétitifs ou des réponses qui manquent de nuances contextuelles spécifiques.
Plutôt que d’essayer de tromper ces systèmes, il est généralement plus productif et éthique d’utiliser les outils d’IA de manière responsable et transparente, en reconnaissant leur utilisation lorsque cela est pertinent. Cela contribue à maintenir la confiance et la crédibilité dans les interactions numériques.
Si vous avez des inquiétudes spécifiques ou des cas d’utilisation où la détection de l’IA pourrait être un problème, il peut être utile d’en discuter ouvertement avec les parties concernées pour trouver des solutions adaptées.
Les autres méthodes pour détecter ChatGPT
Il existe quelques approches pour essayer de détecter si un texte a été généré par ChatGPT ou un modèle de langage similaire, mais elles ont également des limites:
- Analyse des motifs de texte : On peut rechercher des signatures ou motifs typiques des textes générés par IA comme des répétitions, des transitions abruptes, un manque de cohérence. Mais les générateurs deviennent de plus en plus fluides.
- Détection de la nouveauté : Les modèles de langage génèrent surtout des combinaisons de contenu existant, donc détecter des idées vraiment nouvelles peut indiquer un humain. Mais l’IA peut aussi parfois innover.
- Analyse statistique du texte : Rechercher des patterns comme la complexité du vocabulaire, longueur des phrases, fréquence des mots. Mais l’IA imite de mieux en mieux les vrais styles d’écriture.
- Détection d’erreurs : Rechercher des failles logiques, des incohérences ou des erreurs factuelles révèle les limites des connaissances de l’IA. Mais les modèles deviennent de plus en plus précis.
Il n’existe pour l’instant aucune méthode de détection parfaite et fiable à 100%. La combinaison de plusieurs outils et une analyse humaine attentive restent les meilleures solutions. Toutefois l’IA continue de progresser à une vitesse fulgurante. L’avancée d’OpenAI et ses concurrents risques de poser de plus en plus de difficultés à détecter l’intelligence artificielle dans les textes.