Dernière modification le 28 décembre 2023

Avec l’évolution exponentielle de l’intelligence artificielle, les outils de générations de texte basés notamment sur le modèle GPT se sont révélés être un outil puissant pour générer du texte convaincant et réaliste.

Ces outils peuvent mener des conversations complexes, répondre à des questions et même écrire des articles. Cependant, avec leur capacité à imiter si fidèlement le langage humain, il peut être difficile de distinguer l’intelligence artificielle d’un véritable interlocuteur humain. Heureusement, il existe des outils qui permettent de détecter ces textes générés par l’IA.

Détection de contenu IA : comment ça marche ?

La détection de contenu IA est un processus qui utilise une combinaison de techniques d’apprentissage automatique et de traitement du langage naturel pour déterminer si le texte a été écrit par un humain ou généré par l’IA.

Les détecteurs de contenu IA sont formés sur de vastes ensembles de données de contenu écrit par des humaines et par des intelligences artificielles afin d’identifier des modèles dans chaque type d’écriture.

Comment avons-nous évalué ces détecteurs de ChatGPT ?

Afin de mesurer la pertinence et la précision des différents outils que nous avons testé, nous avons d’abord générés plusieurs articles à l’aide de la version GPT-4 de ChatGPT. Ensuite, ces articles ont tous étés soumis dans les différents sites pour évaluer de quelles manières ils analysent les textes et comment ils arrivent à détecter ChatGPT. 

1. Lucide

Lucide

Lucide est un outil destiné aux experts SEO et éditeurs de site web qui offre des fonctionnalités avancées pour maintenir la qualité du contenu en ligne. Il permet de distinguer si un texte est généré par l’IA et va plus loin en évaluant la qualité de cette génération, ce qui le rend unique pour identifier la pertinence des textes issus de l’IA. Lucide propose également une analyse approfondie des textes, permettant aux utilisateurs de comprendre l’origine du contenu, qu’il s’agisse de ChatGPT, de rédaction offshore ou d’un professionnel expérimenté. L’outil joue également un rôle crucial dans la lutte contre le plagiat en identifiant le contenu dupliqué avant qu’il ne puisse causer de problèmes.

L’une des principales caractéristiques est son interprétation des résultats. Contrairement à d’autres outils, Lucide ne se limite pas à la simple détection. Il fournit une interprétation détaillée basée sur des algorithmes avancés, permettant une meilleure prise de décision. De plus, Lucide offre une API qui permet une intégration facile de ses fonctionnalités dans d’autres solutions professionnelles. 

Le gros avantage de Lucide est que c’est un outil français et donc qui a été principalement entrainé sur des textes de la langue de Molière. En terme de pertinence et de précision, Lucide à eu 100% de réussite sur les différents textes (IA et écrit par un humain) qui ont été soumis dans l’outil.

Lucide est un outil très utile pour les professionnels du web soucieux de maintenir la qualité et l’authenticité de leur contenu afin de garder le contrôle sur les textes qui peuvent être fournis par des rédacteurs externes. 
> Découvrez notre avis complet sur Lucide

Précision : Forte

 

2. Originality.ai

Originality

L’un des outils les plus efficaces pour détecter les chatbots GPT est Originality.ai. Conçu par une équipe d’experts en marketing de contenu et en intelligence artificielle, cet outil répond aux besoins spécifiques des éditeurs de sites web. Il offre plusieurs avantages significatifs.

Le plus notable est sa capacité à effectuer la vérification de plagiat la plus précise du marché. Il détecte avec une précision de 99 % le texte généré par GPT-4, 83 % celui provenant de ChatGPT, tout en gardant les faux positifs autour de 2 %.

En plus de cela, Originality.ai fournit un score de lisibilité pour votre contenu. Ce score est basé sur une étude de 20 000 résultats permettant d’identifier le score cible pour obtenir les meilleurs résultats sur Google.

Précision : Moyenne

3. GPTZero

GPTzero

GPTZero est un autre outil intéressant qui se concentre sur la détection du texte généré par l’IA. Il s’agit d’un modèle de classification qui prédit si un document a été écrit par un grand modèle de langue. Il fournit des prévisions au niveau de la phrase, du paragraphe et du document.

Ce modèle a été formé sur un corpus large et diversifié de textes en anglais, écrits tant par des humains que par des IA. Il est donc particulièrement utile pour détecter l’utilisation de l’IA dans l’écriture de textes, en particulier dans la prose anglaise.

Comme pour les autres outils, GPTZero identifie les textes générés par l’IA avec une précision accrue lorsque des quantités plus importantes de texte sont soumises. Cependant, il est important de noter que les résultats de ce modèle ne doivent pas être utilisés pour sanctionner les élèves, mais plutôt comme l’un des éléments d’une évaluation globale des travaux des élèves.

Précision : Moyenne

4. Draft & Goal

Draftandgoal

Draft & Goal est une entreprise innovante qui utilise l’intelligence artificielle pour améliorer la création de contenu. Elle propose un outil unique nommé AI Content Detector, spécialement conçu pour identifier les empreintes laissées par le texte généré par l’IA. Cet outil est encore en phase bêta, mais il a déjà montré un grand potentiel.

En plus du détecteur de contenu IA, Draft & Goal propose également un processus de production de contenu automatisé. Contrairement à un simple générateur de texte IA, leur flux de travail vous guide à travers l’analyse de contenu, l’idéation et la génération de contenu IA.

Précision : Moyenne

5. Corrector App

Correctorapp

Corrector App est un outil gratuit de détection de faux texte généré par ChatGPT. Il offre une solution rapide et facile pour vérifier si un texte a été créé à l’aide d’un algorithme GPT-3.

L’un des principaux avantages de Corrector App est sa capacité à aider à vérifier l’authenticité et l’exactitude d’un document en identifiant les segments de texte faux. C’est un outil extrêmement facile à utiliser qui fournit un retour d’information en temps réel sur le pourcentage de textes faux contenus dans un texte donné.

Précision : Relativement faible

6. Compilatio

Compilatio

Compilatio est une entreprise d’Annecy qui se spécialise dans la lutte contre le plagiat universitaire depuis 2005. Face à l’émergence de technologies d’IA comme ChatGPT, utilisées pour les devoirs universitaires, Compilatio a conçu un outil « IA Detector Evaluation ».

Cet outil est capable de détecter si un texte a été généré par une IA, avec une fiabilité actuelle de 90%. Il se base sur des critères tels que la longueur des mots, l’utilisation de certains termes ou leur répétition pour démasquer les textes générés par des robots. Compilatio préconise aussi la mise en place d’une réglementation et d’une sensibilisation autour des IA.

L’entreprise a pour ambition de s’étendre aux secteurs de l’édition et du journalisme, proposant une solution « Copyright » pour combattre le plagiat dans ces domaines. Son but ultime est de développer un dispositif garantissant que les manuscrits et les textes sont authentiquement rédigés par des humains.

Précision : Relativement faible

Le besoin de détecter les textes générés par IA

L’essor de ChatGPT et d’autres outils similaires soulève de nombreuses préoccupations quant à leur utilisation abusive dans différents domaines. Les éducateurs s’inquiètent notamment de l’utilisation de ChatGPT pour rédiger des essais et des devoirs présentés comme des travaux originaux, ce qui pourrait favoriser le plagiat et nuire à l’apprentissage des étudiants.

  • Propagation de contenus inexacts ou inhumains sur les réseaux sociaux
  • Difficulté à identifier les sources d’information fiables
  • Risque de manipulation de l’opinion publique

C’est dans ce contexte il existe certains outils visant à détecter les textes écrits par des systèmes d’intelligence artificielle. L’objectif était de permettre aux utilisateurs de vérifier si un contenu a été généré par une IA ou par un humain, afin de lutter contre les abus et de préserver la qualité de l’information.

Quelles sont les limites des détecteurs de ChatGPT ou d’IA ?

Les détecteurs de ChatGPT sont des outils qui peuvent être utilisés pour identifier les textes générés par ChatGPT. Cependant, ces outils ont un certain nombre de limites.

  • Premièrement, les détecteurs d’IA ne sont pas toujours fiables. Ils peuvent parfois identifier à tort du texte humain comme étant généré par ChatGPT, et ils peuvent parfois ne pas identifier du texte généré par ChatGPT.
  • Deuxièmement, ces outils peuvent être contournés. Il existe un certain nombre de techniques qui peuvent être utilisées pour générer du texte qui n’est pas détecté par les détecteurs de ChatGPT.
  • Enfin, les détecteurs de ChatGPT ne sont pas toujours utilisables dans toutes les situations. Par exemple, ils ne peuvent pas être utilisés pour identifier le texte généré par ChatGPT dans des images ou des vidéos.

En conclusion, les détecteurs d’IA sont des outils utiles qui peuvent être utilisés pour identifier les textes générés par ChatGPT. Cependant, ils ont un certain nombre de limites qui doivent être prises en compte lors de leur utilisation.

Comment savoir si un texte est généré par une IA ?

Pour déterminer si un texte a été généré par une IA comme ChatGPT, vous pouvez rechercher plusieurs indices. Voici quelques conseils pour identifier un texte généré par l’IA :

  1. Répétitivité et redondance : Les textes générés par l’IA peuvent parfois se répéter ou surexploiter certaines phrases ou structures de phrases.
  2. Manque de profondeur ou de détails contextuels : Les IA peuvent manquer de précision ou de détails spécifiques à un contexte ou à une situation personnelle. Le texte peut sembler générique ou peu profond.
  3. Incohérences ou erreurs factuelles : Les erreurs factuelles ou les incohérences dans le texte, surtout si elles sont en dehors du domaine de compétence habituel de l’auteur présumé, peuvent être un indice.
  4. Style et tonalité : Un changement soudain dans le style d’écriture ou la tonalité par rapport aux écrits antérieurs connus de l’auteur peut suggérer l’utilisation d’une IA.
  5. Utilisation étrange ou inappropriée de mots : Les IA peuvent parfois choisir des mots ou des phrases qui semblent inhabituels ou inappropriés pour le contexte.
  6. Manque de réponse émotionnelle ou personnelle : Les textes générés par l’IA peuvent manquer de la touche personnelle ou émotionnelle que l’on attendrait d’un humain.

Comment tromper les détecteurs de contenu rédigé par ChatGPT ?

Il est difficile et généralement déconseillé d’essayer de tromper les détecteurs de contenu généré par des IA comme ChatGPT. Ces détecteurs sont conçus pour identifier les caractéristiques typiques des textes générés par l’IA, comme des modèles de langage répétitifs ou des réponses qui manquent de nuances contextuelles spécifiques. Plutôt que d’essayer de tromper ces systèmes, il est généralement plus productif et éthique d’utiliser les outils d’IA de manière responsable et transparente, en reconnaissant leur utilisation lorsque cela est pertinent. Cela contribue à maintenir la confiance et la crédibilité dans les interactions numériques. Si vous avez des inquiétudes spécifiques ou des cas d’utilisation où la détection de l’IA pourrait être un problème, il peut être utile d’en discuter ouvertement avec les parties concernées pour trouver des solutions adaptées.

Les autres méthodes pour détecter ChatGPT

Il existe quelques approches pour essayer de détecter si un texte a été généré par ChatGPT ou un modèle de langage similaire, mais elles ont également des limites:

  • Analyse des motifs de texte : On peut rechercher des signatures ou motifs typiques des textes générés par IA comme des répétitions, des transitions abruptes, un manque de cohérence. Mais les générateurs deviennent de plus en plus fluides.
  • Détection de la nouveauté : Les modèles de langage génèrent surtout des combinaisons de contenu existant, donc détecter des idées vraiment nouvelles peut indiquer un humain. Mais l’IA peut aussi parfois innover.
  • Analyse statistique du texte : Rechercher des patterns comme la complexité du vocabulaire, longueur des phrases, fréquence des mots. Mais l’IA imite de mieux en mieux les vrais styles d’écriture.
  • Détection d’erreurs : Rechercher des failles logiques, des incohérences ou des erreurs factuelles révèle les limites des connaissances de l’IA. Mais les modèles deviennent de plus en plus précis.

Il n’existe pour l’instant aucune méthode de détection parfaite et fiable à 100%. La combinaison de plusieurs outils et une analyse humaine attentive restent les meilleures solutions. Toutefois l’IA continue de progresser à une vitesse fulgurante. L’avancée d’OpenAI et ses concurrents risques de poser de plus en plus de difficultés à détecter l’intelligence artificielle dans les textes.

Loïc Frissard

Passionné par le web et l’entrepreneuriat, j’ai fondé Digitiz en 2016. Mon objectif est de vous transmettre mon expérience et de pouvoir vous faire gagner du temps dans le choix de vos outils.

Pin It on Pinterest

Share This