Comment ça marche concretement?
Tu lui donnes du texte (ou une URL). Il lance dix verifications statistiques sur le document entier et dix-huit verifications sur chaque phrase individuelle. Puis il te dit quel pourcentage semble écrit par une IA et quel pourcentage semble humain.
Pas de réseaux de neurones, pas d'APIs cloud, pas de téléchargement de modèle. Juste des maths qui tournent dans ton navigateur. Le tout prend quelques millisecondes.
Pourquoi se soucier de détecter le contenu IA?
Si tu es prof et que tu verifies des copies, éditeur qui revise des soumissions, ou marketeur qui audite ton blog, tu veux probablement savoir si le texte devant toi a vraiment été écrit par une personne. Pas parce que le texte IA est forcement mauvais, mais parce que connaitre la source, c'est important pour la confiance.
La plupart des services de détection facturent au scan et demandent d'uploader ton texte sur leurs serveurs. Celui-ci est gratuit et ton texte ne quitte jamais ton ordi.
Qu'est-ce qui fait un bon signal de détection?
La conformite à la loi de Zipf est le signal individuel le plus fort qu'on a trouve. Les fréquences de mots dans le texte humain sont en vrac ; dans le texte IA elles suivent une courbe mathématique quasi parfaite. Les debuts de phrases repetes, c'est ridiculement simple mais efficace : l'IA adore commencer les phrases par 'Le' et 'Ce' encore et encore.
Au niveau de la phrase, le détectéur cherche des trucs comme l'abus de tirets (l'IA adore les tirets longs), les mots de transition que personne ne dit a voix haute ('en outre', 'de surcroit'), et le classique pattern titre-en-gras-puis-explication que ChatGPT utilisé par défaut.
Ce qu'il rate
Les communiques de presse corporate et les textes juridiques peuvent ressembler a de l'IA même quand ils le sont pas, parce qu'ils sont formulaiques par nature. Les textes très courts (moins de 200 mots) n'ont pas assez de données pour que les metriques soient fiables. Et si quelqu'un généré du texte avec l'IA puis edite un tiers à la main, tous les détectéurs du marche vont galerrer avec ca.
Prend le résultat comme un signal, pas comme un verdict. Si ça dit 60% IA, ça veut dire 'ca merite un regard plus attentif', pas 'c'est sur qu'un robot a écrit ca'.





