« Oui, je suis un humain » : la détection des robots ne fonctionne plus. Et attendez l'arrivée des agents d'IA,

Les développeurs devront faire la différence entre les « bons » bots et les « mauvais » bots

Le 25 décembre 2024 à 17:43, par Mathis Lucas

87PARTAGES

De nombreux rapports soulignent qu'il est plus difficile que jamais de prouver que l'on est humain sur les sites Web. Parallèlement, des robots passent désormais les étapes de vérifications en quelques millisecondes grâce à l'IA. L'ironie de la situation est que les outils conçus pour prouver que nous sommes humains nous gênent désormais davantage que les machines qu'ils sont censés tenir à l'écart. Les énigmes CAPTCHA deviennent de plus en plus compliquées, ce qui frustre les internautes. Les tests alternatifs au CAPTCHA gagnent du terrain. Mais les experts s'attendent à ce que la situation se complique davantage pour les internautes à mesure que l'IA s'améliore.

L'efficacité des CAPTCHA mise à rude épreuve par les progrès fulgurants de l'IA

Les sites Web utilisent les CAPTCHA (acronyme de l'anglais « Completely Automated Public Turing test to tell Computers and Humans Apart ») pour déterminer si un utilisateur est un humain ou une machine. Les CAPTCHA ont évolué au fil des ans pour s’adapter aux menaces croissantes sur Internet et garantir l'intégrité des sites Web. Le problème ? Les CAPTCHA sont devenus de plus en plus difficiles et de plus en plus complexes à résoudre pour les internautes.

Les CAPTCHA posaient autrefois une simple question du type « copiez le texte », mais ils ont désormais évolué pour demander aux internautes de résoudre des questions qui leur demandent de se creuser les méninges. Une tâche aussi simple que de se connecter à un compte de média social ou d'essayer de payer ses factures d'électricité devient un casse-tête. La complexité croissante des CAPTCHA crée un obstacle gênant à l'accès aux sites Web pour les humains.

Mais qu'est-ce qui explique cette évolution controversée ? La réponse est simple : l'IA. En effet, après avoir résolu un CAPTCHA, les données issues de nos efforts pour étiqueter ces grilles floues de feux de circulation, de texte ou de bus sont utilisées pour entraîner les machines, qui s'améliorent alors en déjouant les CAPTCHA et en faisant croire aux systèmes qu'ils sont humains. L'IA a fait des progrès remarquables et est désormais capable de résoudre ces énigmes.

Des chercheurs de l'université de Columbia ont montré en 2016 qu'ils pouvaient résoudre les CAPTCHA d'images de Google avec une précision de 70 % en utilisant des outils de reconnaissance d'image automatisés disponibles dans le commerce. Ces outils pourraient être facilement utilisés par les concepteurs de robots.

Ainsi, les CAPTCHA sont devenus plus complexes par nécessité. En effet, à mesure que l'IA se perfectionne, les CAPTCHA perdent de leur efficacité. Les énigmes de certains CAPTCHA sont même devenues un peu surréalistes. Et les entreprises technologiques et les consommateurs estiment qu'il est temps de changer.

L'IA déjoue facilement les CAPTCHA grâce à l'apprentissage automatique

Le CAPTCHA a été inventé au début des années 2000 par une équipe d'informaticiens de l'université Carnegie Mellon de Pittsburgh. Les premières versions étaient basiques, mais efficaces. Vous voyiez des lettres ondulées et déformées et vous deviez les taper dans une boîte. Les robots ne pouvaient pas « lire » le texte comme les humains, et les sites Web restaient donc protégés. Les versions améliorées ReCAPTCHA et ReCAPTCHA v2 ont été publiées par la suite.

Les systèmes d'IA d'aujourd'hui peuvent résoudre les problèmes posés par ces CAPTCHA. Ils peuvent « lire » un texte déformé, de sorte que les lettres ondulées ou écrasées des tests CAPTCHA originaux leur sont faciles à lire. Grâce au traitement du langage naturel et à l'apprentissage automatique, l'IA peut décoder les mots les plus désordonnés. Les développeurs de CAPTCHA ont donc été contraints de les complexifier pour les rendre à l'épreuve des systèmes d'IA.

Cela dit, même les développeurs de CAPTCHA ne croient plus vraiment en l'avenir de cette technologie. « Cliquer sur des images telles que des bus ou des panneaux de signalisation est dépassé. Les robots ont évolué, mais pas les CAPTCHA traditionnels. Des mini-jeux encore plus alambiqués pourraient ne pas suffire à tenir l'IA à distance », a déclaré Ashish Jain, directeur technique d'Arkose Labs, une entreprise de sécurité Web qui conçoit des CAPTCHA.

De même, des systèmes d'IA tels que Google Vision et Clip d'OpenAI peuvent reconnaître des centaines d'objets plus rapidement et plus précisément que la plupart des humains. Si un CAPTCHA demande à une IA de cliquer sur tous les bus d'une sélection d'images, elle peut le résoudre en quelques fractions de seconde, alors qu'il faudrait dix à quinze secondes à un humain. Selon les spécialistes de l'industrie, il ne s'agit pas seulement d'un problème théorique.

En Angleterre, les listes d'attente des examens de conduite sont longues de plusieurs mois, mais il est possible d'obtenir un examen beaucoup plus rapide en payant une somme plus élevée à un rabatteur du marché noir. The Guardian a rapporté en juillet que les rabatteurs utilisaient couramment des logiciels automatisés pour réserver tous les créneaux d'examen, tout en échangeant les candidats pour s'adapter à leur emploi du temps en constante évolution.

Même chose pour les billets d'entrée à des matchs de football. Dès que des billets sont disponibles, des robots envahissent le système, contournent les CAPTCHA, achètent des billets en masse et les revendent à des prix exorbitants. Les vrais utilisateurs sont souvent perdants, car ils ne peuvent pas agir aussi rapidement.

Les robots s'attaquent aussi aux plateformes de médias sociaux, aux sites de commerce électronique et aux forums en ligne. De faux comptes diffusent des infox, publient des spams ou s'emparent d'articles limités pendant les soldes. Dans de nombreux cas, le CAPTCHA n'est plus en mesure d'arrêter ces abus.

Les entreprises s'accrochent et tentent tant bien que mal d'améliorer les choses

Les développeurs ne cessent de proposer de nouvelles méthodes de vérification. Certains systèmes, dont ReCaptcha v3 (introduit en 2018) de Google, ne vous demandent plus de résoudre des énigmes. Au lieu de cela, ils observent la façon dont vous interagissez avec un site Web. Déplacez-vous votre curseur de manière naturelle ? Tapez-vous comme une personne ? Les humains ont des comportements subtils et imparfaits que les robots ont encore du mal à imiter.

ReCAPTCHA v3 ne plaît pas à tout le monde, car il soulève des problèmes de protection de la vie privée. De plus, l'entreprise doit...

La fin de cet article est réservée aux abonnés. Soutenez le Club Developpez.com en prenant un abonnement pour que nous puissions continuer à vous proposer des publications.

Une erreur dans cette actualité ? Signalez-nous-la !

Votre nom : Votre e-mail :

Décrivez l'erreur que vous souhaitez porter à notre connaissance :

Identifiez-vous

Créer un compte

« Oui, je suis un humain » : la détection des robots ne fonctionne plus. Et attendez l'arrivée des agents d'IA,

Les développeurs devront faire la différence entre les « bons » bots et les « mauvais » bots

Identifiant
Mot de passe

Mot de passe oublié ?

Identifiez-vous

Créer un compte

« Oui, je suis un humain » : la détection des robots ne fonctionne plus. Et attendez l'arrivée des agents d'IA, Les développeurs devront faire la différence entre les « bons » bots et les « mauvais » bots

« Oui, je suis un humain » : la détection des robots ne fonctionne plus. Et attendez l'arrivée des agents d'IA,

Les développeurs devront faire la différence entre les « bons » bots et les « mauvais » bots