OpenAI présente Operator : un agent d’IA semi-autonome

Date:

OpenAI poursuit l’exploration des capacités de l’intelligence artificielle (IA). Avec Operator, l’entreprise lance un agent IA semi-autonome qui interagit avec un navigateur Web comme un utilisateur humain. Ce nouvel outil vise à transformer la façon dont les interfaces graphiques en ligne sont exploitées. Il démontre le potentiel étendu de l’IA agentique.

Fonctionnalités d’Operator pour une navigation Web efficace

Operator exécute des tâches variées en ligne à l’aide d’un navigateur virtuel basé dans le cloud. Il peut réaliser des actions comme réserver des restaurants, gérer des commandes ou acheter des billets. Contrairement aux outils d’automatisation classiques, Operator ne travaille pas directement sur le navigateur de l’utilisateur. Il utilise une plateforme dédiée accessible via operator.chatgpt.com.

L’utilisateur interagit avec Operator via une interface simple et intuitive, similaire à celle de ChatGPT. Une fois une requête saisie, l’agent IA opère en temps réel, affichant ses actions à l’écran. Si une tâche ne peut être réalisée, Operator informe l’utilisateur par un message texte, permettant une supervision constante.

OpenAI propose actuellement l’accès à Operator uniquement aux abonnés américains du plan ChatGPT Pro, pour un tarif de 200 dollars par mois. OpenAI utilise cette phase de prévisualisation pour recueillir des retours et affiner les capacités de l’agent IA.

La technologie avancée au cœur d’Operator

L’innovation majeure d’Operator réside dans l’utilisation de la technologie « Compute Using Agent » (CUA), une variante avancée de GPT-4. Cette technologie combine la vision par ordinateur et l’apprentissage par renforcement. Elle permet à l’agent IA de naviguer et d’interagir directement avec des interfaces utilisateur graphiques (GUI). Au lieu d’utiliser des API (Application Programming Interface), Operator s’appuie sur des captures d’écran et des actions simulées. Ces outils lui permettent de percevoir, raisonner et agir sur des sites Web.

Cette approche innovante offre une grande flexibilité. Operator peut s’adapter à divers cas d’utilisation, allant de la planification de voyages à la gestion de listes de courses, tout en offrant des performances prometteuses sur des benchmarks tels que WebVoyager (87 % de réussite) et WebArena (58,1 % de réussite).

Sécurité renforcée et contrôle utilisateur avec Operator

Compte tenu des possibilités offertes par Operator, OpenAI a intégré des mesures de sécurité rigoureuses. L’utilisateur reste maître des actions sensibles, comme les paiements ou l’envoi de messages. Un mode de surveillance assure un contrôle continu pour les tâches critiques, notamment sur les plateformes financières.

Les équipes d’OpenAI ont conçu des systèmes pour prévenir les abus et contrer les attaques malveillantes. Elles protègent également la confidentialité des utilisateurs en proposant des options pour effacer les données de navigation et refuser le partage d’informations avec OpenAI.

Les perspectives d’avenir pour Operator et l’IA

OpenAI prévoit d’étendre l’accès à Operator à travers des offres d’abonnement supplémentaires, notamment pour les utilisateurs Team et Enterprise. OpenAI intègre progressivement Operator dans l’écosystème ChatGPT. Elle prévoit aussi de rendre l’API CUA accessible aux développeurs pour leur permettre de créer des agents IA personnalisés.

Operator allie innovation, flexibilité et sécurité. Il marque une étape clé dans l’évolution de l’IA, passant d’un outil passif à un acteur actif dans le paysage numérique. Si les limites actuelles sont surmontées, cet agent IA pourrait redéfinir l’expérience utilisateur et l’automatisation des tâches quotidiennes.

Chloé (EFIMOVE)
Chloé (EFIMOVE)
Efimove.ai est une entreprise spécialisée en intelligence artificielle à destination des entreprises afin de transformer leurs processus métiers. Efimove est également l'une des entreprises précurseuses des solutions RAG IA avec de belles références à son actif.

Suivez-nous :

Newsletter

Formation en intelligence artificielleFormation en intelligence artificielle

Populaires

A lire également
Intelligence Artificielle

Formation à l’IA, un enjeu crucial pour l’Europe

L'article N°4 de l'#IA Act fixe un cadre #juridique visant à garantir des formations adaptées à l'utilisation éthique de l'#IA.

Perplexity lance Sonar : une API pour exploiter l’IA générative

#Sonar, l’API #IA de #Perplexity, offre aux équipes #IT une solution pour intégrer des recherches fiables et actualisées.

Stargate : un projet d’IA ambitieux aux États-Unis

#Stargate pourrait redéfinir les standards de l’#IA et de l’#IT grâce à des infrastructures technologiques avancées aux États-Unis.

Mistral AI : Vers une introduction en Bourse décisive

L’annonce d’une potentielle introduction en #Bourse par #Mistral AI souligne son succès dans le domaine de l'#IT et son rôle majeur dans l’#IA européenne.