Partager
OpenAI a annoncé une mise à jour du modèle d’intelligence artificielle qui alimente Operator, son agent capable de naviguer sur le web et d’utiliser certains logiciels dans une machine virtuelle hébergée dans le cloud pour exécuter les requêtes des utilisateurs.
Operator fonctionnera bientôt avec le modèle o3
Prochainement, Operator utilisera un modèle basé sur o3, l’un des plus récents de la série o d’OpenAI, spécialisée dans le raisonnement. Jusqu’à présent, Operator s’appuyait sur une version personnalisée de GPT-4o.
Selon plusieurs critères d’évaluation, o3 est bien plus performant, notamment dans les tâches impliquant des calculs et du raisonnement.
OpenAI précise dans un billet de blog : « Nous remplaçons le modèle actuel basé sur GPT‑4o par une version fondée sur o3 pour Operator. L’API d’Operator continuera toutefois à utiliser GPT‑4o. »
Une concurrence féroce dans le développement d’agents autonomes
Operator fait partie des nombreux outils agentiques lancés récemment par les entreprises d’IA. Celles-ci rivalisent pour créer des agents capables d’exécuter des tâches complexes avec peu ou pas de supervision.
Google propose également un agent via son API Gemini, capable de naviguer sur internet et d’agir au nom de l’utilisateur. Elle propose aussi Mariner, un service destiné aux particuliers. Les modèles d’Anthropic permettent aussi d’effectuer des tâches informatiques comme l’ouverture de fichiers ou la navigation web.
Un modèle o3 amélioré pour une utilisation plus sûre
Selon OpenAI, le nouveau modèle nommé o3 Operator a été ajusté avec des données supplémentaires liées à la sécurité informatique. Ces données visent à apprendre au modèle où fixer les limites en matière de confirmations et de refus.
Un rapport technique publié par OpenAI montre les performances de o3 Operator sur plusieurs évaluations de sécurité. Comparé à la version GPT‑4o, ce nouveau modèle refuse moins souvent d’exécuter des activités considérées comme « illicites » ou de rechercher des données personnelles sensibles. Il est aussi moins vulnérable aux attaques de type « injection de prompt ».
Les capacités du modèle sont encadrées
OpenAI précise que o3 Operator utilise le même système de sécurité multicouche que la version précédente basée sur GPT‑4o. Même si o3 Operator hérite des compétences en codage du modèle o3, il ne dispose pas d’un accès direct à un environnement de développement ou à un terminal.