La sortie de GPT-4.5 par OpenAI suscite autant d’attentes que de débats. Présenté comme le modèle le plus puissant développé par l’entreprise, il affiche une capacité de traitement inégalée, mais son coût élevé interroge sur sa pertinence pour un usage à grande échelle. Ses concurrents, comme Claude 3.7 Sonnet, offrent des performances similaires pour un prix inférieur.
Disponible pour les abonnés ChatGPT Pro à 200 dollars par mois, GPT-4.5 devrait être accessible aux offres Plus et Team une fois la capacité matérielle d’OpenAI augmentée. La pénurie de GPU a retardé son déploiement à grande échelle, un problème que l’entreprise cherche activement à résoudre.
GPT-4.5 : une puissance de calcul décuplée
Les détails techniques restent limités, mais GPT-4.5 aurait nécessité une puissance de calcul dix fois supérieure à celle des modèles précédents. OpenAI a réparti l’entraînement sur plusieurs centres de données pour y parvenir. Le modèle excelle sur des benchmarks évaluant la précision des réponses et la gestion des hallucinations, réduisant ces dernières de manière significative.
Contrairement à certains modèles récents qui intègrent des techniques avancées de raisonnement, GPT-4.5 reste un LLM classique, sans capacité explicite de « chaîne de pensée ». Il ne produit pas d’auto-évaluations ou d’analyses internes avant de générer une réponse, mais il affiche des progrès en compréhension du contexte et en alignement sur les attentes des utilisateurs.
Par ailleurs, GPT-4.5 a bénéficié d’améliorations en apprentissage non supervisé, facilitant une meilleure reconnaissance des modèles et des liens logiques entre les informations. Ce programme d’entraînement a permis de rendre les interactions plus naturelles et d’améliorer la précision dans la compréhension des intentions des utilisateurs.
Un modèle plus efficace pour la gestion documentaire
L’intégration de GPT-4.5 dans des outils comme Box AI Studio démontre ses capacités avancées en gestion documentaire. Il affiche une précision améliorée pour l’extraction d’informations et la compréhension des documents financiers et juridiques. Les tests montrent une réduction des erreurs et une amélioration notable dans l’analyse des documents complexes.
Selon OpenAI, GPT-4.5 réduit le taux d’hallucinations de 37,1 % par rapport à GPT-4o, ce qui le rend plus fiable sur un large éventail de tâches, en particulier pour les applications professionnelles nécessitant une haute précision.
GPT-4.5 et ses performances en codage
GPT-4.5 montre des performances solides dans l’automatisation des tâches et l’optimisation des flux de travail. GitHub l’a intégré à Copilot pour affiner la rédaction de code et améliorer les suggestions. Il joue également un rôle clé dans l’évaluation des résultats générés par d’autres modèles d’IA, permettant une validation et un affinage des réponses.
OpenAI a également intégré GPT-4.5 à son mode ChatGPT Canvas, permettant aux utilisateurs d’y télécharger des fichiers et des images pour un traitement avancé. Toutefois, il ne prend pas encore en charge des fonctionnalités multimodales comme le mode vocal, la vidéo ou le partage d’écran.
GPT-4.5 : un coût élevé pour une adoption incertaine
Le prix élevé de GPT-4.5 constitue un frein à son adoption. Malgré ses performances, son coût supérieur à celui de ses concurrents pose la question de son retour sur investissement. L’évolution des coûts d’inférence pourrait permettre une adoption plus large à l’avenir.
Les premières réactions des chercheurs et des utilisateurs varient. Certains soulignent des améliorations en fluidité et en compréhension contextuelle, tandis que d’autres questionnent la pertinence de cette version face aux modèles récents axés sur le raisonnement.
Alors que GPT-4.5 marque une avancée en termes de traitement du langage, OpenAI continue d’explorer des approches plus sophistiquées pour les futures versions, notamment en renforçant les capacités de raisonnement et d’alignement des modèles. Son adoption dépendra de sa capacité à justifier son coût par des gains concrets en productivité et en fiabilité.