Amazon Web Services (AWS) élargit son offre en intelligence artificielle (IA) avec SageMaker, Bedrock et PartyRock, chacun répondant à des besoins différents : création de modèles, utilisation de l’IA, ou développement sans code. Voici un tour d’horizon de ces solutions.
SageMaker : création de modèles de machine learning
Lancé en 2017, SageMaker est conçu pour créer et entraîner des modèles de machine learning à grande échelle. Il s’adresse aux data scientists qui souhaitent préparer les données, entraîner les modèles, et les déployer en production. Amazon SageMaker Studio, l’interface visuelle de la solution, permet de suivre toutes les étapes, du développement au déploiement. SageMaker intègre aussi des outils MLOps (ensemble de pratiques qui visent à automatiser et améliorer la gestion du cycle de vie des modèles de machine learning) pour l’intégration et le déploiement continus.
Bedrock : utilisation des modèles existants
Bedrock, lancé en septembre 2023, se concentre sur l’utilisation de modèles préexistants, comme Anthropic Claude, Cohere Command, Meta Llama, et Amazon Titan. Il permet de développer des applications d’IA générative en accédant aux modèles via une API unique. Cette interface facilite l’intégration sans modifications lourdes du code source. Il offre aussi la possibilité d’affiner les modèles avec des données internes pour une personnalisation optimale. Bedrock Studio, l’environnement de développement visuel, permet de prototyper des applications d’IA de manière collaborative.
PartyRock : assistants intelligents sans code
PartyRock est conçu pour créer des assistants intelligents sans programmation. Destiné aux utilisateurs sans compétences en développement, il permet de créer des chatbots pour des tâches variées. Ces tâches incluent la rédaction de courriers ou le support technique. Ce service vise des scénarios prédéfinis. Il simplifie l’accès à l’IA pour les petites et moyennes entreprises, sans nécessiter une infrastructure technique complexe.
Instances adaptées aux besoins
AWS propose des instances (types de serveurs) spécifiques pour optimiser les performances de l’IA. Les instances P5, basées sur les GPU Nvidia H100, sont adaptées aux modèles de grande ampleur, tandis que les instances G5 conviennent à des besoins moins exigeants. AWS offre aussi des instances Trainium et Inferentia2, conçues pour un bon rapport performance/prix. Les puces Trainium sont idéales pour le traitement du langage naturel et la vision par ordinateur, tandis que les Inferentia2 sont adaptées à la reconnaissance vocale et à la génération de contenu.
Une offre en constante évolution
L’écosystème IA d’AWS est en pleine expansion, avec des solutions comme SageMaker, Bedrock, et PartyRock répondant à des besoins variés. AWS s’impose comme un acteur majeur de l’IA, adapté aux besoins des entreprises de toutes tailles.