banner
Maison / Blog / Un nouveau partenariat avec Microsoft accélère le développement de l'IA générative
Blog

Un nouveau partenariat avec Microsoft accélère le développement de l'IA générative

Jan 28, 2024Jan 28, 2024

Rejoignez des cadres supérieurs à San Francisco les 11 et 12 juillet pour découvrir comment les dirigeants intègrent et optimisent les investissements en IA pour réussir. Apprendre encore plus

L'une des tendances les plus en vogue de l'intelligence artificielle (IA) cette année a été l'émergence de modèles d'IA générative populaires. Avec des technologies telles que DALL-E et Stable Diffusion, un nombre croissant de startups et de cas d'utilisation émergent.

L'IA générative s'appuie sur un certain nombre de technologies fondamentales, notamment l'utilisation de modèles de transformateurs. L'utilisation de transformateurs pour l'IA générative et d'autres cas d'utilisation peut nécessiter beaucoup de ressources du côté de l'inférence, où les systèmes prédisent et élaborent les résultats d'un modèle.

Parmi les fournisseurs qui développent une technologie pour aider à accélérer l'inférence de l'IA pour les modèles de transformateurs, on trouve la startup d-Matrix, qui a levé 44 millions de dollars dans une série A de financement en avril pour aider à développer sa technologie matérielle d'accélérateur d'IA. La société a développé une technologie de calcul numérique en mémoire (DIMC) qui n'est pas encore accessible au public, mais elle a déjà attiré l'attention de Microsoft.

Microsoft et d-Matrix ont annoncé aujourd'hui que l'apprentissage par renforcement de Microsoft Project Bonsai sera pris en charge sur la technologie d-Matrix DIMC, dont les deux fournisseurs espèrent qu'elle fournira une accélération significative pour l'inférence de l'IA.

Transformer 2023

Rejoignez-nous à San Francisco les 11 et 12 juillet, où des cadres supérieurs partageront comment ils ont intégré et optimisé les investissements en IA pour réussir et éviter les pièges courants.

"Le projet Bonsai est une plate-forme qui permet notre version de l'apprentissage par renforcement profond et nous l'appelons l'enseignement automatique", a déclaré Kingsuk Maitra, ingénieur principal en IA appliquée chez Microsoft, à VentureBeat. "Nous avons formé un compilateur pour la technologie unique de calcul numérique en mémoire de d-Matrix et les premiers résultats sont très encourageants."

Project Bonsai est en développement chez Microsoft depuis plusieurs années et est actuellement disponible en avant-première.

Maitra a déclaré que le but de l'effort est d'abstraire les complexités associées aux réseaux d'apprentissage par renforcement profond. L'un des premiers objectifs du projet Bonsai est les contrôles industriels, y compris la conception et la fabrication des puces. Une partie de la technologie est une capacité à former des modèles à l'aide d'un langage de haut niveau développé par Microsoft Project Bonsai appelé Inkling pour former des agents de renforcement profond à effectuer des tâches de contrôle.

L'apprentissage par renforcement profond ne nécessite pas de données étiquetées, a expliqué Maitra. Au contraire, il apprend essentiellement avec les commentaires de l'environnement, qui peuvent être émulés avec un simulateur. À la fin d'une boucle de formation, le résultat est un agent d'apprentissage par renforcement (RL) formé, que Microsoft appelle « cerveau ». Le cerveau, lorsqu'il est déployé, peut prendre des mesures significatives pour accomplir la tâche à accomplir.

"Nous exécutons des charges de travail réelles actives et formons le compilateur, par rapport à ces charges de travail réelles, la plupart d'entre elles avec de grands modèles de langage bien connus avec différents cerveaux Bonsai", a déclaré Maitra.

Actuellement, d-Matrix n'a pas de puces accessibles au public, mais la première, nommée Corsair, devrait faire ses débuts en 2023.

"Nous construisons une plate-forme informatique accélérée pour les transformateurs et spécifiquement axée sur l'IA générative", a déclaré Sudeep Bhoja, cofondateur, CTO chez d-Matrix à VentureBeat.

Bhoja a expliqué que les puces que d-Matrix développe peuvent être construites de manière très modulaire et peuvent être emballées avec un processeur ou peuvent être intégrées sur une carte PCI qui se branche sur un serveur dans le cloud. La technologie d-Matrix est conçue pour aider à accélérer l'inférence de l'IA, avec sa technologie DIMC qui offre des performances élevées et une faible latence.

Avec Project Bonsai de Microsoft, d-Matrix dispose désormais d'un compilateur capable de créer des outils d'apprentissage par renforcement profond pour son silicium. L'un des principaux objectifs finaux de d-Matrix est d'aider à soutenir la croissance et le déploiement continus de modèles d'IA générative.

"Nous voulons activer [les modèles d'IA générative] car cela nécessite beaucoup de puissance de traitement, il y a des contraintes de latence et c'est l'utilisateur qui est confronté", a déclaré Bhoja. "Vous devez pouvoir le faire de manière très économe en énergie afin que les centres de données n'aient pas à apporter plus d'énergie…."

La mission de VentureBeat est d'être une place publique numérique permettant aux décideurs techniques d'acquérir des connaissances sur la technologie d'entreprise transformatrice et d'effectuer des transactions. Découvrez nos Briefings.

La mission de VentureBeat