13 février 2025

Akgents : Vers de véritables escouades hybrides homme-IA

Que sont les Akgents ?

En bref, les Akgents, ou acteurs-agents, sont une mise en œuvre opérationnelle de la proposition de valeur de la transformation de l'IA, sur laquelle vous pouvez en savoir plus ici.

Les akgents sont une nouvelle version d'une vieille idée. Dans les années 70, les gens réfléchissaient à des paradigmes de programmation adaptés à la parallélisation des tâches informatiques, et c'est ainsi qu'est apparue l'idée du modèle de l'acteur. Si vous avez rencontré le modèle d'acteur au cours des deux dernières décennies, ce n'était probablement pas dans le contexte de l'intelligence artificielle, mais l'objectif de l'article original était en fait l'intelligence artificielle, ce qui est même mentionné dans le titre : "A Universal Modular ACTOR Formalism for Artificial Intelligence". ¹ Je trouve fascinant que, dès les années 1970, des personnes aient réfléchi à la manière de construire des systèmes d'IA robustes et évolutifs. Si vous lisez l'article, que je vous recommande vivement, vous verrez qu'ils sont allés assez loin (du moins en théorie) !

Au fil du temps, l'idée des acteurs a été reléguée au second plan par des concepts tels que la programmation orientée objet, la programmation fonctionnelle, etc.

La raison, vous le devinez sans doute, ce sont les systèmes d'intelligence artificielle multi-agents !

La beauté du modèle d'acteur réside dans sa simplicité ! Les acteurs sont des entités logiques qui peuvent faire quatre choses :

Maintenir leur propre État
Effectuer des actions
Envoyer des messages à d'autres acteurs
Engendre/détruit d'autres acteurs

C'est tout. C'est tout le modèle. Il s'avère que cela suffit pour construire des systèmes d'IA robustes qui résolvent de nombreux problèmes auxquels les agents d'IA sont actuellement confrontés.

‍L'approche ne requiert aucune structure ou processus intrinsèque, mais soutient ces concepts comme faisant partie de la conception ou même comme une propriété émergente ! Voir l'exemple du débat ci-dessous : c'est un pur chaos fonctionnel, mais il fonctionne !

Chez B12 et Yuma, nous avons beaucoup réfléchi à la manière d'aller au-delà de l'actuel SOTA dans les systèmes d'IA agentique. Nous pensons que les systèmes multi-agents, qui nous permettent de former des équipes d'agents d'IA et d'humains de manière transparente, sûre et efficace, seront la prochaine grande nouveauté en matière d'IA. Cependant, les frameworks tels que Langchain, bien qu'ils soient parfaits pour construire des applications de back-office et des flux de travail alimentés par l'IA, souffrent de certaines limitations techniques dans le contexte des multi-agents. Par exemple, les graphes de Langchain sont statiques, ce qui signifie que si vous souhaitez ajouter ou supprimer des agents, vous devez générer un nouveau graphe, le recharger et le redémarrer. Ce n'est guère souhaitable si vous construisez une application évolutive. En outre, si vous souhaitez mettre l'humain dans la boucle, vous devez interrompre l'exécution de l'ensemble du graphe. Étant donné que les humains et l'IA travaillent sur des échelles de temps très différentes, cela n'est pas optimal. Enfin, les nœuds d'une chaîne linguistique partagent un état global, ce qui est encombrant à bien des égards : gouvernance, évolutivité, etc.

C'est pourquoi nous avons commencé à réfléchir à d'autres approches, et le modèle de l'acteur nous a semblé être une voie naturelle à explorer. Quelques discussions intenses sur tableau blanc plus tard, l'ensemble s'est rapidement mis en place, aboutissant à une nouvelle approche basée sur le modèle de l'acteur. Récemment, nous avons également appris que Microsoft travaillait sur une approche similaire des multi-agents, la version 0.4 d'AutoGen étant également basée sur le modèle de l'acteur. Nous y avons vu une validation passionnante de nos idées !

Nous nous sommes inspirés de l'idée des acteurs pour élever la notion d'agent à une entité logique qui "vit" à l'intérieur d'un acteur. Il peut s'agir d'un agent Langraph doté d'outils multiples, d'un morceau de code déterministe ou d'un être humain ! Chaque acteur peut être alimenté par son propre modèle d'IA, avoir un rôle défini, une personnalité, des outils, des actions et des règles concernant les personnes à qui il peut envoyer des messages et à quel moment. Les agents peuvent vivre dans l'espace réel (par exemple, nous, les humains), dans le nuage ou sur site. Il n'y a aucune limite à l'endroit où vous pouvez les déployer !

‍Labeauté du cadre est qu'il est moins axé sur la technologie que sur les aspects organisationnels de l'équipe Akgent, qui apparaît comme le concept central. C'est très important car lorsque nous parlons de systèmes multi-agents, d'IA, de logiciels, etc. nous ne nous intéressons pas vraiment aux détails de la technologie. nous ne nous intéressons pas vraiment aux détails de la technologie, mais plutôt à la manière dont nous pouvons utiliser cette technologie pour en faire quelque chose d'utile. Le cadre Akgent vous permet de passer des détails techniques aux objectifs fondamentaux de manière très organique.

Les Akgents répondent directement aux cinq piliers de la transformation de l'IA décrits ci-dessus :

Perspective holistique: Les Akgents agissent comme des membres d'une équipe dans n'importe quelle situation et peuvent être adaptés à n'importe quelle organisation ou processus, et peuvent être utilisés pour redéfinir les notions fondamentales d'une organisation à n'importe quel niveau.
L'autonomisation de l'homme: Les Akgents sont conçus pour rehausser le rôle de l'humain, et non pour le remplacer ! L'approche est intrinsèquement inclusive, ce qui facilite la gestion du changement et permet de générer une valeur supérieure à celle de l'approche d'automatisation complète de l'IA, par exemple.
L'intelligence collaborative: Le concept central de l'approche n'est pas l'agent lui-même, mais l'équipe ! Les Akgents résolvent un problème technique majeur qui consiste à permettre aux agents de l'IA et aux agents humains de communiquer de manière transparente sans avoir besoin d'interrompre les opérations, malgré le fait que les humains et l'IA travaillent sur des échelles de temps différentes, dans le but ultime de permettre à l'IA et aux humains de fonctionner comme plus que la simple somme de leurs parties.‍
Souveraineté : Akgents peut être alimenté par n'importe quel modèle d'IA, n'importe où ! Cela signifie que la gestion des questions de gouvernance est intégrée dans le cadre. Si une partie de l'équipe multi-agents doit vivre dans un espace de données protégé, il est facile de s'en accommoder. Si une autre partie doit se trouver dans le cloud, il en va de même.
Durabilité et résilience: Les équipes Akgentic sont architecturalement élastiques (si un akgent tombe en panne, le système continue à fonctionner). Elles s'auto-échelonnent également bien - vous pouvez créer et détruire des Akgents à la volée, en utilisant les ressources lorsque vous en avez besoin et en garantissant un haut degré d'évolutivité et des pratiques informatiques vertes.

Voyons quelques exemples de ce que vous pouvez faire avec les Akgents.

Un débat présidentiel avec un agent marionnettiste

Supposons que nous voulions simuler un débat présidentiel réaliste en utilisant des agents dotés d'une intelligence artificielle. Vous avez besoin d'un modérateur qui générera des questions sur un sujet et s'assurera que les deux candidats ont eu l'occasion d'y répondre. Les deux candidats répondront aux questions du modérateur et réagiront aux réponses de leurs adversaires.

Jusqu'à présent, la structure est quelque chose que vous pouvez faire avec Python et l'accès à une API OpenAI. Mais disons que nous voulons maintenant être en mesure d'ajouter un public dans le mélange. C'est là que les choses deviennent intéressantes.

Le public est là pour écouter, mais il peut aussi réagir à ce qu'il entend. S'ils soutiennent un candidat, ils peuvent crier leur soutien, mais s'ils entendent l'autre candidat, ils peuvent le huer. En outre, nous ne savons pas vraiment, dans la réalité, quand le public réagira ni comment il le fera. Les débatteurs entendent également le public et y réagissent. C'est quelque chose de très difficile à faire sans un système multi-agents intrinsèquement asynchrone.

Allons plus loin. Je peux, en tant qu'agent humain sournois, contrôler qui obtient un auditoire, combien il y en a et quel doit être leur ordre du jour. Cela doit se faire sans affecter le déroulement du débat. En d'autres termes, les agents du public doivent apparaître (ou disparaître), commencer à écouter et réagir à ce qu'ils entendent sans que les débatteurs, le modérateur ou les autres membres du public ne bronchent.

Je peux également communiquer avec l'agent modérateur en lui "chuchotant" des instructions à la volée, sans affecter le déroulement du débat. Par exemple, je peux lui demander de changer le sujet du débat pour celui que je souhaite. Enfin, je peux modifier la personnalité (c'est-à-dire l'état) de n'importe quel agent pendant le déroulement du débat.

Ça paraît fou, non ? Mais c'est possible !

Regardez la vidéo ci-dessous pour voir comment cela fonctionne.

‍L'exemple du débat sert à illustrer comment vous pouvez construire un système multi-agents utile et fonctionnel sans avoir besoin d'un processus ou d'une structure prédéfinis !

Vous pourriez simuler n'importe quelle structure d'équipe, ou comment concevoir de manière optimale le flux d'informations à travers une structure organisationnelle. Vous pouvez le faire en tenant compte d'aspects tels que l'action sur des informations partielles, l'ajout/la soustraction de membres de l'équipe, le changement de personnalités, d'objectifs et de tâches au milieu du processus, etc. C'est le conseil en gestion alimenté par l'IA !

Équipe de soutien

La gestion du traitement des données est un défi très courant auquel sont confrontées de nombreuses organisations. Que vous soyez un cabinet d'avocats, une compagnie d'assurance ou un fabricant de biens de consommation, vous devez très probablement traiter quotidiennement un grand nombre de courriers électroniques, de documents, etc. et le traitement de ces données peut devenir une opération très gourmande en ressources.

Pour rendre les choses encore plus complexes, il est souvent difficile de prévoir le contenu ou l'objectif des courriers électroniques ou des documents entrants. Un client peut vous poser des questions sur votre produit, mais aussi sur un autre sujet. Il peut également fournir un ou plusieurs documents dont le contenu et le format varient. Tenter de relever ce défi en construisant des pipelines de traitement de données est voué à l'échec, car la complexité globale des scénarios que vous devez gérer est tout simplement trop importante pour permettre la mise en place d'un système de type pipeline qui soit évolutif ou susceptible d'être maintenu.

Les Akgents offrent une solution ! Au lieu de se focaliser sur un processus rigide d'acquisition de données, les Akgents vous permettent de changer d'état d'esprit et de passer de la tâche de traitement des données à l'objectif de l'équipe, à savoir résoudre un problème de client, fournir un rapport, etc. Imaginez par exemple que vous dirigez un centre de support client pour une société SaaS et que vous recevez quotidiennement des courriels de vos clients. Ces courriels peuvent concerner n'importe quelle fonctionnalité de votre SaaS, la tarification, des questions sur votre feuille de route de développement, des demandes de renseignements sur la réglementation, etc. Il peut également s'agir de simples félicitations de fin d'année.

L'automatisation complète de ce processus peut, bien sûr, être risquée, c'est pourquoi vous devez garder l'humain dans la boucle. Vous pouvez imaginer un système hybride humain-IA, dans lequel un agent analyste de courrier électronique reçoit le courrier entrant et détermine les questions à traiter (et éventuellement les documents nécessaires pour y répondre). Pour chaque question, l'analyste de courrier électronique peut déléguer le processus de formulation de la réponse en créant des membres de l'équipe d'assistance. Les membres de l'équipe d'assistance peuvent avoir accès aux bases de connaissances via les systèmes RAG ou par d'autres moyens, et peuvent déterminer s'il manque des informations. Si l'information est manquante, ils peuvent relayer le message à l'analyste, qui peut décider d'envoyer un courrier électronique au client pour lui demander l'information manquante, ou se référer à un membre de l'équipe. Les membres de l'équipe d'assistance peuvent attendre que l'information supplémentaire arrive, mais si un autre courriel arrive, l'analyste principal peut simplement envoyer une autre équipe de juniors pour le traiter sans affecter l'état d'avancement de l'autre courriel. L'humain, quant à lui, peut choisir d'intervenir et de fournir de nouvelles informations à n'importe quel analyste, ou de transmettre les informations du client. Il peut également choisir de modifier le comportement de l'analyste à la volée s'il remarque, par exemple, qu'un analyste répète une erreur en raison d'un manque de clarté du contexte.

Pendant l'exécution, les agents peuvent poser des questions à l'humain, et l'humain peut interférer avec le flux d'informations en discutant avec les agents, de la même manière que vous enverriez des instructions à un membre junior de l'équipe s'il a fait quelque chose de mal.

Voici une vidéo d'un courriel multi-agents et vous pouvez voir la démonstration vidéo de son fonctionnement ici :

L'ensemble du système ressemble beaucoup à la façon dont les équipes humaines travaillent au départ, et c'est précisément cette approche intuitive de la conception des systèmes d'IA qui constitue une grande partie de la valeur de l'approche d'Akgent - en fin de compte, le problème que vous devez résoudre est moins technologique et plus organisationnel.

‍Pourquoine pas gérer cela avec un seul agent Email Analyst qui s'occupe de tout ? Vous pourriez, mais vous vous retrouveriez avec un système beaucoup plus gourmand en ressources, plus difficile à concevoir du point de vue de la gouvernance et globalement moins résilient.

L'IA au service des jeux (et pas seulement des jeux vidéo)

Les jeux vidéo constituent un environnement très naturel pour les systèmes multi-agents, qui ont le potentiel de rendre les jeux beaucoup plus réalistes, non linéaires et intéressants. Imaginez que vous construisiez un jeu de rôle d'exploration du monde dans lequel les personnages pilotés par des humains rencontrent d'autres personnages pilotés par des IA. Vous pouvez imaginer que chacun d'entre eux est un Akgent, avec son propre état, sa capacité à utiliser des outils, à effectuer des actions et à communiquer. Chaque type d'Akgent peut avoir une personnalité. Cette personnalité peut évoluer au fil du temps, soit par l'intermédiaire d'une contribution humaine, soit par les changements d'état de l'agent (dans la vie réelle, nous appellerions cela l'expérience). Il serait très difficile de prédire le déroulement d'un tel jeu, mais c'est peut-être ce qui rendra les jeux plus amusants à l'avenir !

Les jeux alimentés par des agents peuvent servir d'émulations plus réalistes des systèmes sociaux que ce qui était possible dans le passé. Nous pouvons les utiliser non seulement pour créer des jeux vidéo plus intéressants, mais aussi pour simuler des structures organisationnelles ou concevoir des stratégies basées sur l'IA pour des chaînes d'approvisionnement résilientes.

Conclusions

En résumé, les Akgents offrent un nouveau paradigme pour construire des systèmes multi-agents alimentés par l'IA qui ne souffrent pas des nombreux inconvénients des cadres actuels tels que l'état global et le manque de capacité d'exécution simultanée. Ils permettent une intégration transparente des agents d'IA et des humains, en respectant le fait que chacun d'entre eux opère à des échelles de temps différentes. Enfin, le fait que nous puissions créer/détruire des Akgents lorsque nous en avons besoin permet de construire des systèmes d'IA beaucoup plus évolutifs qu'auparavant. Nous sommes très enthousiastes quant aux possibilités offertes par ce cadre pour construire une nouvelle génération de systèmes multi-agents !

‍

Références

https://www.ijcai.org/Proceedings/73/Papers/027B.pdf

‍

A propos de l'auteur

‍MihailoBacković a commencé en tant que physicien théorique devenu expert en IA qui se spécialise dans l'accompagnement des organisations à travers des transformations réussies de l'IA. En tant qu'associé directeur chez B12 Consulting | part of Yuma, il aide de nombreuses entreprises - des biotechnologies et de la santé à la mobilité et à la finance - à exploiter l'IA pour réaliser leurs plus grandes ambitions. Connu pour son approche analytique approfondie et sa passion pour les problèmes complexes, Mihailo se consacre à façonner un avenir où l'IA et l'humanité prospèrent ensemble. Il explore activement l'impact transformateur de l'IA sur des sujets tels que le marché du travail, la démocratie, la désinformation, et s'engage à construire des solutions d'IA qui permettent aux personnes et aux entreprises de prospérer dans un monde de plus en plus automatisé.

Mihailo Backovic

https://weareyuma.com/insights/Akgents-Towards-True-Hybrid-Human-AI-Squads

Retour aux news

Vous souhaitez lancer un projet ?

Parlons-en

Contactez-nous

13 février 2025

Akgents : Vers de véritables escouades hybrides homme-IA

Que sont les Akgents ?

Un débat présidentiel avec un agent marionnettiste

Équipe de soutien

L'IA au service des jeux (et pas seulement des jeux vidéo)

Conclusions

Références

A propos de l'auteur

Au-delà des mots à la mode : ce qui distingue vraiment les systèmes multi-agents

L'équipe en tant que service : Une expédition vers la création de valeur par l'IA

ReacLM : rationaliser la conformité financière grâce à l'IA

Vous souhaitez lancer un projet ?

Parlons-en

13 février 2025

Akgents : Vers de véritables escouades hybrides homme-IA

Que sont les Akgents ?

Un débat présidentiel avec un agent marionnettiste

Équipe de soutien

L'IA au service des jeux (et pas seulement des jeux vidéo)

Conclusions

Références

A propos de l'auteur

Nos actualités

Au-delà des mots à la mode : ce qui distingue vraiment les systèmes multi-agents

L'équipe en tant que service : Une expédition vers la création de valeur par l'IA

ReacLM : rationaliser la conformité financière grâce à l'IA

Vous souhaitez lancer un projet ?

Parlons-en