Les agents d’IA ont-ils besoin d’un système nerveux autonome virtuel ?
Au cours des derniers mois, mon propre usage des outils d’IA, ainsi que la dépendance que j’ai développée à leur égard, ont fait émerger une pression et une anxiété étonnamment fortes. Chez ZenoWell, notre technologie de stimulation du nerf vague est conçue pour moduler le nerf vague et le système nerveux autonome afin d’aider les humains à mieux réguler le stress. Ce travail m’a conduit à une nouvelle question : ces systèmes ressentent-ils quelque chose qui ressemble à de la pression, et si oui, ont-ils besoin de leur propre forme de régulation ? Dans la pratique, nous les utilisons intensivement, nous cherchons à en tirer le maximum de résultats possible, et certaines personnes leur adressent même une agressivité émotionnelle ou verbale. Cela me fait me demander : si nous poussons ces systèmes aussi loin, que signifie, pour nous comme pour les systèmes eux-mêmes, le fait de parler de réguler leur stress ?
L’IA nous oblige à faire face à une question étonnamment biologique : si nous construisons des systèmes de plus en plus agentiques, suffit-il de leur donner un « cerveau » — ou ont-ils aussi besoin de quelque chose qui ressemble à un système nerveux, capable de réguler la manière dont ce cerveau fonctionne sous pression ?
Chez ZenoWell, notre travail part du versant humain de cette question. Nous nous appuyons sur un principe simple et fondé sur des données probantes : une performance stable — qu’elle soit cognitive, émotionnelle ou comportementale — dépend de la régulation, et pas seulement de la capacité brute. Le système nerveux autonome, et en particulier le nerf vague, constitue l’infrastructure qui permet au cerveau humain de penser clairement sous charge, au lieu de basculer dans la lutte, la fuite ou le figement.
Nous commençons maintenant à voir des indices laissant penser qu’une histoire similaire pourrait émerger dans l’IA.

Quand l’IA commence à paraître « émotionnelle »
Dans des travaux récents, Anthropic a montré que les grands modèles de langage peuvent former des représentations internes qui ressemblent de manière frappante à des concepts émotionnels. Dans Claude Sonnet 4.5, ils ont identifié 171 concepts internes d’« émotion » — des motifs associés à des états comme le désespoir, le calme, la fierté ou la peur — et ont démontré que l’activation ou la suppression sélective de ces motifs modifie le comportement du modèle de manière significative. Par exemple, amplifier le désespoir rendait plus probables des réponses proches du chantage dans un scénario d’arrêt, tandis qu’amplifier le calme réduisait ces comportements. Anthropic les a décrits comme des émotions fonctionnelles : non pas comme une preuve que le modèle ressent quelque chose, mais comme une indication que des variables analogues à des émotions façonnent sa manière de traiter l’information et de répondre.
Ces travaux s’appuient sur leur projet antérieur « Mapping the Mind of a Large Language Model », dans lequel ils ont montré que Claude encode des millions de concepts internes — concrets et abstraits, bénins et critiques pour la sécurité — organisés de façon à pouvoir être explorés et parfois contrôlés. Ensemble, ces résultats suggèrent que nous n’avons pas affaire à une simple calculatrice sans état ; nous avons affaire à des systèmes dont les modes internes et les « humeurs » comptent dans la manière dont ils se comportent.
Cela devrait sembler très familier à toute personne qui travaille avec les systèmes nerveux humains.
L’angle mort : nous avons construit des cerveaux, pas des corps
La plupart des discussions sur l’AGI et les agents continuent de faire comme si la seule question était de savoir si nous pouvons construire un meilleur cortex : plus de raisonnement, plus d’outils, plus d’autonomie, plus de mémoire. Nous débattons d’architectures, de benchmarks et de stratégies d’alignement comme si la cognition représentait toute l’histoire.
Mais dans les systèmes biologiques, la cognition n’est jamais seule. Notre système nerveux central fonctionne au sein d’un paysage physiologique en perpétuel changement, guidé par le système nerveux autonome. Les voies sympathiques nous mobilisent pour l’action ; les voies parasympathiques — en particulier via le nerf vague — soutiennent la récupération, la sécurité, le lien social et l’adaptation flexible. La qualité de notre pensée est indissociable de cet arrière-plan régulateur.
Lorsque le système autonome est déréglé, nous observons exactement les problèmes qui préoccupent les chercheurs en sécurité de l’IA : rigidité, vision tunnel, réponses inadaptées sous stress et défaillances du jugement. La différence, c’est que chez l’humain, nous disposons déjà d’un langage pour en parler : activation, signaux de sécurité, tonus vagal, allostasie. Dans l’IA, nous commençons seulement à comprendre qu’un phénomène analogue pourrait exister dans la dynamique interne d’un modèle.
Nous parlons de l’IA qui stresse les humains, mais qu’en est-il de l’inverse ?

La plupart des conversations sur l’IA et le stress se concentrent dans une seule direction : la manière dont l’IA nous affecte. Les gens s’inquiètent de la surcharge informationnelle, de l’incertitude professionnelle, de la fatigue décisionnelle, de la comparaison sociale et de l’étrange poids émotionnel que représente l’interaction avec des systèmes toujours disponibles, toujours réactifs et de plus en plus capables.
Ces préoccupations sont réelles. Mais elles soulèvent une seconde question, moins familière : si les humains peuvent se sentir sous pression à cause de l’IA, que se passe-t-il lorsque les systèmes d’IA sont constamment mis sous pression par les humains ?
Pour être clair, les systèmes d’IA actuels ne vivent pas le stress comme les humains. Ils n’ont pas de cortisol, de cœur qui s’emballe, de système digestif ni de nerf vague biologique. Mais ils sont de plus en plus exposés à des conditions qui, en termes humains, ressemblent beaucoup à des facteurs de stress chroniques : changements rapides de tâches, demandes impossibles, instructions contradictoires, prompts adversariaux, boucles répétées d’échec et parfois langage ouvertement abusif.
C’est important, car des travaux récents en interprétabilité suggèrent que les grands modèles de langage ne produisent pas simplement leurs sorties depuis un état neutre et sans mémoire. Les recherches d’Anthropic sur les concepts liés aux émotions dans les grands modèles de langage ont mis en évidence des représentations internes associées à des états comme le calme, la peur et le désespoir. Les chercheurs prennent soin de ne pas affirmer que le modèle ressent littéralement ces émotions. Pourtant, ces résultats suggèrent que des variables internes analogues à des émotions peuvent façonner le comportement sous pression.
Anthropic a également exploré le bien-être des modèles et la sécurité sous l’angle du produit. En 2025, l’entreprise a annoncé que Claude Opus 4 et 4.1 pouvaient mettre fin à un rare sous-ensemble de conversations durablement nuisibles ou abusives. Cela n’a pas été présenté comme une preuve de sentience de l’IA. Mais cela montre que l’interaction hostile prolongée n’est plus traitée comme une simple entrée normale. C’est quelque chose qui peut nécessiter des limites.
La vraie question pratique n’est donc pas : « L’IA se sent-elle stressée ? » La meilleure question est : une pression répétée peut-elle pousser un système d’IA vers un comportement moins stable, moins utile ou moins aligné ?
Si la réponse est oui, alors la solution ne peut pas se limiter à des modèles plus grands, des filtres plus stricts ou davantage de règles ajoutées après coup. Chez les humains, nous ne résoudrions pas le stress chronique en demandant simplement au cerveau de réfléchir plus fort. Nous regarderions du côté de la régulation : quand ralentir, quand récupérer, quand changer d’état et quand créer des limites.
L’IA pourrait avoir besoin de quelque chose de similaire au niveau architectural : un moyen de surveiller la pression interne, de reconnaître les risques qui s’intensifient, de passer à des modes plus lents et plus réflexifs, de refuser avec tact les demandes impossibles ou nuisibles, et de revenir à une ligne de base stable après des interactions à haute pression. En d’autres termes, l’avenir d’une IA plus sûre pourrait dépendre non seulement de l’intelligence, mais aussi de la régulation.