L’énigme du prisonnier : théorie des jeux et décisions logiques

Deux chemins symbolisant un dilemme de décision stratégique

La théorie des jeux est la branche des mathématiques qui étudie les situations de décision stratégique — celles où le résultat de votre choix dépend non seulement de votre décision mais aussi de celles des autres. Fondée par John von Neumann et Oskar Morgenstern en 1944, elle est devenue un outil fondamental en économie, en biologie évolutive, en sciences politiques et même en informatique. Son énigme centrale — le dilemme du prisonnier — illustre de façon saisissante pourquoi l’intérêt individuel et l’intérêt collectif peuvent diverger.

Le dilemme du prisonnier : l’énoncé classique

Deux suspects sont arrêtés et placés en isolement. Chacun peut soit coopérer avec l’autre (se taire) soit le trahir (avouer). Si les deux se taisent, ils écopent chacun d’un an de prison (charge mineure). Si les deux trahissent, ils écopent chacun de trois ans. Si l’un trahit et l’autre se tait, le traître est libéré immédiatement et le silencieux fait cinq ans. Quel choix doit faire chaque prisonnier ?

L’analyse logique individuelle conduit à la trahison : quelle que soit la décision de l’autre, trahir donne un meilleur résultat (0 an si l’autre se tait, 3 ans si l’autre trahit — contre 1 an si l’autre se tait, 5 ans si l’autre trahit). Donc les deux rationnels trahissent — et obtiennent chacun 3 ans, alors qu’ils auraient pu n’avoir qu’un an en coopérant. Ce paradoxe illustre comment la rationalité individuelle peut conduire à un résultat collectivement sous-optimal.

L’équilibre de Nash : quand personne n’a intérêt à changer

John Nash (dont la vie a été popularisée par le film A Beautiful Mind) a formalisé le concept d’équilibre qui porte son nom : une situation où aucun joueur n’a intérêt à modifier sa stratégie unilatéralement, étant donné les stratégies des autres. Dans le dilemme du prisonnier, la trahison mutuelle est l’unique équilibre de Nash — même si elle est collectivement sous-optimale.

La notion d’équilibre de Nash s’est révélée extraordinairement féconde. Elle permet d’analyser des situations aussi variées que la fixation des prix dans des oligopoles, les stratégies militaires entre nations, la coévolution prédateur-proie en biologie, ou les protocoles de communication dans les réseaux informatiques. Nash a reçu le Prix Nobel d’économie en 1994 pour cette contribution, partageant le prix avec deux autres théoriciens des jeux.

Le dilemme itéré : comment la coopération peut émerger

Le dilemme du prisonnier devient beaucoup plus riche quand on le répète un grand nombre de fois entre les mêmes joueurs. Dans ce cadre itéré, des stratégies coopératives deviennent viables. Robert Axelrod a organisé dans les années 1980 des tournois informatiques où des programmes utilisant différentes stratégies s’affrontaient dans des dilemmes itérés. La stratégie gagnante était la plus simple : « œil pour œil » (coopérer au premier coup, puis répéter le dernier choix de l’adversaire).

Cette découverte a des implications profondes pour comprendre l’émergence de la coopération dans la nature et dans les sociétés humaines. Les biologistes évolutifs ont utilisé ces résultats pour expliquer des comportements altruistes apparents dans le règne animal — l’altruisme est rationnel à long terme quand les interactions sont répétées et quand les agents se reconnaissent entre eux. La coopération ne nécessite pas d’être altruiste par nature — elle peut émerger de la rationalité dans un cadre répété.

D’autres jeux classiques de la théorie

Le jeu du faucon et de la colombe modélise les conflits de ressources : le faucon se bat toujours, la colombe recule toujours. Si deux faucons se rencontrent, ils se blessent mutuellement ; si deux colombes se rencontrent, elles partagent pacifiquement ; si un faucon rencontre une colombe, le faucon prend tout. L’équilibre évolutif prédit un mélange stable des deux stratégies dans la population — et on observe effectivement des comportements mixtes dans la nature.

Le jeu de l’ultimatum révèle les limites du modèle rationnel en économie. Un proposeur reçoit 100€ et propose un partage à un répondant. Si le répondant accepte, chacun reçoit sa part ; s’il refuse, personne ne reçoit rien. Un agent purement rationnel devrait accepter toute offre non nulle (car rien est moins que quelque chose). Or, expérimentalement, les offres de moins de 20% sont presque toujours refusées — les humains préfèrent punir l’injustice au détriment de leur propre gain.

Applications pratiques de la théorie des jeux

La théorie des jeux a transformé la pratique économique. Les ventes aux enchères du spectre radioélectrique — les fréquences que les télécommunications achètent aux gouvernements pour leurs réseaux mobiles — sont désormais conçues par des théoriciens des jeux pour maximiser les revenus gouvernementaux et l’efficacité d’allocation. Google Ads fonctionne sur une enchère de type Vickrey (deuxième prix) dont les propriétés ont été analysées par William Vickrey, Prix Nobel 1996.

Dans votre vie quotidienne, vous pratiquez intuitivement la théorie des jeux chaque fois que vous négociez, que vous choisissez une file dans un supermarché, ou que vous décidez si vous devez signaler ou non votre intention de tourner à gauche en voiture. Tester vos intuitions sur ces situations stratégiques vous donnera peut-être un avantage dans vos prochaines négociations.

La théorie des jeux nous invite à une forme particulière de sophistication cognitive : la capacité à se décentrer de sa propre perspective pour modéliser celle des autres joueurs — et à modéliser ce qu’ils pensent que vous pensez, et ainsi de suite. Cette récursivité de la pensée stratégique est ce que les théoriciens des jeux appellent la « connaissance commune » : non seulement je sais que tu sais, mais tu sais que je sais que tu sais. Les négociateurs expérimentés, les joueurs d’échecs de haut niveau et les diplomates pratiquent cette forme de pensée à plusieurs niveaux en permanence.

Ce qui rend la théorie des jeux particulièrement précieuse dans le monde actuel, c’est sa capacité à révéler des structures communes derrière des situations apparemment disparates. Le dilemme du prisonnier apparaît dans les émissions de CO2 (chaque nation a intérêt à polluer si les autres se retiennent), dans les guerres tarifaires commerciales, dans la course aux armements, dans les négociations salariales. Comprendre la structure générale permet de repérer les leviers d’action — et parfois de concevoir des institutions ou des règles qui transforment un dilemme en jeu coopératif.