ModÉvol (I) : Introduction & Hawk-Dove Game

1.1. Introduction

Le 5 juin 1981, le CDC (Centers for Disease Control), principale agence fédérale de santé publique aux États-Unis, annonce la mort de 5 hommes à Los Angeles, tous décédés suite à une pneumocystose. Le caractère surprenant de ces décès tient au fait que la pneumocystose n’amène que rarement à des cas de décès chez les individus possédant un système immunitaire normal. Depuis ce rapport, le SIDA fut reconnu comme la cause principale de leurs décès et son caractère épidémique a causé la mort de plus de 20 millions de personnes à travers le monde (UN, 2004). Mais comment progresse ce virus ? Voyons ensemble l’évolution intracorporelle de ce dernier en fonction des lymphocytes CD4 supposés défendre l’organisme contre les agressions mais qui deviennent, dans le cas du VIH, les principales victimes du virus (Otto, 2011).

 f1

Figure 1 (© Otto & Day, 2007)

 Typiquement, le temps d’incubation du virus du VIH pour atteindre sa forme pleine de SIDA prend en moyenne 10 ans la version la plus répandue HIV-1 en Amérique du Nord. Dans la phase aigüe (« acute phase »), la charge virale atteindre un pic qui dure environ 100 jours et correspondant aux symptômes de la grippe. Six semaines après la contamination, les virus particules commencent à diminuer drastiquement : qu’est-ce qui cause ce déclin ? La réponse la plus intuitive était que le système immunitaire commence à reconnaître et éliminer l’hôte infecté. Mais une explication alternative, issue d’un modèle développé par Philipps, proposa que le déclin de l’expansion du virus fût dû au fait que la plupart des cellules CD4+ étaient déjà infectées et qu’il y avait donc moins de cellules hôtes à infecter. Il expliquait donc la dynamique du virus sans avoir recours à la réponse immunitaire : ce résultat illustre le principe de parcimonie.

 ★ Principe de parcimonie/simplicité :

Privilégier le modèle contenant aussi peu de variables et paramètres possibles pour les attributs essentiels d’un système. Cette stratégie ontologique vient de la philosophie et du fameux rasoir d’Ockham. Ce principe fait l’objet de nombreux débats quant à l’adéquation entre simplicité et évidence empirique (Baker, 2013 ; voir http://plato.stanford.edu/entries/simplicity/#ProJusSim). Le débat fait notamment rage entre qui du critère d’information d’Akaike (AIC) qui se base sur le nombre de paramètre et le critère d’information bayésien (BIC), qui prend également en compte la taille de l’échantillon, permet la meilleure mesure de la qualité d’un modèle statistique donnée. Le compromis étant d’essayer de trouver un point d’équilibre entre le surajustement du modèle aux données (introduisant trop d’erreurs et de bruit) et l’hypersimplification du modèle qui le coupe de la réalité expérimentale. Pour les plus curieux, Forster & Sober (1994) propose une approche intéressante pour résoudre ce dilemme épistémique ainsi que celui de la génération d’hypothèses ad hoc (voir http://www.andrew.cmu.edu/user/kk3n/simplicity/forster-sober1994.pdf).

Finalement, le modèle de Philipps, bien qu’ayant plus tard était discrédité par certains aspects, a amené de nombreuses avancées. D’une part, il permit d’imaginer des solutions contre-intuitives telles que l’explication de la chute virale par la dynamique des cellules CD4+ sans réponse immunitaire. D’autre part, il a généré de nouvelles prédictions testables : la dynamique du virus devrait être la même chez les patients ne possédant pas d’anticorps anti-VIH, prédiction confirmée chez plusieurs patients (Philipps, 1996). Enfin, le modèle de Philipps prédit que la charge virale devrait atteindre un équilibre ce qui a cependant été contredit par les observations (la phase chronique de la figure 1 montre bien la charge virale augmente à mesure que le système immunitaire s’affaiblit).

Le type de modèle que nous venons de décrire est dit « dynamique » en ce sens qu’il décrit les changements d’un système au cours du temps. Cette puissante approche est un complément nécessaire aux statistiques fréquentistes vu dans l’article précédent et les méta-analyses sont un bon point de départ pour modéliser un système. Parmi les modèles dynamiques, 2 classes existes : déterministe (le future est entièrement prédit par le modèle) et stochastiques (des événements aléatoires affectent ce modèle qui rendre les résultats prédictibles seulement en termes de probabilité).

 f2

Figure 2 (© Bolker, 2007)

 La figure 2 décrit, dans la colonne de gauche, les caractéristiques des modèles analytiques (ce que nous allons voir dans cet article) et la colonne de droite les modèles stochastiques (Bolker, 2007). Comme nous l’avons dit précédemment, les modèles mécanistiques, bien que puissant, se focalise sur les processus sous-jacents et peuvent manquer de détails dans leurs analyses (c’est un peu comme créer une carte de Paris : le détail du croisement entre telle et telle avenue vous importe peu : vous voulez uniquement pouvoir vous diriger). Ils utilisent essentiellement des équations mathématiques là où les modèles agent-based basent leurs analyses sur des simulations assistées par ordinateurs et tentent d’extraire un « pattern » dans les données introduisant, cependant, beaucoup de bruits et d’erreurs dans vos analyses. Les deux approches ont chacune leurs avantages et leurs inconvénients et tenter de les combiner représentent à la fois un challenge et une voix d’analyse prometteuse (Bolker, 2007 ; McElreath & Boyd,  2007 ; Otto & Day, 2007). Leurs applications aux politiques publiques ont déjà été nombreuses et nourrissent considérablement des débats sociétaux aussi divers que les comportements agressifs, altruistes, sexuels (voir McElreath & Boyd, 2007) ; l’impact de la disponibilité des armes à feu sur les homicides (Wodarz & Komarova, 2013) ; la gestion optimale des ressources naturelles (Poteete, Janssen & Ostrom, 2010) ou encore la compréhension de la dynamique virale, des cancers, des changements démographiques (Otto & Day, 2007).

Nous allons nous concentrer sur les modèles analytiques en théorie des jeux évolutionnaires et ce pour plusieurs raisons (McElreath & Boyd, 2007) :

  1. D’une part, ils ont extrêmement utilisé dans la littérature biologique sans que nous connaissions nécessairement les développements sous-jacents (ce qui pourtant fondamentales).
  2. D’autre part, pour l’approche évolutionnistes que nous allons voir, ils permettent de partir de modèles très simples puis de complexifier peu à peu le système (avec des principes issus de données empiriques) pour le rendre plus réaliste. Cela permet également de voir directement les résultats d’une modification des conditions initiales sur le système là où des simulations peuvent prendre un certain temps.
  3. Enfin, la vision évolutionnaire de la théorie des jeux permet une approche distale en cherchant à expliquer les causes ultimes des comportements. Le jeu que nous allons aborder permet d’entrevoir les phénomènes d’agressions dans le modèle animal et à terme son extension chez l’être humain. Il a notamment trouvé une application dans la compréhension des conflits nucléaires comme ce fut le cas lors de la guerre froide (Russel, 1959). Le modèle de théorie des jeux que nous allons voir ne requiert que des connaissances mathématiques élémentaires (niveau collège) pour en comprendre les grandes lignes.

1.2. « Hawk-Dove Game » ou « Le Jeu du Poulet » 

Les ressources sont rares et la pénurie peut souvent mener à des conflits. Bizarrement, dans beaucoup d’espèces, les conflits se résolvent sans recours à d’extrêmes violences. Alors que dans les années 1950-1960, la plupart des biologistes pensaient que les animaux évitaient ce genre de comportements car ils favorisaient l’espèce. En 1973, Smith et Price construise un modèle, basé sur la sélection individuelle, pour tenter de comprendre cette dynamique. Ce jeu, couramment appelé « le jeu du poulet » a pour nom original « Hawk and Dove » (« le faucon et la colombe »). Je préfère ce dernier car il met en exergue les 2 stratégies de bases impliquées dans ce modèle.

ff

Imaginez une espèce où deux individus rentrent en conflit sur des ressources ou des territoires. Dans notre modèle simple, il n’existe que 2 stratégies : Hawk, qui combat toujours et ne bat jamais en retraite et Dove qui se montre dans un premier temps mais s’enfuit s’il est attaqué. Il y a donc 3 types de pairs possibles : 2 Hawks, 2 Doves et un de chaque. Si un Hawk rencontre un Dove, le Hawk accapare toutes les ressources et le Dove repart bredouille mais il n’est pas blessé (puisqu’il fuit en cas d’attaque, or Hawk attaque toujours). Lorsque 2 Doves se rencontrent, il se partage les ressources.

1.2.1. Le modèle de base   

Quelle stratégie la sélection naturelle va-t-elle favoriser ? Nous devons d’abord construire une table de « payoff » pour évaluer les conséquences des 4 interactions possibles sur le « fitness » de l’individu (ses chances de survivre et donc de transmettre ses gènes à sa descendance). La valeur de la ressources est égale à v et le coût de perdre un combat c.

Hawk Dove
Hawk (v-c)/2 v
Dove 0 v/2

Table 1. Payoffs du jeu basique Hawk-Dove.

Si l’on doit maintenant  calculer le fitness globale de la stratégie Hawk on fera donc une somme de la première ligne :

W(H) = w0 + pV(H|H) + (1-p)V(H|D) = w0 + p(v-c)/2 + (1-p)v

avec w0 le fitness de base de l’individu et p la fréquence de Hawks dans la population.

Idem pour le fitness de Dove (somme seconde ligne) :

W(D) = w0 + pV(D|H) + (1-p)V(D|D) = w0 + (1-p)v/2

Ces stratégies sont-elles stables évolutionnairement ? Plus précisément, ces stratégies sont-elles stables si elles sont envahies par des stratégies concurrentes ? Imaginez qu’il existe très peu de Doves dans la population et que donc Hawks n’en croisent quasiment pas (p≈1) :

W(H) ≈ w0 + (v-c)/2

W(D) ≈ w0 + 0

Doves ne gagne jamais les ressources mais ne se fait jamais battre non plus. Il s’en sort mieux uniquement lorsque W(D) > W(H) soit :

w0 + (v-c)/2 < w0 + 0 <-> v-c < 0 <-> v<c.

Dove peut envahir une population de Hawks quand le coût de perdre un combat excède la valeur des ressources pour lequel la bataille a lieu. Quand la bataille est coûteuse, un Dove peut de temps à autre envahir la population. A l’inverse, quand est-ce qu’une population en majorité de Doves peut-elle résister à une invasion de Hawks ? (p≈0) :

W(D) ≈ w0 + v/2

W(H) ≈ w0 + v

Comme v > v/2, un Hawk peut toujours envahir une population majoritairement de Doves. Aucune de ces stratégies ne résistent à l’invasion par d’autres stratégies, ils ne sont pas des ESS (stratégie évolutionnaire stable).  Mais une stratégie mixte de Hawks et Doves peut-elle exister ? Nous savons qu’un équilibre existe quand :

∆p = p(1-p)*(W(H)-W(D)/w) = 0 (figure 3)

soit quand p=0, p=1 ou W(H)=W(D)

 f3

             Figure 3 (© McElreath & Boyd, 2007)

 Soit p = ṕ et W(H) = W(D), cherchons la fréquence de p pour laquelle il y a un mix stable de Hawks et de Doves :

w0 + ṕ(v-c)/2 + (1- ṕ)v = w0 + (1- ṕ)v/2 <-> ṕ(v-2)/2 + (2(1-p)v – (1- ṕ)v))/2 = 0 <-> ṕv – ṕc + 2v – 2ṕv – v + ṕv = 0 <-> -pc + v = 0 <-> p = v/c.

Le système est à l’équilibre quand une fraction de v/c est Hawk et une fraction de 1-(v/c)(1-p) est Dove. Les théoriciens des jeux appellent ces équilibres ou plus d’une stratégie persiste un équilibre mix ou polymorphique pour les généticiens.

Si on plote Δp contre p, on voit que Δp = 0 (équilibre)  quand ṕ = 1, ṕ = 0 ou p = v/c comme nous venons de le voir (figure 4).

 f4

             Figure 4 (©McElreath & Boyd, 2007)

Le modèle Hawk-Dove a deux résultats qualitatifs différents en fonction du ratio v/c. Quand la valeur de la ressource excède le cout du combat, Hawk domine et la meilleur stratégie est l’agression ; quand les combats sont couteux, à l’inverse une stratégie mix de Dove et Hawk émerge quand la fréquence de Hawk est v/c.

1.2.2. Le Riposteur

Roosevelt résumait sa politique internationale en disant « speak softly and carry a big stick » indiquant qu’il faut être diplomate mais être prêt à se battre en cas d’agression. Insérer dans notre Hawk-Dove Game, cette stratégie de riposte nous donne la matrice de payoff suivante :

Hawk Dove Riposteur
Hawk (v-c)/2 v (v-c)/2
Dove 0 v/2 v/2
Riposteur (v-c)/2 v/2 v/2

W(R) = w0 + p(v-c)/2 + (1-p-q)v/2 + qv/2 avec q = fréquence de R ; 1-p-q = fréquence de Doves.

W(H) = w0 + (p+q)(v-c)/2 + (1-p-q)v

W(D) = w0 + (1-p-q)v/2 + qv/2

La stratégie du Riposteur est-elle évolutionnairement stable ?

V(R|R) > V(H|R) = v/2 > (v-c)/2 donc c > 0 ce qui est toujours le cas.

Quand H est rare (p=0) :

W(D) = W(R) = w0 + v/2

W(H) = w0 + q(v-c)/2 + (1-q)v

Or, si W(H) > W(D) ou W(R)

q(v-c)/2 + (1-q)v > v/2 <-> q(v-c) + 2(1-q)v > v <-> qv – qc + 2v – v – 2qv > 0 <-> -qv – qc + v > 0 <-> q(-v-c) > – v <-> q > -v/(-v-c) <-> q < v/(v+c)

Au-delà de ce seuil de Riposteurs, Hawk ne peut envahir la population mais en-dessous de cette fréquence Hawk exploite Dove pour résister à R et finalement les envahir. Que se passe-t-il quand il y a l’équilibre Hawk/Dove (q = 0, p = v/c), W(H) = W(D) = w0 + (1-(v-c))(v/2), W(R)= w0 + (v/c)*((v-c)/2))+(1-(v/c))*(v/2)).

Un rare Riposteur peut envahir ce mix quand : W(R) – W(H) > (v/c)*((v-c)/2) > 0 ce qui est vrai seulement quand v >c.

 f5

             Figure 5 (© McElreath & Boyd, 2007)

Si on veut maintenant représenter graphiquement comment le système se comporte en fonction du mix de ces 3 stratégies, on peut utiliser un triangle au lieu d’un simple graphique rectangulaire (qui privilégierait toujours 2 stratégies sur la 3ème).  La figure 5 représente ce diagramme : le segment du bas représente le modèle Hawk-Dove de base. Les courbes internes montrent comment le système évolue en fonction de conditions initiales dépendante du mélange des 3 stratégies. La fréquence de ces 3 stratégies est donnée par la longueur du segment perpendiculaire projetée perpendiculairement sur la face opposée.

1.2.3. « Ressource Holding Power »

Jusqu’ici nous avons présenté uniquement des combats avec des caractéristiques symétriques. Cependant, il est évident que dans la nature les individus présentent d’énormes disparités : ils n’arrivent pas en même temps sur le terrain, ne mesurent pas la même taille, joue Hawk une partie du temps Dove le reste du temps, etc. Une asymétrie corrélée avec les chances de succès s’appellent « Ressources Holding Power » (Parker, 1974).

Nous ajoutons la stratégie « Expert » qui joue Hawk quand Expert est plus gros et Dove quand il est plus petit.

x = chance de gagner quand on est plus gros que son adversaire x > 1/2 donc quand plus petit (1-x) < 1/2

V(A|A) = (1/2)*v (bigger) + 1/2 *0 (smaller) = v/2

V(A|H) = (1/2)*(xv-(1-x)c) + (1/2)*0 = (xv-(1-x)c)/2

V(H|A) = (1/2)*v + (1/2)*((1-x)v-xc) (smaller)

Pour Expert vs. Dove : V(A|D) = (1/2)*v (bigger) + (1/2)*v/2(smaller) = 3v/4

V(D|A) = (1/2)*v/2 + (1/2)*0 = v/4

ESS contre Dove car V(A|A) > V(D|A)

Mais contre Hawk : v/2 > v/2 + ((1-x)v –xc)/2

0 > ((1-x)v-xc)/2

0 > v/2 – xv/2 / xc/2

xc > v(1-x) quand x=1, Expert est ESS (si c > 0)

Si x = 1/2, Expert est ESS quand v < c (si perdre est très couteux, vous devez choisir très sagement vos combats). Si les gens choisissaient uniquement les combats qu’ils peuvent gagner, l’agression universelle pourrait donc être stable.

De nombreux ajouts peuvent être trouvés dans le chapitre « Animal Conflict » du livre de McElreath & Boyd (strategie continue, jeu sequentiel et toute les reference du chapitre que vous pouvez travailler). Le prochain article portera sur les processus d’altruisme et le fameux dilemme du prisonnier.

Bibliographie

  • Baker, A. (2008). Simplicity. Stanford encyclopedia of philosophy.
  • Bolker, B. M. (2008). Ecological models and data in R. Princeton University Press.
  • Forster, M., & Sober, E. (1994). How to tell when simpler, more unified, or less ad hoc theories will provide more accurate predictions. The British Journal for the Philosophy of Science, 45(1), 1-35.
  • Joint United Nations Programme on HIV/AIDS. 2004b. UNAIDS 2004 Report on the global AIDS epidemic. UNAIDS, Geneva, Switzerland
  • Maynard Smith, J. and Price, G. R. (1973). The logic of animal conflict. Nature, 146:15–18.
  • McElreath, R., & Boyd, R. (2008). Mathematical models of social evolution: A guide for the perplexed. University of Chicago Press.
  • Otto, S. P., & Day, T. (2007). A biologist’s guide to mathematical modeling in ecology and evolution (Vol. 13). Princeton University Press.
  • Phillips, A. N. 1996. Reduction of HIV concentration during acute infection: Independence from a specific immune response. Science 271:497–499.
  • Poteete, A. R., Janssen, M. A., & Ostrom, E. (2010). Working together: collective action, the commons, and multiple methods in practice. Princeton University Press.
  • Russell, B. (1959). Common sense and nuclear warfare. Psychology Press.
  • Wodarz, D., & Komarova, N. L. (2013). Dependence of the firearm-related homicide rate on gun availability: a mathematical analysis. PloS one, 8(7).
Advertisements

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out / Change )

Twitter picture

You are commenting using your Twitter account. Log Out / Change )

Facebook photo

You are commenting using your Facebook account. Log Out / Change )

Google+ photo

You are commenting using your Google+ account. Log Out / Change )

Connecting to %s