In principio erat Evolutionis

行動生態学・進化心理学などの勉強ノート・書評

『人間進化の科学哲学』その7

第6章 「罰の進化」

 本章では人間行動進化の実例の一つとして罰の進化を取り上げる.罰の進化はこの20年ほど研究が行われてきており,有力な仮説として「行動修正戦略」としての罰の進化が提起されている.しかし,本章では(他の動植物同様に)人間における罰は行動修正戦略と捉えるのは難しいことが示される.

 

 まず罰についての概念の整理が行われる.罰は「ある生物に損失を与える行為」(p. 134)といえるが,とりわけ罰は「条件的」である点に特徴がある.つまり,ある有害な行為に反応して罰が与えられるということである.本章では以下のように罰を定義している.

「その罰の受け手となる生物によって引き起こされた最初の有害な行為(あるいは形質)が原因となって,その受け手に対して行われる,有害な(すなわち適応度を下げる)行為」(p. 134,括弧内は原文ママ.)

 有害な行為(侵害,violation)とは,進化的観点から見ると,適応度の減少をもたらすような行為であることに注意が必要である.ここで著者は行為者及び行為の受け手の適応度の増減に基づく行動の区分を次のように整理している.

  • 利他的行動(altruism)→行為者の適応度:減少,受け手の適応度:増加
  • 利己的行動(selfishness)→行為者の適応度:増加,受け手の適応度:減少
  • 意地悪行動(spite)→行為者の適応度:減少,受け手の適応度:減少
  • 相互扶助行動(mutualism)→行為者の適応度:増加,受け手の適応度:増加

 なお,短期的にはコストのかかる行動であっても,長期的には適応度の増大をもたらすものである可能性があることを著者は指摘する*1

  罰についての以上の議論は,あくまでも行動的・機能的な定義をしているのであって,何らかの規範についての行為者・受け手の理解が罰にとって必要というわけではない.進化的観点からは,人間のみならず,動物や植物における罰も考察対象なのである.

 

 次に罰の進化についての以下の2つの仮説を検討する.

  • 行動修正戦略(behavioral modification strategy)としての罰:罰の被害者(罰を受けたもの)の行動が修正されることによって罰を与えたものが利益を得る.
  •  行動修正なしの罰:損失削減戦略としての罰と,損失負荷戦略としての罰 

 罰の行動修正戦略 としての進化は広く受け入れられている仮説である.人間社会における刑罰や,その他の生物一般で罰に対する応答が見られるということが理由として挙げられている.GardnerとWestの言を引きながら,人間においては罰を与える行動自体がしばしばコストのかかるものであるが,それにもかかわらず罰が進化してきたのは,罰を与える個体に対して他の個体がより協力するからではないかとしている.行動修正戦略の直感的正当性として「オペランド条件づけ」がある(ラットに対する電気ショックの実験など).ただし,オペランド条件づけは,時間的に連続していることが必要であるが,実際には行為とそれに対する罰の間に時間が離れていることがあり,これは行動修正戦略による罰の進化の妥当性としては疑問だ.そこで著者は行動修正なしの罰について,上記の損失削減戦略と損失負荷戦略を検討する.

 損失削減戦略とは,以下のようなものである.

  1. それまでの間,AはBに対して何らかの利益を与えていた(つまり,Aは何らかのコストを払っていた).
  2. Bは何らかの有害な行為をした.
  3. AはBに対して利益の供与を止めた(→「利益供与にともなう損失」の削減).

 AはBを罰することで,損失を削減しているので利益を得たことになるので,適応的といえる.

 損失負荷戦略とは,侵害者に対してコストを課すことによって,侵害者が罰を与えたもの,あるいはその血縁者に対して損失を与えることができなくなることによって,罰が進化するというものである.極端な例では侵害者を殺害,または深刻な被害を与えるということが挙げられる.

 

 次に著者は植物や昆虫における罰の例を記している.大豆と根粒菌ムラサキ科の植物Cordia nodosaとアリ,イチジクとイチジクコバチ,ユッカとユッカ蛾,アシナガバチのメスの模様など,様々な例が挙げられているが,いずれも行動修正戦略として罰が進化したとは考えられず,損失削減戦略や損失負荷戦略と見ることができるとする.これらの例で行動修正戦略が機能していないのは,これらの生物の行動の柔軟性が低いからであるという可能性が示唆される.そこで次に,行動の柔軟性がより高いと思われる脊椎動物の罰を検討する.

  魚類における罰として,ハゼ科のParagobiodon xanthosomusの社会階層の例では,罰を受ける下位個体は群れから追い出されてしまい,繁殖ができなくなってしまう.これは行動修正戦略ではないだろう.ベラ科のLabroides dimidatusの例は,行動修正戦略と見えるかもしれないが,実際には罰を与える個体の適応度が,罰を与えない個体の適応度よりも高いと考えられるので,損失削減戦略ともみなせるのである.次に哺乳類,特に霊長類の例を見る.ミーアキャットの例は,群れから追い出す損失負荷戦略であるし,霊長類では,アカゲザルの食物共有の例はどうか.この例では,食物を独占する個体に対する罰を与えるコストが低く,また,独占しようとした個体に対して罰を与えれば,食物を奪うこことができるので(つまり,罰を与える個体に大きな利益があるので),行動修正なしであっても罰が進化しうるとする.なぜ行動修正戦略としての罰が,行動の自由に変化する余地の大きい脊椎動物でさえ見られないのか.その理由として,長期記憶や利益の見積もりに関する認知能力の限界を挙げている.

 

 次に人間の系統における罰が検討される.人間は高い認知能力を持っており,行動修正戦略としての罰の進化がありそうであるが実際はどうであろうか.以下の2つは,行動修正戦略仮説への反論となりうる.

 行動修正戦略としての罰は,オープンなものでないと意味がない.隠されている場合,相手の行動の修正を期待できない.つまり,ゴシップのように,当人にはわからないような形での罰は行動修正戦略ではないだろう.

 村八分は,非常に多くの社会で見られるものだが,罰の受け手を追い出してしまうものであるため,これもまた行動修正戦略ではない.

 この2つの例のように,高い認知能力を持つ人間であっても行動修正戦略として罰が進化してきたとは必ずしもいえない.これは罰に関するいくつかの実験からも示唆される.人は,行動修正を伴いものであっても罰を与えることが示されているし,また,偶然の出来事に対しても罰する傾向があるが,これは行動修正戦略とは矛盾する.

 では罰と協力の関係はどうか.これについては以下のようなゲーム的状況を設定した実験がよく行われる.

  • 公共財ゲーム:各プレイヤーが払ったコストの総額の数倍の額をプレイヤーの人数で割った額をそれぞれのプレイヤーに分配するゲーム.→罰を与えられない場合は「フリーライダー」がもっとも得をすることになる.罰を与えることができる場合は,利他的な罰がよく見られ,それが行動修正戦略を支持していると解釈される.しかし,一部の社会では利他罰が見られないし,多くの社会では罰によって平均的な利得が減少しており,集団的な利益が増えているわけではない.このことは行動修正戦略によって罰が進化したという説への反論となる.
  • 最後通牒ゲーム:2人のプレイヤーA,Bがおり,最初にAは実験者から一定額をもらい,AはBに対してある額の分配をオファーし,Bはそのオファーを受け入れるか,あるいは拒否するゲーム→最初の金額の50%程度が拒否額になれば,プレイヤーが公平性を有しているということになる.
  • 独裁者ゲーム:最後通牒ゲームにてBに拒否する権利がないようなゲーム.→結果には地域差がある.タンザニアの狩猟採集を行っているHadza族では0%の提示が最も多いそうだ.

 Hadzaの社会には二者間の罰は当然あるので,罰が協力を誘発できていないことを示していると思われる.このように罰について地域差が見られるということは公平性に関するユニバーサルなモジュールはないことを示唆している.また,Hadzaの社会では第三者への罰も見られないので,第三者への罰は農業革命以後の大規模社会によって生まれたかもしれないとしている.

 

 結論として,行動修正戦略よりも,損失削減戦略や損失負荷戦略の方がよりよく罰を説明できると著者は主張している.

 

 本章を読んで,罰の進化に関して数値シミュレーションを行ってみた.罰を与える者(P),罰を与えないもの(NP),侵害者(A)の相対適応度をw,mをmultiplication factor,cを罰を与える(与えられる)コストとして,第k+1期の相対適応度を第k期の相対適応度の関数として以下のように与えてみた.

 

{ \displaystyle w_{p, k+1} = m_{p}\frac{w_{p, k}}{w_{p,k} + w_{np, k} + w_{a, k}}\exp(-c_{p}w_{a, k}) }

{ \displaystyle w_{np, k+1} = m_{np}\frac{w_{np, k}}{w_{p,k} + w_{np, k} + w_{a, k}}}

{ \displaystyle w_{a, k+1} = m_{a}\frac{w_{a, k}}{w_{p,k} + w_{np, k} + w_{a, k}}\exp(-c_{a}w_{p, k}) }

 

 以下のように,係数の値を変えてみることで結果がかなり変化しうることがわかる.定式化の問題もありそうであり,罰の進化は条件に依存する可能性が高いのだろう.また,罰を与えるものの適応度が低くなったとしても,それまでの間に侵害者の適応度が十分に低くなっているとすれば,罰が観測されなくとも,社会は維持可能なのかもしれない.どのような条件であれば,罰を与えるものの適応度が十分に高くなるのか,もっと調べないとわかりそうにない.

f:id:tomkosaka:20171022210142p:plain

f:id:tomkosaka:20171022210236p:plain

 

 次回は第7章「教育の進化」を読む.

 

*1:著者は「短期的な適応度の増減」と「長期的な適応度の増減」と記しているが,これはいささか曖昧な表現に思われる.(短期的な)payoffは減少しても,(長期的には)適応度を増やす可能性がある,という意味で捉えればよいだろう.