簡単な数理社会学の練習問題集 (ver. 2.2) (Last Updated 10/01/02)

 以下に示す問題は、小林淳一・木村邦博 1997 『数理の発想(アイディア)でみる社会』 ナカニシヤ出版 の各章および「数学のおさらい」で学んだ手法の練習問題として、木村が考えたものです。まず1999年度の「行動科学基礎演習U」(東北大学文学部)のために作成し (ver. 1.1)、2001年度の「計量社会学特論(数理社会学)」(大阪大学人間科学部、集中講義)のために改訂しました (ver. 2.1)。HTML文書化にあたって、若干の修正を加え、ver. 2.2 としました。
 この問題集に関するご意見、ご感想、改訂のご提案などをお聞かせいただければ幸いです。どうぞよろしくお願いいたします。


問題1 テニスで勝つ確率 [1章、数学のおさらい(A)(B)]

(1) テニスで1ポイント取る確率を p とする。このとき、

(a) 4ポイント先取する確率
(b) 1ゲームを取る確率
(c) 1セットを取る確率
(d) 5セット・マッチで勝つ確率

をもとめよ (Haigh 1999, pp155-160; Paulos 1995, pp.176-177, 訳189-190頁; Stewart 1989, chap.2)

ヒント
k 回目の成功を得るまでの失敗の回数を x (= 0, 1, 2, ...) として、その確率を考える。(あるいは、n 回目にはじめてk 回成功する確率を考える。ただし n = x + k ; x は失敗の回数。)これは、負の二項分布 (ex. 池田 1989, 63頁; 西田 1973, 38頁; 東京大学教養学部統計学教室 1991, 119頁) になる。これを利用すればよい。
デュースになるところでは、無限等比級数を利用する。
タイブレークがあり得ることにも注意。

(2) p = 0.4 の場合、(1)でもとめた(a)(b)(c)(d)のそれぞれの確率はどのような数値になるか。

(3) [余裕があれば挑戦!] p ∈ [0, 1] の値が変化すると、(1)でもとめた(a)(b)(c)(d)のそれぞれの確率がどのように変化するか、Mathematica, Speakeasy などのコンピュータ・ソフトを利用してグラフで表しなさい。(プログラムとグラフの出力結果の両方を提出すること。)

(4) 以上の結果から、テニスのルールの特徴として、どのようなことを指摘できるか、考えよ。

(5) 以上のことをふまえて、様々なスポーツのルールの評価について考察せよ(cf. 中村 [1989] 1994, テニスについては特に6章; 平野 1999 など)。

ヒント
たとえば、「おもしろさ」「公平」などの観点から見るとどのようなことが言えるだろうか。

文献


問題2 変化の行方 [2章、数学のおさらい(C)(D)]

 次のA・Bの両方について解答すること。

A 一生のうちに飲むビールの銘柄の割合 (cf. 高坂 1978)
K君は毎日、ビールを飲む。好きな銘柄はシマウマ・ビールの「ファースト搾り」とサンライズ・ビールの「ウルトラ・ドライ」で、この2つのいずれかしか飲まない。K君が「ファースト搾り」を飲んだ翌日にまた「ファースト搾り」を飲む確率は 0.4 である。他方、「ウルトラ・ドライ」を飲んだ翌日に「ファースト搾り」を飲む確率は 0.8 である。

(1) この調子で行くと、K君が一生のうちに飲むビールのうち「ファースト搾り」「ウルトラ・ドライ」はそれぞれおおよそどれくらいの割合を占めると予想されるだろうか。(不動点確率ベクトルで表される定常分布・極限分布でこの割合を推定してみよう。)

(2) [余裕があれば挑戦!] 1日目には確率 p で「ファースト搾り」を飲んでいるとして、2日目ではそれぞれの銘柄を飲む確率はどれくらいか、3日目では、......というように、変化のプロセスが見えるようなコンピュータ・プログラムを作成せよ(用いる「言語」は何でもよい)。初期確率 p の値を様々に変えてみて、定常分布・極限分布(不動点確率ベクトルで表される分布)においてそれぞれの銘柄を飲んでいる確率が初期確率 p に依存しないことを確認してみよ。

B 移り気な投票行動
 ある(架空の)国では、伝統党、民衆党、革新党という3つの政党があり、激しい選挙戦が頻繁に繰り返されていた。政治学者の研究により、最近の2回の選挙における有権者の投票には、次のようなパターンが見出されるということがわかった。


   (1) 前回伝統党に投票した人のうち、55%が今回も伝統党に投票、
                      30%が今回は民衆党に投票、
                      15%が今回は革新党に投票した。
   (2) 前回民衆党に投票した人のうち、30%が今回は伝統党に投票、
                      60%が今回も民衆党に投票、
                      10%が今回は革新党に投票した。
   (3) 前回革新党に投票した人のうち、15%が今回は伝統党に投票、
                      35%が今回は民衆党に投票、
                      50%が今回も革新党に投票した。

(なお、前回の選挙における各政党の得票率は、伝統党45%、民衆党35%、革新党20%であった。)
投票する政党の変化が上のような形のまま選挙が繰り返されていくと仮定した場合、最終的に各政党の得票率はどのようになると予想されるだろうか。

文献


問題3 簡単な家庭経済学 [3章、数学のおさらい(E)]

家庭の主な働き手(主に夫)と補助的な働き手(主に妻)の労働時間の決定に関して、意思決定のしかたが次のように異なる、という考えがある (cf. Kay and King 1990, pp.25-35, 訳40-46頁; Hakim 1996, p.66)。

主な働き手:労働時間を(1単位だけ)増やしたときの税金額の増加率に反応
補助的な働き手:単位労働時間あたりの税金額に反応

次のようなモデルを用いて、この説について検討してみよう。

仮定1 賃金 W と税金 C は、労働時間 T の関数で、次のように表される。

W = kT (ただし、k > 0 は定数)
C = aT b (ただし、a > 0, b > 1 は定数)

注釈
問題の性質上、T ≥ 0 の範囲で考える。
k は賃金率。たとえば「時給いくらか」にあたる。
厳密にいうと、税金額は賃金額の関数であるけれども、賃金額が労働時間の関数なので、税金額を労働時間の関数として表すことができる。
b > 1 としたことにより、一種の累進課税を想定していることになる。長時間働けば働くほど税金額そのものが大きくなる(dC/dT ≥ 0, 等号は T = 0 のとき)ということだけでなく、税金額の増加率も大きくなる(d 2C/dT 2 ≥ 0, 等号は T = 0 のとき)ということも仮定したことになる。(このことを確かめてみよ。)

仮定2 主な働き手は、税引き後の賃金(純益) A = W - C を最大化するような時間 T * だけ働く。

仮定3 補助的な働き手は、単位時間あたりの平均純益 M = A/T = (W - C)/T を最大化するような時間 T˜ だけ働く。

(1) このとき、主な働き手、補助的な働き手のそれぞれが働く時間 T *, T˜ はそれぞれどうなるか、考察せよ。

ヒント
イメージがわきにくい場合には、たとえば k = 6, a = 0.5, b = 3 として、W, C, A のグラフを描いてみよ。そのグラフで dC/dT, dA/dT は何を表しているか。また M は何に対応しているか。

(2) このモデルから得られた、T *, T˜ に関する帰結を、限界税率 dC/dT と平均税率 C/T に注目しながら最初にあげた説と対応させると、どのようなことが言えるか。

(3) このモデルの問題点を指摘し、モデルの改良・展開の可能性について考察せよ。

文献


問題4 囚人のジレンマの超ゲームの展開 [4章]

(1) 囚人のジレンマの超ゲームに関して、教科書(小林・木村 1997 『数理の発想で見る社会』 ナカニシヤ出版)の視点とは異なる、「生態学的な視点」あるいは「進化論的な視点」 (cf. Axelrod 1984; 小林・三隅・平田・松田 2000, 3章) から解釈を施せ。(その場合、教科書の92頁に出てくる w i は、「将来の利得に対する割引率を表すもの」という解釈ではなく、どのような解釈ができるだろうか。)

(2) ナッシュ均衡と「進化的に安定な戦略」(ESS) (Maynard Smith 1982; 小林・三隅・平田・松田 2000, 3章) との関係について考察せよ。

(3) 教科書(小林淳一・木村邦博 1997 『数理の発想で見る社会』 ナカニシヤ出版)の97頁の問4について考察するために、まず次の4つの超戦略を選択肢とする超ゲームを想定し、どのようなナッシュ均衡(あるいは進化的に安定な戦略)が得られるか、またそのようなナッシュ均衡(あるいは進化的に安定な戦略)が成立するための条件はどのようなものかについて考察せよ (cf. 鈴村 1982, 2章; Taylor 1987)。

しっぺ返し (Tit-for-Tat)
無条件非協力
無条件協力
ランダム(毎回1/2ずつの確率で CD かを選択)

(4) [余裕があれば挑戦!] (3)で取り上げた4つ以外の超戦略も考案し、これも加えた超ゲームのナッシュ均衡(あるいは進化的に安定な戦略)について考察せよ。

文献


問題5 会社での給料の決まり方 (Simon 1957) [5章]

企業組織のヒエラルキー(トップから最下層までのピラミッド)を考えよう。層の数は L で、トップは1人、最下層に属する人を除き全員が直属の部下を m 人持っていると仮定する (m > 1)。また、最下層の人の給料を A とし、階層をひとつ上がるごとに給料が b 倍 (b > 1) になると仮定する。

(1) この企業の規模(トップから最下層までの全員の人数)を S とする。これは(近似的に)どのように表せるか。

(2) この企業のトップにいる人の給料を C とする。最下層の人の給料 A, 階層の数 L, 昇給率 b を用いると、C はどのように表すことができるか。

(3) 以上の考察をふまえて、トップの給料 C を企業規模 S の関数として表せ。

(4) 上から i 番目の階層に属する人の給料を R(i) とし、上から i 番目の階層までの累積人数を K(i) とする。R(i) と K(i) を利用して、給料の金額が x 以上の人の累積人数 N(x) を求めよ。これから、給料の分布がパレート分布をしていることを確認せよ。(教科書の5章のモデルとの対応関係も確認せよ。)

文献


問題6 幸せなX君のナンパ学習モデル [6章; cf. 2章、数学のおさらい(C)(D)]

X君は「幸せ」な人である。女の人に出会って声をかけたとしたら、相手の女の人がどんな反応をしようとも、「この人は自分に気がある」と思い、うれしくなってしまうような性格だ。そのため、ある女の人に出会って声をかけた場合には、次に別の女の人に出会ったなら必ず声をかけてしまうだろう。
しかし、女の人に出会っても声をかけなかったとすると、うれしい思いをすることもなければ別に落ち込むわけでもない。このような場合、次に別の女の人に出会ったら、気まぐれでその人に声をかけることもあれば声をかけないこともあるだろう。
このようなX君が、「女の人に出会ったら声をかける」という行動を学習していくプロセスを、Bower (1961) の 「1要素悉無モデル」(1-element all or none model) を使って分析してみよう (cf. Olinick 1978, chap.12; Roberts 1976, pp.332-336)。
この学習モデルは、次のような段階を経て学習が行われると想定している。

   ┌────┐ ┌────┐ ┌──┐ ┌──┐ ┌────┐
   │条件付け│ │    │ │  │ │  │ │条件付け│
 ┌→│    │→│刺激抽出│→│反応│→│強化│→│    │─┐
 │ │の状態 │ │    │ │  │ │  │ │の変化 │ │
 │ └────┘ └────┘ └──┘ └──┘ └────┘ │
 │                                │
 └────────────────────────────────┘

条件付けの状態 最初の試行 (trial) に際しては、「女の人に出会ったら声をかける」という条件付け (conditioning) ができていない。2回目以降の各試行にあたっては、「女の人に出会ったら声をかける」という条件付けができている場合もあれば、できていない場合もある。このような条件付けができている状態を C, できていない状態を U で表す。

刺激抽出 各試行は、女の人に出会うという刺激 (s) の抽出 (sampling) から始まる。

反応 各試行で取り得る反応 (response) は「声をかける」(R) か「声をかけない」(L) かのいずれかである。「女の人に出会ったら声をかける」という条件付けができている場合(C)、X君は確率1で「声をかける」(R)。これに対し、このような条件付けができていない場合(U)、確率 g で「声をかけ」(R)、確率 1 - g で「声をかけない」(L)。

強化 (reinforcement) 「声をかける」(R) という反応にはつねに報酬 (reward) が伴い、「声をかけない」(L) という反応には報酬が伴わない。(通常の学習モデルの場合と異なり、ここでの「報酬」は本人にとっての「主観的」なものにすぎないけれども。)

条件付けの変化 試行が始まる際に、「女の人と出会ったら声をかける」という条件付けができていれば (C)、試行の最後でもそのように条件付けられたままである。これに対しその試行のはじめにこういう条件付けができていない場合 (U)、試行の最後に条件付けられることになる確率は c である。この確率は試行の数や反応などにかかわらず一定であり、0 < c < 1 と仮定する。

(1) 条件付けの状態の推移確率行列 P を示せ。(この推移確率行列が吸収マルコフ連鎖を表すものであることを確認せよ。)

(2) 条件付けができていない状態 (U) から出発して条件付けができた状態 (C) に至る(すなわち、「声をかける」という行動が学習される)まで、(期待値として)何人の女性に出会うと予想されるか。

(3) t 回目の試行で女の人に声をかけない確率はどのようになるか。

(4) 条件付けができていない状態 (U) から出発した過程が、条件付けのできた「吸収状態」(C) に吸収される確率を求めよ。

(5) このモデルから他にどのような予想を導出することができるか、検討せよ。

文献


「その他」に戻る

[Top] 木村邦博のトップページへ