井戸端すうがくかいぎ-番外編(小選挙区制の数理)

さて, 本編では比例区の話をしましたが, 今日はもう一つの選挙制度を数学で解いてみたいと思います.
ネタ素は以前ここでも紹介した"こんなに役立つ数学入門"です.

小選挙区制とはご存じの通り, その選挙区で当選する人が一人だけという選挙の方法です.
当然, 次点以降の人は当選できません(日本の選挙制度は複雑で比例区との重複立候補が認められているので, 今回の話が一概に成り立ちません).
つまり, 死票が多くなってしまいます.
そこで, 今日はこの小選挙区制度における得票率と議席の獲得率の関係について数学的にどうなっているかを見てみようと思います.

当然得票率が高ければ, 議席獲得率もたかくなるということは分かるかと思いますが, この関係は線形(つまり, 得票率 = 定数 × 議席率)の関係ではありません.
結論から言いますと, 議席率を s, 得票率を v とすると,
s / (1-s) = (v / (1-v) )^3
となります.
何故こうなるのか?
これはイギリスでの選挙における経験則によるものです.
数学的な論理的な根拠は全くありません.
ただ, 長年データを集めてみて, 式の上に載せたら, この式が一番ぴったりしたというだけの話です.

果たしてこんなものが万国共通で役に立つのかと言われると, やはり役に立たない場合もあります.
昨年行われた日本の衆議院選挙では,
s / (1-s) = (v / (1-v) )^5
になったようです.
これは, v の肩の数字(冪乗の数字)が大きくなるに従って, 選挙区間でのばらつきが小さくなるということを意味しているのです.
これは上式の 5 を n に変えて, s について解き, それについての分散を計算すれば分かります(もう少し簡単に理解するには "5" をいろいろ変えて見て(2, 3, 4, 5, 6....), 横軸に v, 縦軸に s を書くと visual 的に分かります).
では, 選挙区間のばらつきが小さくなるとはどういうことかと言うと, ほとんどの選挙区において, ほとんど同一の政党に入れたことを意味します.
確かに前回の衆議院選挙では, 郵政民営化 Yes or No を問うた選挙だったため, それに対して Yes と応えた人が多かったという事実にマッチします.

先にも言ったように, この関係は経験則に基づいているため, 全ての選挙で同じような関係が成り立つわけではありません.
経済などの計量分析においてもこのような方法(パラメータマッチング)がよく用いられますが, 汎用性がかけています.

これから参議院選挙ですが, 数学を使って選挙を見てみると, いつもと違った感じで選挙を楽しむことができるのではないでしょうか?

| | コメント (0) | トラックバック (0)

井戸端すうがくかいぎ-番外編(選挙の数理)

さて, ようやく参議院選も公示され, 選挙戦突入!
と言った感じでしょうか?

本来ならば, 結果が出た頃にこの記事を読むようにと思っていたのですが, なかなか思うようにはいきませんね(^^;).

さて, 今日は選挙がテーマです.
本編では, ドント方式における大政党の有利さについて述べましたが, ここでは,
1) 開票速報の怪
2) 小選挙区の数理
をテーマにしたいと思います.

では, まず開票速報についてです.
選挙が行われると, 最近ではほぼ即日開票されます.
そして, よほどのことがない限り(かなり競っていない場合)を除き, 開票率が低い段階で, 当選確実や当選がアナウンスされます.
速いところでは, 開票率 0% ですでに当選確実になってしまっています.
もちろん 0% と言っても, 本当に 0 ではなく, 0.x % であるのですが, それにしても速い時点での当選確実であることには変わりありません.

何故, 開票率 0 % で当選確実となることが分かるのでしょうか?
実はここでは, 統計的推測と呼ばれる手法が使われているのです.
具体的に言うと, こういうことです.
候補者は ① と ② の二人いるとします.
ある選挙区(例えば A 市)があったとき, この選挙区を地区ごとに分割します(分かりやすい例では投票所レベルみたい感じです: 実際はもう少し広くする場合もあります).
そして, 分割された地区を α, β, γ と置きます.
また, 各地区の有権者数は同数とします.
候補者①の人は α 地区を地盤にしていて,  α 地区では有権者の 90 % 近くが①に投票します.
しかしながら, γ地区は候補者②の人の地盤で①の人に投票してくれるのは, 15% 位しかいないとします.
β 地区は, その日の気分で投票するとしましょう.
このような時に, 仮に①の候補者がβ地区で 60% 近く得票できれば, α地区, γ地区と足し合わせて過半数を獲得することができます.
一方, ①の候補者が β地区で 10 % 位しか得票できなければ②候補者が過半数を獲得することができてします.
では, β地区の人実際どのように投票したのでしょうか?というのが問題になります.
そこで, TV 局などが行っている方法は一つは出口調査というものです.
投票を終えた人に直接聞いて, 誰に投票したかを確認し, その結果から, 推定します.
もう一つは選挙管理委員会が発表する公式データです.
これはこの地区の開票でこのくらい得票できたという実際のデータが与えられます.
その与えられたデータと実際に投票した人の割合から推測する方法です.

前者の出口調査は, 推定を速くするには効果的ですが, 正しいデータが集まるかどうかは微妙なところです.
一方後者, 開票作業が進まないと正確な推測を行うことができません.
早い時点での公式発表では, 候補者が同得票数で差がついていません.
この時点ではなかなか当選確実をだすことは難しいです.

上の例では, 2 名を例にしていますが, 3 名以上でも同じことです.
3 名以上だともっと票が散ってしまうので, 逆に早い段階で当選確実を出しやすくなる傾向があります.

要はごく一部のデータから全体を推測するという統計的手法が選挙の開票速報では用いられているのです.

この手の話は大学院時代に私の先輩の研究テーマでしたが, テーマとしては, 当然のことながら, 事後の研究(選挙が終わった後で今回の投票パターンがどうだったか)になってしまい, 結果パラメータマッチングになってしまいます.
そのため, 実際の選挙においてはアナウンスを逸る余り, 最後に数十票差で逆転されてしまうケースも出てきてしまいます.

さて, 明日は, 小選挙区制について話したいと思います.

| | コメント (0) | トラックバック (0)

井戸端すうがくかいぎ-番外編(公平な巴戦)

さて, 今回の井戸端すうがくかいぎでは, 大相撲の巴戦をテーマに扱いました.
誌面では一番簡単な例として, 各力士が勝つ確率は全て 1/2 として計算しました.
このときに, 最初に対戦した二人が優勝する確率の方が残った一人の優勝する確率よりも大きいことが分かりました.
しかしながら, 各力士が勝つ確率は全て 1/2 のはずはありません.
では,
A が B に勝つ確率を p
B が C に勝つ確率を q
C が A に勝つ確率を r
としたらどうなるでしょう.
このとき, A が優勝する確率を計算すると,
(1) 初戦で A が勝って A が優勝する確率
A ○ - × B    p
A ○ - × C    (1-r)        = p(1-r)
----------
A ○ - × B    p
A × - ○ C   r
C × - ○ B    q
A ○ - × B    p
A ○ - × C    (1-r)        =p(1-r) pqr
----------
A ○ - × B    p
A × - ○ C   r
C × - ○ B    q
A ○ - × B    p
A × - ○ C   r
C × - ○ B    q
A ○ - × B    p
A ○ - × C    (1-r)        =p(1-r) (pqr)^2
となり, 初項が p(1-r) で公比が pqr の等比数列になっていることがわかります.
よって, 初戦で A が勝って A が優勝する確率は {p(1-r)}/(1-pqr) となります.
(2)次に初戦で A が負けて A が優勝する確率
A × - ○ B    (1-p)
B × - ○ C    (1-q)
C × - ○ A    (1-r)
A ○ - × B    p        = p(1-p)(1-q)(1-r)
----------------
A × - ○ B    (1-p)
B × - ○ C    (1-q)
C × - ○ A    (1-r)
A × - ○ B    (1-p)
B × - ○ C    (1-q)
C × - ○ A    (1-r)
A ○ - × B    p        = p{(1-p)(1-q)(1-r)}^2
----------------
A × - ○ B    (1-p)
B × - ○ C    (1-q)
C × - ○ A    (1-r)
A × - ○ B    (1-p)
B × - ○ C    (1-q)
C × - ○ A    (1-r)
A × - ○ B    (1-p)
B × - ○ C    (1-q)
C × - ○ A    (1-r)
A ○ - × B    p        = p{(1-p)(1-q)(1-r)}^3
となり, 初項が p(1-p)(1-q)(1-r) で公比が (1-p)(1-q)(1-r) の等比数列になっていることがわかります.
よって, 初戦で A が負けて A が優勝する確率は {p(1-p)(1-q)(1-r)}/{1-(1-p)(1-q)(1-r)} となります.
(1)と(2)の和, つまり
p(1-r)/(1-pqr) + {p(1-p)(1-q)(1-r)}/{1-(1-p)(1-q)(1-r)}       ……①
が A の優勝する確率になります.

一方 B が優勝する確率は上の (1),(2) と同じように考えると:
(3) 初戦で B が勝って B が優勝する確率
A × - ○ B    (1-p)
B ○ - × C   q        = q(1-p)
----------------
A × - ○ B    (1-p)
B × - ○ C    (1-q)
C × - ○ A    (1-r)
A × - ○ B    (1-p)
B ○ - × C   q    = q(1-p){(1-p)(1-q)(1-r)}
----------------
A × - ○ B    (1-p)
B × - ○ C    (1-q)
C × - ○ A    (1-r)
A × - ○ B    (1-p)
B × - ○ C    (1-q)
C × - ○ A    (1-r)
A × - ○ B    (1-p)
B ○ - × C   q    = q(1-p){(1-p)(1-q)(1-r)}^2
となり, 初項が q(1-p) で公比が (1-p)(1-q)(1-r) の等比数列になっていることがわかります.
よって, 初戦で B が勝って B が優勝する確率は {q(1-p)}/{1-(1-p)(1-q)(1-r)} となります.
(4) 初戦で B が負けて Bが優勝する確率
A ○ - × B    p
A × - ○ C   r
C × - ○ B    q
A × - ○ B   (1-p)    =(1-p)pqr
----------
A ○ - × B    p
A × - ○ C   r
C × - ○ B    q
A ○ - × B    p
A × - ○ C   r
C × - ○ B    q
A × - ○ B    1-p    =(1-p) (pqr)^2
となり, 初項が (1-p)pqr で公比が pqr の等比数列になっていることがわかります.
よって, 初戦で Bが負けて B が優勝する確率は {(1-p)pqr}/{1-pqr} となります.
よって B が優勝する確率は
{(1-p)pqr}/{1-pqr} + {q(1-p)}/{1-(1-p)(1-q)(1-r)}        ……  ②
となります.

①, ②の確率が 1/3 になるように p, q, r を決めれば良いのですが, 変数が 3 つで方程式が 2 つ(あと一本 Cが優勝する確率 =1/3 を作れますが, これは 1 から①と②の確率を引くので, ①②と同じ方程式になってしまいます)しかないので, このままでは解くことができません.
例えば最初に対戦する 2 人の力士の勝つ確率が同じ, つまり p=1/2 とすれば, それを満たす, q, r を求めることができるかもしれませんが, これも面倒な計算になってしまいます(途中で挫折しましたm(__)m).

では, どうすると良いかというと, "芳沢光雄著 生活じょうずは数学じょうず" では, 3 人で総当たり戦を行い, 2 勝したものを(2連勝ではない)優勝にすればよい. もし, 2 勝した力士がいなければ, 再度総当たり戦を行えば良いとするされています.
こうすると, 確かに
A が優勝する確率 p(1-r)
B が優勝する確率 q(1-p)
C が優勝する確率 r(1-q)
と比較的シンプルな形になり, 力士に力の差に影響されることはあっても, 巴戦ほど不公平さはないように思います.







| | コメント (0) | トラックバック (0)

なぜ人は宝くじを買うのだろう

宝くじ, 競馬, コイントスなどのテーマを確率を用いて, 説明してくれている.
この前に読んだ, "生き抜くための数学入門"と比べてもきちんとした議論をしている.
その中でも面白かったのが井戸端すうがくかいぎでも扱った誕生日の確率(本書ではさらに, 結婚式等の冠婚葬祭が重なる確率まで発展させている), と宝くじの確率(いずれ井戸端すうがくかいぎで扱いたいと思っている)の話である.

誕生日の確率は要は, 考えているよりも誕生日が一致することが多いと言うことを, きちんと確率を使って説明している.
ここまでは他の本でもよくある話であるが, 結婚式や葬式, 誕生会がブッキングする確率まで考えている本はなかなか無かった.
普通, 営業のサラリーマンの付き合いと言っても数十人が妥当な線であろうが, 政治家となると, この数が一気に増える.
となると, 意外にブッキングが起こってしまうと言うことを説明している.

そして, もう一つは宝くじの確率.
これもかなり有名な話であるが, 改めてまとめている本は見あたらなかった.
本書では, 正確に書かれている.
一つだけ残念なのは, 投資金額を回収するための期待値(300円以上戻ってくる期待値)を計算していれば, 非常に面白かったと思う.
とは言うものの, 末等までの確率とその期待値を計算しているので, 宝くじがいかに損をするかが分かるだろう(損の部分で夢を買うと考えれば, 良いのかもしれないが).

また, 甲子園で優勝する確率や株式投資のことに書いてあるが, こちらは仮定が適当ではないために, 議論がちょっと飛躍している節がある.

井戸端すうがくかいぎのネタ本として読んでみたが, 非常に面白かった.

| | コメント (2) | トラックバック (1)

井戸端すうがくかいぎ-番外編(最適解の求め方2)

昨日は n (お見合いする回数)を固定して, 最適な k (何回断れば良いか)を考えました.
今日は, n と k の関係を考えてみたいと思います.
ちょっと難しいので分からなければ読み飛ばしてください.

まず次の命題を考えてみます.
①P(n-1,k) < P(n,k)
②P(n,k) > P(n+1,k)
が成り立つとき, 次の (a), (b) が成り立つ.
(a) P(n,k-1) < P(n,k)
(b) P(n,k) > P(n,k+1)

この命題の細かい証明は省きますが, ①, ②から
n-1
Σ  1/m = L
m=k
と置いたとき, L>1 の関係が導けます.
これを用いると (a), (b) が成り立ちます.
これは何を意味するかというと, お見合いを断る回数 k を固定したときの最適解は n を固定したときの最適解と一致していることを意味しています.
また, L>1 が成り立つと,
P(n,k) > P(n,k+1)
も成り立ちます.
つまり, L>1 のもとで, k が固定されると, n について単調に減少することになります.

次に, 断る回数が変化した場合を考えてみます.
P(n,k) > P(n-1,k)  かつ
P(n,k) < P(n+1,k)
⇒  P(n-1,k-1)  >  P(n,k)
これは, 断る回数 k を固定したときに,  P(i,j) は最適解 P(n,k) に到達するまで増加し続けます.
そして, 最適解になると, そこから単調減少します(先ほどの命題).
このとき,
n-1 の時の最適解の方が, n の時の最適解よりも大きいことが示せます(細かい証明は省きます).
これにより, 断る回数が変化したときも単調に減少することが示せます.

以上より, 最適解が単調に減少することが分かりました.
もし, 細かい証明の方法が知りたければご連絡ください.

以上, お見合い確率の問題シリーズは終わりです.

| | コメント (0)

井戸端すうがくかいぎ-番外編(最適解の求め方1)

昨日最良の人と結婚できる確率の一般系 P(n, k) を求めました.
次に気になるのは, 一体, 何人断ると良いかということです.
本編では, 実際に計算した結果のみを載せましたが, 実は, そんなことしなくてもある程度まで絞り込むことができます.
まず, P(n, k) の和の部分
  n-1
  Σ  1/m
  m=k
に注目します.
1/m は m が大きくなるにつれて小さくなっていく数列ですので, 連続関数 1/x を用いて

  n-1         n-1            n
∫ 1/x dx < Σ  1/m < ∫  1/x dx
  k            m=k            k

で抑えることができます(この方法は積分を考える上で基本になる区分求積法により求めることができますが, ここでは省略します).
この右辺の値は
log (n/k)
となります.
つまり,
k/n log((n-1)/k) < P(n, k) <  k/n log (n/k)
という関係があります.
ここで, 厳密には不等号が成り立っていますが, 等号として, 連続関数の n 固定したときの最大値を求める(n を固定したとき, 最大値になりうる k の値を求める)問題に置き換えてしまいます.
そこで,
f(x) = x/n log (n/x) = x/n (log n - log x)
と置いて,
df(x)/dx = 1/n log n - 1/n log x - x/n * 1/x = 1/n ( log n - log x - 1)
となります.
よって, f(x) が最小となる x は
1/n ( log n - log x - 1 ) = 0
より,
x = n/e
となります.
これが上限の値になり, 同様に下限の値を求めると x= (n-1)/e となります.

(n-1)/e < x < n/e

を満たす x の取りうる値に整数が含まれれば, その値を k とすれば良いのですが, 実際, 計算してみると, 上式を満たす整数 x が存在しない場合があります(例えば n=13 の場合) .
このときは, [x] ± 1 の三つの値を k として, 各々の場合の P(n,k) を求めていずれが最大値になるかを確かめなくてはいけません.
ここで[x] はガウス記号を表し,  x を越えない最大の値になります. x > 0 の場合は x の整数部分と考えて問題ありません.

三回計算しなければなりませんが, n が非常に大きい場合には有効です.

さて, 明日は, 本編で何気なく記述した P(n,k) の単調減少性を紐解いてみます.

| | コメント (0)

井戸端すうがくかいぎ-番外編(お見合いの確率の求め方)

このお見合いの確率はお見合いする人数が決まって始めて計算できる確率です.

                        n-1
この確率 P(n,k) = Σ (1/m) × k/n とかけることを本編で述べましたが, その確率がど
                        m=k
のようにしてこうなるかを考えてみましょう.

まず, お見合いする相手 n 人を適当に並べたときに最良の人が k+m+1 番目に出てくるとします.
このとき, m の取りうる範囲は 0 から n-k-1 になります.
そして, k+m+1 番に現れる最良の人を選ぶ確率は 1/n となります.
今, k+m+1 番目の人(最良の人)とお見合いするまでに k+m 人の人とお見合いをします.
この k+m 人の中での最良の人(ここでは better な人と呼ぶ)がいるとき, この better な人がお見合いを断った k 人の中にいるときには, その後の j 人のお見合い相手は断ることになり, 最良の人を選ぶことができます.
しかしながら, k+1 ~ k+j の間に better な人がいるときには, その人(もしかしたら better な人以外の人かもしれない)を選んでしまい, 最良の人を選ぶことができません.
よって, 最良の人を選ぶ確率は k/(k+m) となります.
これが, 全ての m の場合で起こりうるので,

1/n( k/(k+1) + k/(k+2) + … + k/(k+(n-k-1)) )

  n-1
= Σ (1/m) × k/n
  m=k

となります.
こうすることによって, P(n,k) を計算することができます.
明日は, 最良の人を選ぶ確率を最大するために何人断れば良いかを考えます.

| | コメント (0)

井戸端すうがくかいぎ-番外編(平均というメジャーの罠)

今回の KMC 通信(5月号)では, 平均をテーマに扱い, そこで, 平均を使う理由として, 計算しやすいと説明しました.
とは言うものの, 本文で見たように, 平均所得のような分布では, 平均を計算しても実際とのズレが生じてしまいます.
それが分かっているにも関わらず何故平均を計算するのでしょうか?

その答えは世の中の分布が正規分布と呼ばれる分布に従っていると考えられがちであるからです.
正規分布とは式で書くと確率密度関数は
f(x) = 1/(2 π σ^2)^(1/2) * exp(- (x - μ)^2/(2σ^2))
となり, 下図のようになります.

Gauss_2

ここで, exp はネピア数(自然対数の底)と呼ばれる数字で約 2.7182818284……です.
この数字の特徴については機会があれば, 話したいと思いますが, ひとまずこんなものかと思ってください.
また, 正規分布はドイツの数学者ガウスによって発見されたのでガウス分布とも呼ばれています.
ドイツでは彼の栄誉を讃え, 50マルク紙幣の肖像画にしていました. そして, 裏にはこの正規分布の密度関数が描かれていました.
日本では差詰め関孝和と言ったところでしょうか....
(関孝和が紙幣になっても誰この人言われそうですが....それはまたそれで悲しい(。>。<。)).
この正規分布(正確に言うと確率密度関数)の形と平均所得の分布を比べて見てください.
どう見ても似ても似つかない形です.
にも関わらず, 無理矢理平均を計算しているから, 現実とのズレが生じてしまうのです.

もう一つ問題です.
では, 平均所得の分布をモデル化するにはどのような分布を用いれば良いのでしょうか?
正解から先に言うと, 対数正規分布という分布になります.
式で書くと,
f(x) = 1/(2 π σ^2 x^2)^(1/2) * exp(- (log x - μ)^2/(2 σ^2))
となります. 正規分布と同様に, μ = 0, σ = 1 の場合の図を書くと下図のようになります.

Log_gauss_2

どちらかというと, こちらの分布の方に近いと感じないでしょうか?

元の度数分布から実際の分布を推定するのはかなり難しく, パラメータマッチングになってしまうことが多いようです.
故に, 一般的に成り立つと言われる正規分布を仮定してしまうのです.
そして, 正規分布は平均と中央値は一致しますから, 平均を計算し, それを代表値として扱ってしまうのです.
が, 平均所得のように, 明らかに正規分布に従わないような場合もあります.
このような場合は面倒でも中央値を計算してみる価値はあると思います.

もちろん, 元の分布が分かっていれば, その分布を使ってモデル化するのが一番良いのです.
ですから, 平均を扱うときには, 元の分布がどのような形になっているか, 正規分布のような左右対称な分布に従っているのかなどを吟味して使うように気をつけましょう!

| | コメント (0) | トラックバック (0)

井戸端数学かいぎ-番外編(同じ誕生日の人が2 組いる)

さて, 昨日の話は"自分"と同じ誕生日の人が 3 人いる確率でした.
今日の話は, その"自分"という制限を外します.
つまり, ある集団の中で同じ誕生日の人が 3 人いる確率です.
ちょっと難しいので, 私の考えも間違っているかもしれませんので, その場合は是非指摘してください.

n 人いるとき, すべての人の誕生日が異なる場合の数は
365 × 364 × … × (365-n+1)
になります.
これは, KMC 通信の 4 月号で解説した通りです(KMC 通信を一般化した場合).
次に, この中のちょうど 2 人だけが同じ誕生日である場合の数を考えます.
ちょうど同じ誕生日である日を除けば良いので, それ以外の人の誕生日が取り得る場合の数は,
365 × 364 × … × (365-n+2)
となります.
ところが, n 人の中から, 2 人を選ぶ選び方というのが,
n × (n-1) /2
通りあります(いわゆる組み合わせの数と呼ばれるものです*1).
よって, ちょうど 2 人が同じ誕生日である場合の数は,
365 × 364 × … × (365-n+2) × n × (n-1) /2
となります.

次に, 同じ誕生日の人である 2 人が 2 組いる場合の数を考えます.
同じ誕生日の人(4 人)以外の誕生日の取り得る場合の数は
365 × 364 × … × (365-n+3)
となりますが, さらに, 同じ誕生日の 2 人を 2 組選ぶ方法は
n × (n-1)  × (n-2) × (n-3) / 8
となります.
これは, n 人から 2 人選び, さらに残りの n-2 人から 2 人選ぶ方法になりますが, さらに, 最初に選ばれた 2 人と次に選ばれた 2 人が入れ替わる場合も考慮して, 2! で割ります.
つまり, (a,b), (c,d) という組が選ぶとき, (a,b) - (c,d) と選ぶ方法と (c,d) - (a,b) と選ぶ方法があり, それは同じであるために 2! で割ります.

2! とは数学的に階乗というものを意味し, ! の前の数字を 1 つずつ減らして 1 までかける演算を意味します.
例えば, 2! = 2 × 1, 3! = 3 × 2 × 1 となります.

それらを全て掛け合わせたものが,
365 × 364 × … × (365-n+3) × n × (n-1)  × (n-2) × (n-3) / 8
同じ誕生日の 2 人組 2 組いる場合の数になります.

さて, 一般化です.
n 人の中で同じ誕生日の人が 2人 k 組いる場合の数は, 同様に考えて,
365 × 364 × … × (365-n+k+1) × n × (n-1)  × … × (n-2k+1) / 2^k
となります.
これを 365^n で割った数字が, 同じ誕生日の人の 2人組が k 組いる確率になります.

さて, では, KMC 通信 4 月号の表 A に記載されているように 60 人の中で 8 組同じ誕生日の 2 人組がいる確率はどれくらいでしょうか?
n = 60
k = 8
を入れて計算すると, だいたい 2.1 % になります.
この数字をみると, 表 A もかなり怪しい数字になりますね(^^;)


| | コメント (0) | トラックバック (0)

井戸端すうがくかいぎ-番外編(私と同じ誕生日の人が3人)

さて, 昨日の続きです.
自分と同じ誕生日の人がいる確率は昨日計算しました.
今日は自分と同じ誕生日の人が 3 人いる確率を計算します.
まず自分と同じ誕生日の人が 3 人いるのですから, 60 人の集団で, 自分と異なる誕生日の人は 56 人います.
そして, 自分と異なる誕生日ですから, その確率は (364/365)^(56) (364/365 の 56乗)になります.
さらに自分と同じ誕生日の人は (1/365)^3 (1/365 の 3 乗)になります.
そしてさらに, 自分をのぞいた 99 人の中から, 自分と同じ 3 人を選び出す組み合わせを考えます.
それは, 99 × 98 × 97/(3 × 2 × 1) になります.
これら全てを掛け合わせた,
(1/365)^3 × (364/365)^56 × 99 × 98 × 96 /(3 × 2 × 1) =  0.0027
になります.
自分と同じ誕生日に人がちょうど 3 人いる確率は一気に 2.7% までいることになります.
同様の方法で, 2 人いる場合も, 4 人以上いる場合も計算できます.
興味を持たれた方は是非試してみてください.

明日は, これをさらに発展させます.
"自分と同じ" という条件を外します.
つまり, 誕生日が同じ人の組が 2 組いる場合の確率を計算します.

| | コメント (0) | トラックバック (0)

井戸端すうがくかいぎ-番外編(私と同じ誕生日)

井戸端すうがくかいぎ 第 4 回(KMC 通信 2007/4月号掲載)にて, 同じ誕生日の人がいる確率についてお話ししました.
今回は, その発展系その一として, 自分と同じ誕生日に人がいる確率です.

誌面で紹介したのは, 同じ誕生日の人が一組以上いる確率でした.
今回はある一日(自分の誕生日)と同じ誕生日の人がいる確率です.
ある部屋に人が一人いるとします(わかりやすいように, その人の誕生日を3/21 としておきましょう).
その部屋に最初にに入ってきた人の誕生日が 3/21 でない確率は 364/365 になります..
二番目にその部屋に入ってきた人の誕生日も 3/21 でない確率は 364/365 になります.
以下 n 番目に入ってきた人の誕生日も 3/21 ではない確率も 364/365 です.
つまり, n 人全てが最初に部屋にいた人と異なる誕生日である確率は (364/365)^n になります(364/365 を n 回かけたものを n 乗と言い, ここでは便宜的に ^n と記します).

ちなみに n が 59 人の場合(最初にいた人を含めて 60 人), 最初に部屋にいた人の誕生日と異なる確率は約 85% になります.
つまり, 60 人いる中で, ある一人と同じ誕生日の人が存在する確率は 15% 程度になると言うことが分かりました.
誌面で紹介した, 同じ誕生日の人が一組以上いる確率に比べるとずいぶん小さくなることがわかります.
これは, "ある" 一日に限定してしまったために, 確率が下がってしまったのですが, これだけ下がるものなのです.
それだけ, 限定することには強い意味があるのです.

さて, 明日はこの誕生日の確率発展系その二として, 同じ誕生の人が 3 人いる確率を計算してみます.

| | コメント (0) | トラックバック (0)

井戸端すうがくかいぎ-番外編(閏年の数え方)

井戸端すうがくかいぎ 第 3 回(KMC 通信 2007/3月号掲載)にて, 自分の生まれた日が何曜日かを計算する方法を紹介しました.

その際, 閏年の数え方について, 一つずつ数える方法を紹介しましたが, もう少し, 機械的に数える方法を紹介します.
例として, 1984 年 2 月 23 日(23歳)で計算してみます.

1.  自分の年齢以下でに一番近い4 の倍数を探し, 4 で割ります.
【例では, 20 を 4 で割ることになります.】

自分が生まれた年が閏年でない人(1955 年のように, 西暦の下 2 桁が 4 で割り切れない年に生まれた人)は (a) へ,

閏年に生まれた人(1956 年のように, 西暦がの下 2 桁が 4 で割り切れる人)は (b)へ.
【例ではこの場合に相当します】

進んでください.
ここで, 閏年に生まれた人とは, 2/29 に生まれた人という意味ではありません.
2/29 がある年に生まれた人という意味です.
但し, 1900 年は閏年ではないので注意してください.

(a) 1. で用いた年齢【例では 20 歳】から, 今年(基準になる年)までに閏年がある, もしくは,
今年(基準になる年)が閏年ならば, 1. で求めた数字【例では 5 】に  "1"  を足します.
この数字が生まれてから今までにあった閏年の数になります.

(b) 自分が生まれた年が閏年で, かつ, 3/1 以降に生まれた人は 1. で求めた数字が,
生まれてから今までにあった閏年の数になります.

自分が生まれた年が閏年で, かつ, 2/28 以前に生まれた人【例では, 1984 年が閏年で, かつ, 2/23 生まれなのでこの場合に相当します】は, 1. で求めた数字【例では 5】に  "1" を足します.

例では, この場合に相当するので, 1984 年 2 月 23 日生まれの人は, 生まれてから今までに閏年が 6 回あったことになります.

とこのように考えてのですが, あまりエレガントではないと思います.
もし, 他に良い方法がありましたら, 教えてください.

| | コメント (0) | トラックバック (0)

統計数学を疑う

井戸端すうがくかいぎのネタ本として読んでみた.
内容自体非常にわかりやすく記載されていて, 読みやすかった.
一点残念だったのは, 統計数学というより, 経済統計に注力した本だったこと.
もう少し, 一般的に統計というものを扱ってもらえるとより一層良かったと思う.

一方, この本は, 物価指数について, パーシェ型とラスパイレス型の 2 種類をきちんと説明していた.
物価指数について書かれている本はかなりあるが, この説明を具体的な例を出して説明している本は専門書でもそんなにない.
それ故, 指数の仕組みを理解する上で非常に役立った.
実は私も物価指数についてはごちゃごちゃになっていて, 証券アナリストの試験勉強の際に理解した(つもりだった).
その上で, 何に注意して何を疑わなければならないかを説明してくれている.
最後の章の地下経済については不明な点が多いため, 物足りなさを感じたが, 4 章の GDP までの内容に関してはわかりやすかった.

投資をやる人はもちろん, 経済統計がどのように作られているかの仕組みを理解する上には良い本だと思った.

いずれ, 井戸端すうがくかいぎのネタに使ってみたい.

| | コメント (0) | トラックバック (0)

いどばたすうがくかいぎ

以前 FP 寺子屋というタイトルで半年間連載したことがあった.
その続きを二ヶ月ほど前に依頼された.

以前連載したときには, 正直かなりレベルを上げてしまった.
が, それには, それなりの理由があった.
最近では, 軟派な本がかなりあふれている.
専門外の分野なら, 私も読んでみたりする.
が, それは所詮, 分かった気にさせる本であり中途半端な知識しか身につかない.
もちろん, 良い面もある.
ある程度知識が身についてくれば, 軟派な本ほど系統的に整理されている本はない.
が, それはあくまでも, ある程度の知識がある場合である.
知識もなく, 読んだところで右から左に流れてしまうだけである.
それで良いなら, そういった軟派な本を利用するのも一つの手である.
が, 私はそんなものは書きたくなかった.
数学とは, 手を動かし, 頭で考え, 答えを導くものである.
コンピュータや数式処理ソフトが流行っても, その基本は変わらないと思う.
だから, あえて, 多少難しくても, 本質を伝えたかった.

が, それはやはり書き手にも読み手にも酷だった.

ということで, 第二シリーズはもう少し, わかりやすく身の回りの数学から, FP の数学へ展開させて行こうと思っている.
そのネタを探しているが, これがなかなか見つからない.
落とすのは中身だけにして本質は伝えたく, さらに身近なものとなるとこれほどまでに難しくなってしまうことに気付かされた.

そろそろ, 年内分の原稿を上げないと行けないのだが.....
一向に片付く気配がない(;_;)クスン、クスン.

| | コメント (0) | トラックバック (0)