日本人の99%は名前(フルネーム)に「サ行」か「濁点」が入っているらしい
本当なのだろうか?
どういった検証や実証ができるのだろうか?
まず99:1になるような計算だが、
例えば、簡単な値で実現するならば、
苗字で9:1、名前で9:1になるような場合、
9x9+2x9:1x1=99:1
ということが可能である。
実際の五十音の比率では、サ行+濁音と残りの割合は、5:9である。
さ、し、す、せ、そ、が、ぎ、ぐ、げ、ご、
ざ、じ、ず、ぜ、ぞ、だ、ぢ、づ、で、ど、
ば、び、ぶ、べ、ぼ
の25文字
あ、い、う、え、お、か、き、く、け、こ、
た、ち、つ、て、と、な、に、ぬ、ね、の、
は、ひ、ふ、へ、ほ、ま、み、む、め、も、
や、ゆ、よ、ら、り、る、れ、ろ、わ、ん、
ぱ、ぴ、ぷ、ぺ、ぽ
の45文字
フルネームがn文字の場合、
(5+9)n-9n:9n=16n-9n:9n=99:1
になるには、nはいくつになのか?
n | 16n-9n | 9n | 比率 |
1 | 7 | 9 | 0.777777777:1 |
2 | 175 | 81 | 2.160493827:1 |
3 | 3367 | 729 | 4.618655693:1 |
4 | 58975 | 6561 | 8.988721232:1 |
5 | 989527 | 59049 | 16.75772663:1 |
6 | 16245775 | 531441 | 30.56929179:1 |
7 | 263652487 | 4782969 | 55.12318541:1 |
8 | 4251920575 | 43046721 | 98.77455184:1 |
8.0039227796 | 4298516055 | 43419354.09 | 99:1 |
文字の利用頻度とかを完全に無視し、日本人のフルネームが8文字程度あると、99:1になる計算である。
確かに、フルネームが8文字の日本人は、結構な数居るだろう。
しかし、4文字は居ないにしても、5文字の人を知っているし、6文字や7文字も結構な数居るだろう。
それを逆転するほど、9文字以上がある程度居れば、挽回は出来る可能性はないとは言い切れない。
この辺の計算から、99%に該当するという所以なのかもしれない。
では、もう少し現実に沿ったところで考えてみる。
日本の苗字の世帯数トップ10は、ほとんど変動がない。
1 佐藤 [さ]とう
2 鈴木 [す][ず]き
3 高橋 たかは[し]
4 田中 たなか
5 渡辺 わたな[べ]
6 伊藤 いとう
7 山本 やまもと
8 中村 なかむら
9 小林 こ[ば]や[し]
10 加藤 かとう
独断と偏見で、私の知る限りのポピュラーな読みで埋めてみました。
この段階で、5:5=1:1である。
11 吉田 よ[し][だ]
12 山田 やま[だ]
13 佐々木 [さ][さ]き
14 山口 やま[ぐ]ち
15 松本 まつもと
16 井上 いのうえ
17 斎藤 [さ]いとう
18 木村 きむら
19 林 はや[し]
20 清水 [し]み[ず]
ここまでで、12:8=1.5:1
21 山崎 やま[ざ]き
22 池田 いけ[だ]
23 阿部 あ[べ]
24 森 もり
25 橋本 は[し]もと
26 山下 やま[し]た
27 石川 い[し]かわ
28 中島 なか[じ]ま
29 前田 まえ[だ]
30 藤田 ふ[じ]た
ここまでで、21:9=2.333333:1
31 小川 お[が]わ
32 岡田 おか[だ]
33 後藤 [ご]とう
34 長谷川 は[せ][が]わ
35 村上 むらかみ
36 近藤 こん[ど]う
37 石井 い[し]い
38 坂本 [さ]かもと
39 遠藤 えん[ど]う
40 青木 あおき
ここまでで、29:11=2.636363:1
41 藤井 ふ[じ]い
42 西村 に[し]むら
43 福田 ふく[だ]
44 太田 おおた
45 三浦 みうら
46 藤原 ふ[じ]わら
47 岡本 おかもと
48 松田 まつ[だ]
49 斉藤 [さ]いとう
50 中川 なか[が]わ
ここまでで、36:14=2.571429:1
これ以降を書いても良いのだが、29:16をピークに、どんどん比率が均衡してきてしまう。
つまり、苗字だけで9:1のような比率になること、よっぽど作為的にデータを作る他ない。
どうやるかというと、菅野を「かんの」「すがの」など比率が解らない場合、「すがの」を優先させるなど。
苗字 | 名前 |
2:1 | 32.333333:1 |
3:1 | 24:1 |
4:1 | 19:1 |
5:1 | 15.666666:1 |
だとしても、苗字の比率が均衡していると、名前で挽回出来るとは思えない。
ここでは記していないが、世帯数を考慮しても、99:1に近づくかは難しい。
故に、この法則は一見正しそうにもみれるが、実データを有る程度揃えても、揃えなくても、99:1のような比率にはならないと推測できる。
例えば、統計学的にサンプルとしては少ないかもしれないが、芸能人を100人あげたら、1%は1人ということ。
つまり、1%側が2人や3人とみつかるようならば、99%側も198人、297人と見つけなければ割に合わない。
確かに1%側は、1%とは言わないが、少ないことは確かです。
ではでは