三割打者では三割は打てない
珍しく釣りっぽいタイトルをつけたが、本稿の主題は「実力」と「運」(あるいは「偶然」と「必然」)である。人生は実力と運の両方に左右されるが、この両者を厳密に区別できる人は少ない。人は成功した事は実力だと思いたがるし、失敗した事は運だと思いたがる。 「実力」や「運」という言葉自体は気軽に使われていて、誰もがその意味を理解したような気になっているが、実際には言語ゲーム的に使われているに過ぎなくて、きちんと意味を定義して使われていることは少ない。
「実力」と「運」の区別は思想にすら影響を与える。たとえば「機会の平等」という考え方があるが、これは運の影響を最小化して、できるだけ実力(や努力)が反映されるようにすべきという思想だろう。ロールズの「無知のベール」も似た思想かもしれない。あるいは、一時期流行したカッコ付きの「自己責任」は、運の影響を無視してすべてを実力に還元しようとする考え方とも言える。このような思想は、そもそも「実力」と「運」の区別がつくことが前提となっている。
本稿では、「実力」と「運」についてぼくらが誤解しがちな点を、野球を例として示してみたい。読んでいただければ、読者がよりリアルな現実認識を持つための一助になると信ずる。
なおタイトルはただの釣りではない。かなり省略した表現ではあるが、ある前提条件を置けば「三割打者では三割は打てない」ということが本当に言えるのだ。だからタイトルに釣られた人も、ぜひ最後まで読んでみてほしい。
・ 「実力」は理想的要素
まず、「実力」という言葉に対し、ぼくらが経験的に持っているイメージから考えてみよう。
たとえば、ある試合で選手 A はノーヒット、選手 B は 4 安打固め打ちだったとする。ぼくらは普通これだけでは「選手 B の実力は選手 A より上」だとは判断しない。なぜかというと、一試合だけの結果では、好不調・対戦相手との相性・試合場のコンディションなどいろんなものに大きく左右されることを知っているからだ。これが言わば「運」に相当すると言える。
日本プロ野球史上、生涯 1 度しか打席に立たず、なおかつホームランを打った選手が 1 人だけいる。野球の記録マニアには有名だが塩瀬盛道という選手だ。もしどんなに短期間でも高いアベレージを残した打者が実力のある打者だとするなら、この塩瀬が日本プロ野球史上最高の打者ということになってしまう。
では逆に記録を集計する期間を長くして、たとえば生涯打率を「実力」と考えればどうかと考えると、この方法にもいろいろ問題があることがわかる。なぜかというと、人間は長い間に成長したり老化したり怪我をしたりする生物だからだ。
たとえば、日本プロ野球の通産打率(四千打数以上)のトップに立っているのは、レロン・リーであり、多くの人が打撃の天才と認める落合博満は第 9 位に留まっている。しかしこれを理由にリーの方が落合より実力が上だと言う人はそう多くないだろう。落合の通算成績がリーを下回っているのは、あくまで落合の方が現役期間が長かったからであって、全盛期の「実力」は落合の方が上だと考える人が多いだろう。
つまり、「実力」という言葉でぼくらがイメージするのは、あくまで選手の特定の時点での能力なのだ。しかし、能力は結果を観察しなければ知ることはできない。短期間の結果は「運」に左右されるので、「実力」を知るにはある程度長期間の結果を観察しなければならない。ところが観察期間が長くなると、今度は逆に時間経過によって「実力」自体が変化してしまうのだ。
こう考えると、「実力」というのは、長期の観察結果から逆算でイメージされる、ある種仮想の概念であり、数学で言えば「微分」に近いものだということがわかる。このような概念を現実世界で直接測定することは難しいが、理論的に仮想することにより現実の把握が容易になるわけだ。数学ではこういう概念を「理想的要素」と呼んだりするが、人間が世界を整合的に認識するための、ある種理想化されたモデルなのである。ここに現実世界で「実力」を「運」と峻別する際の難しさがある。
・ 理想の三割打者
そこで今度は逆に、極限まで理想化された選手を考えてみよう。好不調・対戦相手・試合場のコンディションなどに関わらず、常に三割を打つ打者を想定するのだ。そしてこの打者の成績がどれだけ「運」に左右されるかを考えてみる。そうすれば、それは間違いなく「運」の影響だということになるはずだ。
ここで「常に三割を打つ打者」の成績は常に三割でしょ? と思ったら大間違いである。「常に三割を打つ打者」というのは、数学的には、歪んだコインをトスするのと同じことだ。コインを 1 回トスした結果は表か裏。表の場合は 1 打数 1 安打に相当するから打率十割でその実現確率は 0.3。裏の場合は 1 打数 0 安打に相当するから打率ゼロ割でその実現確率は 0.7。 この時点でもう「常に三割」とは言えない。
では 2 打席の場合はどうか。(ヒット、ヒット)の場合には打率十割でその実現確率は 0.3*0,3 = 0.09、 (ヒット、アウト)または(アウト、ヒット)の場合には打率五割でその実現確率は 0.3*0.7 + 0.7*0.3 = 0.42、(アウト、アウト)の場合には打率ゼロ割でその実現確率は 0.7*0.7 = 0.49 である。
1打席目 | 2打席目 | 打数 | 安打 | 打率 | 確率 |
ヒット | ヒット | 2 | 2 | 1.000 | 0.09 |
ヒット | アウト | 2 | 1 | 0.500 | 0.21 |
アウト | ヒット | 2 | 1 | 0.500 | 0.21 |
アウト | アウト | 2 | 0 | 0.000 | 0.49 |
1打席目 | 2打席目 | 3打席目 | 打数 | 安打 | 打率 | 確率 | 確率 |
ヒット | ヒット | ヒット | 3 | 3 | 1.000 | 0.027 | 0.027 |
ヒット | ヒット | アウト | 3 | 2 | 0.667 | 0.063 | 0.189 |
ヒット | アウト | ヒット | 3 | 2 | 0.667 | 0.063 | |
アウト | ヒット | ヒット | 3 | 2 | 0.667 | 0.063 | |
ヒット | アウト | アウト | 3 | 1 | 0.333 | 0.147 | 0.441 |
アウト | ヒット | アウト | 3 | 1 | 0.333 | 0.147 | |
アウト | アウト | ヒット | 3 | 1 | 0.333 | 0.147 | |
アウト | アウト | アウト | 3 | 0 | 0.000 | 0.343 | 0.343 |
このような分布は、確率論では二項分布と呼ばれており、計算方法も確立されているので、その方法を利用すれば何百打席分でも計算できる。もちろん、紙と鉛筆で計算しようとしたら大変だが、パソコンのスプレッドシートを使えばいとも簡単だ。試しに 100~500 打数まで計算してグラフにすると以下のようになる。
500 打数(これは現在の日本プロ野球のシーズン規定打席に近い)にもなると、さすがにゼロ割や十割はほとんどなくなり、打率三割の周囲に分布するようになるが、それでも一定の確率でゆらいでいることがわかるだろう。「常に三割」を打つ理想的な三割打者でも二割八分だったり三割二分だったりすることがあるのだから、これこそ「運」だとしか言いようがないだろう。
勘のいい方ならお気づきだと思うが、逆に「実力」三割二分の打者が運悪く三割を打ったり、「実力」二割八分の打者が運良く三割を打ったりすることもありうる。ここまでは「実力」三割の打者が実際に何割打つかを計算してきたわけだが、発想を逆にして、実際に三割以上打った打者の「実力」が何割である可能性が高いかを計算することもできる。これを 500 打数について計算してグラフにすると以下のようになる。
(このような関数を統計学では尤度関数と呼ぶので「尤度」と書いてあるが、知らない人はあまり気にする必要はない。)
このグラフを見ると、90% 以上の確率で打率三割以上を打つには、三割三分以上の「実力」が必要なことがわかる。これがタイトルで「三割打者では三割は打てない」と書いた第一の理由だ。
こう書いたのにはもう一つ理由がある。ここまで「実力」三割の打者が実際には三割打つとは限らないことを説明してきたが、では逆に、実際に常に三割ピッタリ(端数は除く)打てる打者がいるとしたら、それはどういう打者だろうか。
その打者は、打率が三割を少しでも下回ったら「必ず」ヒットを打ち、打率が三割を少しでも上回ったら「必ず」アウトにならなければならない。言い換えれば、任意の打席でヒットとアウトを自由に選択できなければならない。そのような打者は、実は三割どころか、打とうと思えば十割だって打てるだろう。
つまり、常に三割ピッタリを打とうと思ったら、実際には十割打つ「実力」が必要なのである。これがタイトルで「三割打者では三割は打てない」と書いた第二の理由だ。
・理想と現実
ここまで読んだ人はこう思うかもしれない。「現実のバッターは何もちょうど三割を打とうとして打席に入っているわけじゃない。すべての打席においてヒットを打とうとしているが、結果としては意思に反して三割になっているにすぎない。野球は本質的には決定論的な現象であって、結果として確率的な現象に見えるにすぎない。それをこのようにモデル化するのは、人間の主体的な意志を矮小化する行為ではないか。」
そうだろうか。たとえばサイコロだって、運動自体は決定論的な物理現象だが、通常は確率論的な現象として捉えられている。ぼくらは博打でサイコロを振るとき、1~6 の目を確率 1/6 で平等に出したい、などとは思っていない。特定の目を出そうと思って振っている。しかし結果はちゃんと確率 1/6 になっている。もし事実に反して、自分は好きな目が出せると思い込んでいる人がいたとしたら、その人は博打に負けるだろう。そのことはサイコロの運動が決定論的な現象であることと矛盾しない。
同じように、打者自身が主観的には毎回ヒットを打とうとしているとしても、実際の結果が確率的にゆらいでいる場合には、確率的現象として捉えた方が、より適切な現実認識につながることもあるのだ。
たとえば、イチローが大リーグに移籍して以降の月間打率の分布をグラフにすると、以下のようになる。
(イチローを選んだのは、大リーグの方が記録をインターネットから入手するのが容易だからであり、月間成績を選んだのは、年間成績だとサンプル数が少なすぎるからであって、他意はない。なお、3 月と 10 月は打数が極端に少ないので省略した。)
月間打数は通常 100 打数程度なので、このグラフを上の「理想の三割打者の打率分布」の 100 打数の曲線と比較してみて欲しい。イチローの平均打率は 3 割を越えているので、分布の中心が少し右に寄っていることを除けば、分布の形状もゆらぎの幅もあまり変わらないことがわかるだろう。
野球ファンは、やれ「イチローは春先は調子が悪い」だのやれ「イチローは夏場に強い」だのと大騒ぎするが、そういうのも実はただの「偶然」かもしれないのである。
(ただし、二割八分近辺にある山はぼくも少々気になる。これこそおそらく「偶然」ではなく「必然」による何かであろう。しかしその原因はこれだけではわからない。)
・ 「大数」は意外と大きい
ここまで「実力」が変わらなくても結果は一定の幅でゆらぐという話を延々としてきたが、そのゆらぎの幅は、先のグラフでもわかるように、打数が増えるほど狭くなってゆく。これが実はかの有名な大数の法則に他ならない。
大数の法則という言葉や、無限に試行を繰り返すと結果は平均値に限りなく近づくという結論を知っている人は多いが、何回ぐらい繰り返せばどの程度近づくのかを、感覚的・量的に把握している人は意外と少ないのではないだろうか。
そこで今度は打数を横軸にとって、ゆらぎの幅の変化をグラフにしてみよう。
図中の「10% 以下」、「5% 以下」、「1% 以下」は、この線から外側の打率が実現する確率がそれぞれ 0.1、0.05、0.01 であることを示している。
ご覧の通り、ゆらぎの幅は、最初の 100 打数ぐらいで一気に減るが、その後はいくら打数が増えてもなかなか減らないことがわかる。つまり「大数の法則」が現実化するにはかなり時間がかかるのだ。「長い目で見れば自分が勝つはずだ」と思って博打を続けているうちに成す術もなく負けることがは珍しくない。
この現象は数式を使うと簡単に説明できるので、少しお付き合い願いたい。ゆらぎの幅を示す量として標準偏差があるのはご存知だろう。実は二項分布の標準偏差は、次のような公式で簡単に計算できる。
式中の n はここで言う打数、p は「実力」に相当する。ただし、このままだと安打数の標準偏差になってしまうので、打率の標準偏差にするために、これを打数 n で割ってみよう。
この式の分子は「実力」だけで決まる量であり、分母は打数だけで決まる量である。つまり、打率の標準偏差は、打数の平方根に反比例するということだ。たとえば、百打数の時点での打率の標準偏差が一分だったとしたら、それを一厘まで減らすには一万打数必要だということになる。
日本プロ野球史上で現役通算一万打数を越えているのは、3000 試合出場、実働 26 年の野村克也ただ一人であり、ほとんどの選手が千打数に達することもなく現役を終える。つまり、ぼくらが通常接する打率の記録には、一分から二分程度のゆらぎがあって当然だということになる。
・ 「運」を量的に捉える意義
このように「運」を量的に捉える事の利点は、「世の中すべて実力だ」とか「世の中すべて運だ」といった両極端な主張に惑わされず、実力と運が複雑にからみあった世界の実態をよりリアルに認識できることである。
たとえば、上のグラフを理解していれば、シーズン開始時の四月中の打率が二割五分でもあまり気にする必要はないが、シーズン終了時の打率が二割五分ではさすがに言い訳できないだろう、というようなことが言える。
スポーツの難しさの一つに「実力」と「運」をはっきり区別できないことがある。結果が「実力」か「運」かで、正しい対応はしばしば正反対になる。成績が悪化したのが「実力」のせいならフォームの改造などなんらかの対策をした方がよいだろうが、「運」のせいなら対策したりするとかえってフォームを崩す恐れがある。スポーツではよく「好調の後ほどスランプになり易い」と言われるが、その理由はおそらくこういうことではないか。
うろ覚えだが、イチローは何試合か不調が続いた後で突然固め打ちしたときに、「昨日から一日しかたっていないのに、技術的にそんなに大きく変わるはずないんですよね」と言っていた。その真意を想像するに、「これは実力ではなく運なので、その結果に振り回されてしまっては、かえってバッティングを崩すことになる」ということではなかろうか。
一方、ID 野球で有名な野村克也は「勝ちに不思議の勝ちあり、負けに不思議の負けなし」という言葉を座右の銘にしていた。これは本稿の言葉で言えば、「『運』で勝つことはあるが、『運』で負けることはない。負けはすべて『実力』だ」という意味であろう。
でも、ぼくは負けにも不思議の負けがあると思う。ただ安易にそう思ってしまうと向上心が失われるので、向上心を維持するための精神訓として「負けに不思議の負けなし」と言っているだけではないだろうか。
しかし、先に言ったように、敗因でないものを敗因と勘違いして対策をとれば、結果は向上どころか悪化する可能性もある。だから野村的な現実認識よりもイチロー的な現実認識の方が優れているとぼくは思う。
「運」に振り回されない方法の一つは、「実力」を結果以外で判断することである。おそらくイチローのように長期にわたって安定した成績を維持できる一流選手はみな、結果以外で自分の調子を判断するバロメータ(フォームのチェックポイントとか)を持っているのではないかと、ぼくは想像している。
・敗者にも優しさを
スポーツではよく紙一重の勝負が行われる。野球で言えば、1991 年の古田対落合の首位打者争いとか 1976 年の谷沢対張本の首位打者争いなどは最早伝説と化している。ぼくも記録マニアの友達がいるのでこの手のドラマは大好きだ。
しかしここまでの議論でわかるように、このような勝負の結果はかなりの部分が「運」できまる。ちなみに、本稿の理論的な枠組みを利用すると、両選手の「実力」がシーズン打率に等しいと仮定して、勝負の結果が「運」によって逆転する確率を求めることもできる。ぼくはこの確率を仮に「逆転率」と呼んでいる。
(数学に詳しい人のために方法を説明すると、打率の二項分布を正規分布で近似し、正規分布の差が正規分布になるという定理を利用して打率の差の分布を求め、その累積分布関数から差がマイナスになる確率を求めればよい。)
選 手 | 打率 | 打数 | 安打 | 逆転率 |
古田 敦也 | 0.340 | 412 | 140 | 0.500 |
落合 博満 | 0.340 | 374 | 127 | 0.496 |
高木 豊 | 0.333 | 490 | 163 | 0.415 |
野村 謙二郎 | 0.324 | 524 | 170 | 0.305 |
レイノルズ | 0.316 | 468 | 148 | 0.227 |
駒田 徳広 | 0.314 | 510 | 160 | 0.203 |
パチョレック | 0.310 | 442 | 137 | 0.176 |
オマリー | 0.307 | 476 | 146 | 0.149 |
山崎 隆造 | 0.301 | 402 | 121 | 0.118 |
レイ | 0.299 | 415 | 124 | 0.104 |
2 位の落合の逆転率がほとんど五割近いのは当然としても、三位の高木や四位の野村ですら三割以上の逆転率があることがわかる。
このように勝負はかなりの部分が「運」に左右されるにも関わらず、勝者と敗者では扱いに天と地の差がある。これは社会の仕組みとしては仕方がないだろう。しかし敗者の中にも勝者と同じぐらい「実力」があったり努力したりしている人は少なくないのだ。
だからぼくらは心の中では敗者にも暖かい拍手を贈ることを忘れないようにしたい。これは経済的な弱者についてもある程度同じ事が言えるのではないかと、ぼくは思っている。
追記: セイバーメトリクスの基本文献の一つとされる「Curve Ball」(邦訳:「メジャーリーグの数理科学」)を読んでいたら、まるまる 1 章を割いてこの記事とほとんど同じ議論をしていて、かなりあせった。
もちろん、この記事は数理的な事実を書いているだけだし、読んでから書いたわけではないので、パクリではないが、オリジナリティに欠けることは否定できない。 このへんがちゃんとサーベイをしない素人のダメなところである。もっとも、逆にぼくが口から出任せの与太を飛ばしているわけではない、という傍証になっているとも言えるが。
両者の最大の違いは、こっちは二項分布を使って確率分布を厳密に計算しているのに対して、あっちはモンテカルロ・シミュレーションを使って誤魔化している、もとい、数学に馴染みのない読者にもわかり易く説明しているところである。
(あと、あっちは信頼区間を使って区間推定をしているが、こっちはしていない。もちろんその発想もあったのだが、区間推定の方法を数学的に厳密に説明するのは面倒だし、90% とか 95% とか恣意的な信頼度を設定する意味も説明しずらいのでやめたのである。この本では、区間推定の考え方だけをシミュレーションを使って大雑把に説明し、実際の計算式は天下り的に導入している。 )
本書は他にも、確率モデルをゲームに例えたりして、数学的記述に深入りしない工夫が随所に見られる。「メジャーリーグの数理科学」などと偉そうな邦題がついているが、おそらく原書は、専門書ではなく一般向けの啓蒙書として書かれたのではないだろうか。
だから、ぼくの記事を読んでもよくわからなかった人は、ひょっとしたらこの本を読んだ方が理解できるかもしれない。ただし、ぼくが読んだのは英語版の原書なので、邦訳版の質に関してはなんの保証もできないことをお断りしておく。
| 固定リンク
「スポーツ」カテゴリの記事
- 田中の稲尾越え確率を推定してみる - 対戦投手編(2013.08.05)
- 田中の稲尾越え確率を推定してみる(2013.08.04)
- 月間本塁打数の変動がだいたい「偶然」で説明できちゃう件(2013.07.17)
- 統一球大喜利(2013.06.13)
- 吉見と浅尾の WPA を計算してみたい(2011.10.20)
「哲学」カテゴリの記事
- ネオ・フェミニスト映画(2011.12.26)
- 一人称を「私」に変えた理由(2011.11.17)
- 楽観主義バイアス - 不合理に楽天的な脳(2011.11.09)
- コメントしないという美学(2011.11.06)
- 政治はバイナリサーチ(2011.09.23)
「数学」カテゴリの記事
- コンドルセの陪審定理をGeoGebraで解説してみた(2019.07.02)
- ライバルに勝つには 2.4142… 倍に賭けろ!(2014.04.05)
- 平均値・標準偏差の幾何学的意味(2013.10.18)
- 期待値の説明の大雑把さを補足してみる(2013.09.10)
- 田中の稲尾越え確率を推定してみる - 対戦投手編(2013.08.05)