« lowercase はうるさい | トップページ | 再分配は悪 »

野球の短期決戦におけるリスクとリターンのトレードオフ

 これも説明が面倒なので、大分前に予告しただけで放置してあったネタ。でも、これ以上ずるずる放置しておくと、野球のポストシーズンも終わって旬を過ぎてしまうので、このへんでがんばって仕上げてみよう。

 実は、幼馴染の友達に野球の記録マニアがいたおかげて、野球の記録分析には子供の頃から興味を持っていた。最近のセイバーメトリクスなどはあまりフォローしていないので、多少知識が古くなっているとは思うが、おそらく、平均的な日本人はもちろん、平均的な野球ファンとくらべても、野球の記録分析には詳しい方だと思う。

 そのようなぼくが長年思っていたことなのだが、従来の野球の記録分析手法には大きく欠けた部分がある。それは、扱われる統計量が平均値ばかりで、分散や偏差、あるいは、全体的な確率分布などがほとんど問題にされないことだ。

 もちろん、宇佐美徹也氏を筆頭とする野球記録研究者の方々は、それなりに立派な仕事をされてきたと思う。ただ、これまでは現代的な統計の知識自体が世の中にあまり普及していなかったので、そのような手法を取り入れる研究者自体が少なかっただろうし、もしいたとしても、そういう議論についてこれる読者も(とくにそういう記事が発表されるような媒体には)あまりいなかったのだろう。

 しかし、分散や偏差の分析が野球の戦略にとって重要でないはずがないのである。たとえば、野球の戦略に関する議論ではよく、バントで確実に点をとるか、それとも一発を狙って大量得点を期待するか、みたいなことが問題になるが、これはまさしく、分散(リスク)の小ささと平均値(リターン)の大きさのトレードオフの問題だ。同じような問題は、ちょっと考えるだけで枚挙に暇がない。しかし、これまでの野球記録分析の手法では、分散や偏差という概念がないため、このようなトレードオフの問題を量的に扱うことができず、定性的な議論しかできなかった。

 そのせいもあってか、このような場合にどのような戦略を選ぶかは、監督の好みや哲学の問題とされる傾向が強かった。もちろん、だからこそ、ファンの一人一人が自分の価値観や人生哲学を重ね合わせて議論を楽しめたという面もあるが、どちらがより正しい戦略かという問題に、論理的な回答が提示されることはなく、戦略の評価は主に結果だけで決められてきた。

 この小論では、野球においてリスクとリターンのトレードオフが問題となるような典型的な事例の一つを取り上げ、それを統計的なモデルに基づいて分析することにより、どちらがより正しい戦略かという問題に論理的な解を与える。それを一つの分析事例として読んでいただくことにより、野球記録分析において分散や偏差を考えることの利点を少しでも理解していただければ幸いである。


・おまけ

 以下の計算に使ったスプレッドシートを無料公開しちゃいます。以下の議論が理解できなくても心配ありません。防御率と標準偏差の数値を入力するだけで、シリーズの結果を予想できちゃいます。マクロも何にも使ってない単純なシートですから、この程度のシミュレーションだったら意外と簡単にできるということもおわかりいただけるでしょう。

 コピーや改変をしてもかまいませんが、自分で作ったとウソつくのだけはやめてください。こっちがウソつき扱いされてややこしいことになりますので。あと、シミュレーションの結果について、「これはコンピュータで予想したんだから間違いない」とかなんとか大袈裟なことを言うのも絶対にやめてください。ぼくがそんな大それた主張をこれっぽっちもしていないことは、以下の議論をちゃんと読んでいただいた方にはわかるはずです。

 以下の議論ではクライマックスシリーズのような 5 試合のシリーズを想定していますが、せっかくこの時期ですから、日本シリーズ用の 7 試合バージョンも作ってみました。

 このスプレッドシートがどのような理論モデルに基づいているのかを理解した上で正しく利用したい人は、ぜひぜひ、以下の小論を読んでくださいませ。それでは。


・短期決戦の戦略

 日本シリーズやクライマックスシリーズのような短期決戦において、戦略としてクローズアップされることが多いのは、先発投手の選択である。たとえば、エースにはエースを、二番手には二番手をぶつけるという戦略もあれば、西武黄金時代の森監督のように、あえてエースを2戦目に持ってくるというような戦略もあるようだ。ここでは、そのような戦略の是非を、単純なモデルによって考えてみよう。

 まず、試合数は 5 試合で、勝ち越したチームが優勝とする。各チームには投手が 5 人ずついて、それぞれが 1 試合ずつ登板するものとする。また、登板した投手は必ず完投し、投手交代はないものとする。そして、各試合の失点は、登板した投手の防御率だけで決まるとする。つまり、監督にできることは、各試合の先発投手を選ぶことだけで、それだけでシリーズ全体の結果が決まるという、極めてシンプルなモデルを考えるわけだ。

 失点が防御率で決まると言っても、防御率 2 点の投手はどの試合でも必ず 2 点しかとられないという意味ではない。それでは問題が単純になりすぎるし、リスクを論じることもできなくなる。そうではなくて、防御率 2 点の投手は、ある試合ではちょうど 2 点とられることもあるが、別の試合では完封することも大量点をとられることもあって、平均すれば 1 試合あたり 2 点とられるという風に考えるのだ。そうすれば、リスクの問題を論じることが可能になる。

・得失点の確率分布

 ここで問題となるのは、各試合の得失点がどのような確率分布をするのかということだ。ここでは便宜上、得失点は正規分布をするということにしておく。

(注:なぜ得失点の確率分布が問題になるのかという問題設定の意味自体がわからない人は、以下の議論をとばして「エース同士をぶつける戦略」から読んでくれてもかまわない。それでもこの小論の意義はある程度わかっていただけるはずである。) 

(注:実は、誰かが似たようなことを考えているに違いないと思って、インターネット上を探し回ってみたのだが、野球の得失点の確率分布について論じた記事は、ほとんど見つけることができなかった。しょうがないので、一生懸命自分で考えたわけだが、このこと自体が、野球の記録分析において、いかに分散や確率分布の分析がかるんじられているかということの、一つの例になっていると思う。)

 その根拠の一つは、中心極限定理だ。野球の1試合の得点は、各イニングの得点を合計することによって決まる。ということは、各イニングの得点がどのような確率分布をとったとしても、9 イニングの平均をとれば、中心極限定理によって、正規分布に近づくはずである。

 と言っても、たかだか 9 イニングでは、どこまで中心極限定理が効いてくるか、心もとないと思う人もいるだろう。そこで、各イニングの得失点の確率分布が正規分布にどれだけ近いかも検証しておこう。ここでもまず、打者の打率は全員同じ、結果は必ずアウトかホームランという、超シンプルなモデルを想定してみる。すると、各イニングの得点の確率分布は、打者が 3 回アウトになるまでに、何回ホームランを打てるかという分布になる。

 これはベルヌーイ過程の一種であり、二項分布幾何分布の中間のような分布になるのではないか、ということは多くの人に想像がつくだろう。学者というのは偉いもので、このような分布にもちゃんと名前がついていて、これを負の二項分布という。負の二項分布の計算法などは関連する文献を参照していただくことにして、このモデルに基づいて計算した各イニングの得失点分布は下のグラフのようになる。

 負の二項分布による得失点分布.jpg

 色分けされた線は、それぞれ、打率 0.1、0.2、0.3、0.4、0.5 の場合の得失点分布を表している。たとえば、打率 0.3 の場合なら、イニングの得点が 0 点である確率が 0.35 ぐらい、1 点である確率が 0.3 ぐらいというふうになる。こうしてぱっと見ただけでも、たとえば瘤がたくさんあるような、正規分布とかけ離れた分布ではないことがわかる。

 試しに、この負の二項分布とまったく同じ期待値と標準偏差を持つ正規分布でこの曲線を近似してみると、下のグラフのようになる。 

負の二項分布の正規分布近似.jpg 

 ご覧ののように、上のグラフとかなり似ていることがわかる。先に述べたように、1 試合当たりの得失点分布では、これにさらに中心極限定理が働くことを考えれば、得失点分布を正規分布で近似してもそれほど問題はないと思われる。ということで、以後の議論では、得失点分布が正規分布であると仮定する。

 なお、正規分布は実数上の連続分布であるが、実際の野球の得失点は自然数上の離散分布であるという問題もある。ここでは、計算を簡単にするため、得失点も実数であると仮定する。つまり、1.23 点対 1.45 点でチームAの勝ち、というようなことが起こり得るようなルールになっていると仮定する。

(注:確率過程論に詳しい方ならお気づきだと思うが、マルコフ過程などを使えば、単打や盗塁なども考慮に入れた、より精密なモデルを作ることも可能だ。しかし、仮にそうしたとしても、結論はおそらくこの負の二項分布のモデルとそう大差ないものと思われる。もちろん、学者さんとかならそのへんもっと論理的に詰めるのであろうが、ぼくは一介のアマチュアだし(^^)、そこまでやる能力や時間はないので、この程度のモデルで誤魔化しておくことにする。もし、マルコフ過程を使って得失点分布の計算をしたという奇特な方がいらしたら、ぜひ結果をご教授いただきたい。)

(注:実は、2007 年の大リーグのデータを利用して、正規性の検定などもやってみたのだが、残念ながら、危険率 5% 以内で正規分布であるとは言えなかった。この項目がなんとなく歯切れ悪く書いてあるのはそのせいでもある。もっとも、この小論でとりあげるのはかなり大雑把なモデルなので、瘤がいくつもあるような特異な分布でない限り、結論に大きな差はないと思われる。気になる人は、いろんな分布で試してみて欲しい。) 

2007年大リーグの得失点分布.jpg

・エース同士をぶつける戦略

 さて、基盤となるモデルが定まったところで、いよいよ、先発投手の選択が勝負の結果にどう影響するかを見てみよう。対戦するのはチームAとチームBの 2 チーム。チームAの投手は、防御率 1、2、3、4、5 点の 5 人。チームBはこれより少し弱くて、防御率 2、3、4、5、6 点の 5人がいるとしよう。そして、防御率の標準偏差は、すべて 1 点であるとする。

(注:あらかじめ白状しておくと、この標準偏差 1 点というのは、結果が極端に現れるように、わざと少なめに設定した数字である。2007 年の大リーグのデータを何チーム分か調べたところによれば、チーム得失点の標準偏差はだいたい 3 点ぐらいであった。また、先程の負の二項分布を見ればわかるように、実際にはおそらく、防御率の標準偏差も投手によって異なり、防御率が増えるにしたがって標準偏差も大きくなると思われる。現実の野球戦略に以後の議論を応用したいと思っている人は、そのような点も考慮していただきたい。)

 まず、エースにはエース、二番手には二番手をぶつけるというタイプの戦略の結果を考えてみよう。この戦略では、チームAの防御率 1 点の投手と、チームBの防御率 2 点の投手が対戦することになる。先に述べたように、もし偏差がなければ、この試合の結果は常に 2-1 になって、必ずチームAが勝つ。つまり、チームAの勝率が 100% になる。しかし、このモデルではどちらの防御率にも 1 点の偏差があるのでそうはならない。では、この試合のチームAの勝率はどうすれば計算できるだろうか。

 そのためには、チームAとチームBの得点差の確率分布というものを考えればよい。得点差がプラスならチームAの勝ち、マイナスならチームBの勝ちであるから、得点差が 0 点より大きい確率と小さい確率がそれぞれチームAとチームBの勝率になる。好都合なことに、正規分布同士の差はやはり正規分布になるという定理があるから、得点差の分布も正規分布として計算できる。その結果は、下の表のようになる。

試合シアイ

チームA

チームB

差の分布

勝率

 

防御率

標準偏差

防御率

標準偏差

得失点差

標準偏差

チームA

チームB

1 1.00 1.00 2.00 1.00 -1.00 1.41 0.76 0.24
2 2.00 1.00 3.00 1.00 -1.00 1.41 0.76 0.24
3 3.00 1.00 4.00 1.00 -1.00 1.41 0.76 0.24
4 4.00 1.00 5.00 1.00 -1.00 1.41 0.76 0.24
5 5.00 1.00 6.00 1.00 -1.00 1.41 0.76 0.24

 このように、各試合の勝率が求まれば、5 試合で各チームが何勝ずつするかという確率の分布が計算できる。たとえば、1 試合目だけチームBが勝ち、以後の試合はすべてチームAが勝つ確率だったら、0.24×0.76×0.76×0.76×0.76=0.08 である。この確率を、考えられるあらゆる勝敗パターンについて計算して、それを勝数ごとに集計したものが勝数の確率分布になる(この戦略に限って言えば、どの試合も勝率が同じなので、確率分布は二項分布でも計算できる。ただし、このことは一般の戦略には当てはまらない)。このような計算も、手計算でやればかなりの重労働だが、幸いなことに今は文明の利器コンピュータというものがあって、Excel を使えばたいした手間もかからない。その結果は下の表のようになる。

 

チームA

チームB

勝数

確率

期待値

分散

確率

期待値

分散

0 0.00 0.00 0.01 0.25 0.00 0.36
1 0.01 0.01 0.10 0.40 0.40 0.02
2 0.08 0.16 0.26 0.25 0.51 0.16
3 0.25 0.76 0.16 0.08 0.24 0.26
4 0.40 1.60 0.02 0.01 0.05 0.10
5 0.25 1.27 0.36 0.00 0.00 0.01

 

勝ち越し率

平均勝数

標準偏差

勝ち越し率

平均勝数

標準偏差

  0.91 3.80 0.95 0.09 1.20 0.95


 説明するまでもないと思うが、3 勝以上で勝ち越しであるから、この分布から 3 勝以上の確率を合計すれば、シリーズの優勝確率が求められるわけである。この戦略の場合、チームAの優勝確率が 0.91、チームBの優勝確率が 0.09 である。それとは別に、各チームの平均勝数と勝数の標準偏差も計算しておいた。この 2 つの数字は、後で戦略同士を比較する際に重要な役割を果たすので、楽しみにしていただきたい。

・捨てゲームをつくる戦略

 このように、エース同士をぶつける戦略とは逆に、自チームのエースをあえて力の劣る投手にぶつけることによって、その試合の勝率を高めるという戦略も考えられる。ただしその場合には、相手チームのエースには逆に力の劣る投手しかぶつけられないことになるので、差し引きどっちが得かが問題になるわけだ。

 たとえば、シリーズ全体で 3 勝すれば優勝なのだから、自チームの上から 3 番目までの投手をなるべく力の差のある投手にぶつけ、残りの 2 試合は捨てゲームとする戦略を考えてみよう。この戦略における各試合の勝率を先程と同じように計算すると、下の表のようになる。

試合シアイ

チームA

チームB

差の分布

勝率

 

防御率

標準偏差

防御率

標準偏差

得失点差

標準偏差

チームA

チームB

1 1.00 1.00 4.00 1.00 -3.00 1.41 0.98 0.02
2 2.00 1.00 5.00 1.00 -3.00 1.41 0.98 0.02
3 3.00 1.00 6.00 1.00 -3.00 1.41 0.98 0.02
4 4.00 1.00 3.00 1.00 1.00 1.41 0.24 0.76
5 5.00 1.00 2.00 1.00 3.00 1.41 0.02 0.98


 ごらんのように、チームAの1、2、3 試合の勝率は 0.98 にまで高まった。その一方で、残り 2 試合の勝率は 3 割以下にまで下がってしまった。これがシリーズ全体の優勝確率にどう影響するだろうか。先程と同じように計算してみよう。

 

チームA

チームB

勝数

確率

期待値

分散

確率

期待値

分散

0 0.00 0.00 0.00 0.00 0.00 0.01
1 0.00 0.00 0.00 0.24 0.24 0.15
2 0.04 0.07 0.05 0.72 1.44 0.03
3 0.72 2.17 0.03 0.04 0.11 0.05
4 0.24 0.95 0.15 0.00 0.00 0.00
5 0.00 0.02 0.01 0.00 0.00 0.00

 

勝ち越し率

平均勝数

標準偏差

勝ち越し率

平均勝数

標準偏差

  0.96 3.21 0.50 0.04 1.79 0.50


 この戦略の場合、チームAの優勝確率は 0.96 になり、先程のエース同士をぶつける戦略よりも 5% ほど向上していることがわかる。

 これがもし、標準偏差(リスク)を考慮に入れていなかったらどうだろう。エース同士をぶつける戦略ではチームAが 5 戦全勝、捨てゲームと作る戦略ではチームAが 3 勝 2 敗。内容の違いはあるが、どちらもチームAが 100% 優勝することになる。つまり、このような戦略の差は、標準偏差(リスク)を考慮に入れることによってはじめて明らかになるのだ。そのことがはっきり示された。

・リスクとリターンのトレードオフ

 ここで注目してほしいのは、チームAの平均勝数である。エース同士をぶつける戦略では、平均勝数は 3.80 だったのに対し、捨てゲームを作る戦略では、平均勝数は 3.21 に下がっている。つまり、平均勝数が減っているにもかかわらず、優勝確率が増えているのである。なぜこのようなことが可能なのだろうか。

 その秘密は、標準偏差、つまり、リスクにある。エース同士をぶつける戦略では、勝数の標準偏差は 0.95 であったのに対し、捨てゲームを作る戦略では、標準偏差が 0.50 にまで減っている。つまり、この戦略は、リターンを犠牲にしてリスクを減らす戦略なのである。

 このへんの事情は、確率分布をグラフにして比べてみるともっとはっきりする。  

エース同士をぶつける戦略の確率分布.jpg

捨てゲームを作る戦略jpg.jpg

 ご覧のように、エース同士をぶつける戦略では、勝数のピークは捨てゲームを作る戦略より右にあるのだが、分布の裾がやや長い。そのため、2 勝以下の確率が結構高くなってしまっているのだ。逆に、捨てゲームを作る戦略では、勝数のピークは左にあるが、分布の裾が非常に短い。そのため、2 勝以下になる可能性がほとんどないわけである。

・弱者の戦略

 これまでは、主にチームAの立場で戦略を検討してきた。今度はチームB、つまり、やや実力に劣る側の立場にたって戦略を考えてみよう。チームBは、次のような戦略をとれば、優勝確率を 0.44 にまで高めることができる。

試合シアイ

チームA

チームB

差の分布

勝率

 

防御率

標準偏差

防御率

標準偏差

得失点差

標準偏差

チームA

チームB

1 1.00 1.00 5.00 1.00 -4.00 1.41 1.00 0.00
2 2.00 1.00 6.00 1.00 -4.00 1.41 1.00 0.00
3 3.00 1.00 2.00 1.00 1.00 1.41 0.24 0.76
4 4.00 1.00 3.00 1.00 1.00 1.41 0.24 0.76
5 5.00 1.00 4.00 1.00 1.00 1.41 0.24 0.76


 

チームA

チームB

勝数

確率

期待値

分散

確率

期待値

分散

0 0.00 0.00 0.00 0.01 0.00 0.07
1 0.00 0.00 0.01 0.13 0.13 0.22
2 0.44 0.88 0.22 0.41 0.83 0.03
3 0.41 1.24 0.03 0.44 1.32 0.22
4 0.13 0.52 0.22 0.00 0.01 0.01
5 0.01 0.07 0.07 0.00 0.00 0.00
 

勝ち越し率

平均勝数

標準偏差

勝ち越し率

平均勝数

標準偏差

  0.56 2.71 0.74 0.44 2.29 0.74


 これもある意味捨てゲームを作る戦略であるが、チームBの場合にはチームAほどリスクを減らすことはできない。

弱者の戦略.jpg

 弱いチームの場合、平均勝数を 3 勝以上(つまり右半分)の領域に持っていくことはできないのだから、平均勝数(リターン)を犠牲にして標準偏差(リスク)を減らすという戦略には意味がない。ここが、強者の戦略と弱者の戦略の根本的な違いである。

・まとめ

 長々とお付き合いいただいたが、いかがであろうか。もちろんここでは、極端に単純化されたモデルにおける、典型的な結果をいくつか示したにすぎない。しかし、野球において平均値(リターン)だけではなく偏差(リスク)を計算することの利点はある程度示せたのではないかと思うし、現実の短期決戦においてもリスクとリターンのトレードオフが生じていることの傍証にもなったであろう。

 もちろん、さらに考えるべきことはたくさんある。途中の注でも言及したが、得失点分布のより精密なモデルを作って実測データで検定してみるのもいいだろう。これはほとんど労力だけの問題だ。投手力だけではなく打力や守備力まで考慮に入れたモデルを作ってみるのも面白い。また、最適な投手起用法に関するもっと見通しのよい一般理論を考えるという課題もある。これはヒマなときにつらつらと考えてはいるが、まだアイデアがまとまっていない。もっとも、ぼくごときが余暇の範囲できることは限られているので、この記事をとっかかりにしてさらに考察を深めてくれる方がいらっしゃれば幸いである。

 ぼくがこの理論からまず連想するのは、西武ライオンズ黄金時代の森監督の戦略である。森監督は、日本シリーズに 8 回出場して 6 回優勝、6 回目までは 6 連勝を記録した、シリーズに強い監督として有名だったが、シリーズ第一戦ではなく第二戦にエースを登板させる癖があった。本人は、二戦目で勝ったほうが勢いに乗るんだとかなんとか言っていたが、ぼくはあまりその説明に説得力を感じていなかった。今にして思うと、実はエース同士の対決を回避して確実に 1 勝するという意味の方が大きかったのではないかと思う。

 もちろん、森監督以外の監督の投手起用法も、この分析法で分析してみれば、いろいろ興味深い事実が出てくるかもしれないので、機会があればやってみたいと思う。

|

« lowercase はうるさい | トップページ | 再分配は悪 »

スポーツ」カテゴリの記事

数学」カテゴリの記事

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/67762/42903945

この記事へのトラックバック一覧です: 野球の短期決戦におけるリスクとリターンのトレードオフ:

« lowercase はうるさい | トップページ | 再分配は悪 »