田中の稲尾越え確率を推定してみる - 対戦投手編

 「田中の稲尾越え確率を推定してみる」では田中投手の勝率を推定する方法を紹介したが、その方法は、今シーズンの田中投手と楽天の平均的な成績に基づいていた。本稿ではこれをさらに一歩すすめて、田中投手が今後実際に対戦する可能性の高いチームや投手を想定して、勝率を推定してみよう。

 ローテーション通りなら、田中投手の次の登板は 8 月 9 日の福岡ソフトバンクホークス戦、その次の登板は 8 月 16 日の埼玉西武ライオンズ戦になると予想される。

  8 月 9 日の福岡ソフトバンクホークス戦のホークス側の先発投手は、ローテーション通りなら、大場投手の可能性が高い。さらに、ローテーションを崩してきた場合も考えて、大場投手、攝津投手、帆足投手と対戦した場合の勝率を予想してみる。

 8 月 16 日の埼玉西武ライオンズ戦のライオンズ側の先発投手は、ローテーション通りなら、野上投手の可能性が高い。さらに、ローテーションを崩してきた場合も考えて、野上投手、菊池投手、牧田投手と対戦した場合の勝率を予想してみる。

  方法は「田中の稲尾越え確率を推定してみる」と基本的に同じで、楽天の得点分布の代わりに相手投手の失点分布を使っただけだが、少し修正したところもある。それは、投球イニングに合わせた失点補正の方法である。

 前回は各試合の失点数を「失点÷投球回×9」という式で補正したのだが、今回対象にした投手の中には、1 回 7 失点とか序盤の大量失点で降板してしまった投手がいて、この補正をすると逆に非現実的な数値になってしまうことがわかった。そこで今回はこの補正をせず、投球回数に関わらず失点数をそのまま使うことにした。その分投球回の少ない投手が多少有利になっていることにご注意いただきたい。

・ 8 月 9 日の福岡ソフトバンクホークス戦

・大場翔太投手

失点分布 - 大場.JPG 

田中投手の推定勝率: 0.872(正規分布) ~ 0.945(経験値)

・攝津正投手

失点分布 - 攝津.JPG

田中投手の推定勝率: 0.618(経験値) ~ 0.620(正規分布)

・帆足和幸投手

失点分布 - 帆足.JPG

田中投手の推定勝率: 0.681(正規分布) ~ 0.689(経験値)

・ 8 月 16 日の埼玉西武ライオンズ戦

・野上亮磨投手

 失点分布 - 野上.JPG

田中投手の推定勝率: 0.735(正規分布) ~ 0.789(経験値)

・菊池雄星投手

失点分布 - 菊池.JPG

田中投手の推定勝率: 0.533(経験値) ~ 0.535(正規分布)

・牧田和久投手

失点分布 - 牧田.JPG

田中投手の推定勝率: 0.675(正規分布) ~ 0.690(経験値)

・まとめ

 本稿の方法による、田中投手の予想勝率は以下の通りである。

  • 8 月 9 日福岡ソフトバンクホークス戦
    • 対大場: 0.872(正規分布) ~ 0.945(経験値)
    • 対攝津: 0.618(経験値) ~ 0.620(正規分布)
    • 対帆足: 0.681(正規分布) ~ 0.689(経験値)
  • 8 月 16 日埼玉西武ライオンズ戦
    • 対野上: 0.735(正規分布) ~ 0.789(経験値)
    • 対菊池: 0.533(経験値) ~ 0.535(正規分布)
    • 対牧田: 0.675(正規分布) ~ 0.690(経験値)

 この中で最強の敵は菊池雄星投手なので、新記録の掛かった試合で渡辺監督が菊池をぶつけてくるか、個人的に注目してみたい。

| | コメント (0) | トラックバック (0)

田中の稲尾越え確率を推定してみる

 東北楽天ゴールデンイーグルスの田中将大投手の連勝記録が話題だ。本稿投稿時点で、シーズン開幕 15 連勝のプロ野球タイ記録。賞賛すべき成績だ。しかし開幕以来と限定しなければ、シーズン連勝のプロ野球記録は、稲尾和久投手の 20 連勝。当然、次の注目はこの記録を抜けるかどうかだ。

 そこで本稿では、田中投手が稲尾投手の連勝記録を越える「確率」を推定してみたい。

 何のために? いろいろ理由はつけられるが、要はまあ一種のお遊びである。新記録を樹立しようと努力する田中選手や、新記録を期待するファンの気持ちに、水をかける気か? と憤慨する向きもあるかもしれないが、あくまでお遊びなので、寛容な態度で見逃して欲しい。確率論の応用例として、それなりに面白いところもあるだろうと思うので。

・確率モデルを選ぶ

 このような確率の予想は、結局はどのような確率モデルを選択するかで決まる。田中投手の連勝確率を推定するために、考えられるもっとも単純なモデルは、田中投手の過去の勝率から未来の勝率を予想するというモデルだろう。今シーズンの田中投手のこれまでの勝率は 10 割だから、今後の勝率も 10 割と予想される。ゆえに稲尾越えの 20 連勝の確率は 100% である。以上終わり。

 これだって一種の確率モデルには違いないが、さすがにバカすぎる。もう少しマシなモデルを考えたい。そのために、勝率の元になる要因をもっと細かく分解してみよう。田中投手の勝率は、そのような要因が相互に影響しあった結果であり、現在までの勝率 10 割は、さまざまな可能性の一例にすぎず、他の可能性もあったはずだと考えるのである。

 本稿では、要因を試合単位の得失点分布まで分解し、田中投手の失点分布と楽天の得点分布から、田中投手の勝率が決まるというモデルを採用する。このモデルは、実は「野球の短期決戦におけるリスクとリターンのトレードオフ」という記事でも採用したモデルなので、モデル自体の細かい説明はこちらの記事を参照していただきたい。

 もちろん、もっと細かくしようと思えば、いくらでも細かいモデルを考えることはできる。たとえば、野球の試合を 24 個の状態を持つマルコフ過程であると考え、その状態間の推移確率をチームの投手記録や打撃記録から推定するとか(これは実は OERA という指標の計算に使われている方法で、例の鳩山元総理大臣の論文でも引用されていたはず)。

 しかし、モデルを細かくしても労力に見合った結果が得られるとは限らないので、労力と結果の費用対効果を考えれば、この程度のモデルでもそこそこバランスがよいのではないかと思う。だいたい、そこまでやるほどヒマでもないし。

・田中投手の失点分布

 まず、田中投手の失点分布を調べよう。今シーズンの田中投手の各試合の失点数を横軸に、その失点の試合が出現した頻度を縦軸にとってグラフ(ヒストグラム)にすると、下図のようになる。

 田中失点分布.JPG

つまり、今シーズンの田中投手は、失点 0 の試合が 6 試合、失点 1 の試合が 4 試合…だったということである。

(紫色の「正規分布」というグラフは、この失点分布を正規分布で近似したものである。これについては後で説明する。)

 ただし、このグラフには一つ注釈が必要だ。「田中投手の失点」と言っても、田中投手は毎試合 9 回まで完投しているわけではない。途中で降板している試合も多い。9 回で失点 1 の試合と、7 回で失点 1 の試合のを同じように扱うのはいろいろと不都合がある。

 そこでこのグラフでは、田中投手がどの試合も 9 回まで完投したと想定して、「失点数÷投球回数× 9」という式で失点数を補正している。実際には、降板以降はリリーフ投手が投げることになり、リリーフ投手の防御率は田中投手とは異なるので、この補正方法にも問題はあるが、大雑把な近似としては使えるだろう。

・ 楽天の得点分布

 次に、楽天の得点分布を調べよう。先ほどと同じように、今シーズンの楽天の各試合の得点数を横軸に、その得点の試合が出現した頻度を縦軸にとってグラフにすると、下図のようになる。

楽天得点分布.JPG

グラフの見方も先ほどとほぼ同じだ。今シーズンの楽天は、得点 0 の試合が 4 試合、得点 1 の試合が 12 試合…だったということである。

 ただし、このグラフにも一つ注意すべきことがある。それはやはりイニング数の問題だ。一試合のイニング数は常に 9 回とは限らない。後攻のチームがリードしていれば、9 回裏はプレイされずに 8 回になるし、延長戦になれば 10 回以上プレイされる。そのようなイニング数の違う試合がこのグラフには混在している。

 取得元のデータ形式のせいもあって、このイニング数の違いを簡単に補正する方法は見当たらなかった。厳密ではないが見逃して欲しい。8 回と 9 回のイニング数の差は小さいし、延長戦になる試合もそれほど多くはないので、おそらく、それほど大きな影響にはならないと思う。

・勝率の推定 - 経験値

 では、いよいよこの二つのデータから田中投手の勝率を推定してみよう。

 先ほど紹介した田中投手の失点分布や楽天の得点分布は、あくまで経験値であった。つまり、各点数が実際に過去このような頻度で発生したという記録にすぎない。しかし、これを元に近い将来の得点分布を予想できると考えるのは自然であろう。

 田中投手のこれまでの登板試合数は 18 試合であるから、各失点の頻度数を 18 で割れば、田中投手の登板した試合がその失点になる確率の推定値になる。

 同じように、楽天のこれまでの試合数は 90 試合であるから、各得点の頻度数を 90 で割れば、楽天の試合がその得点になる確率の推定値になる。

 この得点・失点両方の確率を一つのグラフにまとめたのが下図である。

楽天得点-田中失点分布.JPG

 さて後は、このような得点・失点の分布が「独立」に発生すると仮定すれば、田中投手の勝率を推定するのはそれほど難しくない。

 田中投手の勝利になるのは、田中投手の失点が楽天の得点より小さい場合である。したがって、

田中投手の失点 0 点の確率 × 楽天の得点 1 点以上の確率 +

田中投手の失点 1 点の確率 × 楽天の得点 2 点以上の確率 +

田中投手の失点 2 点の確率 × 楽天の得点 3 点以上の確率 +

……

という計算をすればよいのだ。数学的に言えば、「独立する二つの確率分布の差の分布は、両分布の確率密度関数の畳み込み積分によって求められる」という定理の応用である。この定理、数式で見ると怖ろしげに見えるが、やってることはこれだけの話にすぎない。

(ただし、野球の場合、同点で引き分けの試合は、勝ち数にも負け数にもカウントされないので、この分は差し引いておくべきだろう。)

 実際にこのようにして計算した、田中投手の勝率の推定値は、0.775 であった。

・勝率の推定 - 正規分布近似

 これも一つのモデルであるが、実際の頻度そのものから確率を推定するのはいかにも素朴である。このような得失点の元になる確率分布があって、実際の得失点の頻度はそれが現実化した一例であると考える方が自然だ。

 世論調査にたとえて言えば、調査の結果はあくまで調査に協力した一部の人のパーセンテージであって、社会全体のパーセンテージと必ずしも同じではないのでは、と考えてみるのだ。

 ここでは、野球の試合の得失点の分布は正規分布であると仮定してみる。「野球の短期決戦におけるリスクとリターンのトレードオフ」でも書いたように、この仮定にはいろいろと問題もあるが、大雑把な近似としては有効だと考える。統計学では、これを正規母集団と呼ぶ。

 そうすれば、実際の得失点の経験値をサンプルと見なして、そこから正規母集団の平均値と標準偏差を求め、確率分布を計算することができる。それをグラフにしたものが下図である。

楽天得点-田中失点(正規分布近似).JPG

 このデータを元にすると、先ほどの経験値の場合とほとんど同じようにして、田中投手の勝率の推定値を計算することができる。

(ただし、正規分布は離散分布ではなく連続分布であるため、ここでは畳み込み積分ではなく、正規分布の線形変換が正規分布になるという定理を使って計算した。)

 実際にこのようにして計算した、田中投手の勝率の推定値は、0.807 であった。

 つまり、どちらの方法でも、田中投手の将来の勝率の推定値は、約 8 割程度ということになる。

・連勝確率の計算

 一試合の勝率が推定できれば、そこから連勝確率を推定するのは容易である。

2 連勝の確率 = 勝率 × 勝率

3 連勝の確率 = 勝率 × 勝率 × 勝率

……

n 連勝の確率 = 勝率の n 乗

という極めて初等的な計算でしかない。勝率を横軸に、連勝確率を縦軸にして、各連勝数の確率をグラフにすると、下図のようになる。

勝率と連勝確率の関係.JPG

 田中投手が稲尾投手の 20 連勝を抜くには、あと 2 連勝する必要があるが、8 割の勝率で 2 連勝できる確率は 6 割程度である。意外と低いと思いませんか? 少なくとも、冒頭で冗談めかして書いた 10 割よりは下がった。

(なんか思いっきり勘違いした記事を一回投稿してしまったが、もしそれを目撃しちゃった人がいたら、見なかったことにしてください。)

・飛びぬけた実力+ほんのちょっぴりの幸運=記録

 このグラフを見ると、そもそも、8 割程度の勝率で 15 連勝できる確率自体がかなり低いことがわかる。 結局、連勝確率というのは勝率と「指数関数的」な関係にあるので、ちょっとの勝率の差が、非常に大きな連勝確率の差として現れてしまうのである。

 「8 割程度」とか書いてしまったが、もちろんプロ野球界全体を見ても飛びぬけて優秀な勝率で、田中投手が超エースであることは疑いない。それでも、15 連勝を余裕でできる勝率とは言いがたいのだ。これがもし 9 割 5 分ぐらいの勝率であれば、15 連勝の確率も 5 割近くになるのだが。

 田中投手やそのファンからすれば心外に響くかもしれないが、上記のような分析からすると、この記録はやはり若干の幸運の産物のように見える。もちろん、それも超エース級の実力があったればこそなのであるが。

 実際に田中投手の各試合の記録を調べてみると、6~7 月は 42 イニング連続無失点の記録を作ったぐらいで、どの試合でもほとんど 0~1 点しかとられていないが、3~5 月はそこまで調子がよくなくて、2~3 点とられた試合も結構ある。ここで1回ぐらいは負けていてもおかしくなかった。

 記録が途切れそうな危ない試合は何回かあった。特に危なかったのは、4 月 23 日のオリックス vs 楽天5 月 28 日の阪神 vs 楽天、そしてつい先日 7 月 26 日の楽天 vs ロッテあたり。

 4 月 23 日のオリックス vs 楽天では、6 回まで 3 対 2 でリードされていたが、7 回に一挙 5 点をとって逆転、勝ち投手に。5 月 28 日の阪神 vs 楽天では、2 点リードされたまま 6 回で降板したが、7 回に逆転したので勝ち負けつかず。7 月 26 日の楽天 vs ロッテでは、9 回表まで 2 対 1 でリードされていたが、9 回裏に逆転して辛くもサヨナラ勝ち。

 上の分析を読んだ人の中には、相手投手が不調だったり打線が好調だったりして、たくさん点数のとれそうな試合では、投手はそれを計算に入れて手を抜くこともあるんだから、失点と得点がまったく無関係に発生するような仮定には無理があるんじゃないの? と思った方もいるだろう。しかし実際には、得点が少ないのに失点が多い試合もあったということがわかる。つまり少なくとも、田中投手が勝敗のすべてを制御できていたわけではなかったのだ。

 ちなみに、田中投手の各試合の失点と援護点の関係をグラフにすると、下図のようになる(8/10 追加)。

田中 - 自責点 vs 援護点.JPG

 図中の赤い直線は、回帰直線とよばれる直線で、失点と援護点の間に正比例的な関係があるとすればこうなる、という直線である。その傾きがほぼゼロということは、両者にほとんど関係がないことを示している。R2 というのは決定係数と呼ばれる数値で、1 に近いほど、両者の関係が比例的関係として説明できるということになる。その決定係数がほとんどゼロということは、この両者の関係は正比例ではまったく説明できないということである。

 要するに、田中投手の失点と援護点にはほとんど相関関係は見出せず、田中投手が援護点に合わせて失点を調節できているという仮説は疑わしい。しているとしても、それほど大きな範囲ではないだろう。これが両者を「独立」として扱える可能性が高いという一つの傍証になっている。

 もっとも、田中投手の調子が尻上がりに上向いていることを考えると、現時点での「勝率」はもう少し高いと考えることもできるだろう。そう考えれば、稲尾越えの確率ももう少し高く見積もってもよいかもしれない。

 あと、この方法の根本的な欠陥として、途中降板して責任投手にならずにすんだおかげで、連勝記録がとぎれなくてすむ確率というのを正しく見積もれないこともお断りしておく。

・誤解しないでね

 念のために書いておくが、私は田中投手になんの他意もなく、それどころかファンと言ってもよいくらいだ。この記事の真意は、あくまで確率論的な考え方を示すことにある。一ファンとしては、田中投手が新記録を達成することを心から願っている。

 そもそも、連勝記録などというものは、投手の実力を正しく表す指標とは言いがたい。実力のない選手にはもちろん作れないが、実力最高の選手が作れるとも限らない。そういう類の記録である。

 それで大騒ぎするのは、まあ半分はお祭りみたいなものだ。もちろん、そういうお祭りは野球のまっとうな楽しみ方の一つであり、私もそれを心行くまで楽しもうと思っている。

| | コメント (0) | トラックバック (0)

月間本塁打数の変動がだいたい「偶然」で説明できちゃう件

 プロ野球の選手は、常に同じようなペースでホームランを打つわけではない。同じ選手が、突如として大量のホームランを打ち出したり、逆にまったくホームランを打てなくなったりすることも珍しくない。

 2013 年のシーズンでも、トニ・ブランコ選手が 3~4 月だけで 15 本のホームランを打って注目を集めた。多くの人は、こういう現象を見ると、そこに何か原因があると考える。打撃に開眼したせいだとか、チームを移籍して心機一転したせいだとか、統一球の反発係数が上がっていたせいだとか。

 しかし、ホームランの数が一時的に変動したからと言って、常にそこに何か「原因」があると言えるのだろうか。単なる「偶然」ということはないのだろうか。本稿ではそれを問題にしてみたい。

 なお、本稿で紹介するデータはもともと、私が友人に個人的に見せるために作成したものだが、できてみると自分でも思っていた以上に興味深いデータになっていたので、お裾分けする次第である。

・わからないときは

 実は、本稿と同じような趣旨の記事は、以前にも書いたことがある。「三割打者では三割は打てない」という記事がそれだ。

 この記事で扱ったのは、主に打率と偶然の関係だった。本稿では、打率の代わりに月間本塁打数を対象にしているだけで、アイデアや方法論はこの記事とあまり変わらない。

 だから、本稿ではその分説明を省略させてもらうことにする。説明が少なすぎてよくわからない方は、「三割打者では三割は打てない」を併読することをお勧めする。それでもわからない場合は、後で紹介する参考文献をお読みになるとよいかもしれない。

・偶然による変動をモデル化する

 生身の選手はいろんな要因に影響されるため、何が偶然で何が必然なのかわかりにくい。そこで本稿では、純粋な偶然をモデル化するため、機械のように何があっても常に一定の確率でホームランを打つ打者を想定する。

(数学用語で言うと、本塁打を打つ過程をベルヌーイ過程と見なし、本塁打数の確率分布を二項分布として計算する、ということだが、数学嫌いな人は無視してかまわない。)

 野球記録界ではなぜか、ホームランを打つ確率を「本塁打数/打数」ではなく「打数/本塁打数」で表して、「本塁打率」と呼ぶことが慣例になっている。本稿でもその慣例を踏襲しているので、以下の記述では、本塁打率が大きいほどホームランの確率は小さく、ホームランゼロなら本塁打率∞(無限大)となる。違和感のある人は、頭の中で逆数にして考えるとよいかもしれない。

 この用語法で言い直すと、本稿では、常に本塁打率一定の打者、というものを想定するわけだ。「三割打者では三割は打てない」で説明した通り、毎打席同じ確率でホームランを打ったとしても、ホームラン数の合計は常に同じ数になるわけではなく、一定の範囲で変動する。 このような変動には、何か具体的な要因があるわけではないので、純粋に偶然による変動と言えるだろう。

 たとえば、本塁打率 10 の打者(つまりかなりの長距離打者)が 85 打数(平均的な月間打数)打ち続けたとき、本塁打数の分布は数のようになる。

月間本塁打数分布 - 本塁打率10.JPG

 一見して、本塁打数にはかなりの変動幅があることがわかる。平均は約 8 本だが、13 本以上打つ確率も、4 本以下しか打てない確率も、それぞれ 5% 程度ある。

 繰り返すが、この変動には特に好不調などの要因があるわけではなく、純粋に「偶然」だけによる変動である。

 また同じように、本塁打率 20 の打者(つまり中距離打者)が 85 打数打ち続けた場合、結果は下図のようになる。

月間本塁打数分布 - 本塁打率20.JPG

 平均本塁打数が減っているのは当然として、注目して欲しいのは、変動の幅も狭くなっていることである。

 このように機械的に常に同じ確率でホームランを打つ打者の場合、偶然による変動の幅は、本塁打率と打数によって自動的に決まり、一般に本塁打率が大きくなるほど小さくなる。

(厳密に言うと、本塁打率が 2 より小さい、つまり、本塁打を打つ確率が 0.5 より大きくなると、逆に変動の幅は小さくなっていくのであるが、そんな確率で本塁打を打つ打者は現実には存在しないので、あまり気にする必要はない。)

 この事実は、後で実際のデータを分析する際に重要な鍵となるので、覚えておいて欲しい。

・モデルと現実を比較する

 「偶然」による変動がどのように現れるかを予測する理論モデルができたので、次は、この理論モデルと実際の選手の月単位の記録とを比較してみる。そうすれば、生身の選手がどの程度偶然に左右されているかを推定できるはずである。

 次の節ではいよいよ、その比較結果のグラフを紹介するが、細かいことが気になる人のために、下にグラフの作成方法を簡単に記しておく。早く結果を知りたい人は、読み飛ばして次の節に進んでもかまわない。グラフを見て作成方法に疑問を持った方は、以下をチェックすればたいていの疑問点が解消できるはずである。

  1. 実際の記録の統計処理
    1. 記録は「プロ野球ヌルデータ置き場」から取得する。
      • このサイトを選んだ理由は、他に月単位のプロ野球記録を容易に入手できるサイトが見当たらないからである。
    2. 特定の選手を選ぶ
      • 厳密な基準があるわけではないが、ある程度ホームラン数が多く、なおかつ、ある程度長期的に安定した成績を残している選手を選んだ。
    3. 特定の選手の月単位の打数と本塁打数の記録を、入手できる限り集める。
      • このサイトのデータは 2006~2013 年の範囲に限られているので、利用したデータもその範囲に限られていることに注意。
    4. 月単位の記録のうち、打数 60 未満の記録を一律に除外する。
      • これは主に、試合数の極端に少ない 10 月の記録や、怪我で出場機会の少ない月の記録などを除外するためである。
      • この処理により、極端な不調によりスタメンを外れたときの記録も除外される可能性があり、この処理自体が確率分布に影響を与える可能性があることに注意。
    5. 月間本塁打数別の出現頻度を集計する
      1. サンプル数の少なさが原因と考えられる頻度数のデコボコがあり、隣り合う区間を平均すればより滑らかな分布になると思われる場合には、適宜区間の結合を行う。
      2. 下の例で、本塁打数が「0, 2, 4, 8…」または「1, 3, 5, 7…」ととびとびになっている場合には、この処理が行われている。
  2. 比較対象の理論モデルの計算
    1. 上で抽出した記録から、打数および本塁打数の合計を求める
    2. 打数の合計をレコード数で割って、月平均打数を求める
    3. 打数の合計を本塁打数の合計で割って、月平均本塁打率を求める
    4. 上で計算した月平均打数と月平均本塁打率から、二項分布により本塁打数分布を求める
  3. 1、2のデータを並べてヒストグラムを作成する。

・これが現実だ!

 ではいよいよ、比較結果のグラフを怒涛のように紹介していこう。グラフ中の「理論値」が理論モデルから計算した分布、「実測値」が実際の記録から計算した分布である。

・中村剛也

月間本塁打数分布 - 中村剛也.JPG

・トニ・ブランコ

月間本塁打数分布 - トニ・ブランコ.JPG

・アレックス・カブレラ

月間本塁打数分布 - アレックス・カブレラ.JPG

・阿部慎之助

月間本塁打数分布 - 阿部慎之助.JPG

・小笠原道大

月間本塁打数分布 - 小笠原道大.JPG

・山崎武司

月間本塁打数分布 - 山崎武司.JPG

・アレックス・ラミレス

月間本塁打数分布 - アレックス・ラミレス.JPG

・村田修一

月間本塁打数分布 - 村田修一.JPG

・金本知憲

月間本塁打数分布 - 金本知憲.JPG

・松中信彦

月間本塁打数分布 - 松中信彦.JPG

・和田一浩

月間本塁打数分布 - 和田一浩.JPG

・小久保裕紀

月間本塁打数分布 - 小久保裕紀.JPG

・中村紀洋

月間本塁打数分布 - 中村紀洋.JPG

・新井貴浩

月間本塁打数分布 - 新井貴浩.JPG

・稲葉篤紀

月間本塁打数分布 - 稲葉篤紀.JPG

・中島裕之

月間本塁打数分布 - 中島裕之.JPG

・井口資仁

月間本塁打数分布 - 井口資仁.JPG

・糸井嘉男

月間本塁打数分布 - 糸井嘉男.JPG

・青木宣親

月間本塁打数分布 - 青木宣親.JPG

・内川聖一

月間本塁打数分布 - 内川聖一.JPG

・鳥谷敬

月間本塁打数分布 - 鳥谷敬.JPG

・偶然には一定の幅がある

 さて、グラフをご覧になってどのような感想を持たれただろう。思いのほか理論値と実測値が一致していると感じた方が多いのではないだろうか。正直私自身、実際に計算してみるまで、ここまで一致しているとは思わなかった。

 正規分布の曲線を見慣れた方は、こういうのはだいたいこういう形になるのが普通なんじゃないの? なんて思うかもしれないが、注目して欲しいのは変動の幅なのである。

 先に、この偶然による変動の幅は、打数と本塁打率によって自動的に決まる、と言ったことを思い出して欲しい。月間本塁打数の変動が、もし選手の実力自体の変化によるものであるならば、偶然による変動の幅に律儀に一致するとは限らないはずだ。

 つまり、記録上の変動の幅が偶然による変動の幅とほぼ一致していること自体が、この変動が偶然によるものである蓋然性が高いことを示している。

・本当に好不調だとどうなるか

 では、偶然ではなく本当に選手の実力自体が変動した場合には、どのようなグラフになるのだろうか。上に挙げた選手の記録は、予想以上に理論モデルとの差が小さくて、偶然ではない変動を示すいい実例が見当たらない。

 そこで、コンピュータによるシミュレーションで人工的にそういうデータを作ってみよう。先のモデルのように本塁打率一定ではなく、本塁打率自体が周期的に変動する打者を想定し、その打撃結果をシミュレーションしてみるのだ。

 具体的には、本塁打率を三角関数を使って 5~∞ の間で周期的に変動させ、その本塁打率に基づいて 5000 打数分の擬似乱数を発生させ、月間本塁打数の分布を生成した。それが下図である。

月間本塁打数分布 - 好不調.JPG

 本当の好不調による変動は、偶然による変動の幅には必ずしも収まらないことがわかるだろう。

・独立性の仮定は正しいか

 数理統計学や確率論の素養がある方の中は、この理論モデルが前提にしている試行の「独立性」に疑問を持った方もいるかもしれない。以下はそういう人のための説明である。疑問を持たなかった人は読み飛ばしてもかまわない。

 一般の方には説明しづらい概念なので、あえてはっきり書かなかったが、この理論モデルでは、各打席が独立試行である、つまり、前の打席の結果が後の打席の結果に影響を与えることはないと仮定している。それ自体が非現実的な仮定ではないか、というのはもちろん有力な反論である。

 ところが実は、この理論モデルで予測される変動幅が実際の月間本塁打数の変動幅があまり変わらないということが、現実の打者の各打席もほぼ独立試行と見なせるという傍証にもなっているのだ。 なぜなら、もし独立試行でなければ、偶然による変動の幅も変わってくるからである。

 たとえば、独立試行とは反対に、打つときは必ず固め打ちする打者がいたとしよう。打つときは 10 打数連続で 10 本のホームランを打つが、打てないときは 0 本という極端な選手だ。この固め打ちの確率を 0.1 とすると、平均の本塁打率は 10 になって、先ほどの例と同じになる。この選手が 80 打数続けて打った結果を、先ほどの例と比較すると、下図のようになる。

月間本塁打数分布 - 固打.JPG

 極端な例ではあるが、独立試行でなくなると変動の幅自体が変わる理由が、直感的におわかりいただけるのではないかと思う。

・偶然は「定量的」に把握する必要がある 

 本稿では、実際の選手の月間本塁打数の変動が、かなりの部分「偶然」として説明できることを示した。

 もちろん、だからと言って、このような変動の「すべてが偶然だ」と断言したいわけではない。実際、偶然以外の要因もいろいろ混ざっているだろう。ただ、偶然でも説明できる部分が少なくないと言っているだけである。

 偶然としても説明できるものを、他に理由があると主張するためには、それなりの根拠が必要だ。特に根拠がなければ、多くの場合、偶然で説明できる範囲の現象は偶然と見ておくのが妥当である。

 ある現象が偶然で説明できるかどうかを判断するには、偶然で起こり得る変動の範囲を「定量的」に把握していなければならない。

 多くの人は、このような偶然による変動の幅を「定量的」に把握していない。だから、偶然でも説明できることにいちいち意味を見出そうとしてしまう。

 逆に言えば、偶然を「定量的」に把握できていて、はじめて真に偶然でない現象が判別できるのである。

・統計的検定との関係

 数理統計学の素養のある人ならとっくに気づいているだろうが、実はここでやったことは本質的には「統計的検定」と呼ばれる方法とあまり変わらない。つまり「偶然で説明できる」というフレーズを、「統計的に有意ではない」と言い換えてもそれほど間違ってはいない。

 本稿の内容を厳密に統計的検定の手続きにのっとって書き直すことももちろん可能だ。たとえば、月間本塁打数の分布が二項分布に従うと仮定して、ブランコの 15 本の本塁打が、統計的に有意な変化であるかどうかを検定する、というような問題の立て方をすると、これは二項検定と呼ばれる検定になる(二項分布に従うかどうか自体が疑問な場合には、さらにそれを検定する適合度検定という方法もある)。

 現代では、民間療法や薬に本当に効能があるかとか、放射線に本当に害があるかとか、特定の属性と能力に関係があるかとかを、統計的検定によって判定するのが普通だが、それと同じように、ブランコの本塁打が「偶然」か「実力」かを「検定」することが可能なのだ。

 ただ、本稿では一般の方でも理解できるような直感的なわかりやすさを重視して、あえてそういうスタイルをとらなかった。興味のある方は自分でやってみると面白いかもしれない。

・参考文献

Curve Ball: Baseball, Statistics, and the Role of Chance in the Game  このような話は、別に筆者の独創でもなんでもなく、ちょっと数理統計学や確率論の素養があれば、誰にでも思いつくたぐいの話である。

 現に、セイバー・メトリクスの基本文献の一つである「Curve Ball」には、本稿と同じように、一見すると因果関係があるように見えるものが、実は偶然にすぎないという話が、しつこいほど繰り返し書かれているので、本稿のような話題に興味のある方にはお勧めだ。

 「Curve Ball」には日本語訳(「メジャーリーグの数理科学」)もあるのだが、前にも書いたように、 この翻訳ははっきり言ってド素人の訳で、まったくお勧めできない。英語を苦にしない人だったら原書を直接読むことを断然お勧めする。

 原書は、統計学を知らない人にも理解できるように、きわめて親切に書かれた啓蒙書であって、難解でもなんでもない。ド素人が翻訳したから別の意味で難解になってしまっているだけだ。せっかくわかりやすい良書を書いた著者が可哀想である。

| | コメント (0) | トラックバック (0)

統一球大喜利

 統一球問題について、Twitter で親切な方々が解説してくださっているのだが…

 何がすごいって、一つも意味がわからん。一つたりとも意味がわからん。何の分野かすらようわからん。

 自分でも考えてみたけど、何も思いつかなかった。みんなすごいな。

| | コメント (0) | トラックバック (0)

吉見と浅尾の WPA を計算してみたい

 前回の記事では、記録の上では吉見の方が上で、浅尾はイメージだけみたいな書き方をしたが、先日紹介したセイバーメトリクスの WPA のような指標を使えば、おそらく吉見と浅尾はそう遜色ないのではないかという気がする。

 日本には多分まだないが、アメリカには WPA をリアルタイムで計算して公開している FanGraphs というウェブサイトがある。そのサイトのデータによると、2011 年のメジャーの投手のうち、WPA 1 位は Justin Verlander という先発型の投手だが、2 位の Tyler Clippard という投手はセットアッパーである。 

名前 チーム WPA SV HLD 投球 防御率
Justin Verlander Tigers 5.14 24 5 0 0 251 2.4
Tyler Clippard Nationals 5.01 3 0 0 38 88.1 1.83

 なぜ投球回数が 3 倍も違うのに、WPA はあまり違わないかというと、WPA の場合、同じイニングを抑えても、試合後半や得点差の少ないときのプレイの方が、試合前半や得点差の大きいときのプレイより高く評価されるからだ。

 そのせいか、先発投手と救援投手の WPA は分けて考えるべき、と主張している人もいるし、その補正方法も提案されているようだ。

 でも WPA というのはもともと、そういう異なる種類のプレイを統一的に評価するための指標なので、限界に留意しつつも参考のために比較してみることは悪くないと思う。 

  ちなみに、今日(2011.10.20)現在の吉見と浅尾の成績はこのようになっている。

名前 チーム WPA SV HLD 投球 防御率
吉見 一起 ドラゴンズ ??? 18 3 0 0 190.7 1.65
浅尾 拓也 ドラゴンズ ??? 7 2 10 45 87.3 0.41

 この 2 つの表を比べてみれば、吉見と浅尾の WPA がそれほど遜色ない可能性はおおいにあることがわかる。

 もし時間ががあれば、自分でもこの 2 人の WPA の推定値をなんとか計算してみたいが、同時にこれを機会に、中継ぎ投手の評価方法に関する議論が深まることを期待したい。

| | コメント (0) | トラックバック (0)

中継ぎ投手史上初の MVP?

 今年のセ・リーグ MVP はおそらく浅尾だろうけど、もし取ったら、日本プロ野球史上初の中継ぎ投手の MVP じゃないだろうか。とすれば、抑え投手として初めて MVP をとった江夏以来の快挙ということになるんじゃないかな。

 ぼくは浅尾には結構思い入れがある。もう覚えてる人もあまりいないと思うけど、彼は中継ぎに転向した当初、わりとよく打たれていた。ぼくは浅尾が出て来るたびに、また打たれるんじゃないかと心配し、実際その予想通りになることが多かった。ぼくはなぜ落合さんがこんなに浅尾にこだわるのか不思議でならなかった。

 しかし、その後の浅尾の活躍はご存知の通り。ぼくは自らの不明を恥じ、落合さんにまた一つ大事なことを教わったのだった。人を育てるとは、そういうことかと。

 記録だけ見ると、吉見も素晴らしい成績なんだけど、実際に中日の試合を観ていた人間にとっては、浅尾の印象が圧倒的に強いだろうと思う。

 特に今年は、統一球のせいで僅差の試合が多く、その分中継ぎ抑えの重要度が高かった。その上、岩瀬がいま一つ不安定だったので、ロングリリーフも多く明らかに当番過多。多くの人が浅尾の貢献度が高いと感じるのは自然なことだ。

 優勝を決めた試合の 10 回裏、ベンチからブルペンに電話していたのは、おそらく岩瀬の意思を聞いていたのじゃなかろうか。このまま浅尾に投げさせてもよいかと。そして岩瀬は自分の意思で浅尾に投げさせてくれと言ったのではなかろうか。できすぎた美談かもしれないが、ぼくは勝手にそんな想像をしていた。

 もちろん岩瀬も好きな選手で、まだまだ頑張って欲しい。でも今年は浅尾でしょ、という感じ。

| | コメント (0) | トラックバック (0)

WPA のシリーズ補正について

セイバーメトリクスには、選手の勝負強さや結果論としての貢献度を評価する指標がある。「メジャーリーグの数理科学」で紹介されている PWA や PGP もそうだし、最近の FanGraphs などでは WPA (Win Probability Added) などと呼ばれている。

 これは打点を精密化した概念と考えればわかりやすい。打点の場合、選手の特定のプレイ前後の得点の変化をその選手の貢献度としてカウントするが、WPA の場合、得点の変化の代わりに、勝率の変化をカウントする。

 勝率の変化なんてどうやって計算するのか、と思う方もいるかもしれない。細かい説明は、それこそ「メジャーリーグの数理科学」でも(できれば英語版で)見て欲しいが、簡単に言うと、イニング別・点差別の勝率のデータと、出塁状況・アウト数別の得点期待値のデータがあるので、これを組み合わせて計算するのだ。この 2 種類の確率は、マルコフ過程のような確率モデルからも計算できるし、経験的な統計データから計算されたものもある。

 「メジャーリーグの数理科学」では、この PGP を使って、記者投票によるワールド・シリーズの MVP が妥当だったかという検証を行っている。

 この件を読んでいたら、ふと閃いた。

 そもそも、なぜ得点の代わりに勝率をカウントするかというと、野球の目的は、得点を最大化することではなく、勝率を最大化することだからだ。でもその論法で言えば、ワールド・シリーズの真の目的は、個々の試合に勝つことではなく、シリーズ全体に勝つことなんだから、PGP (や WPA)をそのままシリーズ MVP の評価に使うのはおかしくはないか。

 そうだそうだ。ふっふっふ、セイバーメトリシャンもまだまだ甘いな。私はそう嘯きながら WPA を短期決戦シリーズ用に補正する方法を計算しかけたのだが、いや待て、世の中そんなに甘くないぞ、と思い直して、"WPA series adjust" などと入力して検索してみた。

 そしたら、案の定ありましたよ。 こんな記事が。

Ranking most valuable World Series HRs

While WPA is a great tool, the overall objective is to win the series as opposed to winning each individual game. We need to look at how much that play increased a team’s chances of winning the series, as opposed to just the game.

To adjust for this second level of leverage, we need to find a way to go from “Game WPA” to “Series WPA," or the change in the probability the team would win the series from before the play to after the play. Series WPA can be expressed as a product of Game WPA and the leverage of the game in the series.

Series WPA = (Leverage of Game in Series)*(Game WPA)

“Leverage of Game in Series” can be defined as the probability the team wins the series if it wins the game in question minus the probability the team wins the series if it loses the game in question.

 この記事がセイバーメトリクス界でどう評価されているかはよく知らないのだが、私は基本的に同意する。 少なくともその方が考え方として首尾一貫しているからだ。

(もちろん、選手の能力は常に一定であり、勝負を左右する場面で打ったのはたまたまの結果論である、という正反対の考え方もできるが、セイバーメトリクスにはそういう考え方(いわば成果主義に対する能力主義)の指標もちゃんとある(RC や LSLR など)ので、これはこれでいいんじゃないかと思う。成果主義と能力主義のどっちが「正しい」かは、また別の問題。)

 というか、本当はシリーズだけではなく、ペナントレースにも同じことが言えるはずなんだよね。ペナントレースの目的は、個々の試合に勝つことよりも、リーグ優勝することだとも言えるわけだから。

 たとえば、昨日の中日・ヤクルト戦で、浅尾が最後に飯原から奪った三振は、開幕戦でネルソンが奪った三振よりも、(成果主義的な発想に立てば)はるかに優勝貢献度は高かったはずだ。

 実は私は、ペナントレースについても同じ方式でリーグ優勝確率の変化を計算しようとしたことがあるのだが、これはかなり難しい。なぜかというと、ペナントレースはリーグ戦なので、直接対決だと自チームの勝率が上がるだけではなく、相手チームの勝率も下がったりするからだ。結局、考えているうちに面倒になって投げ出してしまったのだが、これをちゃんと定式化できれば、セイバーメトリシャンに勝てるかもしれない。誰か挑戦してみないか。


付録: 上で引用した記事には、肝心のレバレッジの計算方法が明記されていないので、私が使った方法を一応書いておく。と言っても別にたいした方法ではなく、ちょっと確率論の素養のある人なら誰でも思いつく方法だが。

 まず、試合の勝率をどの試合も 5 割と仮定する。勝率を事前に推定する方法があれば別に変更してもよいが、日本シリーズは異なるリーグの対戦だから勝率データがないことが多いし、あったとしても 5 割とそう大きく違わない可能性が高いだろう。 (違う勝率で計算したい場合には、以下の式の 1/2 や 0.5 を適宜書きかえればよい。)

 シリーズが 7 試合制で、計算対象のチームが m 勝 n 敗だとすると、その時点でのチームのシリーズ優勝確率は以下の式で計算できる。

難しげに見えるかもしれないが、これは実は初歩的な二項分布の累積分布関数にすぎない。

 この式を使って、あらゆる勝数・負数の組み合わせについて、シリーズ優勝確率を計算するには、スプレッドシートを使う。

 まず、以下のように、行列の見出しに勝数・負数を入力した表を作る。

勝/負 0 1 2 3 4
0          
1          
2          
3          
4          
そして、各セルにこんな式を入力する。
=BINOMDIST(3-B$1,7-($A2+B$1),0.5,TRUE)
これはセル B2 用の式だが、相対参照と絶対参照を使い分けてあるので、他のセルにもこのままコピーできる。ただし、4 敗の列だけはエラーになる。4 敗した場合にシリーズに勝つ確率は 0 なので、数値として 0 を入力しておく。
 計算した結果はこのようになる。
勝/負 0 1 2 3 4
0 0.5 0.344 0.188 0.063 0
1 0.656 0.5 0.313 0.125 0
2 0.813 0.688 0.5 0.25 0
3 0.938 0.875 0.75 0.5 0
4 1 1 1 1  
  数値だけではイメージが涌きにくいので、グラフにしてみよう。負数を固定して、勝数に対するシリーズ勝率の変化をプロットするとこうなる。

シリーズ勝率.JPG

 傾きが大きいところほど勝率の変化が大きく、「レバレッジ」が大きくなる。3 勝 3 敗の後の 1 勝が最も重要度が高いのは常識的な直感と一致する。

 WPA に影響するのは、勝数・負数が増えたときのシリーズ勝率の変化である。勝・負の影響を同時に見るために、ベクトル解析の概念を応用して、グラディエント(勾配)を計算してみよう。そうすれば、各試合がシリーズ勝率に与える影響の大きさを統一的に見ることができる。 (グラディエントを知らない人は、とりあえず微分係数の多次元版だと思えばよい。)

 そのためには、上の表の少し下に、同じような表を作って、各セルに以下の式を入力すればよい。

=SQRT(POWER(C2-B2,2)+POWER(B3-B2,2))

これは 0 勝 0 敗のセル用の式だが、相対参照なので、縦横にコピーするだけで表が完成する。隣のセルとの差をとっているので、計算できるのは 3 勝 3 敗のセルまでである。

実際に計算した結果はこうなる。

勝/負 0 1 2 3
0 0.221 0.221 0.177 0.088
1 0.221 0.265 0.265 0.177
2 0.177 0.265 0.354 0.354
3 0.088 0.177 0.354 0.707
 
数値のままではイメージが涌きにくいので、グラフにしてみよう。今度は勝数・負数とグラディエントの関係をまとめて見れるように、3 次元にプロットしてみる。

シリーズ勝率勾配.JPG 

 各試合の重要度は、勝数・負数の差が少ないほど大きく、なおかつ、勝数・負数が多いほど大きい、という傾向がはっきりわかる。

| | コメント (0) | トラックバック (0)

「メジャーリーグの数理科学」の誤訳(第10章)

  • 原文:In trying to define which of these should be called a "clutch situation" (an admittedly vague term), we've come up with these criteria:
    • 元訳:これらの状況のうちどれが「勝負を決める状況(clutch situation)」(非常にわかりやすい明確な言葉であるが)と呼ばれるべきかを定義しようとするに当たって,私たちは次のような基準を提案する.
    • 拙訳:このうちのどれを「勝負を左右する状況」(これが曖昧な用語であることは認める)と呼ぶべきかを定義しようと試みる過程で,筆者たちは以下のような基準を見出した:
    • 解説:"an admittedly vague term" をなぜ正反対に訳したのだろう。はっきり言ってまったく理由がわからない。
  • 原文:If we pick a player and say that he hits in the clutch, what exactly do we mean?
    • 元訳:もし私たちが選手を1人選び,勝負を決めるときにその選手がヒットを打つと言うとすると,それは正確には何を意味するのだろうか.
    • 拙訳:私たちが特定の選手を指して「彼は勝負強い打者だ」と言うとき,正確には何を意味しているのだろうか。
    • 解説:「選手を1人選び,勝負を決めるときにその選手がヒットを打つと言う」って、お前は預言者か。英語の動詞の現在形というのは、主語の決まった属性を表す形容詞に近い使われ方をするので、それを知らないとこういう変な訳になる。"he hits..." というのは、「彼は…という状況でよく打つ」というような意味であって、過去にヒットを打ったとか未来に打つだろうとかいうことではない。
  • 原文:Do we mean that he hits better when runners are on base? When the score is close? When runners are on and there are two outs?
    • 元訳:私たちは走者が塁にいる時,得点差が少ない時,あるいは走者がいて2アウトの時の方が選手はより良いヒットを打つと考えているのだろうか?
    • 拙訳:その選手は走者がいるときによく打つという意味だろうか。それとも点差が少ないとき、もしくは2アウトで走者がいるときによく打つという意味だろうか。
    • 解説:この he は上の文で選ばれた "a player" のことなんだから、それとわかるように訳すべき。でなきゃ、あらゆる選手がチャンスに強いという意味にとれてしまうではないか。「より良いヒット」も意味不明。だいたい「より良いヒット」だったら "better hits" だろう。"When..." を複数並べているのは、A・B・C のどれが正しいかという問いかけだが、元訳のように「あるいは」でつないでしまったのでは、A・B・C のどの状況でも選手はヒットを打つ、という逆の意味になってしまう。
  • 原文:Since he had no walks, and sacrifice flies are included among opportunities for getting on base, Carter's on-base percentage (7/28 = .250) was actually lower than his batting average.
    • 元訳:四球はなく,また犠牲フライも塁に出た回数に含まれるので,カーターの出塁率(7/28 = .250)は彼の打率よりも実際には低かった.
    • 拙訳:カーターには四球はなく,犠牲フライは出塁機会に含まれるので,実際にはカーターの出塁率(7/28 = .250)は打率より低かった.
    • 解説:"opportunities for getting on base" は「塁に出た回数」ではなく「出塁機会」である。これもある意味正反対の訳で、少しでも意味を考えて訳していれば間違えようがない。前の文には、打数が 25 で犠牲フライが 3 だとちゃんと書いてあるし、犠牲フライを出塁に入れたら、出塁率は下がるどころか上がるに決まってるではないか。
  • 原文:These values (presented in Table 7-7) are the average or expected number of runs for each hit after the frequencies of all game situations have been considered.
    • 元訳:これらの値(表7-7で示されている)は,打率または全てのゲーム状況の頻度を考慮した上でのそれぞれのヒットから得られる予想得点数である.
    • 拙訳:(表7-7に示されている)これらの値は,試合中のあらゆる状況の頻度を考慮して求めた、各安打の平均得点数または得点期待値である.
    • 解説:"the average" を「打率」と解釈して、"expected number of ..." 以下と等価と見なしたらしいけど、これは、(the (average or expected) number) という構文である(こういうのは定冠詞の位置を見ればだいたいわかる) 。「平均値または期待値」という意味。
  • 原文:This expectation is derived from the probabilities of scoring different numbers of runs.
    • 元訳:この期待値はいろいろな得点を挙げる可能性からひきだされる.
    • 拙訳:この期待値は,さまざまな点数の得点確率から求められる.
    • 解説:なんかずいぶん茫漠とした訳になっている。probabilities には確かに日常用語としての「可能性」という意味もあるが、この場合ははっきり数学用語としての「確率」である。
  • 原文:To see that we have actually accomplished this, let's examine an alternate- or parallel-universe batting performance for Joe Carter.
    • 元訳:実際にこれが達成されたことを見るため,ジョー・カーターのもう1つの,あるいは別世界(parallel-universe)での打撃成績を見てみることにしよう.
    • 拙訳:この目標を実現できたかどうか確認するため,ジョー・カーターのパラレル・ワールド(もしくは二次創作)における打撃成績を調べてみよう.
    • 解説:alternate-universe というのは、日本ではコミケとかでよくある「二次創作の世界」のことであり、 parallel-universe というのは、SF に出てくる「パラレル・ワールド」のこと。ここは著者が茶目っ気を出して読者のオタク心をくすぐってる部分なのだろうから、ちゃんとそれっぽく訳してあげよう。
  • 原文:The alternate performance in Table 10-10 is one that Phillies' fans wish had actually occurred.
    • 元訳:表10-10に示されたもう1つの結果はフィリーズのファンの願いを現実に移したものである.
    • 拙訳:代わりとなる表10-10の結果は,フィリーズのファンが「実際にこうだったらよかったのになあ」と思っている結果だ.
    • 解説:細かいことを言うようだが、これは著者が勝手にでっちあげた成績であって、「現実に移して」はいない。これをわざわざ指摘したのは、この訳者はどうも仮定法過去完了を知らないフシがあるからだ。原文には「現実」に当たる言葉はないので、actually を無理矢理そう解釈したっぽい。あと、この wish は動詞で "Phillies' fans wish (that) one had actually occured" という節の one が関係代名詞 that になって前に出た形の構文なのだが、この訳者は "Phillies' fans wish" という名詞として解釈してるっぽい。(その解釈が正しければ、fans ではなく fans' になってるはず)。これは非常にありがちな間違いで、確か伊藤和夫先生の「英文解釈教室」にも出てたはず。
  • 原文:In fact, if PWA is truly supposed to evaluate clutch performance, it could be argued that player B should be rated higher than Player A, since his results were achieved more critical circumstances.
    • 元訳:事実,もし選手の勝率が本当に勝負どころでの実績を評価すると想定されているならば,選手Bは選手Aより高く評価されるべきである.というのもより勝負を決める場面において彼の結果が達成されたからである.
    • 拙訳:実際,もし PWA が本当に勝負どころでの実績を評価するためのものならば,選手 B の実績の方がより決定的な場面で達成されているのだから,選手 B の PWA の方が選手 A よりも高くてしかるべき,とも言えるはずだ.
    • 解説:これも、どこが決定的に間違っているとは言いにくいけれど、全体として支離滅裂で何が言いたいのかよくわからない訳になっている。言いたいのは要するにこういうことだ。「選手の勝率」も「1ゲーム当たりの得点」ほどではないけれど、日常用語に近すぎてあまりいい訳語とは思わない。まあ、野球は団体競技なので、普通の文脈で「選手の勝率」という言葉が使われることはないので(あ、そんなことないや。投手の勝率という言葉がある)、区別がつくと言えばつくのだけれど。英語の場合、日常用語をそのまま専門用語にしても、頭文字を大文字にして区別したりできるのだけれど、日本語では無理なので、こういうのは、日常用語とはっきり区別のつく漢語の造語を作るか、それが無理ならカタカナや頭文字のままにしておく方が無難だと思う。
  • 原文:This presents some rationale for rating Player A higher than Player B.
    • 元訳:これは選手Bより選手Aの方が高い選手の勝率を出していることに対する論理的根拠を示す.
    • 拙訳:これは,選手 A を選手 B より高く評価することに多少の正当性を与える.
    • 解説:これも文脈を考えるとかなり変な訳。そもそも PWA の計算式はわかっているわけだから、「論理的」になぜ A の方が B より高くなるかはわかりきったことで、ここで問題にしているのは、それが選手の評価として合理的・正当なのか、ということ。論理だけじゃなく価値の問題。
  • 原文:Apparently, the Mills's intent was to construct PWA as a ratio of accumulated achievement (Win Points) devided by accumulated opportunity (total points) as a parallel to batting average (which does the same thing in terms of hits and at-bats).
    • 元訳:明らかにミルズ兄弟の意図は,打率に匹敵するものとして,与えられた機会(全ポイント数)に対してどう貢献できたか(勝ちポイント数)を測る比率として選手の勝率を作ることであった(打率は打数に対するヒット数として同じことをしている).
    • 拙訳:ミルズ兄弟の意図は明らかに,PWA を打率と同じように,実績の合計(勝ちポイント数)を機会の合計(全ポイント数)で割った比率として構成することだった(打率では同じことを安打と打数でやっている).
    • 解説:これも間違いとは言いにくいが、とんでもなくまわりくどい。まわりくどい訳は他にも山のようにあって、いちいち槍玉に挙げていてはキリがないので、極端な例だけど挙げている。devide を「測る」にしているみたいだけど、素直に「割る」でいいだろう。
  • 原文:However, in the Mills's system, when a player comes to bat, the possibility exists of getting Loss Points or Win Points. So in each play, the player can be rewarded or penalized. Net Points provides a measure of the accumulated net contribution to victory. For this reason, there is no need to resort to a ratio such as PWA.
    • 元訳: しかしながら,ミルズ兄弟のやり方では,選手が打席に立つ時,負けポイント又は勝ちポイントを得る可能性が存在する.よって1つ1つのプレイにおいて選手はたたえられるか,けなされるかどちらかの評価を受けることになる.正味のポイントは累積された勝利への貢献(正の値も負の値もあり得る)の総計を測るためのものである.この理由から選手の勝率のような割合に頼る必要はない.
    • 拙訳:けれどもミルズ兄弟のシステムでは,選手が打席に立つたびに,負けポイントを与えられることもあれば,勝ちポイントを与えられることもある。つまり選手はプレイのたびに,報酬を与えられることもあれば,罰を与えられることもあるのだ。正味のポイントは,勝利に対する功罪の両面をまとめた尺度を提供する。だからこそ PWA のように比率に頼る必要がないのだ.
    • 解説:これも少しずつ言葉の選択がずれているせいで、全体としては大幅にすれた意味になっている。というか作業の順番としては、まず英文の意味内容を理解し、それを日本語で表すにはどうすればよいかを考え、できるだけ適切な言葉を選択するという順番になる。だから、まず翻訳してから意味を考えているようでは、いい翻訳はできないのだ。
  • 原文:The impression is that PWA gives too much weight to a handful of critical events that drown out the effects of standard plays in evaluating baseball performance.
    • 元訳:選手の勝率は,野球の実績を評価する際,普通のプレイの効果から引き出した少数の重大なプレイに重みを置きすぎているような印象を受ける.
    • 拙訳:PWAは,野球の成績を評価する際に,一部の決定的なプレイに重みを与えすぎていて,平凡なプレイの影が薄くなっている印象がある.
    • 解説:これは多分、drown を drawn と勘違いしたんだろう。drown out はもともと「溺れさせる」という意味で、そこから転じて、水の代わりに音が溢れて他の音が聞こえなくなるというような意味がある。「普通のプレイの効果から引き出した少数の重大なプレイ」というフレーズ自体意味不明だし、文脈を考えても、この解釈の方が自然。
  • 原文:Besides such criticism, another more practical reason lies at the heart of the lack of interest in Player Win Average at the time.
    • 元訳:このような批判に加え,もう1つのより現実的な理由は,当時のPlayer Win Averageへの関心の欠如にその中心がある.
    • 拙訳:当時のPWAに対する無関心の中心には,そのような批判の他に,もう一つ実際的な理由がある.
    • 解説:"A lies at the heart of B" は「B の中心に A がある」という意味なのだが、なぜか反対の訳になっている。日本語としても意味不明だし、文脈から考えても不自然。
  • 原文:Using computer simulation, the brothers developed a table of probabilities that was not revealed to readers.
    • 元訳:コンピューター・シミュレーションを用いて,ミルズ兄弟は読者に公表されなかった確率の表を例に挙げた.
    • 拙訳:ミルズ兄弟はコンピュータ・シミュレーションを使って確率の表を開発したが,その表は読者には明らかにされなかった.
    • 解説:「例に挙げた」という訳がどこから出てきたかよくわからない。develop を demonstrate と間違えたとか?
  • 原文:The need to capture play-by-play data is a large impediment to PWA's practicality, but the lack of win probabilities made its calculation impossible for anyone but the Mills brothers ... until 1984.
    • 元訳:1つ1つのプレイをとらえる必要があるということが選手の勝率の実用性に対する大きな障害となっている.しかし,勝つ勝率に関するデータの不足が原因でミルズ兄弟以外は誰も選手の勝率を推定することができなかった…1984年までは.
    • 拙訳:PWA を実際に利用する上で,プレイ 1 つ 1 つのデータを入手しなければならないことも大きな障害となっていたが,勝率表が存在しないことは,ミルズ兄弟以外の者が PWA を計算することを不可能にした.…1984 年までは.
    • 解説:この訳だと、「しかし」と逆接になっている意味がわからないだろう。小さい問題もあった「が」、それよりもっと根本的な問題もあった、ということ。
  • 原文:Plotting these probabilities in Figure 10-2, we can see some quantitative support for the critical nature of Late Inning Pressure.
    • 元訳:図10-2にこれらの確率をプロットした.終盤のプレッシャーに関する非常に特殊な性質に対する量的な対応を見てとることができる.
    • 拙訳:この確率を図 10-2 のようにグラフにして見ると,終盤のプレッシャー(LIP)状況がいかに勝負を左右するかに関する,量的な根拠がわかる.
    • 解説:support をソフトの電話サポートみたいなイメージで「対応」と訳したらしいけど、この support は「○○を支持する証拠」の「支持」に当たる。この点差・イニング別の勝率のグラフをみれば、試合終盤になるほど勝負を左右する状況になりやすい理由が量的にわかりますよね、ということ。critical は「特殊」ではなく、勝負を左右するような「重要」「決定的」な状況という意味。
  • 原文:Lindsay's data in Table 7-4 tells us the probability of scoring different number of runs in the remainder of the inning:
    • 元訳:表7-4 のリンゼイのデータは,イニングの残りで,様々な点数を挙げる可能性について教えてくれる.
    • 拙訳:表7-4 のリンゼイのデータは,イニングが終わるまでにさまざまな点数を得点する確率を教えてくれる:
    • 解説:これもわざわざ「可能性」という曖昧な言葉で訳す必要はない。
  • 原文:The Pr(Win Given Runs) probabilities in the fourth column are taken from Table 10-14 for the sixth inning and the appropriate lead.
    • 元訳:Pr(得点して勝つ)は6回で適当なリードという状況に対して表10-14からとられた.
    • 拙訳:4 列目の Pr(特定の点数で勝つ)確率は,表 10-14 の該当する点差の 6 回のデータから取得したものである.
    • 解説:「適当なリード」はないだろう。この表 10-14 は、イニング・点差別の勝率の表だから、"the appropriate lead" というのは、その中の「該当する点差」のデータという意味。Pr(Win Given Runs) の Given Runs は「与えられた得点を前提として」いう意味で、要するに特定の得点における条件付き勝率のことなんだけど、「得点して勝つ」ではわかりにくいので変えてみた。
  • 原文:Half of the change was attributed to the offensive player's performance, and the other half to the defensive player's performance.
    • 元訳:変化の半分は攻撃側の選手の実績によるもので,そして残りの半分は守備側の選手の実績によるものである.
    • 拙訳:変化の半分は攻撃側の選手の成績に割り当てられ,もう半分は守備側の選手の成績に割り当てられた.
    • 解説:attribute をどうしても「原因」と訳したいらしいけど、ここでもやはり文脈を考えれば不適切。後で出てくるエラーの例を見ればわかるように、この本では、貢献度が常に攻撃側と守備側で半々である、などという主張はしていない。ただこの PGP という方式では、便宜的にそう割り当てると言っているにすぎない。
  • 原文:It did not seem right for the batter to get any positive recognition for this play, much less greater recognition than the pitcher.
    • 元訳:しかし投手よりかなり認識度は低いのにもかかわらず,打者がこのプレイに関して投手よりよい評価を得るということは正しくないように見える.
    • 拙訳:打者はこのプレイに関して,投手より高い評価はもちろん,いかなる評価も受けるべきではないように見える.
    • 解説:なんでこういう訳になったのかよくわからないが、とにかくいろいろと間違っている。much less... という構文は、より極端な例を出すことにより内容を強調する、というレトリックに使われる構文。この場合、前半が「打者になんらかの評価を与えること」で、後半が「打者に投手より高い評価を与えること」なので、「打者を投手より高く評価するのはもちろん、これっぽっちも評価すべきではない」または「打者をこれっぽっちも評価すべきではない。ましてや投手より高く評価するなんて論外」という意味。
  • 原文:However, Weis's error produced a negative change (from his team's perspective) of D = .035, so he is debited the entire change, -3.5 percent.
    • 元訳:しかし,ワイスのエラーは(彼のチームの見解からして)マイナスの変化 D = .035 を生み出したため,彼にとっては全体の変化が -3.5% の負債となる.
    • 拙訳:けれども,ワイスのエラーは D = .035 の(彼のチームから見て)マイナスの変化を生んだので,ワイスにはこの変化全体,つまり -3. 5パーセントが負わされた.
    • 解説:"from his team's perspective" というのは単に、エラーは攻撃側のチームから見ればプラスだけど、守備側のチームから見ればマイナスだ、ということを言ってるだけだろう。別にワイスのチームがエラーについて特別な「見解」を持っているとかいう話ではないと思う。「全体の変化が -3.5% の負債となる」というのも意味不明。
  • 原文:However, while the mechanics of the probability calculations are objective, identifying the players and whether their defensive contributions were outstanding enough for special recognition remain subjective judgements.
    • 元訳:しかしながら,確率計算のしくみは客観的である一方,その選手たちを見極めることや彼らの守備の貢献が特別な評価を受けるのに十分際立っているかどうかと言うことは主観的な判断として残る.
    • 拙訳:確率計算の仕組みは客観的だが,選手を特定し,その守備による貢献が特別な評価に値するほど傑出していたかどうかを判定することは,依然として主観的な判断だ.
    • 解説:「見極める」が何を意味しているかよくわからないが、この identify は、たとえば、送球の落球があったときに、送球した野手の悪送球なのか、それとも捕球した野手の捕球ミスなのか、といったことを「特定」するという意味だろう。(その後の公式記録員がどうこういう件を読めばはっきりする)
  • 原文:PGP (and PWA) evaluate a play at the moment of its resolution, not after the fact.
    • 元訳:つまり選手のゲーム貢献度(そして選手の勝率)は後の出来事のことではなく,その決定的瞬間だけを評価しているのだ.
    • 拙訳:PGP(および PWA)は,プレイを事後的にではなく,行われた時点で評価する.
    • 解説:これも文脈や意味を考えてない訳。ここで問題にしているのは、カーターのヒットはその後で大量点の呼び水となったのに、PGP ではあまり高く評価されていないということ。だから評価対象はあくまでカーターのヒットであって、「後の出来事」ではない。ただそれを評価する視点が、ヒットの後で大量点が入ったということを考慮に入れた事後的な視点なのか、ヒットの時点では点差が開きすぎていて焼け石に水だったというリアルタイムな視点なのか、ということを言っている。
  • 原文:PGP and PWA operate on probabilities, but sometimes the remote possibilities do occur.
    • 元訳:選手のゲーム貢献度や選手の勝率は確率を操作するが,時にかけ離れた確率をはじき出すことがある.
    • 拙訳:PGP や PWA は確率から計算されるが,確率の低い事だって起きる時は起きるのである.
    • 解説:この文はなかなかニュアンスを出すのが難しくて、私の訳もそれほど自信はないが、元訳よりはマシだろう。そもそも、"the remote possibilities" の解釈が間違っていて、この remote は「離れた」ではなく「ごくわずかな」という意味。要するに、PGP や PWA は、得点の入る確率や勝つ確率から計算されるが、実際には、確率が高いのに点が入らないこともあるし、確率が低いのに点が入ることもある。ゆえに、PGP や PWA の評価は、実際に入った得点と必ずしも連動しない、ということを言っている。だから意味的にも「かけ離れた確率」ではおかしい。
  • 原文:This provides some quantitative support for the leadoff spot being a critical element of each inning..
    • 元訳:これは各イニングの重大な要素になり得る先頭打者の量的な貢献を示している.
    • 拙訳:これは,各回の先頭打者の重要性に関する,一定の量的根拠になっている.
    • 解説:これも support の訳がおかしい。
  • 原文:Continuing the tradition established in Player Win Average, the first application of PGP was to evaluate players in the 1980 World Series.
    • 元訳:Player Win Averages によって確立された慣例を続けよう.選手のゲーム貢献度の最初の適用は,1980 年ワールドシリーズにおける選手の評価に対してであった.
    • 拙訳:PWA の確立した伝統を継承した PGP が最初に応用されたのは,1980 年のワールドシリーズにおける選手の評価であった.
    • 解説:分詞構文の意味上の主語は、省略されている場合には主節の主語なのだから、こんな解釈は明らかにおかしい。"the first application of PGP" が PWA の伝統を継承する行為だ、ということを言っているのであって、筆者や読者が継承するわけではない。
  • 原文:These players (Aikens, Pena, Jones, and Gwynn) deserved a better fate.
    • 元訳:これらの選手(エイキンス,ペーニャ,ジョーンズ,グウィン)の結果はさらなる賞賛に値する.
    • 拙訳:この選手たち(エイキンス,ペーニャ,ジョーンズ,グウィン)は,もっと評価されてしかるべきだった.
    • 解説:この選手たちは評価されていないという文脈なんだから、「さらなる賞賛」は変だろ。
  • 原文:With two exceptions, the PGP ratings presented for pitchers here did not include their appearance at bat.
    • 元訳:2 つの例外がある.投手に対して示された選手のゲーム貢献度の評価は彼らの打席における選手のゲーム貢献度を含んでいない.
    • 拙訳:ここで示した投手の PGP の評価には、2 人の例外を除けば、打席での評価は含まれていない。
    • 解説:誤訳とまでは言えないけど、いきなり「2 つの例外がある」と言われても、何に対する例外かわからないし、その疑問はかなり先まで読まないと解決されないので、わかりにくい。
  • 原文:A common question that comes up in reference to World Series play is whether PGP can be adapted to evaluate players with respect to the probability of winning the series as opposed to winning individual games.
    • 元訳:ワールドシリーズのプレイに関して思い浮かぶ一般的な疑問は,個々のゲームの勝利とは対照的に,選手のゲーム貢献度をシリーズに勝つ確率の評価に適応することができるのかどうかということである.
    • 拙訳:ワールドシリーズのプレイに関して思い浮かぶ一般的な疑問は、PGP を修正して,個別の試合に勝つ確率ではなくシリーズに勝つ確率について選手を評価するようにできないかということだ.
    • 解説:「対照的に」は直訳すぎて意味不明。「ゲーム貢献度『を』」と「適応『する』」の助詞が対応していない。それなら「適応させる」だろう。

まだまだ続きます。随時更新。

| | コメント (0) | トラックバック (0)

「メジャーリーグの数理科学」の誤訳(第9章)

  • 原文:We admit to being bothered by some of them ourselves.
    • 元訳:それらのいくつかは私たち自身を悩ますものでもある.
    • 拙訳:その一部については,筆者たち自身も問題だと思っていることを認めよう.
    • 解説:こういう we を「私たち」と訳してしまうと、筆者なのか、筆者および読者なのか、人類全体なのかわかりずらいので、限定した方がよい(これは日本語と英語の代名詞の使い方の差による)。ピーター・ギャモンの提示した問題の一部については、筆者たち自身も同意している、という意味。
  • 原文:It reminded us, of course, of a favorite player, Roberto Alomar, who slides into first instead of running thorough the base.
    • 元訳:もちろん私たちが心に思い浮かべる人気選手のロベルト・アロマーも一塁を駆け抜ける代わりにスライディングする選手である.
    • 拙訳:この項目が、筆者たちお気に入りの選手の一人であるロベルト・アロマーを思い出させるのは言うまでもない.彼も一塁ベースを駆け抜けずに滑り込む選手だ.
    • 解説:「私たち」については同上。"It remided" の it も具体的に訳さないとわかりずらい。こういうふうに代名詞を具体名詞に置き換えるのは英和翻訳の基本テクニックで、たいていの翻訳本に載っているはずなのだが。
  • 原文:Here are the relevant items from the list (with our emphasis added):
    • 元訳:ここにリストに関連する項目を示す(私たちの強調点も含む):
    • 拙訳:関連するリスト中の項目は以下の通り(太字強調は筆者):
    • 解説:"with our emphasis added" というのは、日本語の「傍点筆者」と一緒で、引用元にはなかった太字(原文ではイタリック)を引用者が追加したという意味だろう。「リストに」の助詞の選択も変。
  • 原文:(In the third item, the unnamed general manager is suggesting that the pitching team "pay" for the intentional pass by having all base-runners advance, even then they are not forced.)
    • 元訳:(3つ目の項目で,ある名前を書けない GM は,敬遠をすることによって,たとえ塁が詰まっていなくても全ての走者が1つずつ進塁する(例えば,2アウト三塁で敬遠すると,三塁走者がホームインする)ようにして,投手陣が「代償を払う」べきだと提案している).
    • 拙訳:(3番目の項目のなかで,その匿名の GM は、投手側のチームは敬遠の「代償」として,塁が埋まっていなくても全走者の進塁を認めるべきだ、と提案している.)
    • 解説:"the unnamed general manager"は、引用元の記事に出てくる "One National League GM" のことなので、それがわかるように訳すべき。わざわざ定冠詞がついているのに、なぜ「ある」にしてしまったのか。
  • 原文:We can summarize the run distributions by the expected runs or run potential table shown in Table 1-9
    • 元訳:表1-9に示したような期待される得点もしくは得点見込みといった視点から得点分布をまとめることができる.
    • 拙訳:この得点分布は,表1-9の得点期待値表(または得点見込み表)に要約することができる.
    • 解説:"the run distributions" は定冠詞がついているのだから、限定詞をつけて得点分布一般ではないことを明示するべき。第 7 章に出てきたリンゼイの得点分布を整理するとこうなる、ということ。"table" が訳抜け(それとも、なぜか "table" を「視点」と解釈したのかも)。
  • 原文:So, on average, the team will score about four-fifths of a run in the reminder of the inning.
    • 元訳:つまり平均的にはこのイニングの残りで得点する確率は約5分の4である.
    • 拙訳:つまり平均すると,このチームはイニングが終わるまでに約5分の4点を得点することになる.
    • 解説:「確率」に当たる言葉はどこにもない。実際ここで言及しているのは、得点「確率」ではなく「期待値」である。この章ではわざわざ期待値と確率を分けて論じているのだから、この違いは大きいのだ。
  • 原文:(This reminds us of a lyric from the Kenny Rogers song The Gambler - "You got to know when to hold 'em...")
    • 元訳:(これはケニー・ロジャースの「ギャンブラー」という歌の一節を思い起こさせる.-「それをいつ掴むかを知っておかねばならない…」)
    • 拙訳:(このことは,ケニー・ロジャースの「ギャンブラー」という歌の歌詞を思い出させる.「いつ突っ張るかを知らねばならぬ…」)
    • 解説:「ギャンブラー」という題の歌なんだから、この hold は当然ポーカー用語の「ホールド」だろう。そのぐらい気づけよ。
  • 原文:In Game 4, there was no shortage of drama and surprise.
    • 元訳:第4戦は,劇的な状況と驚嘆が飽き足らないゲームとなった.
    • 拙訳:第4戦は,ドラマや意外性に不足しない試合となった.
    • 解説:おいおい。飽き足らないと不足しないじゃ正反対じゃないか。驚嘆「が」という助詞の選択も変だし。
  • 原文:The evidence seems overwhelming - it must have made sense to walk Bonds.
    • 元訳:証拠は計り知れないように思われる.つまりボンズを歩かせることは意味を成したに違いなかったのである.
    • 拙訳:ボンズを歩かせるのは当然だと思えたに違いない.その証拠は動かしがたく見える。
    • 解説:「証拠は計り知れない」では日本語として意味不明。「意味を成したに違いなかった」では、ボンズを歩かせたのには実際意味があったことになり、後の記述と矛盾する。この "have made sense" は「意味があると思えた」だろう。
  • 原文:The second comment is that the sacrifice bunt is a more effective strategy in situations when a single run has a significant effect on the probability that the team win the game.
    • 元訳:第2のコメントは,1点を取ることによりチームがゲームに勝つ確率が有意に上がる場合において,犠牲バントがより効果的な戦略になるということである.
    • 拙訳:2番目の注意は,犠牲バントがより効果的な戦略になるのは,1点をとることがチームの勝率に著しい影響を与える場合だということだ.
    • 解説:この訳者は significant をなんとかの一つ覚えみたいに「有意」と訳しているけれど、significiant には統計学用語としての「有意」という意味と、日常用語としての「著しい」という意味があって、この両者は全然違うから文脈によって使い分けなくちゃいけない。この場合なんかも明らかに「有意」ではおかしい。だって、1点を取ったら勝率は有意に上がるに決まってるでしょ。たとえ点差が 30 対 0 だったとしても、同じ状況で 1 兆回(それでも足りなきゃ 1 京回)ぐらいシミュレーションすれば勝率に有意差は出るでしょうよ。じゃなくて、30 対 0 の 9 回裏に 1 点とっても焼け石に水だけど、1 対 0 の 9 回裏に 1 点とったら勝率は大幅に上がるよね、ということを言っているわけ。

| | コメント (0) | トラックバック (0)

「メジャーリーグの数理科学」の誤訳(まとめ)

 この翻訳はとてもではないが質が高いとは言い難い。全体が直訳調で読み辛いし、直訳なら直訳でその分正確ならまだ許せるが、致命的な誤訳も細部のタイポも山のようにあるのでは、どこを褒めていいのかわからない。

 特に、「1ゲーム当たりの得点」のくだりはひどくて、「1ゲーム当たりの得点」を使って「1ゲーム当たりの得点」を推定する、みたいな文章が出てくるにいたっては絶句するしかない。

 また、前後の文が互いに矛盾していたり、前後の章で正反対の事が書いてあったりして、英語力などなくても日本語さえ読めれば間違っていることがわかる部分も多々ある。こういうのは、能力の問題というより、純粋に職業倫理の問題じゃないかと思うのだが。

(私だってたいした能力があるわけではないから、翻訳中に理解できない文章に出会うことはよくある。そのときは当然わかるまで調べるのだ。検索しまくったり、安くない資料を買い込んだり。それでもわからなければ書いた本人に聞いたり。金を取る以上はそんなのは当然だろう。だから、こういう明らかな矛盾を放置したまま出版できる神経というのは、正直理解できないし理解したくもない。しかも出版翻訳は実務翻訳に比べて時間の余裕があるはずなのである。私は両方に関わった経験があるから、そのぐらいは知っているのだ。)

 細かい処まで修正していてはキリがないので、目立つ処だけに限定したが、それでもこの量である。正直言って、もし私がこの翻訳のレビューアーだったら、頭から全部の文に手を入れていただろう。そのぐらいの水準である。

 日本人には馴染みのない大リーグ事情を紹介したコラムを挿入するなど、編集の仕事には評価できるところもあるのだが、そんな余裕があるなら、なぜ翻訳自体の質の向上にもっと力を注げなかったのだろうか。

 ネット上で原書が難解だと言っている人を見かけたが、はっきり言って、原書は難解でもなんでもない。むしろ素人向けにわかりやすく書かれた啓蒙書である。野球には詳しいが数学が苦手な人が訳したのかとも思ったが、訳者のプロフィールを見ると、必ずしもそういう話でもないようだ。

 こういう欠陥商品を平気で市場に流通させてしまうアカデミズムの仕組みには謎が多いが、そんな裏事情など別に興味もないし、勝手にやってろとしか思わない。 まさか大学の先生がここまで理解力がないとは考えられないので、他人に訳させて自分ではロクに目も通さずに名前だけ貸してるといったところなのだろうが。

 きっと、大学教授や博士号の肩書きというのは、デタラメな仕事をして堂々と金をとってもよいという許可証みたいなものなのだろう。日頃、ささいなミスでクライアントに責められたり、金すら貰えずに逃げられたりしながら、あくせくしている私たちから見ると、なんともいいご身分である。大学教授様がお訳しあそばされたのだから、下々の者は文句を言わずにありがたく受け取れというわけだ。

 でも、こういう欠陥商品を買わされて「金返せ!」と憤っていても、原書を読む能力やお金のない可愛そうな人もいるはずなので、そういう人が、この記事を読んで少しでも損害を取り戻せた気になってくれれば幸いである。

 訳書を読んだけど難しくてよくわからなかったという人、心配御無用。あなたのせいじゃない。こんなもの理解できなくて当然。だって間違ったことばかり書いてあるんだから。

 以後、他の章の誤訳も順次指摘していく予定だが、なにぶん仕事の合間にやっていることなので、いつ完成するか確約することはできない。気長にお待ちください。

| | コメント (0) | トラックバック (0)

より以前の記事一覧