セイバーメトリクス指標・用語辞典
※基本的な指標追加 28/9/2024
昨今ではセイバーメトリクスの発展は目覚ましい。
特にMLBではfangraphやbaseballsavantのような細かく包括的なサイトが増えそれと同時に多くの指標が生まれている。
しかしあまりに多く増えているためどの指標が何を指し示しているのか、把握するのが大変になってきている。
そこでこの記事では各種指標や用語について備忘録的、また自身の勉強のためまとめることにした。
興味のある方の助けになれば幸いだ。
紹介は理論的な説明に加え個人的な感想も交えることで「非常に」偏りはあるが温度感を伝えていければと思う。
というか自重しないコメントというかイキったコメントも散見されると思うが一つのスパイスと思っていただければ幸いである。
具体的な計算や例が多く含まれるが「その指標の活用や特徴を理解するもの」として前後の文言を見てくれると嬉しい。
偉そうに何か言っているが普通に間違えている自信があるので間違いなど見つけたら知らせて欲しい。
正直書きたいことをツラツラと書いているだけなので辞典というのは名前負けしている。
順番は英語読みした際のアルファベット順となっている。
日本語で検索したい場合はPCであれば「Ctrl+F」で検索することが可能だ。
まとめて欲しい指標などがあれば私のX(@SABR_lions)やコメントにまでどうぞ。
見方は
・英語指標名(日本語指標名)
以下細かい解説や個人的な見解などとなっている。
ちなみに日本語指標名がないものは中の人が適当に翻訳しているのでそこまで真に受けないで欲しい。
余談だがこの指標・用語辞典は
同人誌「宇宙の果てのセイバーメトリクス」の自重しない指標紹介がきっかけとなっている。
https://baseballconcrete.web.fc2.com/alacarte/sabermetrics_at_the_end_of_the_universe.html
興味深い話も多いのでよければ覗いて見て欲しい。
参考として以下のサイトを参照した。
興味ある方はこちらも参照するといいだろう。
https://baseballconcrete.web.fc2.com/glossary.html#ba
https://hakkyuyodan.livedoor.blog
https://1point02.jp/op/gnav/glossary/gls_index.aspx?cp=101
- 1. A~
- 2. B~
- 3. C~
- 4. D~
- 5. E~
- 6. F~
- 7. G~
- 8. H~
- 9. I~
- 10. J~
- 11. K~
- 12. L~
- 13. M~
- 14. N~
- 15. O~
- 16. P~
- 17. Q~
- 18. R~
- 18.1. ・RCAA/Run Created Above Average (平均比較得点創出)
- 18.2. ・RC27 (27アウトごとの創出得点)
- 18.3. ・Replacement Lebel (リプレイスメントレベル/代替水準)
- 18.4. ・RF / Range Factor (アウト寄与率)
- 18.5. ・RPW / Runs Per Win (単位得点)
- 18.6. ・RRF / Relative Range Factor (相対アウト寄与率)
- 18.7. ・RSAA / Runs Saved Above Average (平均比較失点抑止)
- 18.8. ・Run Created (得点創出)
- 18.9. ・Run Expectancy(得点期待値)
- 19. S~
- 20. T~
- 21. U~
- 22. V~
- 23. W~
- 24. X~
- 25. Y~
- 26. Z~
A~
B~
・Batting Average (打率)
《計算式》
打率=安打÷打数
打数における安打の割合を示す指標。
一般的な打撃指標として最も浸透していると言っても過言ではないが有用性は他の指標に比べ低い。
というのも出塁率からわざわざ四死球を除いておりそこに合理的な根拠がないため。
得点との相関では出塁率や長打率はもちろん本塁打率(本塁打/打席数)にも劣る。
ただリーグレベルが異なると四球の多さや守備能力は大きく変化する。
このため打者の能力を見るために打率が使われた可能性もありそうであれば使用意図は個人的にはかなり理解できる。
惜しむらくはそういった処理が逆に打者の能力を見るのに大事なもの(四球・長打)を削り落としてしまっていた点か。
また、分母は打数だがこれは犠飛が省かれたものであり全体的に見ればただの外野フライである犠飛を省いている点も有用性が低くなる一因かもしれない。
得点との相関は以下の通り(NPB2014~2023年球団の得点/打席数との相関係数)
打率 0.712
本塁打 0.724
出塁率 0.816
長打率 0.901
OPS 0.948
・BABIP(インプレー打率)
本塁打を除くインプレー打球が安打になった割合。
ボロス・マクラッケンが提唱した野球における成績評価項目の一つで何かと議論の対象になる。
人類に早すぎた概念と言われることも。
誤解されがちだが投手BABIPと野手BABIPとで扱いはやや異なる。
投手BABIPは年度ごとに極めて不安定で一貫性がなく、長期的に見ればどの投手も同じような水準に落ち着くことが発見された。
実際に年間度相関は0.1と無いといって問題ない水準。
ここから投手の能力で(本塁打以外の)ヒットを防ぐことはできないとするDIPSの理論を提唱されることになる。
ちなみに私が個人で偶奇分離による折半法で内的整合性を検証をした際は信頼性係数はほぼ0を記録。
なんならマイナスの値も出てきたぐらいでなんのあてにもならないという結果だった。
対して野手BABIPは選手ごとに多少差がつく傾向にあり「投手BABIPよりかは」あてになると考えていい。
ただあくまで比較しての話なので一貫性は弱いことに注意。(年間度相関は0.33ほど)
打球角度が低めで分散が小さい・脚が速い打者は高いBABIPを記録しやすい。
また左打者はBABIPが高くなりやすい。
「投手は被安打をコントロールできない」という従来の常識から外れた結論を導き出すためしばしば議論の対象になる。
ただ多くの人がこれを否定しようとし、そしてその存在を認めざる得なかったことは胸に留めておきたい。
もちろん部分部分を切り取ればBABIPにも一貫性があることは知られている。
例えば
・フライに比べればゴロのほうが、そしてライナーは更にBABIPが高い
・著しく打力に欠ける打者はBABIPが低い(投手など)
・ど真ん中近辺はBABIPが高い
などは広く知られている。
しかし投手は対戦する相手を選びにくく適正BABIPが高い打者も低い打者も相手にするため結果的にある程度投げれば平均へ回帰すると考えられる。
投げる相手に相手が打った打球、さらに味方の守備力にも干渉を受けるため運に左右される要素が多分なのだ。
BABIPに関する要素の内訳は運が44%、投球能力が28%、守備力が17%、球場が11%とされる(※)。
こんなことを言いつつもなんだかんだ投球能力が関わってくる点は見逃せない。
「投手は被安打をコントロールできない」という結論はいわゆる「受けが悪い」。
これは「良いコースに質の良いボールを投げれば打ち取れる」という考えの方が安心できるからだと思う。
また被安打は投手にとって最も失点を左右する事象(※2)であり感覚的にも被安打を制御できれば…
と考えることは私も自然に感じる。
実際に打者はその得点は長打力に大きく左右されるがこれは制御ができると考えられているためこの点を指摘しても普通に受け入れられるだろう。
ただ個人的には「良いコースに質の良いボールを投げる」ことの恩恵は三振や四球に現れると考えている。
このため「良いコースに質の良いボールを投げれば打ち取れる」と「投手は被安打をコントロールできない」は相反するようには思わない。
むしろ被安打がコントロール出来ないのであれば投手は三振と四球だけに集中できるようになるため前向きな結論のように思う。
BABIPは運の要素が強くBABIPの数値は当てにならないが当てにならないからこそ有用に扱えるのだ。
面白い話としてBABIPが統計上優位なほど低い投手というのは打者に対して投げれば投げるほど多くなる(※3)。
しかしこれは「多く投げている投手ほどBABIPが低く優秀」というのではなく「BABIPが低く額面の成績が良くなるから多く投げている」という選択バイアスがかかっている
という可能性がある。
人類がBABIPを使いこなせるようになるとそういった選択バイアスが減るかもしれない。
《計算式》
野手:BABIP=(安打-本塁打)/(打数-三振-本塁打+犠飛)
投手:BABIP=(被安打-被本塁打)/(打者-与四死球-奪三振-被本塁打)
※分母に犠打を加える等バリエーションあり
※https://www.tangotiger.net/solvingdips.pdf
※2 https://note.com/amapen/n/n7efab3a2ee30
※3 https://baseballconcrete.web.fc2.com/alacarte/examining_dips.html
・BB% (四球率)
打席に占める四球の割合を示した指標。
《計算式》
野手:BB% = 四球 / 打席数
投手:BB% = 与四球 / 対戦打者
投手目線では手に入れやすい数値の中ではK%についで信用しやすい指標。
ただK%よりも年間度相関は劣る(※)。
理由は申し訳ないがよくわからない、が一応推察すると相手打者の選球眼によって左右される部分があるからと考える。
実際に低レベルすぎるところだとBB%はまるで役に立たないが最上位の階級が近づくごとに重要性は増してくる。
ある程度のところまでいってやっと求められるスキルなのかもしれない。
野手視点ではK%やISOよりは信頼度が1段落ちるという印象。
こちらも理由は投手と同じで相手の制球力次第なところが多いからだ。
K%やISOは純粋に来た球への反応だがBB%は選ぶ、と言う前に相手がどこに投げるかという要素が加わる。
左右される因子が少し多い分信頼度が下がると解釈している。
K%よりは信用しにくいという話をしたが少なくとも簡易的な指標の中ではK%についで注目したい指標だ。
安打に注目するよりは有用である可能性が高いだろう。
※投手指標年間度相関
R-からAAAの間で重視される指標について
https://tht.fangraphs.com/katoh-forecasting-major-league-pitching-with-minor-league-stats
・BsR / Base Run(s)(ベース得点)
wRCやRC等と同じ得点推定式の一つであり王様。乗算モデルの筆頭(というか複合と言えるかも)。
式は
「出塁走者数*出塁した走者が得点する確率+本塁打」
という形で本塁打を打つと必ず点が入るという野球の構造を考慮した論理的な構成となっている。
チーム総得点を予測する精度は非常に高く得点との相関係数は例えばOPSが0.948であるのに対し0.955。
ほぼ得点期待値に近似されているOPSよりも上を記録する。
特段文句をつけるところがない指標で知名度がややないこともあって実際に誰かが指摘を入れているところを見たことがない。
ただ打線の得点環境を考慮する乗算モデルであるため打者個人の算出に使うには補正を行う必要がある。
補正はTTBsRといい原理的にはRCで平均的な打者8人を仮定した式と同じ(多分)。
このため計算はやや面倒くさくwOBAより知名度などがない理由と思われる。
個人的には原理的にも現実的にも優秀なので好み。
計算は今ならエクセルやプログラミングで簡略化できるし。
《計算式》
BsR = A*{B/(B+C)}+D
A = 安打+四球+死球-本塁打-0.5*故意四球
B = {1.4*塁打-0.6*安打-3*本塁打+0.1*(四球-故意四球+死球)+0.9*(盗塁-盗塁刺-併殺打)}*1.1
C = 打数-安打+盗塁刺+併殺打
D = 本塁打
TT BsR =(A+2.41×打席)×(B+2.44×打席)/(B+C+7.86×打席)+D-0.75×打席
・BsR / Base Runnnig(走塁得点)
盗塁・盗塁刺の部分で平均的な走者に比べてどれだけ利得を得たかを表すwSB
盗塁以外の走塁(安打の際の進塁、タッチアップなど)の部分で得た利得を表すUBR
を足し合わせたもの。
サイトによってはここに
併殺打を防ぐ能力による得点増減を記録したwGDP
も足し合わせる。
走塁に関して得点換算できたものをすべて足し合わせている。
どれだけ走塁能力に秀でてていてもこの項目で年間10点を超えるケースは少なく差がつきにくい。
2024年の大谷選手ですら超えていない。
ちなみに打撃指標のBsRと略称が丸かぶりである。
一般的にはこちらのほうが普及している印象がある。
C~
D~
・DER (チーム守備力)
チームが打たれた本塁打を除く打球について、野手がそのうち何割をアウトにしたかを表す。
チーム守備力の指標。
DERが高ければチームは相手の打球を安打にさせず、よく出塁を防いだということになる。
標準は概ね7割前後。
BABIPとは表裏一体の関係で本塁打以外の打球のうち
「安打になった」割合を表すのがBABIP
「安打にならなかった」割合を表すのがDER
《計算式》
DER = (打席-安打-四球-死球-三振-失策)/(打席-本塁打-四球-死球-三振)
あれ?分子に本塁打が入ってる(安打に含有されている)じゃん
と思うかもしれないが詳細に計算すると
DER = 1 – (安打 + 失策 – 本塁打)/(打者数 – 本塁打 – 三振 – 四死球)
= (打席 – 安打 – 三振 – 四死球 – 失策)/(打席 – 本塁打 – 三振 – 四死球)
となるのでちゃんと元々は消している。
1から引く形のほうが正直覚えやすいと思う。
参考に打者BABIPは
打者BABIP=(安打-本塁打)/(打数-三振-本塁打+犠飛)
で計算されるがこれは上記の
(安打 + 失策 – 本塁打)/(打者数 – 本塁打 – 三振 – 四死球)
と比較すると分子に失策が入っておらず、また犠打が考慮から外れている。
このような微妙な差異のためリーグDERは1-リーグBABIPと同じ値にはならず少しだけずれる。
微妙な差異がある理由は厳密には
打者BABIPが(自発的に打った)インプレー打球中のヒット割合
DERはインプレー打球のアウト割合
を測っているためである。
ヒットでもアウトでもない事象である失策はカウントされず、打者側はベンチの采配による犠打の影響を取り除くためこのような現象が発生する。
フィールドに飛んだ打球を取れば取るほどDERは高まるためUZRとの相関もかなり存在する。
例えば2024年のソフトバンクはDER.738とここ10年で最も優れた数値を披露しUZRは75点を超えるなどこれまたここ10年でベストの数値をマークしている。
統計的に見ると以下のよう(2019~2023年のチームDERとUZR/1200の比較:データはDeltaより)。
DERがよければよいほどUZRは高い数値をマークすることがわかる。
詳細はUZRやスタットキャストを使った指標を見るのがいいが簡易的に見るだけならDERでチーム守備力は十分測れる。
・DIPS / Defense Independent Pitching Stats (守備独立投手指標)
守備から独立した投手数値。
特定の指標を指すというより概念的なイメージでFIPもxFIP、SIERAなどもDIPS。
守備を完全に無視するというよりは守備に対して一律一定の評価基準を与えるというのがコンセプト。
「ホームラン以外のフェア打球はどうなろうと、投手には無関係なのではないか?」
というボロス・マクラッケン(Voros McCracken)が発見した理論に基づき、本塁打以外の被安打は平準化した形で投手の各種数値を補正する。
DIPSには派生的な計算方法が多数存在し、よく利用される計算法としてはトム・タンゴのFIPが有名だろう。
DIPSの理論は急進的であり従来の常識に反していたことから発表当時大きな批判にさらされたが現在ではその有効性が認められている。
少し誤解しがちではあるのだがすべての投手にとってBIP(インプレー打球)はどうしようもない
という話ではない。
統計的に見ても恐らく「ヒットを打たれにくい選手」というのは存在する。
多少なりとも守備の援護はもらっていると思われるが日本時代のダルビッシュ選手や岸孝之選手はほぼほぼ一貫して低いBABIPを記録している。
逆に則本選手はほぼ一貫してBABIPが高い。
このようにヒットの多寡が投手によって制御される事例も否定はしていない。
※厳密な計算を行っているわけではないので間違っていたら申し訳ない
ただ思っているよりは遥かに投手によって制御される事例は少なく一律にインプレー打球(打球)は処理してしまったほうが有用になる
ということなのだ。
正直セイバーメトリクスを扱っている人でも「被安打は投手によって制御される」という結論が出るほうが受け入れやすいとは思うが事実は事実なのだから仕方がない。
周りがカラスを白という中で黒と指摘したボロス・マクラッケン氏に敬意を払わざる得ない。
E~
・ERA (防御率)
一般的によく知られた指標。防御率。
分析上の観点ではあまり使われることはないが結果としてはわかりやすいので併記することが多い印象。
自責点という概念を使っているが使われるきっかけがもし
「野手のミスによる失点をなくしてあげたい」というのだったら
ある意味野手の関与をなくすDIPSの先駆けと言えたかもしれない。
残念ながら後にそもそも野手の関与をすべてを一律に計算するという割と大雑把な処理のほうが実情を反映するということがわかったためRA(失点率)のほうが今では参照されるし防御率は使われる機会が減った。
打率もそうだが試みの目的自体は今と変わらないと推察できる分少し歯がゆく思うところ。
《計算式》
ERA = 自責点*9 / 投球回
F~
・FIP / Fielding Independent Pitching (独立失点率)
DIPSの理論に基づき、守備に依存しない被本塁打・与四球・奪三振から
「守備から独立した防御率」を評価する指標。
トム・タンゴ(Tom Tango)考案。
それぞれのイベントに対する加重は得点価値に基づいている。
《計算式》
FIP = (13*被本塁打+3*(与四球-故意四球+与死球)-2*奪三振)/ 投球回+C
※Cは「リーグ平均防御率/失点率-(13*被本塁打+3*(与四球-故意四球+与死球)-2*奪三振) / 投球回」(通常は3程度)。
これも典型的な加算モデルの指標。
定数でリーグの防御率・失点率に合うように補正をしておりリーグFIPはリーグ防御率or失点率と同じになる。
防御率を使う、失点率を使うパターン両方ある。
加算モデルなので2023年の5月の佐々木朗希選手(11イニング被本塁打0・三振21・四球2)のような成績の場合マイナスになる。
もちろんこれはFIPが壊れた、おかしいのではなくそういった例外的なものでおかしくなることを許容する代わりに簡便さを取っている。
また全体でおよそ30%ほどの要素でしか無い被本塁打・四死球・奪三振を考慮し残りの70%を無視する身も蓋も無い指標とも言える。
それでも有用なのがすごいところ。
算出方法は
おおむねwRCと近く
「平均と比べた失点の多寡」+「平均失点」で失点の期待値を推測し、それをイニングで割ったものと言える(wRCに割る過程はないが)。
具体的に見ていこう。
まず打席結果は大きく
①フェアグラウンドに打球が発生する場合(ex.ヒット・内野フライ・併殺打など)
②フェアグラウンドに打球が発生しない場合(ex.本塁打・四死球・三振)
に分けることができる。
FIPの重要な点は①に対してすべて「一律に同様の価値」を与える点である。
ボテボテのゴロもフェンス直撃の強烈な打球も同じ価値とするのだ。
ここからは①の打球を一律にBIPと呼称する。
1打席ごとの得点価値は(もちろん環境によって変動はあるが)
2019年のパ・リーグを考えて
本塁打: 1.41
四死球: 0.30
奪三振:-0.25
BIP :-0.02
全打席: 0.11
とする。
このときの「全打席」とは1打席ごとの失点を指しているし本塁打なども含有している。
つまり1打席を投げるごとに0.11点ずつ失点していくことを想定しておりこれは「平均失点」に該当している。
逆に本塁打~BIPは「平均と比べた失点の多寡」に影響を与える。
BIPは係数がマイナスだが全打席よりは数値は小さい。
これは「失点をしない」のではなく「平均と比べ失点をしない」ということを指す。
奪三振は係数がマイナスでなおかつ「全打席」よりも数値が大きい。(このため純粋に加算するとマイナス)
これは理屈上でも実際でもそうだがすべての打者から三振を取れれば失点をしないということを反映している。
また加算モデルの歪なところとも言える(失点がマイナスというのはあり得ないため)。
ここでBIPの期待値を基準に考えてみると
本塁打- BIP: 1.43
四死球- BIP: 0.32
奪三振- BIP:-0.23
BIP – BIP: 0.00
全打席+BIP: 0.09 全打席からはその分BIPの数値を加算
となる。
本塁打* HR価値
+四死球* BB価値
+奪三振* K価値
+BIP * BIP価値
+総打席*打席価値
=
本塁打* (HR価値- BIP価値)
+四死球* (BB価値- BIP価値)
+奪三振* (K価値- BIP価値)
+BIP * (BIP価値- BIP価値)
+総打席*BIP価値
+総打席*打席価値
=
本塁打* (HR価値- BIP価値)
+四死球* (BB価値- BIP価値)
+奪三振* (K価値- BIP価値)
+BIP * (BIP価値- BIP価値)
+総打席*(打席価値+ BIP価値)
本塁打- BIP: 1.43
四死球- BIP: 0.32
奪三振- BIP:-0.23
BIP – BIP: 0.00
はそれぞれBIPを基準としたイベントごとの失点と考えることができるため9をかけ投球回数で割ることで失点率と同じスケールにすることができる。
本塁打- BIP: 1.43*9=12.88
四死球- BIP: 0.32*9= 2.88
奪三振- BIP:-0.23*9=-2.09
BIP – BIP: 0.00*9= 0.00
つまり
(13*被本塁打+3*四死球-2*奪三振) / 投球回数
というFIPの前の項が算出される。
これが「平均と比べた失点の多寡」に当たる。
プラスなら失点が多いしマイナスなら少ない。
※ただしこれはかなり強引な丸め込みで2019年の山本由伸選手の成績を正確な方に当て込むと-50に対し丸め込んだ方は-33と大きな差がある。
年度やリーグによって大きく変わる数値であることは頭に入れておきたい。
ちなみに2024年は極端に打低すぎてBIPの価値がほぼプラスマイナスゼロとなっている。
三振や四球が減ったという報告があるがBIPの価値が相対的に上昇しているため打者は適切な対応をしていることがわかる。
対して
全打席+BIP: 0.09
というのは各イベント(本塁打・四死球・奪三振・BIP)が起こるごとに0.09点失点することを指している。
2019年では9回を投げきるまで平均38.4打者が相手になるので
0.09*38 ≒ 3.53
となりこれが定数Cとなる。
つまり定数Cは全打席の結果がBIPに終わるというケースを想定した失点率と言える。
翻って(13*被本塁打+3*四死球-2*奪三振)は全打席の結果がBIPから各イベントが起こったらどのぐらい失点が変動するかを捉えている
と言える。
BIPというのは基本的に得点価値はマイナス(つまり失点を減らす方向に働く)なため全打席の結果がBIPの場合失点は減る。
このため平均失点率と定数Cを比べると定数Cのほうが小さい数値になる。
ちなみに守備を考慮していないように見えて実は少し考慮に入れている部分がある。
例えば定数Cを求める際は9回を投げきるまで平均38.4打者が相手になると仮定したが四球を出さず三振をよく取る投手は守備に依存せず9回を投げきるまでの必要打者数が少なくなる。
もちろん味方の守備が優れていた場合も対戦打者数は少なくなる。
例えば2019年の山本由伸選手はDERが高くなおかつ三振が多く四球も少なかった。
このため9回を投げきる平均打者数は34.8(=553/143)打者と平均よりも3打者以上少なく、翻って定数Cも3.22と小さい数値となるが定数は上記の通り3.53なので2019年の山本由伸選手のFIPは過小評価されている。
仮に守備がリーグ平均レベルだったとして守備によって増えたイニング数は5イニングほど(※)なので平均打者数は36.0打者(=553/138)なのでやはり過小評価されている。
このためやはり0.25ほど山本由伸選手は過小評価されていると言える。
また三振・四球の部分には捕手によるフレーミング能力による影響がある。
フレーミング得点は概ね年間-10~10点ほど捕手の間で差があると報告されている(Delta Fielding Awords参照)。
三振-四球の価値は年によるがおおよそ0.5点ほど。
このためチーム単位で見るとフレーミング最上位のチームと最下位のチームで三振と四球それぞれ40個の差が生まれる可能性がある。
これをFIPに直すと年間で0.15ほどの差になりそれなりに影響を受けていると考えていいだろう。
また分母の投球回だがこれは味方の守備能力が高い/低いほどアウトがより取れる/取れないため影響を受ける。
このように分母にうっかり?守備が関与するイニングを使用しているなど実のところ若干気になるところもある指標。
それでも簡便で強力であることに変わりはないが。
補正をするにはBIPのアウトの数に加え併殺打の数と盗塁死の数を加える必要があるためやや難しい。
BIPに0.750をかけ三振を足すと概ねリーグのアウト総数と一致するため簡易的に補正するなら
イニング→(三振+BIP*0.75)/3
とする。
もしくはFIPを分解すると
(本塁打価値-BIP価値)*HR / 9
+(四死球価値-BIP価値)*BB / 9
+(奪三振価値-BIP価値)*K / 9
+定数C
となるのでHR/9などをHR%ととして対戦打者数基準に直す、などが考えられる。
定数Cは上述の(三振+BIP*0.75)を流用して
(全打席価値+BIP価値)*27 / (K%+BIP%*0.75) ‥(K%+BIP%*0.75)はアウト率
で考えられるので
FIP = 9*対戦打者数*(
(本塁打価値-BIP価値)*HR%
+(四死球価値-BIP価値)*BB%
+(奪三振価値-BIP価値)*K%
) / ((K%+BIP%*0.75) *対戦打者 / 3)
+ (全打席価値+BIP価値)*27 / (K%+BIP%*0.75)
整理して(R=全打席価値+BIP価値、Rは0.08~0.10ほど)
FIP = 3*(13*HR%+3*(BB%+DBB%)-2*K%+9*R) / (K%+BIP%*0.75)
BIP%=1-K%-BB%-DBB%-HR%
簡易的にこれを%FIPと呼ぶ。
対戦打者数と三振・四死球・被本塁打からFIPを算出することができる。
この%FIPの良いところは本来のFIPが
「四死球が対戦打者数を増やしてしまうもののそれを定数に反映できなかった」
のができるようになっている点だ。
上述した通り定数Cは対戦打者数に応じて増やすのが望ましいが一定の値を一律に与えており余計な走者を出さない力が過小評価されていた。
その力をうまく反映していると考えられる。
参考までにFIPとこの%FIPの差とBB%の相関関係は以下のようである。
BB%が大きいほど過剰にFIPがよく見積もられていることがわかる。(縦軸はFIP-%FIP)
※この%FIP、あっているかわからないのでご意見求む
ちなみにFIPの三振の数に内野フライを足すというものもある(ifFIPなどと呼ばれる)。
これは内野フライの価値がほとんど確実にアウトになるなど三振とほぼ等価であるためである。
含んだほうがERAとの差も小さくなるという報告もある(※2)。
データが取れるならこちらも取るといいだろう。
※計算
山本由伸選手の投球回、つまりは獲得アウトは143回*3で429個
そのうち山本由伸選手が取ったアウトは三振127個と盗塁死4個(一旦ここでは投手の責任とする)
298個が守備によって取ったアウトでDERは.736だった。
リーグ平均DERは.701なので守備が多く取ったアウトの数は
298-298*.701/.736 ≒ 15
※2
F. Joseph, Improving the FIP Model, 2014 24/9/2024確認
参考
https://note.com/hegel3/n/nf4ba001f808c
G~
・GBkwERA (ゴ三四防御率)
K-BB%の項目で紹介しているkwERAにゴロ率補正を加えた推定失点率。
「ゴ」ロ率と「三」振と「四」球を使用して算出しているので勝手に534防御率と呼んでいる。
絶対広まらない。
基本はkwERAと同じで算出されたkwERAにGB%による補正を掛けている。
《計算式》
kwERA = リーグ定数 – 価値定数*K-BB%
GBkwERA = kwERA*(-3.518 * GB%^2+2.344*GB%+.629)
価値定数はおおよそ10~12
リーグ定数 = リーグ全体の防御率+価値定数*K-BB%
このゴロによる補正は算出されたkwERAと実際のERA(防御率)の間に差がありそれをゴロ率によって説明できることがわかったため行われている。
GBは当然長打の危険性が低く打球価値が低いためGB%が高いほど失点抑止方向に働くのはある意味当然かも知れない。
GB%に2乗されているのは線形的な近似ではなく2次関数的な近似を取っているため。
翌年の成績の説明能力はSIERA並みに高く様々なDIPSの中でも有力な指標。
GBkwERAの数値は参考元から引っ張ってきているがもちろん環境に合わせて処理は必要。
数値は回帰分析から出しているので野球的な背景はあまりない。
DIPSの多くの指標が三振と四球という構成要素は同じで他に考慮するのが
本塁打の場合→FIP
外野フライの場合→xFIP
ゴロの場合→GBkwERA
ゴロとフライの場合→SIERA
という関係でよくよく見るとほとんど似たものをこねくり回していると言える。
もちろんそれは悪いことではない。
参考
https://tht.fangraphs.com/kwera-the-starting-point-for-pitcher-evaluations
H~
I~
・IsoD(四死球出塁力)
四死球での出塁の多さを表す指標。
安打による出塁の分は減算されるため、打者の総合的な貢献の高さを表す指標ではなくタイプを表す指標。
出塁率の分母に四死球が入っている都合上打率が高いほどIsoDは小さくなる傾向がある。
例えば同じ600打席で四死球100個選ぶ打者がいたとして
①500打数50安打で打率.100
②500打数150安打で打率.300
の場合
①ではIsoDが.250-.100=.150
②ではIsoDが.417-.300=.117
と同じだけ四死球を選んだにも関わらず打率が高いほどIsoDが下がってしまう。
分母が違うものを本来は足したり引いたりしてはいけないということがわかる。
OPSは稀有な例。
今では四球を選ぶ能力を測るのはBB%に役割を完全に移している。
《計算式》
IsoD = 出塁率-打率
・IsoP/ISO(純長打力/長打力)
打者の長打力を表す指標。
打率が低くても長打が多ければある程度高く出るので打者としての総合的な優劣ではなく長打力だけを浮き上がらせる目的で使用される。
安打が全てシングルヒットの場合は0になる。
打者の能力を的確に表しているものとしても有名。
年間度相関は打率はもちろんOPS等よりも高い。
また上位カテゴリーに挑戦する際に参考になる指標の一つ。
例えば大学野球からプロに進む場合に成功するか否かを判断する際の有用な指標となる。
ドラフトマニアの方は成績を調べるとき活用してみてはいかがだろうか。
ちなみにIsoPとISOと似た言葉なのに呼び方が2種類あるのは兄弟のような存在だったIsoDが有用性の低さから淘汰されISOとしてもIsoPとして意味が通るようになったためと思われる。
以下参考
https://www.beyondtheboxscore.com/2011/9/1/2393318/what-hitting-metrics-are-consistent-year-to-year
https://note.com/baseball_namiki/n/neb85722c62c4
《計算式》
IsoP = 長打率-打率
J~
K~
・K% (三振率)
打席に占める三振の割合を示した指標。
《計算式》
野手:K% = 三振 / 打席数
投手:K% = 奪三振 / 対戦打者
三振という古くからある指標と手に入れやすい打席数や対戦打者からわかる指標として非常に有用。
年間度相関やリーグなどをまたいでも相関が高く強固な指標。
投手では似たような指標にK/9があるがK/9は分母がアウトのため四死球や被安打の影響を無視してしまう。
実例を出して見よう。
投手A 24.2回 対戦打者数117 奪三振30 K/9 10.95 K% 25.6%
投手B 60.0回 対戦打者数247 奪三振70 K/9 10.50 K% 28.3%
という2人の投手を比較するとAのほうがK/9は高いにも関わらずK%ではBのほうが高い。
あえて防御率を隠してみたが2人の防御率は以下のようである。
投手A 防御率6.57
投手B 防御率0.90
圧倒的にBがいい。
これは被打率で.245と.179と差があり四球率も15.4%と11.3%と差があることに起因する。
被安打も四球も少なく投げれたほうが当然よくK/9ではそれらを見落とす欠点をK%は補うことができる。
計算もわざわざ9を掛けたりしないで済むので積極的に切り替えていくことをおすすめしたい。
NPBでは平均がおよそ20%とおぼえやすいのも魅力。
野手の方のK%は特にミート力と関連しており低いほどBIP(インプレー打球)を増やすことができるのでヒットを多く打つための方策の一つ。
ただしK%が低い場合バットスピードが遅くゴロが多くなり長打力に欠ける、つまりBIPの価値が落ちやすい。
基本的にバットスピードを上げたほうが貢献度は上がりやすいのでそこは要相談。
石渡祐樹様(@yuki_ss89) より提供
数値の引用及び・詳しく知りたい人向け
https://stat-xbase.com/stopusingk_bb
・K-BB% (三振-四球率)
三振率を四球率で引いたもの。
《計算式》
K-BB% = (三振-四球) / 対戦打者数
至極単純な式でありながら翌年の成績を予想するのにはこれ以上のものは簡易的なものでは基本的にない。
MLBでも同じ結果が出ておりかなり有用な指標と言えるだろう。
ちなみに得点価値で見ると三振と四球の絶対値は≒の関係にある。
例えばMLBでは
三振 -0.27
四球 0.30
とされており多少の違いはあるがかなり近い。
NPBでは
三振 -0.257
四球 0.292
とこちらも多少違いはあるが三振と四球以外のイベントを基準に調節すると
三振 -0.279
四球 0.276
と非常に近い値になる。
このためK-BB%から推定失点率を求めることも可能。
この求められる推定失点率はkwERAと呼ばれ
《計算式》
kwERA = リーグ定数 – 価値定数*K-BB%
で求めることができる。
リーグ定数は
リーグ定数 = リーグ全体の防御率+価値定数*K-BB%
で求めることができる。
スケールを失点率にしたいなら「リーグ全体の防御率」を「リーグ全体の失点率」にすればいい。
価値定数は環境によって変わるが「10~12」の値になることが多い。
打低であれば10に、打高であれば12にすると悪いようにはならないはずだ。
ついでに%にしない「三振-四球」というのも紹介したい。
K-BB%が強力なのは前述のとおりだし先発投手であろうが救援投手であろうが比較できる。
ただ「三振-四球」ならばより多く投げた投手の評価もできる。
特に100を超えると先発の、特にエースクラスの数値となる。
2023年は今永・山本・種市・戸郷・村上・佐々木朗希・東選手が100を超えている。
多くの人が文句なく認めるエース級ではないだろうか。
150を超えるとなるとここ10年では
山本(2回)・佐々木朗希・千賀・菅野(2回)・則本(4回)・菊池・岸・マイコラス・大谷・金子千尋・メッセンジャー選手
とNPB記録持ち・MLBで活躍などNPB史上でも有数な選手たちの集まりとなる。
200超えとなるともはや神域と言って差し支えない。
近年では極めて難しい200勝を達成したダルビッシュ選手は150以上を5回、そして日本最終年は200超えを記録。
MLBでもあと一歩まで迫った。
神の子田中将大選手は150超えを3回、200超えを1回記録。
200超え複数の投手はNPB界のレジェンドしか存在し得ない。
400勝投手 金田正一さんが6回
シーズン42勝投手 稲尾和久さんが4回
401奪三振 江夏豊さんが3回
「精密機械」小山正明さんが3回
最後の300勝 鈴木啓示さんが2回
最後の0点台 村山実さんが2回
250-250達成者 梶本隆夫さんが2回
あまりにも錚々たる選手たちだ。
L~
・Linear Wights/ LWTS (得点線形加重)
各種の事象に一定の価値を加重する分析・評価方式。
wOBAやFIP、UZRといった代表的な指標はこの方式を利用した指標。
ある意味子どもと言えるかもしれない。
基本的にLWTSは得点期待値と関連しており打撃のイベント(例:本塁打)ごとに平均的な得点期待値の変化を価値として付与する。
LWTSを用いた評価はわかりやすく算出も容易な上、正確なので広く利用されている。
例えば2013~2015年の得点価値は以下のようである。
出典:https://1point02.jp/op/gnav/glossary/gls_explanation.aspx?ecd=202&eid=20013 (アクセス日:14/9/2024)
しかし実際のところ「野球は線形ではない」。
四球やヒットが多ければ塁上のランナーが増え1本のヒットの価値が上がるように野球のそれぞれの事象は相互に影響し合う。
このためいついかなる状況においても同一の事象が同じ価値を持つとは限らない。
例えばLWTSから作られたwOBAでは必ず四球を選ぶ打線はwOBA0.700前後を記録する。
平均wOBAが0.300という環境ではこの打線は純粋にwOBA0.700から計算すると年間5000打席で平均より1500点ほど点を取るという計算になる。
この時点でも凄まじいが必ず四球を選ぶ打線は当然アウトにならないため実際には無限に点を取ることが可能である。
FIPではもっと簡単で例えば1回を投げて被弾なし・四球0・三振2個を記録をした投手のFIPは定数にもよるが-0~-1の範囲を取る。
当然失点率マイナスというのは存在し得ない。
このように一般的な野球の環境では線形だが厳密なことを言うと加算の関係ではなく乗算の関係を取る。
あくまでも簡易的な処置として加算モデルが採用されており今ではこれらが主流である。
人間簡単なものに流されやすいと感じる、が一応言っておくとこれは非難されることではない。
簡単で有用なのは最高だ。
M~
N~
O~
・On-base Percentage(出塁率)
《計算式》
出塁率=(安打+四球+死球)/(打数+四球+死球+犠飛)
犠打・インターフェアを除く打席のうち、アウトにならず出塁した割合を表す指標。
出塁し進塁することで得点を上げる野球において本質的な指標の一つ。
wOBAの基準にもなっている。
出塁率は生還率とある程度近似できるため出塁率を2乗すると大まかな得点能力を測ることができる。
ちなみにこの得点能力計測は定義通りの出塁率よりも犠打を分母に含んだときのほうが得点と相関性が高い。
少なくとも2014~2023年NPBではそうだった。(決定係数が0.68と0.71と僅かに差がある)
これはある意味当然で犠打は進塁を伴った普通のアウトとも解釈できるため原理上は含んだほうが得点生産とは相関する。
ただ犠打は多くの場合監督が選手に強いるもの、また状況によるもので打者の能力・評価を測るのには取り除いたほうがいい。
このためチーム単位では犠打を含有させ選手個人では既存のものを使うのが望ましい…のかもしれない。
そんな場合分けにほとんど意味がないという致命的な点を除けば(全部既存の出塁率でいい)。
出塁率と得点の構造について詳しくはこちら
https://baseballconcrete.web.fc2.com/alacarte/structure_of_runs_and_obp.html
・OPS/On Base plus Slugging (出塁+長打)
《計算式》
OPS = 出塁率 + 長打率
その名の通り出塁率(On-base percentage)と長打率(Slugging average)を足し合わせた指標。
打者が打席あたりで得点増加に有効な劇をしているかどうかを表す。
数値が高いほどチームの得点増加に貢献している打者と評価できる。
出塁率と長打率を足すだけと簡単な割に得点相関が非常に高く0.95近くを記録する。
スポナビにも標準搭載されており認知度も高い。
四死球・単打・二塁打・三塁打・本塁打それぞれの加重がLWTSなどから算出される合理的数値とほぼ近似している。
出塁率と長打率を足し合わせた際の得点価値の比は
四死球:単打:2塁打:3塁打:本塁打=(1+0):(1+1):(1+2):(1+3):(1+4)
このため得点との相関が高い。
貧弱で名高いNPBの公式でも出塁率と長打率は記載されており簡単に計算することができる。
コスパの良い指標と言える。
ちなみに選手同士のOPSを比較する際はOPS同士の比を取ってはいけない。
例えば
「OPS.600とOPS.900の打者では.900の打者が1.5倍の打力を持つ」
というわけではない。
仮に600打席立つ場合
OPS.600の選手が生み出す得点はおよそ40点
OPS.900の選手が生み出す得点はおよそ100点
と2.5倍ほどの差がある。
大事なのは「差」であり「比」ではない。
P~
・Park Factors,PF(パークファクター/球場補正)
球場の特性が野球の試合に及ぼす影響を特定の面で数値化したもの。
その対象は
・得点
・本塁打
といった代表的なものから
・球速
・FIP
などのやや細かいものまで算出することができる。
1より大きければ対象の項目が記録されやすく1より下回っていれば記録されにくい。
例えば神宮球場は得点PFが1.20近くあることが多いがこれは1.2倍得点が生まれやすいことを示す。
1シーズンだけだと極端な値が出ることがあるので3シーズンほどの平均や加重平均から算出されることが多い。
誤解されがちな点としては
①貧打のチームだと得点のPFが低く出るなどホームチームの影響を受ける
→受けない。原理上の説明をすると長くなるので以下のサイトなどを参照してほしいが、例えば2024年の西武は歴史上に残る得点力の低さだが得点PFは1前後である。
②ホーム球場の得点PFが1.2のチームは1.2倍得点する
→そういうわけではない。1.2倍の球場で試合をするのはシーズンの半分だけなので影響は半分以下になる。
例にあるような得点PFが1.2の球場がホームのチームは実際には1.08倍ほど得点しやすいだけにとどまる。
逆にナゴヤドームのように得点PFが0.85前後と得点が生まれにくい環境でも0.94倍得点しにくいだけにとどまる。
なら補正をする必要があるのかと思われるかもしれないが
例えば平均的な球場で試合をするチームが年間得点が600点の場合
神宮 648点
ナゴド 564点
と2つの球場で90得点近い差が出る。
このため球場補正をする意義と効果は見過ごすことは出来ない。
また他の注意点として純粋な意味での球場の影響を捉えているわけではない。
例えばクアーズ・フィールドは標高が高くその分空気抵抗が少ないためボールが良く飛び打者有利となっている。
他にも土のコンディションが悪い、バックスクリーンの影響で球が見えにくい等といったことも原因となりうる。
このため球場補正と訳しているが実際は環境補正と言ったほうがいいかもしれない。
ちなみに非常に細かい話として
対象者の対象指標-対象指標のリーグ平均
によってwRAAなどの量的な指標は算出されるが前者と後者どちらにPF補正をかけるかは明確に定まっていない。
例えばDeltaやFangraphは前者にパークファクター補正をしているが原理上は後者にかけても全く問題はない。
計算式などについては以下のサイトが詳しい。
パークファクターはどのような考え方で算出されるか
https://ranzankeikoku.blog.fc2.com/blog-entry-2795.html
wRAAのパークファクター補正
http://bbalone.blog119.fc2.com/blog-entry-551.html
・Pythagorean winning percentage(ピタゴラス勝率)
チームの総得点と総失点から見込まれる勝率を導き出す式。
《計算式》
ピタゴラス勝率=得点^X /(得点^X+失点^X)
Xの値は2や1.83などが用いられる。
得点が0であれば当然勝率は0%であるし失点が0なら勝率は当然100%である。
また得点と失点が同じであれば勝率は.500である。
このXの値は{(得点+失点)÷試合}^0.287
で算出されることが今では一般的なようだ。
式を見て分かる通り打低環境であるほどXの値は小さくなる。
1試合平均得点が3.5点のときは1.75ほど、4.5点のときは1.88ほどになる。
得点と失点をチームの勝率に結びつける重要な指標でありWARの基礎。
得点と失点に関してそれぞれが勝率にどのような影響があるのかがはっきりわかるからこそWARを算出することができる。
ちなみにこのピタゴラス勝率と実際の勝率を比べ監督の采配の是非を調べるといったことがたまにされるがこの勝率差には一貫性がない(※)。
また救援の強さも関係がない(※2)。
この差は折半法により内的一貫性を検証しても一貫性がまるで見つけられずほぼほぼ運により決まるとされている(※3)。
このため差を議論することにはあまり意味がなくチームの戦力をしっかりと把握するということが主な使い方となるだろう。
実際に記録された事実(得点・失点)から算出されるため将来的な予測というよりは事実の適切な記述が主な役割だと考えている。
得点と失点から勝率を読み解くことができるため経験則として
「得点-失点」を5で割ると概ね貯金・借金数と一致するというものがある。
実際に比較してみると(データは1950~2023年、推定貯金数=(得点-失点)/5)
R2値も0.86と非常に高い数値を取るなど高い相関性が見て取れる。
これはピタゴラス勝率(X=1.83)からピタゴラス貯金数(試合数*ピタゴラス勝率-(1-ピタゴラス勝率)*試合数)を計算してもほとんど変化はなくかなり優秀な式である。
ただこの推定貯金数とピタゴラス貯金数には面白い関係があり平均得失点差が0から離れるほど貯金数の差が広がるということだ。
これはピタゴラス貯金が得失点差が正に大きいほどより勝ちやすく負に大きいほどより負けやすいという弾力性を反映していることを示している。
※
https://ranzankeikoku.blog.fc2.com/blog-entry-4549.html
※2
Benjamin, M. 2023, ASSESSING THE IMPACT OF RELIEF PITCHING IN MAJOR LEAGUE BASEBALL, The University of Arizona.
※3
※蜷川皓平, 推定値に表れない要素の一貫性, プロ野球を統計学と客観分析で考える デルタ・ベースボール・リポート4, 水曜社, 2021, pp.107~pp.121
Q~
R~
・RCAA/Run Created Above Average (平均比較得点創出)
同じ打席数をリーグ平均の打者が打つ場合に比べてどれだけ多く(または少なく)得点を生み出したかを示す指標。
平均的な打者で0となり、プラスの値なら平均より優れている打者、マイナスの値なら平均より劣る打者。
例えばRCAAが+5の打者がいた場合、もしチームがその打者が担った打席分を平均的な打者に打たせていたら得点が5減っていただろう
という意味。
計算上打席数が多いほどに絶対値が大きくなる(仮に極めて優れた打者でも打席数が10や20では大きな値を出すことは難しい)ので機会数を標準化して比較したい場合は別途計算が必要。
これはRC27でもよい。
《計算式》
RCAA = 対象打者のRC-(リーグの打席あたりRC×対象打者の打席数)
wRAAと同じく単位は「点」なのでWARの構成因子にしても良い。
・RC27 (27アウトごとの創出得点)
ある打者が一人で打線を組んだ場合の1試合(27アウト)あたりの得点数。
平均と比べどれだけ優れているかはパッとはわからないがなんとなく打力を想像できる優秀な指標。
複数の打者の得点創出能力を比較するような場合はRCの値そのままよりもこちらのほうが適切。
チームRC27が5.00なら年間700得点以上が狙える。
ちなみに非常に細かい話だが
「ある打者が一人で打線を組んだ場合の1試合(27アウト)あたりの得点数」
という説明は正しくない。
というのRCは打者一人の打力から計算しているのではなく
特定の打者+平均的な打者8人の打線から平均的な打者8人による得点を引くことで計算をしている。
このためRCはその打者一人ではなく「打線としての計算をしてからその選手の貢献を浮き上がらせたもの」であり純粋にその打者のRCを表しているわけではない。
ゆえに「一人で打線を組んだ場合」というのは正しくなく「27個アウトになるまでのRC」と表現するほうが正確。
とはいえ多くの場合打線による補正を加えたものとそうでないものとで差はほとんどなく大意的には
「ある打者が一人で打線を組んだ場合の1試合(27アウト)あたりの得点数」
で問題ない。
《計算式》
RC27 = RC÷(打数-安打+盗塁死+犠打+犠飛+併殺打)×27
参考
https://hakkyuyodan.livedoor.blog/archives/6485187.html
・Replacement Lebel (リプレイスメントレベル/代替水準)
選手の評価をする際に用いられる基準の一つ。定義はいかようにもつけることができるが一般的にはレギュラー選手が怪我した際に最小クラスのコストで用意できる代替選手の能力水準のことを示す。
あくまでも基準のひとつなのでこの水準は「平均」でも問題はない。
ただその場合平均的な選手の評価値は「0」となってしまい現実的な感覚と合わないという考えがあり「リプレイスメントレベル」という概念ができたとされている。
このため水準自体は2軍選手にしてもいいし2軍の控え選手というNPBにおける最下層クラスにおいてもいい。
なんなら著者のようなそのへんのおじさんを水準にしてもいい(差を定量的に取れるかは別として)。
リプレイスメントレベルはWARで用いられるが
稀に「WARがマイナスだからこの選手は貢献していない、出場させるだけ無駄だ」
という論を展開する人がいるがこれは間違いである。
WARが0ないしはマイナスというのは控え選手と比べプラスではないというだけで水準を平均にすれば大多数の選手がマイナスになる。
逆に2軍の控え選手を水準とすれば多くの選手がプラスになるだろう。
そのへんのおじさんの場合ははた言うべきにもない。
NPB1軍におけるWARが0ないしはマイナスということが示すのは
「この選手がNPBの野球選手の中で控え選手レベル以下」
というだけでありそのチームにそれ以上の選手がいなければその選手はチームにとって貢献していると言える。
リプレイスメントレベルは選手の価値を定量するのに対してある一定の基準を提供しているに過ぎない。
ましてや罵倒の道具ではない。
MLBやNPBにおいてはこのリプレイスメントレベルの選手だけでチームを構成した場合
得点力は平均の70~80%前後
失点率は平均の120~140%前後
勝率は.200~.350前後
となるとされている。
実際に近年で勝率.300近くを記録したチームとしては
2017年ヤクルト
2024年西武
があげられる。
そしてこれらのチームは(14/9/2024現在)
とある程度近傍の値を取っていることがわかる。
ただ明確に定まった数値があるわけではない。
もちろんこの数値はリーグなど環境によって変動し役割によっても差が出る。
例えば先発投手と救援投手は控え選手のtRAを比較すると
先発は1.23倍
救援は1.11倍
と控え選手のほうが失点しやすく、また救援のほうが差が小さい(※)。
これは救援投手のほうが控え選手から代替しやすいことを示す。
また投球や打撃には顕著な差がでることが知られているが守備・走塁にはあまり差が出ないとされる。
私が行った検証では走塁は年間で0.7点程度、守備は全体で年間1点程度の差であり投球・打撃ほどではないものの守備に関しては守備位置ごとに差がある。
例えば二遊間・捕手は差が大きい(年間5点以上は差がある)。
これをリプレイスメントレベルとするべきか守備位置補正に含有されているのかどうかは今後も議論が必要と考える。
今ではMLBでは守備能力についてOAAという指標から推察でき、これは外野手であれば守備位置関係ないとされるので守備位置補正を考える必要がない。
このためOAAを軸に守備のリプレイスメントレベルは再び検証されるかもしれない。
ちなみに2024年のMLBでは外野手のOAAは控え選手比較4.2アウト/1000イニングという結果が出ている。
これはフル出場では5点ほどの差になるため適用されればかなり大きい補正になる可能性がある。
また他のポジションもFRVで1000イニングあたり2~5点ほどの差が出ており小さな配点かもしれないが1000イニングあたり3点ほどの控え選手補正が今後入るようになる…かもしれない。
https://twitter.com/i/bookmarks/1793804668533190795?post_id=1834180996721508847
https://x.com/i/bookmarks/1793804668533190795?post_id=1823720059711508569
※二階堂智志, 投手リプレイスメント・レベルの再検証, プロ野球を統計学と客観分析で考える デルタ・ベースボール・リポート6, 水曜社, 2023, pp.92~pp.102
・RF / Range Factor (アウト寄与率)
守備者の9イニングあたりのアウト関与数。
多いほど守備範囲が広く優秀な守備者とされる。レンジファクターと呼ばれることが多い。
通常同守備位置内での比較に使う。
例えば、一試合に平均4.2個のアウトを奪う遊撃手と5.1個のアウトを奪う遊撃手では後者のほうが優秀であると考えられる。
従来使用されてきた守備率と異なり積極的なアウト獲得を評価する。
なお、日本においては現状RFの算出に必要な守備イニング数のデータが公的に手に入らないという大問題がある。
このため出場試合数でざっくり算出する簡易RFというものも存在する。
NPBなんとかしろ
《計算式》
RF = 9*(刺殺+補殺)/ 守備イニング
簡易RF = 9*(刺殺+補殺)/ 出場試合数
<刺殺>
刺殺はざっくり野手が捕球してアウトを取った際に記録されるもの。
このため外野手は刺殺が多ければ多いほど純粋に守備範囲が広いとされる。
反面内野手は捕球が容易な内野フライを取ることが多く、またファーストが典型だがセカンドなどからの送球を受けてのアウトもファーストに刺殺として記録される。
ゆえに守備力を表しているとは言い難いものとなってしまっている。
そのため外野手では比較的有用だが内野手ではあまり使用は推奨されない。
<捕殺>
捕殺はざっくり野手が送球してアウトを取った際に記録される。
このため外野手では肩が強い、レーザービーム持ちの選手は多く記録する可能性がある。
また内野手はゴロを処理した際に記録されることが大半なため守備範囲の広さの記録として見ることができる。
外野手は実際に強肩を披露するとランナーが躊躇し捕殺を記録できなくなるという欠点がある。
実際に世界的強肩の持ち主イチロー氏は2001年に鮮烈なレーザービームを披露したため警戒され捕殺ランキングは
2001年 21位
2002年 16位
2003年 4位
2004年 3位
2005年 6位
2006年 12位
2007年 17位
2008年 5位
2009年 37位
2010年 24位
と上位の年もあればそこまで振るわない年もあるなど差が激しい。
失点抑止を含んだ肩の評価の場合は
2001年 21位 記録なし
2002年 16位 37位( -2.7)
2003年 4位 6位(+7.2)
2004年 3位 6位(+6.3)
2005年 6位 26位( -0.6)
2006年 12位 3位(+5.8)
2007年 17位 7位(+6.6)
2008年 5位 4位(+6.2)相当
2009年 37位 40位(-2.9)
2010年 24位 35位(-3.5)
()内の数値は相手の進塁を抑止することで防いだ失点数。
という形で相関しきらない関係になっている。
従来、守備の評価については動きの観察による主観的な評価か、もしくは数字としてはエラーをしない割合を表す守備率による評価が用いられていた。
しかしプレーの観察による評価は必ずしも客観的・合理的な評価とならないこと、守備の目的は失策をしないことではなくアウトを奪い失点を防ぐことである。
このため失策による評価は本質的でないことから、獲得したアウトを加点的に評価するRFが開発された。
考え方は後のUZRなどにも受け継がれている重要な指標。
ただし内野手評価に刺殺を含めるのは大きなノイズが入る原因となっている。
「守備範囲が広い選手ほど多くアウトを奪い1試合あたりのアウトの関与は増える」
という考えのもと数値が多いほど守備範囲が広いと解釈される。
ただ実のところ分母が守備イニング、言い換えればチーム全体の獲得アウトである。
このためRFは式をまとめると「個人のアウト/チームのアウト」と表現されチーム内でのアウトのシェアを示すだけになっている。
これはチーム単位でRFを取るとわかりやすくほとんど全てのチームが4前後の数値を記録する。
別の言い方をすると仮にチームが全員守備の名手でどんなに的確にアウトを取ろうと全員が守備下手でアウトを取る割合が低くてもチームRFの値は変わらない。
1試合(27個アウトを取るまで)にヒットを5本に抑えるチームでも15本打たれるチームでもどこかしらでアウトを取り試合が成立している以上誰かしらがアウトを取っている以上チームRFに大きな変化はないのだ。
このためRFの値はチーム内でのアウトのシェアをどれだけ取っているかを示すだけで安打を防ぎアウトにするという役割をどれだけ遂行できたかを示すことは出来ていない。
また
・奪三振率が低いチームほど守備機会が増えやすい
・投手の利き手によって打球方向に差が出る
・ゴロとフライの比率が異なれば内野手と外野手とで守備機会に差が出る
・チーム全体の守備力による影響を受ける
と言った問題がある。
そもそもが打率もそうだが基本的に何かしらの成功率を測るにはヒットを打数で割るように成功したことをその試行数で割る必要がある。
打率、出塁率が代表的だが長打率やwOBAも重み付けをされた成功例をその試行数で割るという点では共通している。
RFはその点ヒットを防いでアウトに取ったという成功例をその成功例(アウト)だけで割ってしまっており試行数が分母になっていない。
ざっくり例えるなら個人のヒット数をチームのヒット数で割るようなものでチームでのヒットのシェアを知ることは出来てもその打者が優れているかはわからないのと同じである。
個人のヒットを打つ能力を知るには個人の機会数で割るのが間違いなくいいというのは納得いただけるだろう。
同じように守備評価として実用化するには取ったアウトの数をその選手に向かって飛んできた打球の数で割り獲得アウト率を算出し他の選手と比較するなどの行為が必要になる。
UZRなどはこれに近い処理を行っている。
・RPW / Runs Per Win (単位得点)
チームの勝利をひとつ増やすのに値する得点数、または失点数のこと。
一般的にはRPWは10であり、それはすなわち得点が10点増えれば(あるいは失点が10点減れば)チーム勝利が1つ増えるという「得点数と勝利数の間の対応関係」があることを意味する。
ただし年度やリーグごとに平均得点数が異なり、得点の多いリーグでは1得点あたりの勝利への影響度が下がるため、常に「10点で1勝」と考えるのは適切ではない。
そこでピート・パーマー(Pete Palmer)は得点環境に対してRPWを計算する式を開発している。パーマーの計算式はイニングあたりの両チームの得点の平方根をとり10倍するというもの。
もちろん他にもRPWを求める式はある。
これに習って計算すると2018年のセ・リーグはRPWはちょうど10前後だったが2024年は8.5点を切っている。
仮に打撃で42点プラスを作る選手がいたとしても2018年では増やした勝利数は4.2勝に対し2024年では5勝とそれなりに差が生じることがわかる。
MLBでは基本的に環境が安定しているためRPWは10で計算してよいがNPBでは環境が不安定なためWARを計算する際は意識しておくといいだろう。
《計算式》
RPW=10*SQRT{(得点+失点)/ イニング}
RPW=9*(得点 / 投球回数)*1.5 + 3
RPWがわかれば得失点差から貯金数を割り出すことができるので期待勝利数も計算できる。
《RPWから期待勝利数を計算する式》
期待勝利数=(得点-失点)/ RPW+(勝利+敗北)/ 2
ちなみに投手は自身の投球能力によって動的にRPWを動かすことが可能なので正確に計算する場合は投手ごとのRPWを計算する必要がある。
意味としては好投手相手だと1点の価値が高いよね、という話だ。
このRPWは動的RPWと呼ぶ。
式は以下の通り
動的RPW=(([(18 – IP/G)*(リーグFIP)] + [(IP/G)*pFIP]) / 18 + 2 )*1.5
一見するとよくわからないかもしれないが後ろの「+2)*1.5」は上述のRPWの式の「*1.5 + 3」の部分と全く同じ。
18は普通の1試合で投手が投げるイニングのことである。
「(([(18 – 平均投球回)*リーグFIP] + [平均投球回*投手FIP]) / 18」はその投手が投げた際の「得点 / 投球回数」を加重平均して算出しているだけである。
例えばリーグFIPが3.50、ピッチャーの平均投球回が6.00回でFIPが1.00とする。
このとき得点数は
(18-6.00)*3.50 + 6.00*1.00 = 48
これを18で割ると 2.67と算出される。
この数値に1.5を掛け3を足すと7という数値が出てくる。
これがこの投手が投げる際のRPWである。
実はこの数値2023年の佐々木朗希選手の成績が元になっている。
本来の彼は平均投球回6.07回、FIP0.92だったので少し近似しているが彼が投げる際の得点環境がいかに異次元なものになっているか、伝わっていると嬉しい。
もちろん上記の比較対象の指標はFIPでなくxFIPでもtRAでもSIERAでもいい。
2023年の佐々木朗希選手のtRAは0.82だったので厳密に計算するとRPWは6.89。
DeltaはWARの計算時こういった動的なRPWを用いていないのでWARは4.3となっているがこの動的RPWを使用するとWARは5.5。
多くの投手にとって関係ないが彼ほどスペシャルな投球をしたときは反映すると効果が大きい。
・RRF / Relative Range Factor (相対アウト寄与率)
RFの
・奪三振率が低いチームほど守備機会が増えやすい
・投手の利き手によって打球方向に差が出る
・ゴロとフライの比率が異なれば内野手と外野手とで守備機会に差が出る
・チーム全体の守備力による影響を受ける
などといった弱点を補正し改良した指標。(内野手において刺殺を含めてしまっているが)
同じ守備位置のリーグ平均の選手に比べて何倍の能率でアウトを奪ったか、またリーグ平均の選手が同じ分出場するのに比べていくつ多くアウトを奪ったか(=Plus Plays)という数字にして出力される。
「相対」なのでリーグ平均と比べ優れているかで判断され1を超えれば守備力に優れ1より低いと守備力が低いと判断される。
・奪三振率が低いチームほど守備機会が増えやすい
・ゴロとフライの比率が異なれば内野手と外野手とで守備機会に差が出る
・チーム全体の守備力による影響を受ける
というのはある程度納得できるとして補正部分として気になるのが
・投手の利き手によって打球方向に差が出る
という部分だ。
これは本当なのだろうか?
によると
・まず投手の利き手によって右打者との対戦数が変化する、左投手だと右打者増える
・打者のゴロは概ね引っ張り:センター:逆方向が5:3:2の割合で起こる
・このため左投手が多く投げるほど右打者が増え右方向への打球が減る
・この関係は打者の左右より投手の左右による相関のほうが大きい
とされている。
これは2013~2014年のデータではあるが実際に2023年のデータを見ると
投手の利き手による対戦打者の変化は総投球数だと
という形でプラトーン起用されている。
また打者のゴロは概ね引っ張り:センター:逆方向が45:40:15の割合で起こり打球方向の割合も大きな変化はない。
このことから利き手によって補正をかけるのは多くの時代において有効だと言える。
ちなみにフライは打球方向の割合が引っ張り:センター:逆方向=25:40:35と逆の関係になる。
そのため以下のような関係が2014年には示されている。
・右打者のゴロは引っ張った左方向が多く、フライは流した右方向が多い
・左打者のゴロは引っ張った右方向が多く、フライは流した左方向が多い
というのは野球トリビアとして面白いかもしれない。
さて、話をRRFに戻そう。
ここまで各補正の話をしてきたがここからは実際にRRFについて計算をしてみる。
上記のような諸々の補正を除くとRRFの計算式は
《計算式》
RRF計算法(遊撃手)
= (補殺+刺殺)/(期待補殺+期待刺殺)*チームDER/リーグDER
期待補殺
=リーグ遊撃手補殺/(リーグ補殺-リーグ外野手補殺-リーグ捕手補殺)*(チーム補殺-チーム外野手補殺-チーム捕手補殺)
=リーグ遊撃手補殺/リーグ内野補殺*チーム内野補殺(内野は捕手を除く内野)
期待刺殺
=リーグ遊撃手刺殺/(リーグ刺殺-リーグ三進-リーグ外野手刺殺-リーグ遊撃手補殺-リーグ三塁手補殺)*(チーム刺殺-チーム三進-チーム外野手刺殺-チーム遊撃手補殺-チーム三塁手補殺)
=リーグ遊撃手刺殺/リーグ内野刺殺*チーム内野刺殺
となっている。
それぞれで何をやっているか見ていくと
「(補殺+刺殺)/(期待補殺+期待刺殺)」の項ではリーグ平均の選手が同じチームで同じぐらい守ったときと比べと比べて「補殺+刺殺」が多いかどうかを表している。
当然ここが1以上なら期待されるより取ったアウトの数が多いことを示す。
その後「チームDER/リーグDER」を行いチームの守備力による補正を行っている。
これはチームDERが高いほど評価が高まることを示している。
なぜこのような処理をするのか?
それはRFが抱えていたチームの守備力によって選手個人が獲得できるアウトの数が変わってしまうという問題、加えてヒットを許しても評価が下がらない問題を解決するためだ。
例えばとある草野球で遊撃手2名の(補殺+刺殺)/(期待補殺+期待刺殺)が1.2と0.9だったとしよう。
これは直接比較すると前者のほうが優秀であるように見える。
しかし仮に前者のチームは他の選手の年齢が高く若いこの遊撃手が打球をさばく機会が多いとすると数値は高くなってしまう。
逆に後者が仮に大学生などが中心で他の選手もよく動けた場合この遊撃手は能力が変わらなくとも取れるアウトの数が減ってしまう。
もし平均DERが0.700のとき
前者のチームDERが.600、後者のチームDERが.800の場合はどちらもRRFは1.03と同じ数値になる。
チーム守備力が高いとき実際の守備能力に変化がないにも関わらず獲得アウトの数が減るという問題をDERで解決しているのだ。
またヒットを許した場合DERが下がるため守備が許した出塁という観点についても考慮に加えることに成功している。
実際には計算式のように遊撃手、引いては内野手のRRFを測る場合内野のDER同士で比較するほうが望ましいがそこは内外野で一致すると仮定していると思われる。
この手法はやや強引ではあるが仕方のないところ。
また他に特徴的な点として期待補殺及び期待刺殺がリーグ内野を対象に計算されている点だ。
内野手の中での打球占有率を計算していると言ってもいい。
このように計算することでRFがすべての守備者を対象にしているのに対し比較対象を内野に限定している。
これらの処理によりRFにあった欠点を
・守備が許した出塁の考慮
・比較の対象を内野に絞っている
・投手の左右による打球分布の補正
などによってある程度克服している。
とはいえこのままではわかりにくいので実例を踏まえて考えてみる(参考:https://ranzankeikoku.blog.fc2.com/blog-entry-2103.html)。
ここでは2018年の源田壮亮選手を対象としよう。
刺殺は内野手の場合捕球をした際に記録されることが多く内野手においては含めることは不適切と考えられるケースが多いのでここでは含めない。
対して捕殺はゴロを処理し塁に送球した際に記録されるため捕殺数が多いことは即ち内野ゴロを多く処理したと解釈される。
ゴロを多く処理したということは多くのアウトを獲得したということと同義でありチームの失点減に貢献したということを意味する。
このため捕殺をここからは見ていく。
2018年の源田選手はフルイニング1277.1イニングを守り526個の捕殺を記録した。
期待捕殺=リーグ遊撃手補殺/リーグ内野補殺*チーム内野補殺
である。
リーグ遊撃手捕殺は2633、リーグ内野捕殺は7221、チーム内野捕殺は1307であるため
期待捕殺=476.6
源田選手はフルイニング出場しているため期待捕殺も
476.6*100%=476.6 と変化しない。
DERは平均が.704、チームDERが.706なため源田選手のRRFは
RRF(補正なし)≒1.11
左投手が平均より300回多く投げると遊撃手の捕殺は12回増えるとされる(※)。
2018年の平均左投手獲得アウト率は32.7%で2018年の西武ライオンズでは280.2回が平均であるのに対し実際にライオンズでの左投手獲得アウトは431回と150回ほど多い。
このため源田選手の捕殺は6回かさ増しされているため期待捕殺に6をプラスして
RRF(補正あり)=1.09
となる。
また源田選手が期待値より多く稼いだ捕殺の数は43.4個と推定される。
内野手のゴロアウトの価値(単打の価値-アウトの価値)は0.7点ほどとされているため
43.4*0.7=30.3点を源田選手は失点を多く防いでいると算出される。
実際のRngRは22点ほどなためやや過大に評価されているかもしれないがそれなり説明はついていると言えるだろう。
※https://ranzankeikoku.blog.fc2.com/blog-entry-2026.html
・RSAA / Runs Saved Above Average (平均比較失点抑止)
同じイニング数を平均的な投手が投げる場合に比べてどれだけ失点を防いだかを示す指標。
例を出そう。
ある投手が100イニングを30失点で投げきったとする。
このときイニングあたりの失点のリーグ平均が0.4であれば100イニングに通常見込まれる失点は40である。
40 – 30 = 10
でその投手は平均より失点を10点少なく抑えたことになりそれがまさにRSAAの値となる。
失点率がリーグ平均より悪い投手はマイナスの値となる。
RSAAの計算を失点率ではなく防御率で行うとPitching Runsという指標になる。
これらは平均と比較して単位が点の数値を出すという点で同じであるwRAA、RCAA、XR+などの投手版とも言える。
注意点として失点率は野手の守備力にも依存する数字だ。
ゆえに投手に関して守備から独立した評価を重視する現代のセイバーメトリクスにおいてRSAAが用いられる場面は非常に少ない。
というか見ることがない。
《計算式》
RSAA = (リーグ失点率-失点率)/ 9*投球回
ただしこの比較する指標を失点率ではなくFIPなどにしても計算方法は全く同じである。(スケールが失点率に合わされているから)
なので計算式の構造を知る、という意味では知っておいて損はないだろう。
・Run Created (得点創出)
打者が創出した総得点。
RCが100ならその打者が100得点を生み出したということでありチームRCはチーム総得点と近似する。
打席数が多いほどRCを稼ぐ機会に恵まれている(ヒットや本塁打を打つ機会が多いので当然)ので選手同士で比較したい場合はRCを打席数などで割る必要がある。
計算式は
RC = {(A+2.4×C)×(B+3×C)÷(9×C)}-0.9×C
A = 安打+四球+死球-盗塁死-併殺打
B = 塁打+{0.24×(四球-故意四球+死球)}+0.62×盗塁+{0.5×(犠打+犠飛)}-0.03×三振
C = 打数+四球+死球+犠打+犠飛
と恐らく初見では意味が不明だと思う。
筆者もあまり理解が出来ていないが
落ち着いてみると
A=出塁
B=進塁
C=機会
となっていることに気づく。
得点というのはざっくり
出塁率*生還率で打席あたりの得点を求め最後に打席をかけることで創出することができる。
そして生還率と長打率は近似的な関係にある。生還率を進塁率と読み替えて
出塁/機会(出塁率)*進塁/機会(長打率)*機会=得点となることがわかる。
つまりA*B/Cが基本的なRCの構造となる。
興味ある方は出塁率*長打率*打席をしてみるといいだろう。
上記の式はそれを発展させたもので
「対象の打者+8人の平均的な打者」で組んだときの打線が創出する得点を算出した後に
「8人の平均的な打者が作る得点」を引く
というものになっている。
これは対象の打者だけで打線を組むという風にしてしまうと同じ打者9人で打線を組むという現実的にあり得ない状況になるため。
上記のA*Bで説明されているようにRCはざっくり出塁率と長打率のかけ合わせだ。
ゆえにRCは出塁率や長打率が向上するほど相乗的に点が取れるようになる。
仮に出塁率1.000の打者がいたとして計算すると9人その打者を並べたとき無限に点を取ることになる。
実際のところそんな状況はない。
打者の影響はおおよそ1/9に過ぎず攻撃はどこかで終わる。
このような過大評価を防ぐため一見するとよくわからない数値が代入されている。
ひとつひとつの項を説明すると
「A+2.4C」は対象打者の出塁能力+0.3C(平均的な打者の出塁能力)*8(人)
「B+3C」は対象打者の進塁能力+0.375C(平均的な打者の進塁能力)*8(人)
「9C」は機会数C*9人
「0.9C」は平均的な打者8人の得点創出が0.3*0.375*8=0.9で表すことができる。
つまり対象打者が1機会あるごとに0.9点が他の8人の打者によって創出されることを示す
と言える。
「得点は出塁と進塁の掛け算で表すことができる」
という原則を体現したかのような指標。
原理的で補正もされたいわゆる「いい指標」ではあるがwOBAやBsRといった優秀な後輩が生まれ出番はもうほとんどない。
原理的な説明の生き字引としての役割はある、いわゆる兼任コーチのような存在という印象。
晩年の中嶋聡監督のような存在。
・Run Expectancy(得点期待値)
特定のアウトカウント・走者状況からそのイニングが終了するまでに平均的に何得点が見込まれるかを表す数値。
アウトカウントは
無死・一死・二死の3種類、
走者状況は無走者・一塁・二塁・三塁・一二塁・一三塁・二三塁・満塁の8種類
よって組み合わせは3×8=24種類存在する。
その24種類について得点期待値を算出してまとめたものは得点期待値表と呼ばれる。
2022~2024年のNPBの得点期待値表は以下。
出典:https://1point02.jp/op/gnav/basis/runs_probability_o.aspx?cp=101(アクセス日:14/9/2024)
集計の対象となるリーグや年度によって数値は異なり例えば2013~2015年は無死走者なしの状態で0.440だった。
昨今の打低環境により期待値が下がっていることがわかる。
また無死走者なしの状態の期待値に9をかけるとざっくり平均得点がわかる(基本的に9回攻撃があるため)。
2013~2015年は3.96点、2022~2024年は3.42点となりざっくり近似される。
アウトカウント・走者状況や点数に変動をもたらすグラウンド上の事象であれば状況の変化を得点期待値表にあてはめることができ
「その事象が起きる前の状況における得点期待値」
「その事象が起きた後の状況における得点期待値」
を比較することでその事象が得点(失点)の増減においてどれだけの影響があるかを定量的に計測することができる。
例えば上記の得点期待値表に置いて無死走者なし(得点期待値0.379)からヒットなり四球なりで無死一塁となったとする。
このとき
「その事象が起きる前の状況における得点期待値」は0.379
「その事象が起きた後の状況における得点期待値」は0.720
となるのでそのヒットや四球の価値は.341得点見込みを高めたと言える。
これは盗塁やバント、敬遠などにも適用でき様々な指標などの基軸になるなど広い応用範囲がある。
この値はあくまで平均値であり例えば大谷翔平選手のような打者なら期待値はもっと高いし投手が打席に立てば期待値は低くなる。
ちなみにこの得点期待値は打低の環境であればあるほど本塁打の価値が相対的に高くなる。
これは他の事象が後のイベントの影響を受けるのに対し後のイベント関係なく本塁打は強制的に1点を取ることができるからだ。
これは極めて打低の環境を考えるとわかりやすい。
仮に平均打率が.010の環境では仮に単打で出塁したとしても次の打者が打つ確率は極めて低く得点には繋がりにくい。
対して本塁打であれば必ず1点を取ることが可能だ。
実際に2019年と2024年のNPBの環境を比較すると
単打.444→.410
本塁打1.412→1.413
と単打は約7.7%価値が減少した。
これは後続が打てないため単打では得点に繋がりにくいことを指す。
これに対し本塁打は価値はほぼ変動していない。
野球の事象における本塁打の特異性が浮かび上がる。
また本塁打は極端だが長打は得点に直結しやすい(後続の打撃に依存する部分が減る)ため上述の通り2019年と2024年で比較すると
2塁打 0.755→0.730 (-3.3%)
3塁打 1.147→1.131 (-1.4%)
と相対的に得点価値の減少量は小さい。
データは18/9/2024参照
https://1point02.jp/op/gnav/basis/runs_worth.aspx?cp=101
S~
・Sabermetrics(セイバーメトリクス)
ビル・ジェイムズ(Bill James)という人物によって提唱された、野球についての客観的な知見の探求のこと。
セイバーというのはアメリカ野球学会を意味するSABR(Sociaty for American Baseball Research)から取られている。
勘違いされがちだが指標そのものはセイバーメトリクスではなくあくまで客観的な知見の探求がセイバーメトリクスだと私は解釈している。
なのでOPSやUZR、WARはあくまで一つの表現に過ぎず
・バント有効性の検証
・投手の投球数と怪我のリスクの関係
・応援と勝率の関係
なんなら
・野球をするとモテるのか
・野球の歴史
などもセイバーメトリクスの一つであり数値的な検証だけでなく心理的な検証などもセイバーメトリクスの一部と考えている。
現代ではチームの運営にも活用されているがそれはセイバーメトリクスの一端に過ぎない。
・SIERA / Skill-interactive Earned Run Average (シエラ/相互防御率)
DIPSの一種。
守備の関与しない与四球率・奪三振率にゴロ率とフライ率を加えて計算している。
他のDIPSと異なり%で計算するのもやや特異。
相互作用とある通り与四球率・奪三振率、ゴロ率とフライ率それぞれの直接的な影響だけでなく
与四球率が与四球率・奪三振率、ゴロ・フライ率に
奪三振率が奪三振率・与四球率、ゴロ・フライ率に
ゴロ・フライ率がゴロ・フライ率、与四球率と奪三振率に
与える影響について計算している。
つまり3+3C2の9つの項目から計算している。
実際には奪三振率と与四球率、及び与四球率の2乗項はあまり意味をなさなかったので外されている。
《計算式》
6.145 – 16.986 (SO/PA) + 11.434 (BB/PA) – 1.858 ((GB-FB-PU)/PA) + 7.653 ((SO/PA)^2) +/- 6.664 (((GB-FB- PU)/PA)^2) + 10.130 (SO/PA) ((GB-FB-PU)/PA) – 5.195 (BB/PA)*((GB-FB-PU)/PA)
計算式は正直グチャグチャだが使われている項は割と単純で
SO/PAとBB/PA、(GB-FB-PU)/PAに様々な数値がついて計算される。
ここでのPUとはポップアップ、つまりは内野フライのことを指す。
ここからはSO/PAをK%、BB/PAをBB%、GB-FB-PU)/PAをGB-FB%と表記する
6.145 – 16.986*K% + 11.434 *BB% – 1.858*GB-FB% + 7.653 ((K%)^2) +/- 6.664 (((GB-FB%)^2) + 10.130 (K%) ((GB-FB%) – 5.195 (BB%)*((GB-FB%)
これでもまだわかりにくいので次にプラスの項とマイナスの項にわける。
・プラス
+ 11.434 *BB%
+ 7.653 ((K%)^2)
+ 10.130 (K%) ((GB-FB%)
・マイナス
– 16.986*K%
– 1.858*GB-FB%
– 5.195 (BB%)*((GB-FB%)
・どちらでもない
+/- 6.664 (((GB-FB%)^2)
はGB-FB%が正のときマイナスとなり負のときプラスになる。
一つ一つ確認してみよう。
これを見ると簡単に納得できる部分としては
+ 11.434 *BB%、 – 16.986*K%、- 1.858*GB-FB%
で四球は多いほど失点は増えるし三振は多いほど失点は減る。
またゴロが多いほど被打球の得点価値は低いのでゴロが多いほど失点は減る。
ということを表しておりその係数もK%やBB%よりも小さい。
また
+/- 6.664 (((GB-FB%)^2)
も変則だがゴロ率のほうが高いとマイナスになりフライ率のほうが高いとプラスになるためゴロが多いほど失点は減るということを示しており納得ができる。
次に
– 5.195 (BB%)*((GB-FB%)
はゴロを打たせる投手ならば四球が多いほうがその恩恵が大きく失点が減る
ということを示している。
なぜならば四球は1塁にランナーが進むためゴロが多い投手ほど併殺打の可能性が上がるためである。
ライオンズファンならイマイズム(※)という言葉で納得ができるだろう。
続いて
+ 10.130 (K%) ((GB-FB%)
は三振が多い投手ほどヒットを許す機会も減りゴロを打たせても併殺で打ち取る機会が少なくなり効果が薄れることを示唆している。
最後に
+ 7.653 ((K%)^2)
には人によっては違和感を覚える人もいるかも知れない。
というのもこれはK%が上がるほど失点が増えることを指しているからだ。
ただこれは言い方の問題で「三振を取れば取るほど三振による失点抑止効果が薄まる」といったほうが正しいだろう。
三振はピンチの場面でこそ価値が高くなるが三振が多いほどそのピンチが少なくなるため正(つまり失点増加)の方向に向かうのだ。
実際にはK%の2乗なので値としては小さく影響も比較的軽微である。
各項目の数値に関しては回帰的に出しているだけなので説明はしない(しようがない)。
SIERAを振り返ると加算的な場所もありながら乗算もしているという点が際立つところである。
つまり加算モデルと乗算モデルの合体と言える。
投手版のBsRと言えるかもしれない。
野球は同じプレイでも状況によって大きく価値が異なるがこのSIERAは三振率とゴロ-フライ率などとを「相互作用」させることでその状況の変化に対応をしている。
また年間度相関が高いK%、BB%、GB%、FB%(PU%)のみを使っているのもポイントで翌年の防御率を推定するのに高い能力を発揮する。
※2ではGBkwERAやxFIPなどの各種DIPSで翌年の防御率とのR2値がトップだった。
このように有用に見えるSIERAだが実のところ翌年の防御率の推定にしろ既存で簡単に計算できるFIPなどより明確な強みがあるとはいい難い。
上述の最も高いR2値といっても0.158と正直微妙な数値。
また記述的要素も薄くWARに使用される例も見たことがない(私は計算しているが)。
そして何より計算が煩雑である。
ここまで見てもらえばわかるが係数は大きく7つも(切片も含めれば8つも)の項がありなおかつそれらが回帰的な数値で数値自体に意味を見出すことが難しい。
また相互作用が1番のウリかのようにここまで解説したし実際にそうなのだがそういった相互作用を抜きにした
K%とBB%、GB-FB%のみで計算してもその有用性はほとんど変化がない
とも報告されており
「The world doesn’t need even one SIERA」
「SIERAのような存在は、この世に一つも要らない」
とまで言われてしまっている。
個人的には煩雑とは言え多少の成果もあるし今どき計算は割と容易にできるのだからそこまで言わなくても…。
と思う。
※イマイズムとは…2024年現在西武ライオンズ所属今井達也選手が四球を出した後に併殺打を記録すること
※2 https://tht.fangraphs.com/kwera-the-starting-point-for-pitcher-evaluations/
参考
https://legacy.baseballprospectus.com/glossary/index.php?search=SIERA
のPart1~5及び「Manufactured Runs: Lost in the SIERA Madre」を参照
・Slugging Average(長打率)
《計算式》
長打率=塁打÷打数
1打数当たり平均していくつの塁打を得たかを表す指標。
長打を打った割合を示す指標ではない。
塁打は
「単打+二塁打*2+三塁打*3+本塁打*4」で計算され打者が進む塁の数で加重した安打数と言える。
安打がすべて単打の場合長打率=打率となる。
「塁打期待値」と表現しても間違いではない。
意外とじっくりと見ると特筆して語るところがない指標。
得点相関が出塁率よりも高く野球の本質を表している指標の一つと言ってもいいかもしれない。
ちなみに長打が多いほど残塁は減ると考える人もいるかも知れないが残塁数と長打率の相関はほぼ0。
残塁を減らす効果はない。
T~
・tRA(全分配防御率)
守備の関与しない与四球・奪三振・被本塁打という(名目の)3つの項目(FIP)に加え、どのような種類の打球を打たれたかまで投手の責任範囲として、守備から独立した失点率を推定・評価する指標。
もちろんDIPSの一種。
投手を守備から独立して評価するという点についてはFIPと同一。
違いは打球の種類にまで踏み込んで、より詳細に投手の失点阻止パフォーマンスを評価している点にある。
例えばFIPではゴロが多く外野フライが少ないリスクの低い投手を評価しきれないがtRAならきちんと評価できる。
FIPでは
被本塁打
奪三振
四死球
BIP
という配分だったのをBIPをさらに細分化し
外野フライ
ライナー
内野フライ
ゴロ
を組み込んでいる。
それぞれの事象の失点・アウト期待値は表の通り。
各事象の失点期待値を用いて失点の期待値を算出するのはFIPと同じ。
だが守備の関与するイニングを使っていたFIPと異なりtRAではアウト期待値を用いることでその欠点を克服している。
tRAの計算方法は普通の失点率の計算が
失点率 = 9*失点 / イニング(=アウト数/3)
であるのに対しその失点とイニング(アウトの数)を期待値により計算し守備から独立して推測する。
《計算式》
tRA = 9*「守備から独立した失点」/ 期待イニング(=守備から独立したアウト数/3)
= 27*「守備から独立した失点」/ 「守備から独立したアウト数」
守備から独立した失点 =
0.297*四球+0.327*死球-0.108*奪三振+1.401*被本塁打
+0.036*ゴロ-0.124*内野フライ+0.132*外野フライ+0.289*ライナー
守備から独立したアウト数 =
奪三振+0.745*ゴロ+0.304*ライナー+0.994*内野フライ+0.675*外野フライ
最後に定数Cを加えて計算完了である。
定数Cはリーグ平均失点率からリーグ全体のtRAを引いた数値でリーグtRAとリーグ失点率は一致する。
ちなみに計算式をよくよく見た人で気付いた人はいないだろうか。
実はtRAの失点期待値とよく知られている期待値の値が異なるのだ。
例えば三振は得点期待値上では-0.250前後の値だが失点期待値では-0.108ほどと値が大きく異なる。
これらの関係をまとめたのが以下の図である。
失点期待値と得点期待値を取った年が異なるので厳密には対応はしないのだがご容赦を。
2020年の得点期待値を参照している(https://1point02.jp/op/gnav/basis/runs_worth.aspx?cp=101)。
これを見ると本塁打・四球・死球・ライナーはほとんど期待値の変化はないが三振~外野フライで大きな変化が起きていることがわかる。
簡単に調べる限りではこの点について解説している記事が見つからなかったので推測になってしまうが
このような大きな数値の変化が起きる要因は恐らく
「tRAの失点期待値の基準がアウトごとに入る得点」
に基準に置かれているためだ。
具体的に計算してみよう。(ここからは上記の得点期待値を用いる)
まずtRAを「平均からの失点の多寡」+「平均失点」で構築されているとする。
この場合はFIP等と同じく「平均からの失点の多寡」は得点期待値で計算する事ができる。
つまり
守備から独立した「平均からの失点の多寡」 =
0.298*四球+0.328*死球-0.258*奪三振+1.419*被本塁打
-0.073*ゴロ-0.268*内野フライ+0.010*外野フライ+0.299*ライナー
である。
守備から独立した「平均からの失点の多寡」を守備から独立したアウトの数で割ることで守備から独立したアウト毎の守備から独立した「平均からの失点の多寡」がわかる。
守備から独立したアウトの数の計算方法は少し補正して
奪三振+0.730*ゴロ+0.250*ライナー+0.990*内野フライ+0.710*外野フライ
とする。
対して「平均失点」はどのように計算されるだろうか。
平均失点は基本的に9イニングごとの失点期待値を表している。
つまり27アウト毎の失点期待値を表しているとも言える。
1つのアウト毎の失点を算出すると以下のようになる。
「平均失点」= 失点 / (イニング*3)
これは実数値で今回はおよそ0.159である。
つまりtRAは
(
(0.298*四球+0.328*死球-0.258*奪三振+1.419*被本塁打
-0.073*ゴロ-0.268*内野フライ+0.010*外野フライ+0.299*ライナー)
/ (奪三振+0.730*ゴロ+0.250*ライナー+0.990*内野フライ+0.710*外野フライ)
+平均失点
) *27
で表すことができる。
この平均失点に0.159を代入し分母を「奪三振+0.730*ゴロ+0.250*ライナー+0.990*内野フライ+0.710*外野フライ」に揃えると
tRA = (
( (0.298+0.159*0.000)*四球
+(0.328+0.159*0.000)*死球
ー(0.258+0.159*1.000)*奪三振
+(1.419+0.159*0.000)*被本塁打
ー(0.073+0.159*0.730)*ゴロ
ー(0.268+0.159*0.990)*内野フライ
+(0.010+0.159*0.710)*外野フライ
+(0.299+0.159*0.250)*ライナー)
/ (奪三振+0.730*ゴロ+0.250*ライナー+0.990*内野フライ+0.710*外野フライ)
) *27
計算を進めて
tRA = (
0.298*四球
+0.328*死球
ー0.099*奪三振
+1.419*被本塁打
+0.043*ゴロ
ー0.111*内野フライ
+0.123*外野フライ
+0.339*ライナー)
/ (奪三振+0.730*ゴロ+0.250*ライナー+0.990*内野フライ+0.710*外野フライ)
) *27
となり失点期待値と近い値が出てきた。
これが恐らく失点期待値と言われるものとなっている。
このような導出過程のためtRAは各係数が適切に配分されていれば本来定数Cによる補正は必要がない(多分)。
仮に補正するとしても0に近い値を取るはずである。(その割にDeltaの定数Cは結構大きな値を取るが)
tRAはこのように起こり得るすべての事象を捉え各種事象に係数を与えている。
このためこの記事の翻訳では「全分配」と称している。
直訳するなら「真の防御率(失点率)」なのだろうがあくまで各種BIPを適切に係数をつけて計算しているだけで広義的な意味での「真」とは少し異なると私が考えているため。
もちろん真の防御率と訳してもいいだろう(というかそっちでいいです)。
全事象を捉えているためDIPSの中でも特に記述的な要素が強くDeltaではWARの計算にも用いられている。
ただ少し注意したいのが「安全な打球を打たせたかどうか」という結果的な働きは記述出来ているものの
「再現が期待できるかどうか」は全くの別問題であることだ。
特に外野フライやゴロはともかくライナーは年間度相関が低く投手では制御しきれないと考えられており翌年の防御率を測る精度はkwERAやxFIPに劣るケースがほとんど。
未来の選手の予想をするというよりはそのときの「結果を説明する」指標として扱ったほうがいいだろう。
U~
・UBR(走塁得点)
盗塁、盗塁死を除く走塁での貢献を得点化した指標。
リーグの平均的な走者と比べてどれだけ多く走塁で得点を生み出したかを表す。
安打の際の進塁、タッチアップなどが評価の対象となる。
例えば二死ランナー2塁の状況から単打でホームに突入して生還する確率が60%のとき100%成功する選手は
二死ランナー2塁の得点期待値は0.300(実は使わないがイメージのため)
二死ランナー1・3塁の得点期待値は0.450とし
ホームに生還に成功した際は二死ランナー1塁(得点期待値0.200)となるとすると
平均的な走者(生還確率60%)の走塁得点は0.6*(1+0.20-0.45)+0.4*(0.00-0.45) = 0.27点
走塁上手走者(生還確率100%)の走塁得点は1.0*(1+0.20-0.45)+0.0*(0.00-0.45) = 0.75点
※本塁突入に挑まなかった場合はランナー1・3塁になるため突入時との比較にはランナー1・3塁を用いる。
1回機会があるたびに0.48点ほど走塁上手な走者はUBRを記録するようになる。
UBRはアウトの状況、ランナーの状況、ヒットの位置がセンターなのかライトなのかなどにもよって成功率が異なる。
このため計算がやや大変である。
ちなみにFangraphではUBRもアップデートされ「XBR」というStatscastを用いたものに置き換わっている。
XBRは(あやふやな理解で申し訳ないが)UBRの正統進化という感じで状況別で成功率を出していたのをより詳細な状況に分けて算出するようになっている。
これらは対象者を守備者に変えれば守備指標「Arm」としての側面を持つ。
面白いことにこのUBRは脚の速さ(Sprint Speed)はほとんど影響がない。
モデルのR2値は0.001と逆に驚くほど。
https://baseball-analytica.com/posts/2024-05-24/introducing-runners-worth
日本の場合は(2020~2024年に規定到達した選手を対象としている)
関係ないこともないが強い相関ではなく技術や打球判断と言ったもの(あるいは三塁コーチャーの指示)が重要であることを暗に示唆している。
※Spdは擬似的に走者の脚の速さを数値化したもの。
また走塁の上手さと盗塁の上手さには何ら関係もない。
※wSBは盗塁による得点を示す
またこのグラフは縦軸がwSBで横軸がUBRなのだがこれを見ると明らかにUBRのほうが分散していることがわかる。
分散を棒グラフで表すと以下のようである。
多くの打者が~3~3の間で収まっているが3以上を記録する選手は明らかにUBRに多く9以上や-9以下を記録したのもUBRのみである。
このことからわかるように走塁能力に関しては盗塁にばかり目が行くが実際のところはUBRによる差が大きい。
脚が速いことで有名な周東選手だってキャリアで稼いだ得点はUBRで約20点に対しwSBでは約15点。
盗塁王を取りまくっている近本選手もUBRは35点に対しwSBは12点と大きな差が存在する。
秋山翔吾選手に至っては推定60点をUBRで稼いでいるのにもかかわらずwSBでは-6点とマイナスになっている。
明確な数値が出るため盗塁(wSB)に目が行きがちになるが実際にはいわゆる「記録に残らない」走塁のほうが大事なのだ。
実用を考えればこちらのほうを賞として表彰するのがいいだろう。
・UZR / Ultimate Zone Rating (守備得点)
同じ打球を同じ守備位置の平均的な野手が守る場合に比べてどれだけアウトを取れたかを計算し失点に直した守備指標。
打球の位置や種類ごとにサンプルを細分化した上で計算される。
最終的には打球の処理だけではなく様々な要素で評価される。
主に評価されるのは4(5)項目。
①守備範囲
RngRとも言われる。守備範囲により平均よりもアウトを獲得できたのかを算出する。
②肩
外野手と捕手が評価される。
正確には外野手はARM、捕手はrSBという項目で進塁をいかに抑止したかで算出される。
「抑止」であり実際に捕殺を記録する、または盗塁阻止をする必要はない。
内野手の肩の能力は守備範囲にある程度含有されている。
③併殺
DPR。内野手が併殺を完成させることで平均よりもアウトを獲得できたのかを算出する。
④エラー
ErrR。そのポジションの平均の選手と比較してエラーの多寡を比較する。
もちろん少ないほうがプラスの評価。
⑤フレーミング、ブロッキング
捕手の評価に使用される項目。ブロッキングはrPBと表記される。
フレーミングは平均と比べいかにストライクを多く稼いだか、ブロッキングはパスボールの多寡から計算する。
これら4項目の標準偏差を取ってみると(データはDelta2019~2023年の規定守備イニング到達者より)
1000イニングごとの標準偏差は
RngR(6.47)>ARM(3.25)>rSB(2.34)>ErrR(1.80)>DPR(1.13)>rPB(0.30)
と守備範囲、ついでに肩による差が大きい。
エラーは目立つため指摘されることが多いが実際のところは守備範囲や肩による抑止力のほうが差が開きやすい。
もちろん選択バイアスがかかっている可能性もあるのではっきりとは言わないがエラーするかどうかよりも他の選手なら取れたアウトをヒットにしてしまう守備範囲の狭さなどを見落とさないほうが大事と言えるかもしれない。
ちなみにフレーミングはデータ数が合わなかったので上記の比較からは除いたが2022年、2023年のデータを参照すると(https://1point02.jp/op/gnav/column/bs/column.aspx?cid=53880及びhttps://1point02.jp/op/gnav/column/bs/column.aspx?cid=53940)
標準偏差は7.79
RngRよりも大きな値を記録した。
またMLBでもフレーミングは大きな差を生むことが示唆されている。
捕手の守備能力では1番磨くべき箇所かもしれないがAI審判なので導入により必要のない技術になることを考えるとかなり難しい。
一旦ここで守備範囲得点、RngRの算出方法を見てみよう。
Deltaのサイトを参考にする。(https://1point02.jp/op/gnav/column/bs/column.aspx?cid=53002)
Deltaでは図のように22の打球方向に8個に分けられた各ゾーンでまずは分類する。
この分類はもちろん22*8で決まっているわけではない。
Deltaは10mを超える幅を取っているが1m単位で計測しても良い。
次に打球を属性別に分け、打球強度を決める。
ゴロ・フライそれぞれにSoft、Hardのようなタグ付けをするようなイメージだ。
例)
打球A ゴロ・Soft
打球B フライ・Hard
打球C …………
……………
打球それぞれにタグ付けが出来たら各ゾーンごとにタグ付けされた打球がヒットになった際の得点価値を求める。
この得点価値は外野に飛んだフライほど長打の可能性が高いため大きくなりやすい。
もちろんゾーンによるだろうがゴロやフライならば概ねは0.7~1.0ほどでフィールド上の打球は推移するだろう。
ちなみにファウルゾーンの打球をアウトにしても価値は低い。
これはアウトを取ることに失敗してもファウルでしかなく打球そのものの得点価値が低いためだ。
そもそもが球場によってファウルゾーンの大きさは異なるためDeltaでは計算に入れていないようだ。
こうした処理を行うことで飛んだ場所・打球の種類・強さからその打球が安打になった際の価値がわかった。
こうなればあとは比較的簡単。
通常の守備者が10%しか処理できないような打球を処理した場合10%を100%にした差分0.9を「平均的な守備者に比べ多く獲得したアウト(plus)」として記録する。
逆に処理できなかった場合0.1を「平均的な守備者に比べ獲得できなかったアウト(minus)」として記録する。
例えば平均的な処理率が70%、安打価値が0.7点の打球があったとしよう。
その責任打球を50球受けながら処理率90%の選手がいた場合、
この選手が
アウトにした打球は50*0.9=45 ヒットにした打球は50-45=5
plusなアウトは(1.0-0.7)*45=13.5
minusなアウトは(0.0-0.7)*5= 3.5
合算して13.5-3.5=10
即ち10個のアウトを多く獲得したと言える。
安打価値が0.7なため防いだ失点は
10*0.7=7
7点がこのゾーンでこの選手が防いだ失点と考えることができる。
そしてこういった処理をすべてのゾーンで行い合算してその選手の守備範囲得点(RngR)が求められる。
詳細に言うと責任打球という概念などもあるが(ただでさえ長い自称辞典が収集つかなくなるので)ここでは一旦省略する。
さて、ここまでRngRの求め方をざっくり見てきたがこうしてみると稀に見る
「素人が採点している」というコメントがいかに誤解なのかわかる。
確かに打球そのものの分類などは素人が判別しているかもしれないがその後の処理は機械的である。
決して「◯◯選手だから~」、「取れそうな打球だったから~」というような処理過程は経ていない。
あえて素人という目線で批判するとするなら「素人による打球処理が正しいのか疑問が残る」といったほうがいいと思っている。
まあ仮にズブの素人がやっていたとして大事なのは一定の評価基準が与えられていることなので大きな問題ではないと考えているが。
少なくとも上記のレベル程度には分類するぐらいには仕分け出来ていることは伺えるうえ失策などの公式記録も正式な調査員がやっているとは言え目視であることに変わりはない。
とはいえUZRも別に完璧な指標というわけではない(そもそも完璧な指標なんて存在しないし指標に限らず恐らくだが存在しない)。
算出する会社によって値が違うということは日常茶飯事だ。
例えばNPBではデータスタジアムとDeltaがUZRを算出しているが2023年の外崎選手のUZRはデータスタジアムが7.4点(※)、Deltaが3.7点だった。
これらの違いは上記の例であげたようなゾーンデータが2つの会社によって異なること、またUZRの平均の基準がリーグにあるか12球団全体であるかが原因だと思われる。
実際にDeltaは12球団全体で平均を設定しているが2023年のパ・リーグはセ・リーグのほうがUZRが高くハイレベルだったと推察される。
その分を補正すると外崎選手のUZRは+6.8点となりデータスタジアムの値と近くなる。
それでも多少ずれてしまう部分がゾーンデータの違いによるものだろう。
上記の例では平均処理率を70%としたが仮に別の会社が75%としていた場合選手本人の処理率が同じだったとしても防いだ失点は5.25点と変化する。
平均処理率を1年のデータにするのか複数年のデータにするのか、複数年のデータでもそのまま平均を取るのか加重するのか等によって変わってしまう。
予想になってしまうがおそらくはこういった処理の違いにより差が出てしまうと思われる。
シフトの考慮もされているのかは不明だ(少なくともDeltaではシフトのシの字もない)。
そういった問題点は今ではトラッキングデータを使用することで克服しようとしている。
純粋な選手自身の守備範囲を計測するなら今ではトラッキングデータから算出されたOAAという指標のほうが優れているとされる。
またUZRにもPFがあるとされている。
過去の研究では以下のように各ポジションごと各球団ごとにUZRが低く出やすいポジション、高く出やすいポジションがあることが示唆されている。
特に阪神のサード、つまり甲子園のサードは6.1点もの補正が入る(マイナスに評価されやすい)など大きな差が出ているポジションもあるなど無視できない。
パークファクターは年度ごとの変動も大きいので鵜呑みにはできない(特に日本ハムは本拠地を変えたので全く当てにならない)が「選手の守備力を測る」という目的においてはこういった要素があることは頭に入れておきたい。
つまるところUZRはあくまでどれだけ「平均と比べて」「アウトが取れたか」
を測る指標であり「守備の上手さ」を論じているわけではない(※)。
1球も打球が飛んでこないなら測定すらできない。
結果を表現する指標の代表格という印象だ。
UZRで+10点は10点失点を防いだ事実は示すが10点失点を防げる能力を保証しているわけではない。
ただ打率と似たようなもので打率.300は打率.300を打てる能力を保証しているのではなく.300打ったという事実を記述している。
当然打席数がなければ打率を記録することも不可能だ。
月間打率が.400超えていても年間でそれを維持できると考える人が少ないように短期間のUZRからその後のUZRについて何か情報を得ることは難しい。
同様にある年だけ不調に陥るということもありうる。(糸井・山田・丸・栗山・近藤選手などの名選手でもずっとハイアベレージが維持されるわけではない)
このような具合なので打率をあてにするならUZRも同じぐらいあてにしてもいいと思っている。
年間度相関は0.6を超えるなどそこそこの値を持っており(※2)、これは打率などよりも高い。
特にショートやセカンドといった守備機会が多いポジションは比較的少ない試合数でも数値が安定する傾向にある。
不完全な部分に目が行きがちだが現状特にNPBではUZRより信用できそうな守備指標は思いつかないしとりあえずデータが見れるのならばUZRから見ることを勧めたい。
投球指標も打撃指標も相対評価の中から最も確からしいものを使われている点は共通している。
※
正直それなりに守備に立てば打球の偏りなどはある程度回帰するし基本的に守備の上手さと考えて差し支えないと感じている。自身の印象とギャップが有ることによる認知的不協和の解消のために守備が上手いという曖昧な言葉が使用されているように感じてならない。
※2
<おまけ>
UZRが欠陥だと言っているスレがあったのでそこに書き込まれている文言にコメントをしていく。
>バイトが目視で判断している
→そうかもしれないが一定の評価基準を元に判断している以上当てにならないというのは極端な結論。スタットキャストのデータにするべきだとは思うが
>金払わないと見れない指標、一部の企業が独占していて信用できない
→その通り。この点は完全に同意する。
>球場補正がない
→その通りだがあくまで「どれだけアウトを取れたか」という点に関しては支障がない。「上手さ」を測るのなら確かにしたほうがいい。
>違う年違うポジションで比べてる、そもそもが相対評価
→その通り。少なくともどれだけ失点を防げたかは議論できても上手さの議論はできない。ただ現代で王貞治さんがいたとして活躍できるかはわからないが当時の55本塁打は尊重されるように数値自体は数値として扱いたい。
V~
W~
・WAR / Wins Above Replacement (控え選手比較勝利数)
選手の打撃・走塁・守備・投球における貢献度を総合的に評価し、勝利数という一元的な数値で表す指標。
現代セイバーメトリクスの局地と言える指標。
WARでの煽り合いが頻発するためWAR(戦争)と名付けたのはセンスがあるとかないとか。
評価は同じ出場機会分をリプレイスメント・レベルの選手が出場する場合に比べてどれだけチームの勝利を増やしたかという形で表される。
比較対象がここではリプレイスメント・レベルの選手だが別にリーグ平均と比較しても問題はない。
リーグ平均と比べる場合はWAA(Wins Above Average)という名前になる。
どっちにしろ基準によって0の境界は変わるためマイナスだからどうというのはあまり重要ではない。
その基準レベルの選手というだけで勝利に貢献しているとかしていないとかそういった話にはならない。
どちらかというと大事なのは「差」でWARが6の選手と3の選手では3勝分の違いがあるが2倍の能力差があるわけではない。
いくつかの計算方法はあるが一般的な計算方法は
「打撃評価+打撃代替水準対比価値
+守備評価+守備位置補正+守備代替水準対比価値
+走塁評価+走塁代替水準対比価値
+投球評価+投球代替水準対比価値」
となる。
計算に使われる指標は
打撃であればwOBA
守備であればUZR
走塁であればUBRとwSB
投球であればFIP
がよく使われているが最終的に単位が「点」の指標を足し合わせてRPWを通して「勝利」という単位にできればいいので選択肢は多い。
打撃ならRCを使用してもいいしXRを使ってもBsRを使用してもいい。
守備ならDRSやFRV、RRF
走塁はwGDP
投球はtRAやifFIP、SIERA、xFIP、なんなら失点率を使用しても一応問題はない(後ほど守備補正をする必要はあるが)。
wOBAなどが使われることが多いのはそれが現状最も確からしいからであって今後より確からしいものが見つかれば置き換わっていくことだろう。
さて計算方法について見ていこう。
「打撃評価+打撃代替水準対比価値
+守備評価+守備位置補正+守備代替水準対比価値
+走塁評価+走塁代替水準対比価値
+投球評価+投球代替水準対比価値」
で計算されると記述したが実際のところは「守備代替水準対比価値」と「走塁代替水準対比価値」は控え選手と大きな差がないと言われているため計算されることはない。
そのため
「打撃評価+打撃代替水準対比価値
+守備評価+守備位置補正
+走塁評価
+投球評価+投球代替水準対比価値」
というのが概ねの計算方法として一致している。
代替水準は打撃は得点力がおおよそ75~80%ほど、投球では120%ほど多く失点するぐらいとされることが多い。
先発と救援では先発のほうが難易度が高いため代替水準はおおよそ
先発:1.20*平均DIPS+0.30
救援:1.20*平均DIPS-0.55
と救援はよりレベルが高く設定される。(数値は大体の数値。指標によって変わる)
結果指標の詰め合わせという感じなので選手の価値を100%表す指標でもなければ将来の予想となることを目標とした指標でもない。
「代替水準の選手と比較して何勝増やしたか」を示すだけでそれ以上でもそれ以下でもないことに注意。
あくまでもひとつの目安として、また残した結果として受け取るといいように思う。
一見様々な指標が詰め合わさっているので複雑に見えるかもしれないがやっていることは
「長打があって打率も高くて遊撃手や捕手のような重要そうなポジションを守りつつ走塁と守備がうまくて相手打者を抑えることができる選手」
を評価しているだけである。
ようは我々が普段普通に考えている
・野球はおおよそ打撃・守備・走塁・投球に分けられる
・打率も高くて本塁打は打てたほうがいい
・ファーストよりも遊撃手のほうが希少
・より失点を防ぐ守備ができるといい
といった事象をシステマチックに誰でも検証が可能な形で数値にしているだけなのだ。
もちろん数値などに疑問はあるかもしれない。
ただ自分の知る限り真面目なセイバーメトリシャンはよりよい方法を常に模索している。
もしきちんと論理立てた主張であれば喜んで議論に乗ってくれるだろうから自分なりに考えてみるのもまた一興だろう。
少なくとも一度は自分の手を動かして計算してみることをおすすめしたい。
・WHIP (許イニング毎走者数)
イニングあたりにどれだけ走者を許したかを表す指標。
スポナビに標準搭載されており認知度が高い印象がある。
走者の引継ぎの問題などで先発に比べて防御率による評価がしにくい救援投手の評価に比較的有効という見方もある。
しかし被安打は野手の守備にも大きく左右され純粋な投手の働きを表す指標ではないと現代では考えられている。
そのため現代的なセイバーメトリクスにおいては指標としての有効性が強く疑問視されており、基本的には使う必要のない指標。
というかいわゆるちゃんとしたセイバーメトリシャンが使っている場面をネタ以外では見たことがないし自分は分析の範囲では使ったことがない。
《計算式》
WHIP = (被安打+与四球)/ 投球回
計算式を見るとわかるが被出塁を分子に取っているはずなのに死球は含まれていない。
死球は意図したものではないという話ならわからないことはないがそれなら被安打のほうが偶然性に富んでいる。
そういう意味であまり一貫性もあるとは感じない指標だ。
一応遊びとして使うことはできる。
WHIPは計算式に書いた通り分子に被出塁を取っており、分母はアウトの数を出している(アウト=投球回*3)。
このためWHIPは擬似的な被出塁率とみなすことが可能だ。
例えば
WHIP1.00は被出塁率.250 (=(1/(1+3)))
WHIP1.50は被出塁率.333 (=(1.5/(3+1.5)))
また被出塁率の2乗は1打者における失点と考えることができる。(※参照)
加えてWHIPがわかれば9回投げきるときの打者の数がわかる。
例)
WHIP1.00は4*9=36打者
WHIP1.50は4.5*9=40.5打者
ゆえにWHIPがわかれば被弾の多寡やLOB%の影響を無視した擬似的な失点率を割り出せる。
例えば
WHIP1.00は
被出塁率.250
9回投げきるのに36打者必要
ゆえに失点率は0.250^2*36=2.25
WHIP1.50の場合は被出塁率.333
9回投げきるのに40.5打者
ゆえに失点率は0.333^2*40.5=4.50
とざっくり推定することができる。
もうちょっと整理するとWHIPをXとしたとき
失点率 = 9*X^2 / (X+3)
WHIPが0のとき失点率は当然0である。
分子のWHIPの2乗があるためWHIPが大きいほど加速度的に失点が増えるという性質も持つ。
案外納得感の高い式にはなる。(意味はあまりないが)
投手の被出塁率と考えられるので上記のような式や勝敗を決める要素としても扱える可能性がある。
例えばAndrewは機械学習による2チームの対戦成績の予想に出塁率、ISO、WHIPなどを用いることで既存のモデルよりも高い精度で予想できるとしている。
セイバーメトリクス界隈では捨て置かれて久しいし機械学習もより適したもの(BB%と平均に回帰したDERを使用するなど)があるかもしれないが野球の本質の一つである出塁率を擬似的に表現しているのも相まって実はポテンシャルがあるのかもしれない。
※ https://baseballconcrete.web.fc2.com/alacarte/structure_of_runs_and_obp.html
※2 Y. C. Andrew, 2020, Forecasting Outcomes of Major League Baseball Games Using Machine Learning, 最終アクセス20/9/2024, https://fisher.wharton.upenn.edu/wp-content/uploads/2020/09/Thesis_Andrew-Cui.pdf
・wOBA(加重出塁率/得点力)
打者が打席あたりにどれだけチームの得点増に貢献する打撃をしているかを評価する指標。
代表的なデータサイトであるDelta、FanGraphsやBaseball Referenceで打者の評価に利用されている。
セイバーメトリクスの打撃評価指標としては最もポピュラーと言えるだろう。
LWTSの原理に基づいて各種の打撃結果に重みを与え打席数で割ることで計算される。
出塁の価値を全て均一とみなす出塁率と比べ各係数が統計的な根拠に基づいていた値によって「加重」されている。
加算モデルの筆頭とも言える。
このことからOPSよりも適切に打撃の価値を評価する。(得点との相関係数はOPSとさして変わらないが)
またOPSとの違いは原理的に正しいため分析ツールに適しているという点がある。
直訳では加重出塁率なのだが得点力とも訳しているのは野球の打撃における得点への影響が適切で得点能力を測ることに長けているからだ。
数字のスケールは出塁率に合うように設計されているため厳密には値は毎年リーグ環境によって変化する。
計算式では一般的な値を記述する。
《計算式》
wOBA = (0.7×(四球+死球)+0.9×単打+1.3×二塁打+1.6×三塁打+2.0×本塁打)÷(打数+四球+死球+犠飛)
この式の係数はすべて
(「事象の価値」ー「アウトの価値」)*「補正係数(wOBAscale)」
によって計算がされている。
例えば四死球なら四死球の価値はおよそ0.30点でアウトの価値は-0.30点なので
(0.30-(-0.30))*1.2=0.72
と算出される。(1.2がwOBAscale)
他の事象も同じで「事象の価値」の数値のみが変化することになる。
単打であれば(0.45-(-0.30))*1.2 = 0.90
という感じだ。
賢明な読者はお気づきかもしれないが「補正係数(wOBAscale)」というのは本質的には恐らく必要がない。
大事なのは事象の価値とアウトの価値であり補正係数は出塁率に合わせるためだけに使われている。
このため一部のセイバーメトリシャンからは嫌われている様子がある。(自分も好きではない)
しかもNPBにおいては打率と出塁率の比はおおよそ1:1.2~1.3でありwOBAscaleを掛ける前のほうがわかりやすい。
出塁率.400と言われるより打率.320と言われたほうが凄さがわかり易くないだろうか?
なので開発者がわざわざこのwOBAscaleを導入しなかった場合、名前は「wBA」だったかもしれない。
ではなぜこのような無駄とも思えるような処理をしているのだろうか?
これについては
「打率より出塁率のほうがより野球の本質を表しているから」というふうに考えられている。
実際に得点との相関は出塁率のほうが高いし出塁率から擬似的に得点能力を算出することができる。
このため出塁率にする意義は認めざる得ない、が正直計算の手間が増えて面倒くさい。
より本質的な処理をすることで直感的にも計算的にもわかりにくくなっている。
いい意味でも悪い意味でもセイバーメトリクスらしい存在だと思っている。
ただ活用できる場面もある。
出塁率にスケーリングされているため野球の得点を出塁率で表すことができるという特性と絡めて
1打席における生成得点は出塁率^2で近似できることから
選手が生成した得点を 打席*wOBA^2で表したり
チームの1試合の得点を wOBA^2*3*(1+wOBA)*9※ で表すことできる。
※wOBA^2が1打席ごとの得点、3*(1+wOBA)が1イニングあたりの打者数を指す。
ちなみにwOBAは計算するのが基本的には面倒だが出塁率と長打率がわかれば
出塁率*2+長打率を4でわることで「wOBAscaleを掛ける前のwOBA」が大体わかる。
こちらは前述したように打率のように扱える上その後の計算もしやすく便利である。
注意事項としてwOBA.300の打者とwOBA.400の打者を比べる際の解釈として
「wOBA.400の打者はwOBA.300の打者に比べ1.33倍」
というわけではない。
これはwOBAを作成するときに事象に「アウトの価値を引いている」ために発生する事象だ。
四球の価値はおよそ0.30点
単打の価値はおよそ0.45点
であり1.5倍の差があるがwOBAの係数にしたときは
四球が0.7
単打が0.9
となり1.3倍となり実際の得点価値が歪んでしまっているからだ。
wOBAは「差」を見る指標であり「比」で見る指標ではない。
参考 wRC+を探して
https://note.com/hegel3/n/ne7f5e5faa5b4
・wOBAscale (得点力出塁率化係数)
wOBAを出塁率に合わせるために掛け合わせる係数。
本来この係数を掛ける前に打者の得点能力の計算はできているので必ずやらなくてはならないものではない。
「野球の本質は出塁率」
という考えのために掛け合わされているがそれがゆえに元々しっかり計算できている得点力を歪めているという点があまり好みではない。
ちなみにこのwOBAscaleは基本的に1.15~1.25の間で推移し日本でも2018~2021年は1.23~1.26の間で安定していたものの最近は一変。
2022年に1.30を記録すると2023年は1.361、2024年に至っては1.39と右肩上がりで上昇している。
これほどまでに変動してしまうのは環境の変化を反映しており昨今話題となっている打低環境がその一端となっている。
というのもwOBAscaleは得点力を出塁率に合わせるための係数なのだが得点力と比較して出塁率は低下しにくい。
ここ6年の出塁率と得点力の推移は以下のようである。
得点力は総得点/総打席で計算し縦軸は基本的に最も数値が高い2019年を基準とし0.75倍したものが軸の中で最も下に収まるよう調節している。
これを見ると出塁率の低下に比べ得点力の低下が著しい。
2019年比だと出塁率は0.94倍であるのに対し得点力はなんと0.77倍。
得点力を出塁率にあわせる係数も大きくなって当然である。
・wRAA (平均比較加重得点)
同じ打席数をリーグ平均の打者が打つ場合に比べてどれだけ多く(または少なく)得点を生み出したかを示す指標。
wOBAに基づいて計算される。
平均的な打者で0となり、プラスの値なら平均より優れている打者、マイナスの値なら平均より劣る打者。
wRAAが+5の打者がいた場合
もしチームがその打者が担った打席分を平均的な打者に打たせていたら得点が5減っていただろう
という意味。
計算上打席数が多いほどに絶対値が大きくなる(仮に極めて優れた打者でも打席数が10や20では大きな値を出すことは難しい)ので機会数を標準化して比較したい場合は別途計算が必要。
基本的にはwOBA、wRC+が用いられる。
単位が「点」なのでWARの構成要素として使用可能。
今ではwRAAを使うのが主流。
《計算式》
wRAA = (wOBA-リーグ平均wOBA)/wOBAscale×打席
解説サイトを見るとたまにwOBAscaleが1.2前後の数値で固定化されているように見えるが実際はwOBAscaleには幅がある。
打低のシーズンであるほどこのwOBAscaleは大きくなるため違反球が使われた2011~2012年や2023年、2024年はwOBAscaleが大きい。
このため打低のシーズンではプラスやマイナスを過剰に算出してしまう可能性がある。
例えば2024年の西武ライオンズを例にしてみよう。(17/9/2024現在)
2024年の西武ライオンズのチームwOBAは.264で打席数は4690
2024年のパ・リーグの平均wOBAは.301である。
仮にwOBAscaleが1.2の場合西武ライオンズのwRAAは
(.264-.301) / 1.2 *4690 = -144.6点
wOBAscaleが適正な1.4の場合
(.264-.301) / 1.4 *4690 = -125.0点
と20点近い差が出る。
正直ここまでマイナスだと20点近い差も誤差のように思えるが貯金5個分の違いが生まれていることから処理としては間違えたくない箇所だ。
ちなみにWARでの計算にwRAAは(パークファクター補正をされたうえで)用いられるが投手が打席に立つリーグの場合WARの項目「Batting」で見ると大きなマイナスになる。
これはWARで計算する際は比較する対象を単なるリーグ平均ではなくリーグの「野手の」平均にするためである。
この理由は野手WARで表したいのは平均的な野手との比較であるため単なるリーグ平均では「平均的な野手」よりも打力が落ちるからだ。
野手の比較対象は野手なのである。
このマイナス分はポジション補正にて修正をすることが多い。
また極めてニッチな話だが
wRAAでは「打席」を使うのに対し元となるwOBAでは「打席」ではなく「打数+四球+死球+犠飛」が使われている。
つまり失策や守備妨害はもちろん「犠打」が算出から取り除かれている。(「故意四球」も取り除かれる)
実際のところ失策はwOBAの計算に含めるケースがあるので実質的に省かれるのは「犠打」「故意四球」となる。
wOBAから「犠打」「故意四球」を取り除く理由としてはこれらは戦術的なものでありベンチの判断により差がでるからと考えられている。
仮に60犠打を決めた選手の場合、
分母に犠打を含めてしまうと本来は犠打をする打席で打てたかもしれないヒット・本塁打による貢献がなくなってしまうからだ。
例えば2014年の広島菊池選手の場合
菊池選手は43個の犠打を記録しながらもwOBAは.369とリーグでも20指に入る活躍をした。
wRAAは19.6にも及び彼にとっても大きな飛躍の1年となった。
もし仮に43個の犠打を分母に含んだ場合wOBAは.345にまで低下。
wRAAはおよそ7点にまで減少しなんと10点以上も変化してしまう。
wOBAを選手の評価として使うならベンチの判断により選手の評価がこれほどまでに変動してしまうのは好ましくないという判断のため取り除かれている。
つまりこれは逆に言えばwRAAを算出するときは「犠打をした打席は他の打席でしたであろう打撃を仮定している」
ということになる。
つまり極めて極端な話だが1打数1単打500犠打を記録した選手がいたとする。
この選手のwOBAは0.900であるが見ての通り1打数だけなので実質的な得点生産は脆弱だ。
RCだと16点に満たない。
500打席立ってRC16点は本当に打てない捕手レベルでありRCAAは-40点となる。
しかしwRAAでは1打数1単打という結果を「引き伸ばす」。
つまり501打数501単打の選手として数値上は扱うことになる。
このためwRAAでは240点に迫る数値となる。これは1打数無安打では逆に大きなマイナスとなる。
犠打というのは打率を下げずセーフティで成功すれば打率を上げることができるため積極的に行う選手もいるかもしれないが打者が平均より打てる打者なら実は打率だけではなくwRAAにおいても恩恵はある。
例は極めて極端な話ではあるが現実でも犠打を指示されたことによりwRAA、引いてはWARで得をした選手もいるかもしれない。
実際にWARで考えると比較対象がリプレイスメントレベルの選手なので打撃貢献は
(wOBA-リーグ控えwOBA)/wOBAscale×打席
で計算されることになる。
つまりリーグリプレイスメントレベル以上に打てる、つまり平均と比較しておおよそ75%以上の打力があれば犠打はWARにおいてプラスだ。
例えば世界の犠打王、川相氏を見てみよう。
彼は20年以上の現役生活の中で533個の犠打を決めている。
彼の現役通しての平均比較打力は82%であり控え選手よりも打力がある。
ゆえにざっくり計算をすると彼は犠打によっておおよそ通算9点近くwRAAを稼いでいる(※)。
WARに換算すると約1勝分だ。
川相氏のoffenceWARは通算16.1勝なので約6%が犠打によって生成されたと推測できる。
もちろん犠打をした打席も打っていれば今よりもよりプラスを稼いだかもしれないのでこの1勝分というのは犠打によってセコセコと稼いだもの
というわけではない。
あくまでも「1勝分は推定値によって構築されている」ということである。
余談だが川相氏はレギュラー定着当時は平均並みの長打力を持っていたものの犠打をするようになってから大きく長打力が減った。
犠打をするという世界線ではなかった場合もっと打撃貢献ができた選手になれたかもと思うと記録を作れたとはいえやや複雑な気持ちになる。
犠牲バントによりWARがプラスになるのは正直馴染みがないがある選手のキャリアを犠牲にするリスクが有るものと思うとそれぐらいの恩恵はないとやってられないのではと感じる。
※計算方法
川相氏の通算wRAAは-97.5
控え選手の推定wRAAを600打席で-20点を記録するものとする
川相氏5528打席立っているので控え選手が代わりに打席に入ったとすると184.3点マイナスを記録したと考えられる。
つまり川相氏は控え選手に比べると86.8点得点を多く作ったと言える。
この総打席5528打席のうち犠打を決めたのは533回、つまり約10%犠打の分である。
なので533/5528*86.8=8.37点
が川相氏が犠打によって引き伸ばされた結果得たWAR的なプラスといえる。
参考
「WARはバントを評価していない」という嘘
https://hakkyuyodan.livedoor.blog/archives/33845928.html
川相昌弘
https://ranzankeikoku.blog.fc2.com/blog-entry-114.html
・wRC(加重生成得点)
wOBAから算出される打者が創出した得点数。
数値が高いほどチームに多くの得点をもたらしており貢献している打者だと言える。
打席数が多いほど多くのwRCを稼ぐ機会が与えられていることになるため単純に生産性の比較はできない。
打席あたりの貢献の高さはwOBAで、平均的な打者と比較してどれだけ利得をもたらしたかはwRAAで評価する。
リーグ総合wRCはwOBAがリーグ平均wOBAと同じになるためリーグ総得点と等しくなる。
《計算式》
wRC = ((wOBA-リーグ平均wOBA)/ wOBAscale+(リーグ総得点/リーグ総打席))×打席
計算は実質
「wRAA」+「平均得点生産」
という形。
なので例えばリーグ総得点/リーグ総打席が0.1点の場合500打席立ったとき「平均得点生産」は50点となる。
このときwRAAが-50点のときwRCは0点となる。
少しwRCが0の際のwOBAを計算してみよう。
例えば2023年の環境の場合
リーグ総得点/リーグ総打席が0.0934でwOBAscaleは1.361である。
なので X = wOBA-リーグ平均wOBA として
0 = (X / 1.361 + 0.0934)
X = -0.127
と算出できる。
また2023年のリーグ平均wOBAが.306なので選手のwOBAが0.179だとwRCは0になる。
wOBA.179はOPSにして.400以下ぐらいの選手なので投手の大部分はwRCはマイナスになる。
環境によるがおおよそwOBA.180~.200というのがwRC 0の境界だ。
これはwOBAが.180以下の選手は得点生成能力が全くないことを示している
のではない。(すごく得点生成能力が低いことを指してはいるが)
これは投手が9人並んで点が取れる気がしないという感覚とよく一致しているように思えるが厳密に言えば全く点が取れないということを指しているわけではない。
これは加算モデルであるwOBAを使用している以上致し方ない点で加算モデルが細部での整合性より簡便性を重視しているゆえに起こる現象である。
wOBAから1試合あたりの得点を加算モデルと乗算モデルそれぞれで出した結果が上記の表である。
縦軸が1試合あたりの得点で横軸がwOBA。
これを見るとwOBA.280~.420の範囲は近似できており多くのチームwOBAはこの範囲に入り多くの打者もこの範囲に入るため基本的にはよく機能する。
しかし非常によく打てる、もしくは打てない場合青の線とオレンジの線が大きく乖離しているように加算モデルと乗算モデルで違いがよく出ている。
特に.240のあたりからは乖離が激しく過剰に点が取れないと加算モデルでは算出してしまう。
マイナスがでるというのは得点は本来マイナスにならないことを考えると気になるが加算モデルであることを踏まえると仕方がない事象である。
そういった歪み込みで算出していると理解していただければ幸いである。
ちなみにwRCが0になるwOBA(便宜上z(ero)wOBAとする)がわかればwRCは
wRC = (wOBA – zwOBA ) / wOBAscale *打席数
で計算することもできる。
これは上記の加算モデルの式でもある(上記の図はzwOBAを.180としている)。
このままwRCの解説を終えてもいいのだがせっかくなのでwRAA、及びwRCをざっくり算出するテクニックとして出塁率と長打率を活用した例を紹介する。
wOBAの項目で説明しているがwOBAscaleを掛ける前のwOBA、得点生成能力は
(出塁率*2+長打率)/ 4
でざっくり計算することができる。
wRAAの算出は
「対象打者の得点生成能力-リーグ平均得点生成能力」打席数をかけたものだ。
つまり1打席ごとのwRAAは
「(対象打者出塁率-リーグ平均出塁率)*2+対象打者の長打率-リーグ平均長打率」
を4で割ることで表すことが可能だ。
例を出してみよう。
2019年の森友哉選手の出塁率は.413 長打率.547
2019年のパ・リーグの平均出塁率は.326 長打率は.391である。
計算すると
(.413-.326)*2 + .547-.391 = .174 + .156 = .330
これを4で割ると.0825となる。
森選手は573打席に立っているので
573*0.0825 ≒ 47.3点
と算出することができる。
リーグの打席ごとの平均得点おおよそは0.11点なのでwRCは
47.3 + 573*0.11 ≒ 110点
となる。
実際に森選手のwRAAとwRCを確認するとそれぞれ42.3、106.9とほぼほぼ近似されている。
まあ正直面倒ではあるが出塁率と長打率から具体的な得点が推測できると思うと中々面白くあると思う。
感の鋭い読者の方はなぜ近年の選手ではなく2019年の選手の数値を引っ張ってきたのか疑問に思うかもしれない。
これは2024年現在NPBの環境が異常なまでに打低に傾いているため「出塁率*2+長打率」を4で割ることでは得点創出力を正確に算出できないため。
NPBなんとかしろ
MLBは環境も安定しているため上記の式がうまく扱えるはずだ。
平均出塁率は.320、長打率は.400、打席ごとの平均得点は0.11~0.12で計算するといいだろう。
・wRC+(比較得点力)
打席あたりの得点創出の多さを平均的な打者を100とした場合のパーセンテージで評価する指標。
偏差値ではないため200という打者がいれば2倍の効率で得点を生産する打者と言える。
またこちらはPF(パークファクター)を考慮する。
《計算式》
wRC+=(パークファクターを考慮して計算したwRC / 打席)/(リーグ総得点 / リーグ総打席)*100
後者の「リーグ総得点 / リーグ総打席」は「リーグ総wRC / リーグ総打席」としてもよい。
数式の対称性としてはこちらのほうが美しいだろう。
なぜwOBA同士を比較しないのかというとwOBAは本来の得点価値と比べ評価が歪んでいるためその比を取ることに意味がないからだ。
wRC+が200の打者は平均wOBAが.300の環境で.600のwOBAを持つわけではない。
反面「差」には意味がある。
wRC+はその数式上式を組み替えてwRCを除くことができるので実際に組み替えてみるとわかりやすい(パークファクター補正は一旦除く)。
wRC+=(((wOBA-リーグ平均wOBA)/ wOBAscale / + (リーグ総得点/リーグ総打席))+1)*100
となる。
重要なキーパーツ「(wOBA-リーグ平均wOBA ) / wOBAscale」がでてきた。
これは1打席ごとの平均と比較した得点力を表していてマイナスなら平均より得点力が低くプラスなら高い。
このように得点力の平均比較では「差」が使われているためその差を的確に表現できるwRCが計算に使われている。
ちなみにwRCの項目でも解説したwRCが0になるwOBA(zwOBA)を対象のwOBAから引けばwOBAscaleを掛けたその選手の打席ごとの得点力となりリーグ平均と比較することでこちらはwRC+として計算が可能。
実際に例を取ると2023年の佐藤龍世選手のwOBAは.371、対してパ・リーグの平均wOBAは.306である。
この年のzwOBAはおよそ.180である。
佐藤選手の打席ごとの得点力(補正付き)は.371-.180=0.191
平均選手の打席ごとの得点力(補正付き)は.306-.180=0.126
比を取ると0.191/0.126≒1.52
百倍すると152でありこれは実際の佐藤選手のwRC+153とほぼほぼ当たる。
そしてこちらの計算でも「差」を用いている。
別にこちらのほうが計算が簡単というわけではないが一つの知識として「差」がキーポイントであることの一例として。
「比」ではなく「差」で計算しているためwRCがマイナスになり翻ってwRC+もマイナスになることがある。
これは当然その選手を出せば出すほど得点が減る
ということではない。
単に加算モデルである都合上うまく機能する範囲が限定的で極端に打てない選手を測るのに向いていないという話。
具体的な話は環境によって変わってしまうため難しいが少なくとも0近辺の選手はそれなりに歪んでいるため「とても低い打力」という以上にコメントをすることは難しい。
このwRC+、wRAAなどではパークファクターを考慮していなかったのになぜ突然wRC+では考慮するのだろうか。
それは恐らく目的の違いによるものだ。
wRAAなどは実測値として測定し事実を記載することが目的にあると思う。
対してwRC+は選手の比較が目的にあるのだろう。
wOBAやwRCでは試合数やリーグ環境が全く異なる2000年と2024年で比較することは出来ない。
いや、してもいいが良い結果は得られないだろう。
反面wRC+なら2024年の選手でも2000年の選手でもなんなら戦前の選手でもデータがあるなら比較可能だ。
あくまでもその時代の平均との比較になるが傑出度を測るのにこれ以上のものは殆ど無いだろう。
ちなみにNPB最高は1973年の王貞治氏の282だと思われる。
正しい表現ではないかもしれないが一人で2.8人分の仕事をしていたと思うととんでもない。
選手比較の代表的な指標でありほぼ最終形態に近い指標でこれさえ見ておけばOKと言えるほどの指標。
こういうと「打率や本塁打など様々な指標を見て比較するのが大事でこれ1つというのはどうなのか」
と思う方もいるかも知れない。
「様々な指標を見て比較するのが大事」等といった言葉がありそれは一種の真実ではある。
ただ得点力を見て、比較するのであればwRC+だけで正直いいと思う。
打率や打点、本塁打を各個人の尺度で判断するよりそれらを合理的に含有し一定の尺度で算出するwRC+のほうが断然強固であるからだ。
もちろんただ野球の雑談をするうえではwRC+は必要ないし筆者もわざわざ持ち出すことは少ない。
しかし事実ベースに何かを語る、主張するのであればせっかく先駆者が開発してくれたのだから使わないのはもったいないだろう。
初心者のうちは面食らうかもしれないがwRC+を見てその後xwOBAconやChase%などそのwRC+を構成する様を見ることが
「様々な指標を見て比較するのが大事」という文言につながると自分は思う。
「様々な指標を見て比較するのが大事」というがそれには必ず目的、的があるはずだ。
下手な鉄砲も的は狙って打つはずでその的はなるべく正確なものがいい。
計算するなら電卓ではなくエクセルがあるならそっちを使おうよ、という話とも言える。
ちなみにDeltaや一昔前のMLBのリーグwRC+を見るとほぼ毎年セ・リーグは95を下回りパ・リーグも99という中途半端な値を取る。
これはwRC+の比較対象が「野手」のwRCであり計算から投手の打席が除外されているため。
対して実際に計算する際は投手の打席を除外したりしないため投手の分wOBAなどが下がり90台の数値を記録する。
選手単体で見るときは正しい処理ではあるのだがチーム以上の単位で見るとややずれる原因となる。
初学者が見たら混乱しそうなので早く12球団DH制を導入して欲しい。自分はしたし。
・wSB(盗塁得点)
《計算式》
wSB=A−B*C
A=(盗塁*盗塁得点) +(盗塁死*盗塁死得点)
B=(リーグ総盗塁数*盗塁得点+リーグ総盗塁死数*盗塁死得点)/(リーグ総単打+リーグ総四球+リーグ総死球-リーグ総敬遠)
C=単打+四球+死球-敬遠
盗塁での貢献を得点化した指標。
リーグの平均的な走者と比べてどれだけ多く盗塁で得点を生み出したかを表す。
Aで選手本人の盗塁による±を算出しB*Cで平均的な走者が盗塁によって生み出す得点を算出している。
wSBが5点あればその選手は盗塁することで平均的な走者に比べ盗塁で5点プラスを作成したことを意味する。
仮に盗塁企画そのものが0だった場合でも平均的な走者が盗塁がうまかった場合しっかりマイナスになる。
ただ実際のところ後者の項のB*Cはほとんど0になる場合が多い。
NPBの2020~2024年のBの値は-0.0016~0.0007の間であり仮にC(出塁)が300あるほど極めて出塁に長けている選手でも影響は-0.50~0.20と軽微。
現代屈指の盗塁王の近本選手ほどの選手でも200を超えればいいぐらいなので本当に影響は少ない。
また若干ではあるが多くの年でマイナスであるため実はなんら盗塁企画をしない選手のほうがプラスを得ている。
このためネット上では「赤星式盗塁」というのが有名であるがこれが実に有用になる。
「赤星式盗塁」というのは
赤星式盗塁=盗塁成功数-盗塁失敗数*2
で計算されるもので実際の盗塁の成功と失敗の得点価値の絶対値の比(失敗/成功)は2~2.5を取ることが多くうまく規格化されている。
そしてこれは
wSB≒盗塁得点*赤星式盗塁
と等式でつなげることが可能だ。
盗塁は70%ほど成功率が欲しいという言葉を聞いたことがあるかもしれないがそれは赤星式盗塁からも得点価値のという側面からもほぼほぼ正しい。
簡易な計算としては盗塁得点を0.2点に設定するといいだろう。
余談として盗塁得点と盗塁死得点の大きさはもちろん毎年得点期待値表が変わる都合上変化するが打低になると盗塁得点が大きくなり盗塁死得点が小さくなる。
これはランナー1塁での得点期待値が減少し相対的にランナー2塁のときの価値が上がるため。
打低環境では走塁が大事になるというイメージをお持ちの方もいるかも知れないがそれは正しいと言えるかもしれない。
ちなみに脚が速いほど当然盗塁をする機会は多くなるが盗塁企画が増える割には盗塁成功率は高くならない。
もちろん脚が速いほど盗塁成功率は高いのは事実が影響(R2値)は10%にも満たない。
盗塁は技術の要素もかなり大きい可能性が高い。
参考
X~
・xFIP / expected fielding independent pitching(補正FIP)
被本塁打による揺らぎを補正したFIP。
統計的な研究により、投手の外野フライに対する本塁打の割合は長期的には一定の割合に収束するとされる。
外野フライに対する本塁打の割合を表す指標はHR/FBというのだがHR/FBの年間度相関は0.30に満たない。
反面FB%(フライ率)やGB%(ゴロ率)は年間度相関が0.85以上を記録するなど強固な指標である。
この性質に基づき、外野フライに一定の割合の本塁打を見込んでFIPを計算するのがxFIPである。
被本塁打を平均へ回帰させているという表現をしてもいいかもしれない。
この指標は絶対数が少なく揺らぎが大きい被本塁打の影響を外野フライとして一律化することで減らして投手の実力を評価しているのである。
実際にFIPの年間度相関は0.6に満たないのに対しxFIPは0.7近くを記録するなどその強固さが増していることがわかる。
この指標は擬似的に被本塁打の補正をするので本塁打のPFがかかっているような状態となる。
三振と四球は本塁打に比べるとパークファクターの影響は小さいのでおおよそのパークファクター補正が入ったFIPとも言える。
翌年の防御率の説明度もFIPより高めで数あるDIPSの中でも投手の実力を測っている、再現性の高い指標とされている。
反面本塁打を外野フライに丸め込んでいるので記述的(WARに利用するなどの)価値は低い。
Deltaでは課金するとFIP・xFIP・tRAが確認できるが将来的な選手の成績予想としてはxFIPを見ることをおすすめしたい。
またHR/FBの値は完全にランダムというわけではなく厳密には投手によって変わるとされる(BABIPみたいなもの)。
そのためHR/FBが低い選手は過小評価されるし逆に高い選手は過大評価されている可能性がある。
《計算式》
xFIP=(13*リーグ全体のフライに占める本塁打の割合*外野フライ+3*(与四球-故意四球+与死球)-2*奪三振)/ 投球回+定数
定数=リーグ全体の{失点率-(13*リーグ全体のフライに占める本塁打の割合*外野フライ+3*(与四球-故意四球+与死球)-2*奪三振) / 投球回}
定数CはFIPと解釈は同じで全打席がBIP(外野フライを除く)だった場合の失点率。
外野フライは失点リスクも大きいため定数CはFIPの定数Cよりも大きくなる傾向にある。
この計算のためリーグ平均xFIPはリーグ失点/防御率と一致する。
参考
・XR/eXtrapolated Runs(推定得点)
打者が創出した総得点。
XRが30ならその打者が得点30を生み出したということでありチームXRはチームの総得点と近似する。
打席数が多ければ多いほどXRを稼ぐ機会が多い(ヒットなどを記録する機会が多い)ので打者同士で比較する場合はXRを打席数やアウトの数で割る必要がある。
何種類かバリエーションはあるが最も網羅的なものを紹介する。
《計算式》
XR = 0.50×単打+0.72×二塁打+1.04×三塁打+1.44×本塁打
+0.34×(四球-故意四球+死球)+0.25×故意四球
+0.18×盗塁-0.32×盗塁死
-0.09×(打数-安打-三振)
-0.098×三振-0.37×併殺打
+0.37×犠飛+0.04×犠打
上のまとまりから順に
・ヒット関係
・四死球関係
・盗塁関係
・通常アウト関係
・特定アウト関係
・犠牲アウト関係
という風にまとめることができる。
wOBAの先輩というか様々な事象に重みを付けてそれを足し合わせるというwOBAと似たことをやっている。
違いは係数の出し方でwOBAがLWTSから算出されるのに対しこちらは統計的な重回帰分析。
このためやや理論的背景に乏しく各種の事象に適切な得点価値が割り当てられているかは疑問が残る。
例えば最後の犠牲アウト関係では顕著だが犠飛や犠打はプラスとなっている。
これはwOBAとの大きな違いでwOBAではこれら2つを「ほとんど」考慮に入れない、というか得点を生成するものとは扱っていない。
犠飛や犠打は記録の都合上当然走者がいることが前提にあるためその前提にあるヒットや四球などの価値を吸い取ってしまっているのかもしれない。
今では優秀な後輩(出自は全然違うので兄弟ではない)であるwOBAがあり分析の場で見ることは本当に無い。
背景もただの重回帰分析なためRCと比べると面白みにかける。
・XR+/eXtrapolated Runs Plus(平均比較推定得点)
同じ打席数をリーグ平均の打者が打つ場合に比べてどれだけ多く(または少なく)得点を生み出したかを示す指標。
平均的な打者で0となり、プラスの値なら平均より優れている打者、マイナスの値なら平均より劣る打者。
XR+が+5の打者がいた場合、もしチームがその打者が担った打席分を平均的な打者に打たせていたら得点が5減っていただろう、という意味。
計算上打席数が多いほどに絶対値が大きくなる(仮に極めて優れた打者でも打席数が10や20では大きな値を出すことは難しい)ので機会数を標準化して比較したい場合は別途計算が必要。
これはXR27でもよい。
《計算式》
XR+ = 対象打者のXR-(リーグの打席あたりXR×対象打者の打席数)
単位はwRAAと同じく「点」なのでWARの構成因子にしても良い。
・XR27 (27アウトごとの推定得点数)
ある打者が一人で打線を組んだ場合の1試合(27アウト)あたりの得点数。
XR27が5.00の場合年間140試合あるなら700得点、160試合なら800得点狙えるということを示す。
パット見でわかりやすく打席数が違う打者とも比較が可能。
RC27と比べると若干の差があるのが常だがこれは数式が異なるから当然
…というだけでなく算出理念そのものの違いによる差がある。
例えば2005~2024年のチームRC27とXR27の差とチームOPSの関係は以下のようである程度相関がある。
これは根本的にRCが乗算モデルでXRが加算モデルであることが理由と思われる。
乗算モデルでは項の値が大きい、つまり今回の場合打力が高い場合相乗的に値が伸びる。
対して加算モデルではどんな状況でも一定の値を与えるため値の変化に差が生まれない。
このためOPSが高いほどRC27のほうがXR27よりもいい値を取りやすい。
逆にOPSが低く打力が低いほどXR27のほうがいい値を取る。
またこの関係はサンプルサイズが大きくなるほど顕著で例えばリーグ平均の場合だと以下のようになる。
R2値が0.46から0.63と大きく伸びていることがおわかりいただけるだろうか。
つまり先程述べた乗算モデルと加算モデルの違いがより明白になっている。
《計算式》
XR27 = XR÷(打数-安打+盗塁死+犠打+犠飛+併殺打)×27
ディスカッション
コメント一覧
まだ、コメントがありません