巨人VSソフトバンクは75%超え!? 数字で紐解く2024年クライマックスシリーズ ~統計モデルが予測する下剋上の確率~

プロ野球考察データ分析

Pocket

来たる2024/10/12からついに2024年プロ野球の大一番とも言えるクライマックスシリーズが始まります。


セ・リーグは

まず甲子園にて「阪神」VS「DeNA」

その後東京ドームにて「巨人」VS「阪神」or「DeNA」の勝者

が対決し東京ドームでの勝者が日本シリーズへと駒を進めます。


パ・リーグも同じように

まずエスコンフィールドにて「日本ハム」VS「ロッテ」

その後PayPayドームにて「ソフトバンク」VS「日本ハム」or「ロッテ」の勝者

が対決しPayPayドームでの勝者が日本シリーズへと進むことになります。


・シーズン3位から日本一を成し遂げた2010年のロッテ

・3位から19年ぶりの日本シリーズ出場を決めた2017年のDeNA

・2018~2019年と2位から日本シリーズに出場し日本シリーズ12連勝を飾ったソフトバンク

などクライマックスシリーズでは多くの下剋上と、そしてドラマが生み出されてきました。

そして西武ファンは裏で号泣していました。


そこで今回も下剋上がなされるのか、その確率を簡単な数値モデルを使用することで予想してみました

果たして日本シリーズはどのチーム同士の対戦となるでしょうか。

是非確率をなんとなく想像してみて下さい。

セ・リーグ

阪神VSDeNAの勝率は

阪神 61.1%

DeNA 38.9%


巨人VS阪神の勝率は

巨人 81.8%

阪神 18.2%

巨人VSDeNAの勝率は

巨人 85.5%

DeNA 14.5%


総計の日本シリーズ出場確率は

巨人 83.3%

阪神 11.1%

DeNA 5.7%

となり巨人がかなり有利なようだ。

パ・リーグ

日本ハムVSロッテの勝率は

日本ハム 58.1%

ロッテ 41.9%


ソフトバンクVS日本ハムの勝率は

ソフトバンク 92.0%

日本ハム 8.0%

ソフトバンクVSロッテの勝率は

ソフトバンク 92.7%

ロッテ 7.3%


総計の日本シリーズ出場確率は

ソフトバンク 92.3%

日本ハム 4.6%

ロッテ 3.1%

となりソフトバンクが極めて有利なようだ。

計算方法

前提

この項目ではどのように計算をするのかを説明します。

まず計算するうえで大事なのが野球の公認規則

公認野球規則1.05
各チームは、相手チームより多くの得点を記録して、勝つことを目的とする。

になります。

つまるところ「より多くの得点をしたチームが勝つ」ということです。

得点と失点がチームの勝率を左右すると言っても過言ではありません。


そして得点と失点から勝率を算出するのがピタゴラス勝率というものになります。


ピタゴラス…?あの有名な人が野球やっていたの…?

と思うかもしれません


ピタゴラスさんは恐らく野球をやったことはないでしょう。

ピタゴラス勝率は計算式が有名なピタゴラスの勝率に近しいことからその名がつけられています。

実際のピタゴラス勝率は

で定義され、なんとなくピタゴラスの定理によく似ていますね。


一見すると何を意味しているのかわからないかもしれませんが

・得点が多いほどピタゴラス勝率は高くなる

・失点は少ないほどピタゴラス勝率は高くなり0なら勝率は100%

・得点と失点が同じなら勝率は0.500となる(戦力がイーブンと考えられるため)

という風に言われれば当然のことを数式で表現しています。

実際に1950~2023年のチーム勝率とピタゴラス勝率の関係は以下のようでかなり高い相関性があります。

要するに得点と失点がわかればおおよその勝率がわかります


失点は相手の得点と言い換えることが出来ますから

・自身のチームの得点

・相手のチームの得点

がわかれば1試合あたりの勝率がわかります。


クライマックスシリーズ突破は特定の試合数の中で先に2~4勝するのが条件ですから樹形図を作成することが可能。

つまり1試合あたりの勝率がわかれば突破の確率も算出することが出来ます

チームの得点力の計算

ではどうやってチームの得点を算出するのでしょうか。


得点というのはかなりシンプルに考えれば

ランナーが出塁」し、その「ランナーが生還」することで記録されます。

つまり出塁数を生還率でかければ生還するランナーの数がわかります

12人出塁し生還率が33%の場合は4人ランナーが生還、つまり4得点をすると言えるわけですね。

そしてその出塁数は機会数*出塁率で可能。

つまり1打席(機会)ごとにおける得点は「出塁率*生還率」で計算することが可能です。


出塁率は既に公式より発表されていますからあとは生還率がわかれば得点力を計算することが出来ます。


ここで簡単な仮定をしてみましょう。

出塁とは四球にしても本塁打にしろ既存にいるランナーを進塁させることが多いです。

その際にランナーが先の塁にいるほどその出塁によってランナーが生還する可能性が高くなります。

そしてランナーが先の塁にいるには当然ながらランナーとして出塁する必要があります。

出塁率が高いほどランナーは増え、出塁した際にランナーが生還する確率は高まります。

要するに出塁すればするほど出塁により点が取りやすくなる

ということです。(進◯郎構文みたいですね

?? ???

得点が多いチームとは得点が多く取れるチームのことです。

※当然このような発言はしていません

こういった思考から

生還率は出塁率と近似することが可能

つまり1打席ごとにおける得点は「出塁率*出塁率」で計算することができるのです。

これをニッチな界隈では「出塁率2乗法則」のように言ったり言わなかったりします。


「ホントかなあ~?」と思うかもしれませんが実際にチームの「出塁率*出塁率」とチームの得点を比較すると以下の図のようになります。

それなりにちゃんと相関があり説明ができていますね。


ここで感の鋭い読者の方は

「生還率ならよりランナーを前に進めるかどうかが見れる長打率のほうがよくね?」

と思ったかもしれません。

これはおっしゃるとおりでチーム「出塁率*長打率」とチームの得点を比較すると

と先程よりも明らかに高い相関性があります。


つまり長打は長打でしっかりと重み付け、より塁打が多いほど重要視すべきということです。


そこでwOBAという指標を使います。

wOBAはざっくりいうと

・各イベント(四死球や安打)の価値が適切に配分された

・出塁率に大きさが似せされている

指標です。

より細かいことを知りたい場合はよければ私が記述した辞典を参照下さいませ。


要するにwOBAは各イベントの価値が適切に配分されているため

「出塁率*長打率」のような高い相関性が期待されます。

さらに上述したように出塁率に大きさ自体が似ていますから「出塁率*出塁率」という式も扱えます。

実際にチーム得点と比較した図が以下のようになります。

※ここのwOBAは「(出塁率*2+長打率) / 3」の近似wOBA

よくよく見るとR2値(決定係数)は「出塁率*長打率」のほうが大きいですがこちらが優れているのは実際の得点との相関です。


例えば2024年の場合10/9現在まだ試合が終わっていない楽天と西武を除いた10チームの総得点と推定得点は以下のようになります。

計算方法は「打席数*出塁率*長打率」と「打席数*wOBA^2」

どちらも完璧にドンピシャというわけではないですがwOBA^2式のほうが近しい値を取っていることがわかります。

このためwOBAの2乗はチームの得点を適切に表していると言えるでしょう。

wOBAを活用すると今回クライマックスシリーズに出場するチームの1試合当たりの推定得点は

のように推定されます。

ソフトバンクがずば抜けてよく、セ・リーグはDeNAが1番得点が期待できるようです。

得点力の補正

上記のような計算で得点力については推定することが出来ました。

ではこのまま計算…といきたいところですが少し補正を加えます。

①投手力の補正

②ホームアドバンテージの補正

の2種類です。


①の投手力の補正は特に疑問なく受け入れられるでしょう。

例えば今年の巨人は失点率が平均と比べ18%少なかったです。

これはつまり相手の得点力を0.82倍するということで仮に平均得点が4.00点の打線と対戦した場合巨人の守備陣であれば3.28点にまで相手の平均得点を抑える事ができる

と考えられます。


つまり例えば巨人とDeNAが対決する場合平均得点を見ると(DeNAを選んだのは得点が多くわかりやすいため)

巨人 3.47点

DeNA 3.84点

と圧倒的にDeNAがリードしていますが失点率は平均を100としたとき巨人が82、DeNAが109と差があります。

これを補正すると平均得点は

巨人 3.78点

DeNA 3.15点

となり巨人のほうがリードすることになります。(実際直接対決でも16勝8敗で巨人のほうが優位だった)


では②のホームアドバンテージとはなにか。

これはものすごく簡単に言うと

ホームチームほどそのホームに慣れていたり観客の後押しが多くて勝ちやすい

という性質のことです。


得点と失点の性質で見るとおおよそ

・得点は1.05倍増える

・失点は0.95倍に減る

という2つの効果によりホームチームはより勝ちやすいです。

それはなんとなく皆さんも感じられているのではないでしょうか。


これを先程の巨人とDeNAの対戦に落とし込むと

巨人 3.97点

DeNA 2.99点

となり、より一層巨人が有利になりました


ご存知の通りクライマックスシリーズはホームが対戦カードごとに決まっていますからこの補正を入れて計算します。

セ・リーグ

ではここからは上記のような計算で算出した勝率から突破の確率を計算していきます。

阪神VSDeNA

対戦勝率


突破確率


阪神VSDeNAでは60%以上の確率で阪神が勝ち進むと算出されました。

チーム力自体には大きな差はありませんでしたが「ホームアドバンテージ」が大きく効いているようです。


初戦にそれぞれが勝った場合の突破確率

とやはり初戦に勝利したチームが優位であることは間違いないようです。

巨人VS阪神

対戦勝率


突破確率

やはり優勝しただけあって巨人は戦力も充実しており勝率も高く突破確率もそれに伴ってかなり高いものとなっています。

しかし阪神も完全にチャンスがないわけではありません。


5戦目以降までもつれた場合の突破確率

31%と阪神にもそれなりに目が出てきます。

特に6戦目までもつれた場合には通常の勝率に戻るため突破確率は40%を超えており当初の確率の2倍以上となっています。

とにかく勝って後ろの方までもつれ込ませるのが大事なようです。

巨人VSDeNA

対戦勝率


突破確率

阪神に比べるとDeNAは3位ということもありやや戦力が足りず突破率はかなり低い数値となっています。

突破できた場合中々の奇跡と言えそうです。


5戦目以降までもつれた場合の突破確率

5戦目以降までもつれこませた場合は突破率は当初の倍近くとなり可能性が見えてきます。

阪神と同じで、とにかく1~4戦目までに決めさせないのが大事でしょう。

パ・リーグ

日本ハムVSロッテ

対戦勝率


突破確率

セ・リーグと比べこちらはやや拮抗しておりホームアドバンテージの分日本ハムが有利ですがそれ以上の差はあまり出ていないようです。

そのためよりファンからの声援が大事になるでしょう。


初戦にそれぞれが勝った場合の突破確率

こちらもやはり初戦に勝ったチームが大きな優位を確保するのは間違いありません。

ソフトバンクVS日本ハム

対戦勝率


突破確率

90勝を超えたチームの強さは本物で2位の日本ハム相手にも極めて優位。

突破確率は90%を超える結果となっています。


5戦目以降までもつれた場合の突破確率

一方で日本ハムもなんとか後ろにもつれさせればそれなりの突破確率となります。

多少前倒しになってもいい投手から起用し少しでも突破の確率を上げたほうが良い…かも?

ソフトバンクVSロッテ

対戦勝率


突破確率

日本ハムを圧倒したようにロッテもソフトバンクは圧倒。

ほぼほぼ対戦勝率通りの勝率70%でロッテは突破するにはかなり綱渡りをする必要がありそうです。


5戦目以降までもつれた場合の突破確率

5戦目以降までもつれさせれば突破確率は当初の2.5倍となりますからやはり4戦目までに決めさせないように粘りが大切と言えそうです。

まとめ

今回は得点を推定し、そこから各チームのクライマックスシリーズ突破の確率を考えてみました。

まとめると

セ・リーグ第1ラウンドでは6:4で阪神有利

第2ラウンドでは巨人が阪神にしろDeNAにしろ8:2ほど有利

各チームのクライマックスシリーズ突破の確率は

となり巨人の可能性が圧倒的に高いことがわかりました。

さすがは優勝チームですね。


パ・リーグは

第1ラウンドでは日本ハムが6:4で優位で

第2ラウンドではソフトバンクがどっちを相手にしても9:1

と巨人すら上回る圧倒的なリードを取るようです。

そのため各チームのクライマックスシリーズ突破の確率は

とソフトバンクが大本命も大本命と言えるような結果となりました。


このため両リーグの1位、巨人とソフトバンクが対戦する確率は75%となりました。

もし実現すれば巨人は雪辱を果たすチャンスとなりそうです。


もちろんこの結果は数理的に計算しただけです。

現実には多くの変数が存在します。

・けが人の発生

・絶好調なお祭り男選手の出現

・普段と異なるマネジメント

などで結果は容易に変わるでしょう。

覆すのが野球の魅力ですし、覆させないのもまた大きな魅力だと思います。


今回の結果はあくまで一つの見方、解釈として10/12からのクライマックスシリーズを楽しんでいただければと思います。

もし突破確率が低いチームが突破したとしても今回の結果をもって叩くなどのことは控え、素晴らしい戦いをしたとコメントいただければと思います。

少しでも平和な野球界隈にしていきましょう。


以下はなぜ私が今回の記事を書こうと思ったのかのきっかけが書いてあるだけなので興味のある方だけどうぞ。

ここで読み終える方は

↓よければポチっとして応援お願いします

にほんブログ村

Xやマシュマロで感想などもお待ちしておりますので気兼ねなくどうぞ。

X

マシュマロ

https://marshmallow-qa.com/sabr_lions?t=NMGPFs&utm_medium=url_text&utm_source=promotion

あとがき

実は今回の話は「宇宙の果てのセイバーメトリクス」という私が尊敬してやまない「Baseball Concrete」というサイトの管理人が書いた同人誌が元になっています。

第3章1項目の「世界最小の野球モデル」という話が元となっています。

今回はwOBAや補正を使用したためやや複雑になりましたが本来は出塁率だけを用いた簡易的なモデルでありながらそれなりに精密に計算が可能という話になります。

誰もが一度は考える明日の勝率をこんなにもあっさりとしたモデルでそれなりに表現ができることに感動し、その凄さを伝えてみたくて今回の記事を書いた

というのが実態です。

もし今回の話を見て「面白い」と感じてくださった方がいたら是非同人誌を見てみてください。

超おすすめです。

↓↓↓↓
宇宙の果てのセイバーメトリクス

https://baseballconcrete.web.fc2.com/alacarte/sabermetrics_at_the_end_of_the_universe.html

プロ野球考察データ分析