| xwOBA のみ | + Pull Air% | |
|---|---|---|
| + p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001 | ||
| 2021 - 2025 MLB: min. 300 PA | ||
| Data: Baseball Savant | ||
| (Intercept) | 0.034*** | 0.029*** |
| (0.005) | (0.005) | |
| xwoba | 0.889*** | 0.881*** |
| (0.014) | (0.014) | |
| pull_air_rate | 0.045*** | |
| (0.009) | ||
| Num.Obs. | 1395 | 1395 |
| R2 | 0.736 | 0.741 |
| R2 Adj. | 0.736 | 0.741 |
xwOBA が普及するにつれ、wOBA との乖離も注目されるようになり、主にゲレーロ Jr. やタティス Jr. 、パレイデスやバーショなどの標本から、その乖離を埋めてくれる Pull Air% も補助具として使われる場面が増えてきました。
実際に wOBA を記述するという目的においては補助具として機能しています。
ただ、xwOBA の話をしているときに当該期間の wOBA を持ち出し、そして打球方向をあたかも必需的な補助具として扱うのは、些かセンスがないです。Tango が何度も述べてきたように(Tango 2024年a, 2024年b, 2024年c)、Player の指標としては打球速度、垂直角度がある環境において水平角度の必要性は薄いです。
もちろん Play のモデル化においては水平角度は必需品ですので、目的に応じて xwOBA を構築する必要があります。当たり前ですが、生の水平角度を使うほどより記述的になり、カテゴライズされたものを使うほど記述性は薄くなります。
Pull Air は単純な水平角度じゃなくて xwOBA と wOBA の乖離が大きい打球に絞られているのだから補助具として機能する可能性もありますので一応簡単に検証しておきます。
| xwOBA のみ | + Pull Air% | + Sweet Spot% | |
|---|---|---|---|
| + p < 0.1, * p < 0.05, ** p < 0.01, *** p < 0.001 | |||
| 2021 - 2025 MLB: min. 300 PA | |||
| Data: Baseball Savant | |||
| (Intercept) | 0.133*** | 0.132*** | 0.157*** |
| (0.010) | (0.010) | (0.012) | |
| xwoba | 0.570*** | 0.568*** | 0.612*** |
| (0.029) | (0.030) | (0.031) | |
| pull_air_rate | 0.014 | ||
| (0.018) | |||
| sweet_spot_percent | -0.108*** | ||
| (0.029) | |||
| Num.Obs. | 867 | 867 | 867 |
| R2 | 0.303 | 0.303 | 0.313 |
| R2 Adj. | 0.302 | 0.302 | 0.312 |
このように、Pull Air% は xwOBA に追加的な情報を与えません。水平角度を組み込んでいないモデルにおいて水平角度は冗長であり、(Sweet Spot% が情報を追加するように)垂直角度を組み込んでいるモデルにおいて垂直角度は言わば過学習しています。
一応ですが、wOBAcon を xwOBAcon で予測するモデルでも変わりません。
野球に限らず統計モデルにおいてこのような現象は起こりますので、組み込まれていない変数の冗長性、組み込まれている変数の過剰適合には息をするように気を配れるようにしたいものです。