記事一覧

当ブログについて

NPB2021

NPB2020

選手

打線

球場

記録

分析

パークファクターはどのような考え方で算出されるか


 球場によって両翼や中堅までの距離、フェンスの高さなどはまちまち。形状が左右対称ではない球場も多い。これだけ異なる条件の下で行われるスポーツは、野球くらいのものだろう。(中略)それでも本塁打は公式記録と認められ、タイトルもある。ある意味、不公平極まりない記録なのだが、誰も文句を言わないし、当たり前のことと受け止めている。

やっぱりホームランは野球の“華”(SANSPO.com/小早川毅彦のベースボールカルテ)


近年では球場の影響を定量化する手法がいくつか考案されており、その数値は「パークファクター」と呼ばれます。
パークファクターは球場の特性を知る手掛かりになるだけでなく、球場の違いを考慮した選手の成績比較にも活用できます。
本稿ではこのパークファクターがどのような考え方で算出されているかを解説していきます。


 目次
  1. どのように球場を比較するか
  2. 一般的なパークファクターの算出式
  3. 算出式の欠点
  4. より正確な算出式



どのように球場を比較するか

まずは簡単なケースを例に、どのように球場を比較すればよいかを見ていきましょう。
ここでは明治神宮野球場(以下神宮)とナゴヤドームを比較します。


  20201105_pf3.png  20201105_pf2.png

フェンスが近くて低い神宮の方が本塁打を打ちやすいだろうと予測が付きますが、
フェンスのデータからは「神宮はナゴヤドームと比べて本塁打を何倍打ちやすいか」を知ることはできません。
そこで、両球場で記録された成績から本塁打の打ちやすさを何とか割り出せないか考えます。

神宮とナゴヤドームで発生した本塁打の本数を比較するのはどうでしょうか?
どちらの球場も毎年およそ70試合が開催されますが、本塁打はどちらの球場で多く発生しているのでしょうか。
これを調べたものが下記のグラフです。両球場で各年度に発生した本塁打(試合あたり)を示します。

 20201003_pf.png

毎年、神宮ではナゴヤドームの倍以上の本塁打が発生していることが分かります。
この期間の試合あたり本塁打の発生数は、神宮は2.36本だったのに対してナゴヤドームは1.09本でした。
つまり2.36÷1.09=2.17、「神宮は2.17倍本塁打を打ちやすい」と言いたいところですが...

お気付きの方も多いでしょうが、この考え方には問題があります。
この方法のどこがダメなのかは、以下の両球場の使用チームの内訳を見れば一目瞭然です。

 20201010_pf.png
問題は球場によって使用チームが異なるため、各球場で生じた本塁打の本数が比較できないことにあります。
これは日本プロ野球では各チームに「本拠地球場」の保有が義務付けられており、
本拠地球場では「そこを本拠地として保有するチーム」が「他チーム」と対戦する試合が組まれるためです。

たとえば、神宮では「ヤクルトvs他チーム」という試合が必ず組まれるため、
ヤクルトが長距離砲を多く抱えていたら、それだけで神宮で発生する本塁打も当然多くなってしまいます。
当時のヤクルトには本塁打王経験者NPBシーズン本塁打記録保持者がいたわけですから、ありえない話ではないでしょう。

それでは、どうすれば両球場の本塁打の本数を比較できるでしょうか?
上のグラフを見ると、どちらの球場でも「ヤクルトvs中日」の試合が組まれていることにお気付きでしょうか。
このカードに限定して本塁打の発生数を比較すれば、使用チームが異なるという問題は回避できます。

 20201003_pf2.png

どちらの球場でもヤクルトと中日が試合をしているのですが、神宮ではナゴヤドームの倍以上の本塁打が発生しています。
これはヤクルトに長距離砲が多いからではなく、両球場の違いが反映されたものだと考えるのが妥当でしょう。
試合あたり本数は神宮は2.67本、ナゴヤドームは1.10本なので、「神宮は2.42倍(=2.67÷1.10)本塁打を打ちやすい」と言えます。

このように「同じチーム同士の対戦で使用球場だけが違う状況を比較する」ことが、パークファクター算出の基礎となる考え方です。
しかし、このままでは2球場の比較しかできないため、次節では3球場以上を比較する考え方を論じます。



一般的なパークファクターの算出式

6チームが在籍するセ・リーグには6つの本拠地が存在するわけですが、このままではこれらを比較するうえで不便です。
そこで、3つ以上の球場を横並びで比較できるようにしたのが「パークファクター」と呼ばれる指標です。

その特徴は「本拠地とそれ以外の球場を比較する」というアイデアにあります。
例えば神宮の本塁打の打ちやすさを評価するなら、神宮を本拠地とするヤクルトの試合で発生した本塁打に着目して、
ヤクルトの試合で発生した本塁打が「神宮」と「それ以外の球場」でどう変わるかを比較します。

ヤクルトは年間の半分を神宮で試合する一方、もう半分は他チームの各本拠地で試合するため、
神宮とそれ以外の球場を比較することで「本拠地がたくさんある中で神宮がどういう位置付けなのか」を定量化できます。
これを算出式として記述するなら以下のようなかたちが考えられます。

 20201024_pf1-1.png

神宮での「ヤクルトvs他チーム」の試合で発生した本塁打の本数(試合あたり)を、
他球場の「ヤクルトvs他チーム」の試合で発生した本塁打の本数(試合あたり)で割っています。
これが一般的にパークファクターの算出式とされるものです。(Wikipedia1.02 - Essense of Baseballを参照)

この式の優れているところは、分母と分子が「同じチーム同士の対戦で使用球場だけが違う」比較になっていることです。
なぜかというと、ヤクルトが各チームと対戦する時、原則として神宮で試合するのと同じだけ敵本拠地でも試合するため、
ヤクルトは神宮で対戦するのと同じ内訳で、他球場でも各チームと対戦することになるからです。

神宮以外の球場も、そこを本拠地として使用しているチームの成績を使えば算出できます。
この方法でセ・リーグ6本拠地の本塁打の打ちやすさを評価すると以下のようになります。数値は2017年-2019年の平均値。

 20200920_pf3.png

数値は「セ・リーグで使用されている他球場と比べて本塁打が何倍出やすいか」を示しています。
神宮・東京ドーム・横浜は本塁打を打ちやすく、マツダ・甲子園・ナゴヤドームは本塁打を打ちにくい球場であるようです。
一般的なパークファクターの算出式では、このような考え方で各球場の本塁打の打ちやすさが評価されています。



算出式の欠点

ここまではパークファクターの算出式の内、最もオーソドックスな式の成り立ちを見てきました。
しかし、この式には各球場を定量的に比較するうえで明らかな欠点が2つあります。
最後にこれらの欠点がなぜ問題となるかを明確にしたうえで、対策を盛り込んだ算出式を導出します。



欠点1 交流戦を計算に含めていること

 プロ野球のスケジュールが8年ぶりに姿を変える。12球団代表者会議が11日、都内で開かれ、来季の交流戦を現行の24試合制から18試合制へ変更することで合意した。(中略) 24試合制では各カード4試合(ホーム、ビジター各2試合)だったが、18試合制では各カード3試合となり、隔年でホームとビジターで3連戦を戦う形に変わる。

交流戦18試合制で合意 セがパ押し切る(日刊スポーツ)


交流戦は2015年から上のようなスケジュールの18試合制となりました。
各チームと3試合ずつ対戦するわけですが、この3試合は本拠地か敵地のどちらか一方しか使用しません。
つまり、交流戦には「本拠地でしか対戦しない相手チーム」と「敵地でしか対戦しない相手チーム」が存在することを意味します。

「本拠地と他球場で各チームと同じ内訳で対戦している」ことがパークファクター算出の前提ですから、
交流戦の結果を計算に含めることによってこの前提が崩れてしまうことになります。
この問題を解消するため、パークファクターを計算する時には交流戦の結果を除外するのがベターだと考えます。



欠点2 「他球場」を基準としていること

パークファクターは他球場を基準に算出されますが、この他球場の内訳がバラバラであることが問題となります。
例えば、神宮とナゴヤドームから見た他球場の内訳は以下のようになっています。

 20201015_pf.png

前節で神宮の本塁打パークファクターを1.63と、ナゴヤドームの本塁打パークファクターを0.57と算出しました。
これは神宮は左グラフの球場群に対して1.63倍、ナゴヤドームは右グラフの球場群に対して0.57倍打ちやすいことを意味しますが、
ここでいう「1.63倍/0.57倍」という数値は基準がそれぞれ異なるわけですから、厳密には定量的な比較になっていません。

グラフを見比べて、目に付くのが灰色のグラデーションで示した「地方球場」の差です。
日本プロ野球では、自軍本拠地でも相手本拠地でもない球場で試合をするケースがあり、こうした球場は地方球場と呼ばれます。
両球場の「他球場」にも地方球場が含まれているわけですが、両者の中身は全く異なるものになっています。

以上より、数値の基準となる他球場の内訳をできるだけ一致させたいなら、
パークファクターを算出する際、分母(基準)となる他球場から地方球場を除外するのがベターでしょう。
交流戦と地方球場を除外すると、神宮とナゴヤドームから見た他球場の内訳は以下のようになります。

 20201014_pfr.png

「その球場を除く5本拠地を5等分した内訳」になっていることにお気付きでしょうか。
交流戦と地方球場を除外してパークファクターを算出すると、この球場群が出力される数値の基準となります。
つまり、「他の5本拠地の平均と比べて本塁打を何倍打ちやすいか」が数値として出力されることになります。

これでも「リーグ内の6本拠地の中での相対的な位置付け」を知る分には有用ではあるものの、
算出する球場によって他球場の内訳が異なるわけですから、基準がバラバラという問題は解消できていません。

突き詰めると、これは「他球場」を基準としていることに根本的な問題があります。
「他球場」にはその球場が含まれないわけですから、両球場から見た他球場の内訳が一致するわけがありません。
つまり、基準を「他球場」ではなく「他球場にその球場自身を加えたもの」としてやればよいのです。

どのような考え方で他球場にその球場自身を加えればよいかですが、
この点については米大手データサイトのFanGraphsに以下のような指摘があります。

And when you actually calculate the PF(引用者注:Park Factor=パークファクター), most people will just weigh the RPG(Runs Per Game=試合あたり得点) at home against the RPG on the road. Well, the more advanced approaches will, instead of comparing home context to road context, compare home context to league context. If there are T teams in a league, the aggregate league context is based 1/T% on each park. To sum for a team, (T-1)*Road+Home((T-1)/T% is road, 1/T% home).

Park Factors – 5 Year Regressed(FanGraphs)


意訳
パークファクターを計算する時、本拠地と他球場の成績を対比させることが多いが、
より精緻に算出するのであれば、本拠地を他球場と対比させるのではなく、リーグ平均と対比させるべきだ。
T個のチームが所属するリーグの場合、各球場はリーグ平均の1/Tずつを構成するため、
他球場をT-1、本拠地を1と重みづけして加重平均を計算すればリーグ平均を求められる。
(引用者注:この文章は得点のパークファクターについて書かれていますが、本塁打でも同じことが言えます)


リーグ内の本拠地を横並びで比較するなら、リーグ平均(6本拠地の平均値)が基準だと確かに合理的です。
「本拠地で記録された成績」を「他球場で記録された成績」と比較するのではなく、
「本拠地で記録された成績」を「6本拠地で均等に試合した時に記録されうる成績」と比較するべきでしょう。

リーグ内の6本拠地は、その1/6が本拠地、5/6は他球場で構成されるわけですから、
「本拠地で記録された成績」を1、「他球場で記録された成績」を5と重みづけして加重平均すれば、
「6本拠地で均等に試合した時に記録されうる成績」を推定できます。これを式の分母とすればリーグ平均を基準にできます。



より正確な算出式

これまでに述べた欠点に対する対策を盛り込むと、以下のような式が考えられるでしょう。
ここでは例として「神宮の本塁打の打ちやすさ」の算出式を記述します。

 20201024_pf2-1.png

分母は「ヤクルトが6本拠地で均等に試合した時に発生しうる本塁打」を示しています。
分子の「ヤクルトが神宮で試合した時に発生した本塁打」を「6本拠地で均等に試合した時に発生しうる本塁打」で割るので、
この式の数値は「平均的な球場(6球場の平均)に対して神宮は本塁打を何倍打ちやすいか」という意味を持ちます。

実はこの式も「同じチーム同士の対戦で使用球場だけが違う」比較になっています。
他球場と神宮のどちらでも、ヤクルトはセの他5チームと均等に対戦しているため、他球場と神宮の結果の加重平均である分母も、
神宮の結果である分子と同じく「ヤクルトがセの他5チームと均等に対戦した結果」となるためです。

ここでは神宮を評価しましたが、他の球場もそこを本拠地として使用しているチームの成績を使えば定量化できます。
どの球場を定量化する場合にも、この式だと「平均的な球場に対して本塁打を何倍打ちやすいか」を基準に数値が出力されるため、
球場によって基準がバラバラだった従来式とは異なり、数値を定量的に比較できるようになりました。

当サイトではこの算出式を用いて、1957年以降に本拠地として使用された全球場の特性を定量化しています。
球場の特性を考慮して選手成績を比較したり、ホームランテラスの影響の評価で参考になると思いますので、
この記事を読んで興味を持たれた方は下のリンクからご覧になってみて下さい。


2021年12球団パークファクター
各球場の特性を調べました

セリーグ本塁打パークファクター
1957年以降の全球場の特性を調べました

パリーグ本塁打パークファクター
1957年以降の全球場の特性を調べました


コメント

No title

HRPFを用いて平均的な環境でプレーした場合の選手の本塁打数を算出するにはどうすればいいでしょうか?

Re: No title

Namikiさん、コメントありがとうございます!
返信が大変遅くなりまして申し訳ございません。

評価したい選手の本塁打の出方がHRPFに従うものと仮定するなら、
1.評価したい打者の本塁打を球場別に分けて、その球場のHRPFでそれぞれ割ることで補正する
2.評価したい打者の打席を球場別に分けて、球場別打席数で重みづけしてパークファクターを加重平均することで、
  「全打席を平均的な環境でプレーした場合と比べて打者の本塁打が何倍になるか」を計算して、シーズン全体の本塁打を割ることで補正する
などの方法が考えられると思います。
1.は極端な特性の球場に本塁打が集中したりすると外れ値が出る可能性があるため、個人的には2.の方法が好みです。

ただ、パークファクターは「平均的な選手」が球場から受ける傾向を表しているに過ぎないため、
特定の選手が受ける傾向とそのまま見做してよいかは慎重に判断する必要があると思います。

wRAAやWARといったRelative系の指標をPF補正する際には、
比較対象となる「平均」の方にパークファクターを作用させるためこの点は問題となりませんが、
HRのような非Relative系の指標を補正する場合には、信頼性が落ちるかもしれません。

No title

中田翔選手が「札幌ドームじゃなかったらホームランをプラス12本は打っている」と言っていたので
平均的な環境でプレーしたら本塁打が何本増えるのか計算しようと考えたのですが
平均的な選手が受ける傾向を表しているのに過ぎないので難しそうですね。

(ご指摘の通りPFを使うやり方は個々の打者の事情が考慮されていないので)

https://twitter.com/gaora_fighters/status/1364767273404141568

Re: No title

Namikiさん、コメントありがとうございます!

あとは原始的な手法ですが、「ホーム本塁打*1/3+ビジター本塁打*5/3」とかでしょうか。
所属チームの本拠地は全試合の1/2で使用されるのに対して、他チームの本拠地は全試合の1/10でしか使用されないため、
6本拠地で全試合の1/6ずつ消化した場合の本塁打を割り出そうとすると、上のような式になりますね。

ただ、この方法もホームとビジターの比が1:1ではなくなってしまうので、
ホームアドバンテージによるノイズが生じるのが難点ですが...
これもホームアドバンテージは選手によって異なる可能性があるのが問題です。

Statcastのようなデータがなければ完全に特定することはできないので、
推定したい場合、どこまで仮定を置いて妥協するかという問題になるような気がします。
(もっと言うとStatcastでも気流や気候の違いは考慮できないので、厳密にはこれでも完璧とは言えないのですが)

コメントの投稿

非公開コメント

コンテンツ

■2021年シーズンデータ
 ポジション別wRAAと先発救援別RSAA
 セリーグ パリーグ 各種PF


■選手INDEX(球団/五十音/守備)
  De
  西 他消滅球団
 
 

■打線アーカイブ
  De
  西 他消滅球団
 歴代打線得点力評価[-2020]
 歴代打線守備力評価[-2020]

■打撃に関する記録
 wRAA通算 シーズン チーム
 wRC+通算 シーズン チーム
 BABIP+通算 シーズン チーム
 K%-通算 シーズン チーム
 BB%+通算 シーズン チーム
 ISO+通算 シーズン チーム

■投球に関する記録
 通算 シーズン RSWIN
 通算 シーズン RSWIN(PF/DER)
 通算 シーズン RSWIN(リリーフ)
 RSWINで見る強力ダブルエース
 RSWINで見る強力勝利の方程式

■守備に関する記録
 守備得点

■球場に関する記録
 一軍PF 2021 2020 2019
 二軍PF 2019 2018 2017
 セPF 得点 本塁打 BABIP
単打 二塁打 三塁打
三振 四球 FIP
 パPF 得点 本塁打 BABIP
単打 二塁打 三塁打
三振 四球 FIP
 球場別 東京ド 後楽園
甲子園
バンド ナゴヤ球場
マツダ 広島市民
De 横浜 川崎球場
神宮
PayPay 平和台 大阪球場
西 メラド 小倉球場
京セラ GS神戸 阪急西宮
ZOZO 東京スタジアム
札幌ド 駒沢球場
楽天生命
日本生命 藤井寺

■RCWINに関する記録
 RCWIN歴代記録[-2020]
 通算 シーズン RCWIN
 通算 シーズン RCWIN(PF)
 通算 シーズン RCWIN(PF/POS)
 RCWINで見る強力打撃コンビ
 RCWINで見る強力打撃トリオ
 ポジション別
 

■傑出度に関する記録
 打撃歴代記録[-2020]
 通算 シーズン 打率傑出度
 通算 シーズン 出塁率傑出度
 通算 シーズン 長打率傑出度
 通算 シーズン OPS傑出度
 投球歴代記録[-2020]
 通算 シーズン 防御率傑出度
 通算 シーズン 奪三振率傑出度
 通算 シーズン 与四球率傑出度

■戦力分析とドラフト評価
 2019年一軍分析
  De 西
 2019年二軍分析
  De 西
 2019年補強・ドラフト評価
  De 西
 2017年戦力分析
  De 西
 2015年戦力分析
  De 西
 2014年戦力分析
  De 西
 2013年戦力分析
  De 西
 2015年二軍評価
  De 西
 2015年ファーム得点PFと選手評価
 打順の組み方を眺める
 2016年 セリーグ パリーグ

■選手の個人評価
 ポジション別に最優秀打者を選ぶ
 2017年 セリーグ パリーグ
 2016年 セリーグ パリーグ
 2015年 セリーグ パリーグ
 2014年 セリーグ パリーグ
 2013年 セリーグ パリーグ
 2016年打者の通信簿
  De 西
 2015年打者の通信簿
  De 西
 2014年選手別守備得点と総合貢献
 総括
 簡易WARの答え合わせ2014
 球団史上最高の4人を選ぶ
    De 西
 

■2018年の特筆記事
 現役打者の2000本安打達成確率を考える
 現役20代選手の通算安打(2018年版)

■2017年の特筆記事
 現役20代選手の通算安打(2017年版)
 「8番投手」は珍しいのか?
 2017年各種パークファクター
 2017広島打線は史上最強か?

■2016年の特筆記事
 2016年における2000本安打の展望
 2016年広島打線、得点力向上の要因は?
 2016年各種パークファクター
 パリーグ野手編成と野手運用の私的評価
 セリーグの犠打減少を考える
 糸井嘉男の成績低下リスクを考える


■2015年の特筆記事
 2000本安打の展望
 違反球の再来?2015年セリーグ
 こちらも違反球?2015年パリーグ
 秋山と柳田が挑む、もうひとつの日本記録
 秋山翔吾の安打記録更新の確率を考える
 「余剰安打」で見る、安打新記録の価値
 山田哲人は何位?二塁手シーズンHR記録
 二塁手史上最高の打撃?2015年山田哲人
 30HRと30盗塁の両立
 三浦大輔、23年連続安打
 谷繁元信、27年連続本塁打
 坂本勇人、7年連続二桁本塁打
 阪神タイガース、得失点差-59で貯金
 2015年はどのくらい打低だったのか?
 2015年各種パークファクター

■考察のようななにか
 □分析結果系
 徹底比較 ダルビッシュ有と田中将大
 平成の大投手 三浦大輔
 ポスト松井稼頭央時代の遊撃手総合力評価
 恐怖の8番打者
 稲葉篤紀、現役引退表明
 0本塁打のスラッガー
 シーズン二桁本塁打に関する記録
 20盗塁カルテットに関する記録
 ピタゴラス勝率を用いた采配評価の妥当性
 鈴木啓示の先発勝利に関する疑義
 セリーグの野手世代交代に関する考察
 □分析手法系
 RSAAに守備力補正をかける
 守備イニング推定手法の改良案
 RRFの考え方
 外野刺殺指標試案
 外野補殺指標試案
 NPB版oWAR(試案)

■データ置き場
 通算 シーズン 守備位置別安打記録
 通算 シーズン 奪三振率
 通算 シーズン 与四球率
 通算 シーズン K%
 通算 シーズン BB%
 通算 シーズン wSB(盗塁得点)
 投手のシーズン本塁打記録
 セパ年度別 打低打高早見表
 年度別タイトル・表彰獲得者一覧
 平成時代のポジション別最多安打打者
 日本時代のイチローの全試合成績


■当ブログのデータについて
 Kazmix World
 日本プロ野球記録
 スタメンデータベース
 日本プロ野球私的統計研究会
 を参考にさせていただいています。

■お問い合わせ
 ご意見ご感想、間違いのご指摘など
 お問い合わせは コメント欄 及び
 ranzankeikoku.npbstats★gmail.com
 にお願い致します。(★を@に変換)

Twitter

検索フォーム

訪問者カウンター