どの程度のサンプルサイズがあれば数値に信頼がおけるかというのは問題とする指標によって異なる。
例えば投手の奪三振率ならそもそもその高低は選手ごとの実力の違いによって決定される部分が大きいため、
少ない打席数の結果でも実力を反映している割合が高い。
これに対して投手のBABIPは実力差自体が小さいため、多くの打席数を集めなければデータから実力を推定することは難しい。

ひとつの目安として、Baseball Prospectusのラッセル・カールトンは2003年から2011年のMLBのデータを元に
指標ごとにどれだけのサンプルサイズがあれば指標の変動のうちに占める能力の割合が半分以上になるかを計測している。
下記にその一部を引用する。

【打撃指標】
60打席:三振/打席
120打席:四球/打席
240打席:死球/打席
290打席:単打/打席
1610打席:(二塁打+三塁打)/打席
170打席:本塁打/打席
910打数:打率
460打席:出塁率
320打数:長打率
160打数:ISO
820BIP:BABIP

https://1point02.jp/op/gnav/glossary/gls_explanation.aspx?eid=20020