이번 글에서는 총 3가지의 스탯을 다룰 예정이다. RC, RC/27, XR이 그것이다. (2가지라고 봐도 되겠다.)


RC(Runs Created, 득점 생산)는 빌 제임스가 고안한 타자의 득점 생산력을 나타내기 위한 지표이다. Factor A(출루) Factor B(진루) Factor C(기회) 3가지 식에서 복잡한 계산을 거쳐 결과값이 나오게 된다. 이는 처음 개발된 이후 꾸준히 변형되어왔는데, 본 계산에서는 (위키피디아에도 있는) 2002년 버전을 사용하였다. 그 식은 다음과 같다.


A : 안타 + 볼넷 - 도루실패 + 몸에 맞는 공 - 병살타

B : (1.125 * 1루타) + (1.69 * 2루타) + (3.02 * 3루타) + (3.73 * 홈런) + 0.29 * (사사구-고의사구) + 0.492 * (희생번트+희생플라이+도루) - (0.04 * 삼진)

C : 타수 + 사사구 + 희생번트 + 희생플라이


여기에서 (2.4C+A) (3C+B)를 9C로 나눈 다음 0.9C를 뺀다.


이렇게 복잡한 과정을 거쳐서 총 결과값이 나오게 되지만, 실제로는 출루율 * 총루타만 해도 이와 비슷한 값을 얻을 수 있다. 직접 비교해보겠다.


(출루율*총루타로 구한 값 / RC)

박병호 : 103.36 / 100.02

강정호 : 100.77 / 94.82

박석민 : 100.46 / 101.64

최정 : 98.18 / 94.70


대체로 비슷비슷한 값이 나온다는 걸 알 수 있다. 기본적인 개념이 여기서 출발했기 때문이다.

RC는 기본 공식도 95% 정도의 정확성이 보장된다고 한다. 그리고 심화된 계산식은 이보다 더 높은 정확도를 보인다고 한다. 하지만 톰 탱고Tom Tango는 그 자신의 홈페이지(http://www.tangotiger.net/wiki/index.php?title=Runs_Created)에서 RC가 1. 홈런의 가치를 제대로 반영하고 있지 않으며 2. 이론적 기반이 취약하다고 지적한 바 있다.



한편 RC/27이란 무엇인가? 이는 1번부터 9번까지 똑같은 타자로 한 팀을 채웠을 경우, 27개의 아웃을 잡아 경기가 끝날 때까지 그 팀이 총 몇 점을 득점할 수 있는지를 나타낸 지표이다. 만일 강정호의 RC/27이 9.5일 경우 1번부터 9번까지 강정호로만 된 팀이 얻을 수 있는 점수는 9.5점이라는 얘기다. (물론 실제로는 그렇게 될 리가 없지만, 대략은 그렇다는 뜻으로 이해하면 되겠다.) 계산식은 다음과 같다.


27 * RC / (타수 - 안타 + 도루실패 + 병살타 + 희생번트 + 희생플라이)


희생번트와 희생플라이는 넣기도 하고 빼기도 하는 경우가 있다고 하는데, 본 계산에서는 둘 다 넣었다.



XR(eXtrapolated Runs)은 '추정 득점' 정도로 번역하면 될 듯 하다. 이는 Jim Furtado가 고안한 지표인데, RC와 마찬가지로 타자의 득점 생산력을 계산하기 위한 것이다. RC와의 차이점이 있다면 이것은 1955년부터 1997년까지의 메이저리그 시즌에서 회귀분석을 통해 도출한 선형공식이라는 것이다. 또한 득점 생산력을 나타내는 식 중에서는 가장 정확한 편이라고 하며, RC에서 발생할 수 있는 인플레이션 역시 없다고 한다.[각주:1] 식은 다음과 같다.


(0.5 * 1루타) + (0.72 * 2루타) + (1.04 * 3루타) + (1.44 * 홈런) + 0.34 * (사사구-고의사구) + (0.25 * 고의사구) + (0.18 * 도루) - (0.32 * 도루실패) - 0.09 * (타수 - 안타 - 삼진) - (0.098 * 삼진) - (0.37 * 병살타) + (0.37 * 희생플라이) + (0.04 * 희생번트)



아래에서는 위 3가지 스탯을 모두 정리해놓았으니 참고하기 바란다. 기준은 20경기 이상, 50타석 이상을 채운 타자.


※글을 수정하면서 한가지 스탯을 추가했는데, 조정OPS(OPS+)가 그것이다. 조정OPS는 그 해 리그 평균에 대비해 타자가 얼마나 훌륭한 타격을 펼쳤는지 나타내는 스탯이다. OPS와 마찬가지로 타자의 출루율/장타율과 리그 출루율/장타율에 기반하여 계산하며, 100이 딱 평균이다. 숫자가 100 아래면 평균보다 못 친 것이고 100 위면 평균보다 잘 친 것이다. 가령 OPS+가 170인 박석민은 2012년 리그 평균에 대비해 1.7배 잘 친 것이지만, OPS+가 98인 김상수는 리그 평균보다 아주 조금 못 쳤다고 할 수 있다.














RC top 10

1. 김태균 105.08

2. 박석민 101.64

3. 박병호 100.02

4. 강정호 94.82

5. 최정 94.70

6. 이승엽 92.42

7. 이호준 83.07

8. 박용택 82.97

9. 손아섭 76.69

10. 이용규 74.07


XR top 10

1. 박병호 103.14

2. 김태균 99.98

3. 박석민 99.89

4. 최정 96.17

5. 강정호 95.12

6. 이승엽 90.71

7. 박용택 82.39

8. 이호준 81.08

9. 손아섭 72.53

10. 이용규 71.66


RC/27 top 5 (규정타석)

1. 김태균 10.06

2. 박석민 8.50

3. 강정호 7.85

4. 박병호 7.61

5. 이호준 7.19


OPS+ top 5 (규정타석)

1. 김태균 185

2. 강정호 176

3. 박석민, 박병호 170

5. 최정 166

6. 정성훈 163


-----

RC와 XR 순위를 비교해보면 알 수 있겠지만 김태균과 박석민이 RC에서 굉장히 높은 수치를 보이는데, 이것은 두 선수의 출루율이 높고 (규정타석 1,2위) 볼넷이 많은 데서 기인하는 듯 하다. 작은 이병규가 RC/27에서 리그 최상급 수치를 보이는 것도 그의 출루율이 높은 것이 (.435) 원인일 것이다.


아까 잘 이해가 되지 않는다고 적었던 'RC의 인플레이션 현상' 이라는 것은 바로 이런 현상이 아닐까. 출루율이 과대평가되는 것 말이다. 물론 이것이 실제 가치인지 실제 가치보다 더한 평가인지 구별할 능력이 필자에게는 없으므로 어느 것이 정답인지는 확실히 단언하기 힘들다. 개인적으로는 XR을 더 선호하는 관계로[각주:2] 앞으로 타자의 득점생산력을 얘기할 때는 주로 XR을 이용하되, 필요할 때마다 RC/27을 인용할 계획이다.

  1. 사실 이거 뭔 소린지 모르겠다. 위키 원문에는 'And unlike James' RC, it doesn't artificially inflate the runs produced by individual players who combine high OBPs and SLGs.' 이라고 되어있는데, OPS 높은 타자가 보통 득점생산력 더 좋은 거 아닌가? [본문으로]
  2. 앞서도 얘기했듯이 XR은 1955년부터 1997년까지의 기록을 분석해서 만든 스탯인데, 사실 라이브볼 시대 이후 전체를 분석했다면 더 좋지 않았을까 싶지만 약물 시대와 그 이전이 모두 포함된 저 시기도 충분히 의의가 있다고 본다. [본문으로]
Posted by 김에밀
,

-Leverage Index는 무엇인가


Leverage Index, 줄여서 LI는 불펜투수의 등판 당시 상황 중요도를 나타내는 지표이다. (사실 후술할 개념에 따르면 이렇게 간단하게 설명하면 안 되지만, 그냥 이렇게 알고 있어도 무리는 없을 거 같다.)


A. 8회 10-0으로 이기고 있는 상황에서 무사 1,2루에 등판한 투수

B. 8회 3-0으로 이기고 있는 상황에서 무사 1,2루에 등판한 투수

C. 8회 1-0으로 이기고 있는 상황에서 무사 1,2루에 등판한 투수


과연 누구의 책임이 가장 막중한가? 삼척동자라도 C가 제일 큰 부담을 짊어지고 등판했다는 사실을 알 수 있을 것이다. 그렇다면 다음은 어떤가?


D. 7회 5-2로 이기고 있는 상황에서 1사 1,3루에 등판한 투수

E. 6회 4-3으로 이기고 있는 상황에서 2사 3루에 등판한 투수

F. 9회 1-3으로 지고 있는 상황에서 무사 1루에 등판한 투수


슬슬 헷갈리기 시작하지 않는가?


LI를 이해하려면 이에 앞서서 기본 개념인 WPA(Winning Probability Added)를 이해해야 한다. 이는 특정 상황 특정 타석에서 벌어진 퍼포먼스로 '기대 승률' 이 얼마나 변화하는지를 측정하는 지표다. 자세한 설명은 이 링크를 참고하시길. (http://birdsnest.tistory.com/151)


링크를 누르는 것조차 귀찮으신 분을 위해 설명하자면, 넥센과 LG의 경기에서 8회초 넥센이 0:1로 뒤지고 있는 상황에서 넥센의 기대승률을 0.4라고 가정해보자. 현재 상황은 무사에 주자가 아무도 없는 상황이고, 넥센의 5번 타자 강정호가 타석에 들어섰다. 만약 강정호가 홈런을 친다면 넥센이 승리할 확률은 올라갈 것이다. 하지만 강정호가 삼진을 당해 물러난다면 넥센이 승리할 확률은 낮아질 것이다. 이 개별 상황의 기대승률 변화값이 WPA며, 특정 상황의 WPA를 리그 전체 한 타석의 평균 WPA로 나눈 것이 곧 LI가 되는 것이다. 만약 LI가 2.3이라면 그 상황은 평소보다 2.3배 중요하다는 뜻이다. LI가 1이라면 곧 평균적인 상황이라고 할 수 있다.


각 상황이 어느 정도 중요하다는 걸까? 가령 8회말 5-2에서 무사 1,2루는? 7회초 3-6에서 2사 3루는? 궁금한 분들을 위해 LI의 개발자 Tom Tango는 직접 표를 만들어 올려두었다 (http://www.insidethebook.com/li.shtml)


그렇다면 2012년 KBO에서 가장 막중한 상황에 등판한 불펜투수, 혹은 가장 여유있는 상황에 등판한 불펜투수는 누구일까? 직접 계산해보았다. 표에서는 +/- 4점차까지만 계산을 해놓았기에, 5점 이상의 점수차가 날 경우 표에 있는 숫자 변화 추이에 따라 적정하다고 생각하는 값을 넣었으며 (3점차에 1.4 / 4점차에 0.7 이렇게 변했으면 그 다음은 0.3 이런 식으로) 10점 이상 리드를 잡고 있는 상황일 경우 역전할 가망이 거의 없다고 판단해 등판 중요도를 0으로 계산하였다. 기준은 불펜으로 30경기 혹은 30이닝 이상 등판한 투수로 한정한다.








보기 편하게 높은 순, 소속팀별로 재배열했다. 개인적으로 재밌는 점을 꼽아보라면...


1. 손승락의 LI는 2.24로 리그 최고다. 그를 제외하면 클로저 중에서도 LI 2에 근접하는 선수는 봉중근(1.95)과 프록터(1.94)가 있을 뿐이다. SK 박희수의 LI 역시 1.81로 정우람(1.77)보다 높다. 셋업맨이 클로저보다 LI가 높은 것은 다른 구단에는 없는 현상이다. 이는 김시진의 빠른 손승락 투입(8회 1,2사 등에) 그리고 이만수의 박희수 투입(위기상황에 언제든지) 성향이 반영된 것이 아닐까.


2. 삼성 불펜진은 전체적으로 LI가 낮은 편이다. (오승환의 1.58은 다른 클로저들과 비교해보면 꽤 낮은 수치다.) 한화 불펜진 또한 그렇다. 하지만 삼성 불펜진의 LI가 낮은 이유는 믿을 만한 선발 뒤에서 상대적으로 편한 상황에 등판할 수 있었다는 요소가 작용하는 반면, 한화 불펜진의 LI가 낮은 이유는 승리조 투수라도 패전하는 경기(=LI가 낮은) 에서 다른 투수의 뒤를 이어 등판해야 하는 상황이 많았기 때문일 것이다.

Posted by 김에밀
,

-읽기 전에

ERA : 평균자책점

FIP : 수비무관평균자책

ERA-FIP : +값일수록, 높을수록 투수 실력에 비해 운이 안 따라준 케이스

kwERA : 탈삼진/볼넷만 가지고 측정한 변형자책점


표 밑에 FIP와 kwERA에 관한 설명이 있으니, 미리 읽고 표를 볼 것을 권유함.



삼성

ERA

FIP 

ERA-FIP 

kwERA 

장원삼

3.55

3.11  0.44 

3.75 

탈보트

3.97

4.13  -0.16  5.11 

배영수

3.21

3.33 

-0.12 

4.49 

고든

3.94

3.81 

 0.13

4.49 

윤성환

2.84

3.16 

-0.32 

3.99 

차우찬

6.02

5.33 

0.69 

5.27 

오승환

1.94

1.08 

0.86 

1.60 

권혁

3.10

3.25 

-0.15 

4.38 

심창민

1.83

2.47 

-0.64 

3.59 

정현욱

3.16

2.74 

0.42 

4.13 

권오준

2.95

2.31

0.64 

2.99 

정인욱

2.49

3.26 

-0.77 

4.82 

안지만

1.71

2.33 

-0.62 

3.55 

김희걸

5.29

3.87 

1.42

4.49 

전체투수진

3.39 

3.36 

0.03 

4.18 



SK 

ERA 

FIP 

ERA-FIP 

kwERA 

윤희상 

3.36 

3.67 

-0.31 

4.52 

송은범 

4.15 

3.84 

0.31 

4.59 

박희수 

1.32 

2.18 

-0.86 

2.86 

김광현 

4.30 

4.34 

-0.04 

4.40 

이재영 

4.29 

4.46 

-0.17 

4.95 

마리오 

3.40 

4.22 

-0.82 

5.10 

엄정욱 

3.20 

4.08 

-0.88 

4.37 

박정배 

3.14 

4.19 

-1.05 

4.70 

부시 

4.43 

4.68 

-0.25 

4.93 

로페즈 

3.86 

4.00 

-0.14 

4.31 

채병용 

3.16 

3.30 

-0.14 

4.51 

정우람 

2.20 

1.54 

0.66 

2.54 

최영필 

4.58 

3.88 

0.70 

3.73 

전유수 

4.33 

3.67 

0.66 

4.54 

이영욱 

5.57 

5.43 

0.14 

5.57 

임경완 

5.40 

5.25 

0.15 

5.14 

전체투수진 

3.82 

3.99 

-0.17 

4.54 




롯데 

ERA 

FIP 

ERA-FIP 

kwERA 

유먼 

2.55 

3.20 

-0.65 

3.98 

이용훈 

3.01 

3.29 

-0.28 

4.48 

사도스키 

4.32 

4.08 

0.24 

4.87

최대성 

3.59 

3.79 

-0.20 

4.31 

송승준 

3.31 

3.82 

-0.51 

4.35 

고원준 

4.25 

4.82

-0.57 

5.35 

김성배

3.21 

3.54 

-0.33 

4.70 

강영식 

3.89 

2.60 

1.29 

3.42 

이승호 

3.70 

4.36 

-0.66 

5.84 

정대현 

0.64 

1.80 

-1.16 

3.16 

이명우 

2.56 

3.11 

-0.55 

4.59 

진명호 

3.45 

5.19 

-1.74 

4.80 

김사율 

2.98 

3.22 

-0.24 

3.38 

김수완 

3.76 

3.84 

-0.08 

4.61 

이정민 

5.18 

4.05 

1.03 

5.24 

전체투수진 

3.49 

3.79 

-0.30 

4.56 




두산

ERA

FIP 

ERA-FIP

kwERA 

노경은 

2.53 

3.38 

-0.85 

4.14 

니퍼트 

3.20 

3.99 

-0.79 

4.51 

이용찬 

3.00 

3.37 

-0.37 

4.52 

김승회 

4.04 

4.02 

0.02 

4.82 

김선우

4.52 

4.25 

0.27 

5.02 

홍상삼 

1.93 

2.68 

-0.75 

3.55 

프록터 

1.79 

2.64 

-0.85 

4.09 

변진수 

1.71 

3.20 

-1.49 

4.69 

임태훈 

4.65 

5.17 

-0.52 

5.56 

이혜천 

7.45 

4.50 

2.95 

5.13 

김창훈 

2.08 

3.66 

-1.58 

4.98 

정대현 

5.20 

5.34 

-0.14 

5.40 

김강률 

2.88 

3.40 

-0.52 

4.57 

전체투수진 

3.59 

3.82 

-0.23 

4.66 




KIA 

ERA 

FIP 

ERA-FIP

kwERA 

앤서니

3.83

4.41 

-0.58 

4.97 

김진우 

2.90 

3.14 

-0.24 

4.30 

윤석민 

3.12 

2.88 

0.24 

3.38 

소사 

3.54 

3.43 

0.11 

4.13 

서재응 

2.59 

3.46 

-0.87 

4.57 

박지훈 

3.38 

4.20 

-0.82 

5.09 

진해수 

5.27 

4.42 

0.85 

5.08 

박경태 

7.34 

2.99 

4.35 

4.46 

양현종 

5.05 

5.28 

-0.23 

5.70 

최향남 

3.98 

2.17 

1.81 

3.42 

유동훈 

5.29 

2.46 

2.83 

3.78 

홍성민 

3.38 

4.68 

-1.30 

5.06 

전체투수진 

3.90 

3.76 

0.14 

4.53 





넥센 

ERA 

FIP 

ERA-FIP

kwERA 

나이트

2.20 

3.35 

-1.15 

4.69 

벤헤켄 

3.28 

3.87 

-0.59 

4.19 

박성훈 

2.45 

3.78 

-1.33 

4.79 

김영민 

4.69 

4.40 

0.29 

4.97 

이정훈 

4.67 

3.74 

0.93 

4.49 

강윤구 

4.08 

4.44 

-0.36 

4.20 

김병현 

5.66 

5.30 

0.36 

5.03 

한현희 

3.12 

3.73 

-0.61 

4.03 

손승락 

2.15 

2.53 

-0.38 

3.51 

이보근 

5.27 

4.84 

0.43 

5.47 

김상수 

4.73 

5.36 

-0.63 

5.57 

오재영 

5.19 

6.34 

-1.15 

4.87 

문성현 

4.23 

2.35 

1.88 

3.92 

심수창 

7.30 

4.51 

2.79 

5.22 

장효훈 

5.02 

4.63 

0.39 

5.40 

전체투수진 

3.83 

4.06 

-0.23 

4.65 




LG 

ERA 

FIP 

ERA-FIP

kwERA 

주키치 

3.45 

3.44 

0.01 

4.73 

김광삼 

4.92 

3.92 

1.00 

5.19 

리즈 

3.69 

3.19

0.50 

4.01 

최성훈 

4.42 

4.72 

-0.30 

5.65 

신재웅 

3.59 

4.55 

-0.96 

5.05 

유원상 

2.19 

3.21 

-1.02 

4.20 

우규민 

3.30 

2.93 

0.37 

4.37 

김기표 

3.04 

4.23 

-1.19 

4.75 

류택현 

3.33 

4.05 

-0.72 

4.54 

이승우 

5.90 

4.76 

1.14 

4.95 

정재복 

5.64 

3.93 

1.71 

5.22 

이동현 

3.02 

2.31 

0.71 

3.43 

임찬규 

4.53 

4.40 

0.13 

5.00 

임정우 

6.26 

3.83 

2.43 

4.91 

한희 

5.31 

4.98 

0.34 

4.73 

이상열 

3.72 

3.99 

-0.27 

4.71 

봉중근 

1.18 

2.66 

-1.48 

3.35 

전체투수진 

4.02 

3.76 

0.26 

4.68 




한화 

ERA 

FIP 

ERA-FIP

kwERA 

류현진 

2.66 

2.40 

0.26 

2.72 

김혁민 

4.06 

3.60 

0.46 

4.28 

유창식 

4.77 

5.28 

-0.51 

5.33 

박찬호 

5.06 

4.73 

0.33 

5.05 

바티스타 

3.56 

3.84 

-0.28 

3.54 

양훈 

5.30 

4.55 

0.85 

5.40 

송창식 

2.91 

3.73

-0.82 

3.79 

박정진 

5.47 

3.92 

1.55 

4.35 

안승민 

4.75 

3.76 

0.99 

4.14 

마일영 

5.55 

4.34 

1.21 

4.86 

윤근영 

3.72 

4.04 

-0.32 

4.96 

정민혁 

6.16 

4.90 

1.26 

4.30 

송신영 

4.94 

4.71 

0.23 

4.48 

전체투수진 

4.56 

4.06 

0.50 

4.34 






-설명


1. 본문에서는 20이닝 이상 투구한 선수들에 대한 FIP만 구했으므로, 그보다 적게 던진 선수의 FIP가 궁금하신 분은 직접 구해보시면 되겠다.


2. FIP(Fielding Independent Pitching)은 우리 말로 옮기면 '수비무관평균자책점' 정도일 것이다. 이는 일단 세이버메트리션 보로스 맥크라켄의 '인플레이된 공이 범타가 되느냐 안타가 되느냐는 순전히 운이다. 투수의 능력과는 상관없다' 라는 주장 하에서 만들어진 스탯이다. (더 정확히 얘기하면 FIP는 개량된 형태고, 원 형태는 DIPS라고 한다.) 처음엔 이를 말도 안 되는 주장으로 여기는 사람이 많았으나, 후속 연구 끝에 투수의 능력이 인플레이된 공의 안타 여부에 미치는 영향은 3할도 안 되는 것으로 밝혀졌다. (나머지는 운, 구장, 수비에 달려있다. 특히 운이 거의 반.) 


따라서 FIP를 도출할 때는 인플레이되어 수비수가 개입한 모든 타구를 제외하고, 피홈런/사사구/탈삼진과 투구이닝만을 가지고 계산한다. 비록 1. 투수가 타구에 미치는 일부 영향을 무시함 2. 구장에 따른 보정이 없음 이라는 두 가지 약점에도 불구하고, FIP는 현재까지는 투수의 순수 능력을 평가하는 잣대 중에선 상당한 신뢰도를 자랑하는 편이다.


3. kwERA는 FIP보다 더 극단적으로 탈삼진/볼넷만을 가지고 투수의 피칭을 예측하는 스탯이다. 계산법은 5.4에서 12*(K-BB) / BF(상대한 타자 수) 를 빼면 된다. 다음 시즌 성적 예측에 FIP보다 편하다고 알려져있다.


전반기에 올렸던 FIP 글을 지우고 새로 쓴다. 마음대로 퍼가셔도 상관없지만 출처는 되도록 명시해주시길.



Posted by 김에밀
,