이번 글의 계산 방법에 사용된 스탯은 아이스탯(www.istat.co.kr)을 참고했으며, 계산방법은 http://birdsnest.tistory.com/132 이 링크의 방법을 따랐음을 미리 밝혀둔다. 또한, 다음과 같은 과정을 거쳤다.


1. 일단 이 글을 보시기 전에 WAR이 어떤 스탯인지 알 필요가 있다. WAR(Wins Above Replacement Level)대체 선수에 비해 얼마나 더 많이 승리에 기여했는지 나타내는 지표이다. 현재 세이버메트릭스에서 사용되는 지표 중에서는 여러 스탯을 사용하는 가장 종합적인 스탯이기 때문에, 하나의 평가 기준으로 삼기 가장 유용하다. 물론 상대적으로 그렇다는 뜻이지, 이게 절대적인 스탯이라는 얘기는 아니다. 다만 기존의 승-패나 평균자책점 같은 부정확한 지표보다는 훨씬 완성도가 높다는 뜻이다.


2. ERA와 RA 사이에 0.92 : 1의 관계가 경험적으로 성립한다는 것에 의문을 품고 KBO의 31시즌 동안 누적된 ERA와 RA 사이의 값을 구해보니 0.89 : 1이 나왔다. 처음엔 이 값을 쓸까 했지만, 최근 3년간의 ERA와 RA를 분석한 결과 0.917... : 1 정도의 값이 나왔으므로, 그냥 0.92 : 1을 사용했다.


3. 조정 RA를 산출할 때는 ERA Scale인 FIP를 RA Scale로 바꿔주는 것 외에 구장의 Park Factor를 고려해야 한다. 하지만 그냥 이를 무시하고 조정 RA를 산출했다. KBO 구장의 Park Factor를 정확히 구한다는 것에 대해 나는 회의적이며, 혹시 스탯티즈가 아직까지 살아있었다면 그 기준을 사용했을 것이지만 스탯티즈가 없는 마당에 이런 말을 더 해서 뭐하겠는가. 따라서 타자친화적인 구장을 사용하는 투수들의 경우(대표적으로 한화) 최종산출값에서 손해를 보았을 것이며, 투수친화적인 구장을 사용하는 투수들의 경우 최종산출값에서 이득을 보았을 것이다. 그 점을 감안하고 봐주시기 바란다.


4. Tom Tango는 대체선수들로만 이루어진 Replacement Level 팀의 승률인 .300을 위해서는 선발투수는 .380 구원투수는 .470 정도의 승률을 가져야한다고 주장했다. KBO와 MLB의 차이가 있겠지만, 여기서는 그 가정을 그대로 받아들여 채용했다. 또한 계산할 때 승률은 소수점 이하 세 자리(.000) WAR과 이닝은 소수점 이하 두 자리(.00)까지 사용하고, 그 아래는 반올림했다.


5. 이 기록에 사용된 모든 경기/이닝은 선발등판한 것만을 대상으로 한 것이다. 구원투수의 WAR을 구하는 방법은 등판 상황의 중요도를 측정하는 Leverage Index(LI)의 계산이 필요하므로, 훨씬 복잡하다. 그리고 일부 선수는 5경기, 6경기 정도 선발 등판을 했기 때문에 표본이 상당히 적다는 것을 감안하셔야겠다. (문성현, 이영욱 등) 따라서 5경기 미만 선발등판한 선수는 계산하지 않았다.


6. 한 가지 첨언을 하자면, 스탯티즈가 없어진 지금 2005년부터의 상세한 기록을 볼 수 있는 아이스탯은 대단히 소중한 사이트다. 아이스탯에 굉장히 감사드리는 바이며, 부디 변고가 없이 원활한 운영이 지속되기를 바랄 뿐이다.




삼성

장원삼 2.44

배영수 1.92

고든 1.79

탈보트 1.51

윤성환 1.26

차우찬 0.05

평균 WAR 1.50



롯데

유먼 2.94

이용훈 2.11

사도스키 1.09

송승준 0.98

고원준 0.19

평균 WAR 1.46



넥센

나이트 2.75

벤헤켄 1.95

김영민 1.04

문성현 0.97

강윤구 0.54

김병현 -0.04

평균 WAR 1.20



두산

이용찬 2.44

니퍼트 1.76

김선우 1.45

김승회 1.04

임태훈 0.07

평균 WAR 1.35



KIA

윤석민 2.56

서재응 1.71

소사 1.22

김진우 1.17

앤서니 1.05

평균 WAR 1.54



SK

윤희상 1.95

마리오 1.27

김광현 0.73

송은범 0.53

부시 0.52

이영욱 0.01

평균 WAR 0.84



LG

주키치 3.07

김광삼 1.69

리즈 1.10

이승우 0.69

평균 WAR 1.64



한화

류현진 3.07

김혁민 1.53

박찬호 1.37

양훈 0.88

유창식 0.27

평균 WAR 1.42




8개 구단 총 42명, 높은 순서대로 정렬


주키치(LG) 3.07

류현진(한화) 3.07

유먼(롯데) 2.94

나이트(넥센) 2.75

윤석민(KIA) 2.56

장원삼(삼성) 2.44

이용찬(두산) 2.44

이용훈(롯데) 2.11

벤헤켄(넥센) 1.95

윤희상(SK) 1.95

배영수(삼성) 1.92

고든(삼성) 1.79

니퍼트(두산) 1.76

서재응(KIA) 1.71

김광삼(LG) 1.69

김혁민(한화) 1.53

탈보트(삼성) 1.51

김선우(두산) 1.45

박찬호(한화) 1.37

마리오(SK) 1.27

윤성환(삼성) 1.26

소사(KIA) 1.22

김진우(KIA) 1.17

리즈(LG) 1.10

사도스키(롯데) 1.09

앤서니(KIA) 1.05

김영민(넥센) 1.04

김승회(두산) 1.04

송승준(롯데) 0.98

문성현(넥센) 0.97

양훈(한화) 0.88

김광현(SK) 0.73

이승우(LG) 0.69

강윤구(넥센) 0.54

송은범(SK) 0.53

부시(SK) 0.52

유창식(한화) 0.27

고원준(롯데) 0.19

임태훈(두산) 0.07

차우찬(삼성) 0.05

이영욱(SK) 0.01

김병현(넥센) -0.04




-계산에 사용된 파일을 같이 첨부합니다. 맘대로 퍼가셔도 좋지만, 출처는 되도록 밝혀주시길.



선발투수 WAR 계산식.xlsx



Posted by 김에밀
,

1. 야구라에서 올린 기사 [기록으로 환산한 최고연봉타자는 강정호] http://news.naver.com/main/read.nhn?mode=LSD&mid=sec&sid1=107&oid=405&aid=0000000063 를 읽어보신 분이라면 알겠지만, 해당 글은 WAR을 기준으로 삼고 있다. WARWins Above Replacement의 약자로, 대체 선수에 비해 팀에 얼마나 많은 승수를 올리게 해주었는지를 나타내는 지표다. 간단하고 이해하기 쉽고 직관적이며, 때로는 절대적 기준으로 삼을 수 있다. (물론 통계는 모든 것을 보여주지 않는다는 걸 안다. 여기서 말하는 '절대적' 이라는 건, 대충 이걸 갖고 누가 더 낫다고 우겨도 어느 정도는 들어맞는 스탯들 중에서 그 '어느 정도' 의 수준이 제일 높단 얘기다.)


하지만 야구라에서 기사에서도 인정했고 트위터에서도 인정했듯이, 저 WAR은 무언가 결여되어있다. 제대로 된 스탯 제공을 하지 않는 KBO 환경상 저렇게 WAR을 딱딱 구할 수는 없다는 얘기다. 분명히 야구라에서 구했을 WAR에는 본인들도 '이건 어떻게 해야하나...' 하는 고민과, 따라주지 않는 환경에 대한 원망과 피눈물과, 그로 인한 어쩔 수 없는 수많은 생략이 들어가 있을 것이다.


특히 수비에 관한 부분이 제일 고민거리가 될 것이다. wOBA와 wRAA를 통한 타격 기여나, 구장 보정을 통한 Park Adjust 같은 건 나는 못하지만, 야구라에선 충분히 할 수 있을 것이다. 또한 주루에 관한 것도, 팬그래프에서조차 도루/도루 실패 정도를 제공한다는 점을 감안하면 세부적으로 들어가지 않았을 때 그리 계산하기 어려운 건 아니다. 하지만 수비는 다르다. 하지만 심증이긴 하지만 나는 저 기사에 포함된 계산방식은 공격WAR에 한정되는 것이라는 데 이번 주 내가 사먹은 석식 값을 걸 용의도 있다. (그렇다고 탓하는 건 아니다. 아, 내가 이번 주에 사먹은 석식 값 총합이 3,300원밖에 안된다는 건 잠시 무시하도록 하자.)


MLB에서는 TZ(Total Zone) UZR(Ultimate Zone Rating) +/- 같은 다양한 수비스탯을 제공하지만, KBO에서 볼 수 있는 수비 스탯은 고작해야 필딩율 내지는 레인지팩터에 불과하다. 필딩율은 잡기 어려운 공을 안 잡으면 실책 0으로 1.000을 띄울 수 있는 허당 스탯이며, 레인지팩터는 수비범위를 계산하는 데 적정한 스탯이 아니다. 가령 1선발부터 5선발까지 200탈삼진을 기록하는 파워피쳐로 선발진을 꾸린 팀과, 한 해 100탈삼진 잡을까 말까 하는 그라운드볼러로 선발진을 꾸린 팀에서는 당연히 후자의 야수들이 더 높은 레인지팩터를 기록할 수밖에 없다. 요컨대, 인플레이되는 타구 갯수가 비슷할 때나 의미를 갖는 스탯이라는 것이다.


스포츠투아이에서 제공하는 투구추적시스템을 본다면 분명히 한국형 UZR 계산도 가능할 것이다. 아니 가능하다. 150km로 날아가는 공 초속/종속 재고 회전수/궤적 따지는 양반들이 방망이에 맞아서 날아간 공이 수십 조각으로 나뉜 구장 어느 위치에 떨어지는지, 그걸 수비수가 잡고 못 잡고가 1년에 얼마나 반복되는지 합산 못할 리가 없다. 이런 거 하나 제공 안해주면서, 개인스탯 사이트 물먹이는 이유는 뭐고 '기록' 에 관한 저작권을 주장하는 이유는 또 뭐란 말인가? 이종도가 1982년 개막전에 친 만루홈런이나, 최동원이 1984년 한 시즌에 기록한 223탈삼진은 결코 소유할 수 있는 어떤 종류의 것이 아니다. 혹시 스포츠투아이에서 만들어낸 스탯들이 있다면 그에 관해서는 소유권을 인정하겠지만, 앞에서 말한 정도의 노력도 안하는 업체에서 일반 야구팬의 알 권리를 막는 행태는 심히 우습다. 그리고, 막말로 니들은 빌 제임스한테 로열티 내냐?




사족: 저번 글에서 나는 4위권 팀 중에서 LG 롯데 두산 순으로 4강 확률이 높을 거라고 예측했다. 미안하다. 내가 DTD를 너무 무시했다. 좀 다른 얘기긴 하지만, '안될거야 아마' 가 이미 체득된 팀은 결코 일어날 수 없다. 네이버 뉴스 댓글에서 '지금 LG에 필요한 감독은 제리 로이스터다' 라는 얘기를 보았는데, 만약 이루어진다면 괜찮은 인선이라고 생각한다.

Posted by 김에밀
,

*6월 9일까지의 경기 결과를 바탕으로 계산하였다.

*계산하기 위해 동원한 모든 스탯은 아이스탯을 참조하였다.

*무승부는 어차피 쓸모없으므로 굳이 표기하지 않았다.


*아이스탯에서 사용된 피타고리안 승률은 득점^2/(득점^2+실점^2)의 일반 공식이 아닌, 지수에 2대신 X=0.45+1.5×log10((득점+실점)/경기)를 대입한 공식이다. MLB에서 좀 더 정확한 계산시 2 대신 1.82를 지수로 집어넣기 때문에 좀 더 정확한 값이라고 판단하고 그대로 써먹기로 한다.


*수비효율(DER)은 인플레이된 타구를 얼마나 아웃처리했는지 계산하는 것으로, 공식은 (상대타자-안타-삼진-사사구-실책) / (상대타자-홈런-삼진-사사구) 이다.



 

 승

패 

 승률

피타고리안 승률 

수비효율DER 

SK

25 

20

0.556 

0.524

0.660 

넥센

25 

22 

0.532

0.550 

0.605 

롯데 

24 

22 

0.522

0.487 

0.621 

두산

24 

22 

0.522 

0.488 

0.620 

LG 

24 

23 

0.511 

0.507 

0.622 

삼성 

24 

23 

0.511 

0.592 

0.642 

KIA 

20 

24 

0.455 

0.438 

0.612 

한화 

19 

29 

0.396 

0.424 

0.588 


앞으로의 시즌 전망


한화 - 8개 구단 최하위의 수비효율은 이 팀이 왜 꼴찌인지를 말해주는 대목이다. 실책 수로는 롯데(35)와 동률이고 LG(42)보다 적지만, 수비효율로 따져보면 LG와 롯데는 각각 3위와 4위고 한화는 8위다. 시즌 전 기대하던 송신영 박정진 바티스타의 계투진이 전혀 먹히지 않고 있는 점과, 여름이 다가와서 그 동안 뜨거웠던 타격이 식을 것을 감안하면, 압도적인 단독 꼴찌가 예상된다.


KIA - 7위임에도 불구하고 5월 승률 1위 팀이다(.565) 놀랍지?! 하지만 역시 마땅히 전력에 플러스 요소가 될 만한 부분이 없다. 여름에 타선이 살아나준다면 조금 희망이 있을 거 같기도 하지만, ERA/OPS 7위 팀에게서 많은 기대를 하기는 어렵다.


SK, 삼성 - SK와 삼성은 현재 수비효율이 가장 좋은 팀이다. SK는 줄곧 선두를 달려왔으며 삼성은 2경기차 5위까지 따라붙은 상황. 게다가 두 팀은 ERA 1,2위 팀이기도 하다(삼성 3.74 SK 3.83) SK는 별다른 이상이 없는 이상 선두권을 유지할 것이 분명하며, 피타고리안 승률 1위인 삼성도 곧 선두권으로 진입할 것으로 예상된다. (더구나 '여름의 삼성' 아닌가)


넥센 - 넥센은 수비효율 7위임에도 불구하고 타격의 힘으로 상위권을 유지하고 있다(OPS 2위, 홈런 1위) ERA도 3.98으로 5위긴 하지만 평균보다는 좋은 수준. 하지만 타격은 한계가 있다. 최근 기세가 떨어지고 있는 불펜과 좋지 않은 수비력이 만나면 대참사가 일어날 가능성이 높다. 사실상 현재 2위를 차지하고 있는 것은 운이다. 곧 내려올 듯 하다.


롯데, 두산, LG - 세 팀은 비슷한 승률과 비슷한 수비효율을 보이고 있다. 또한 기타 비슷한 지표에서도 그다지 큰 차이를 보이지 않고 있다. 다만 상대적으로 많이 선수들이 갈리고 있는 두산이 좀 더 불리할 것이다. LG의 선발진과 롯데의 불펜진도 불안요소긴 하지만 두산의 Depth 변화에 비해서는 얕은 변화라고 본다. 개인적 예상으로는 LG 롯데 두산 순으로 4강 확률이 높을 것으로 생각한다. [각주:1]



참고로 필자는 시즌 전 삼성-롯데-KIA-SK-두산-한화-넥센-LG 순으로 순위를 전망했었다. 현 순위는 53713825... 망.

  1. 두산은 LG와 롯데에게 현 시점까지 2승 9패로 철저하게 패배하고 있다. (1-4 1-5) [본문으로]
Posted by 김에밀
,