같은 득실차, 다른 승률: 피타고라스 기댓값과 "운"의 정의

지난 글의 마지막에 이런 질문을 던졌다.

득실차만으로는 부족하다면, 승률을 더 잘 설명하는 공식이 있을까?

5시즌 150개 팀에서 r = 0.95를 본 뒤, 우리는 그 0.95 위의 5%가 어디서 오는지를 짚었다. 같은 득실차여도 승률이 다른 팀들이 있다. 같은 +50점이라도, 6:5로 자주 이긴 팀과 10:0으로 한 번 이기고 1:0으로 두 번 진 팀의 승률은 다르다.

그러면 득실차 대신, RS(득점)와 RA(실점)를 따로 쓰는 공식이 있다면 그 5%를 메울 수 있을까?

야구 통계 쪽에 이미 그런 공식이 하나 있다.

빌 제임스라는 사람

1980년대 미국 캔자스의 한 통조림 공장 야간 경비원이었다. 회사 야구팀도 아니고, 학회 소속도 아니다. 그냥 야구 통계를 좋아하는 한 사람이었다.

이 사람의 이름이 빌 제임스(Bill James) 다. 그는 1977년부터 매년 Baseball Abstract 라는 자료집을 자비로 출판했고, 이 책 안에서 야구를 보는 새로운 눈을 만들어냈다. 우리가 지금 야구 중계에서 듣는 OPS, WHIP, BABIP 같은 지표 대부분이 이 사람의 후예들이다. 영화 머니볼 의 빌리 빈이 빌 제임스의 글을 읽고 단장 일을 시작했다.

그의 가장 유명한 발견 중 하나가 바로 이번 글의 주제다. 형태는 이렇다.

\text{Expected Win\%} = \frac{RS^2}{RS^2 + RA^2}

기호로만 보면 답답하니 풀어 쓰면, "득점의 제곱을 (득점의 제곱 + 실점의 제곱)으로 나눈 값"이다. 그 결과는 0과 1 사이의 숫자가 되는데, 빌 제임스는 이게 그 팀의 승률에 가깝다고 주장했다.

이름이 좀 거창하다. 피타고라스 기댓값(Pythagorean Expectation). 직각삼각형의 빗변 공식 a² + b² = c² 와 모양이 닮았다고 빌 제임스 본인이 농담처럼 붙인 이름인데, 그 이름이 그대로 굳어버렸다.

왜 하필 제곱인가

여기서 누구나 한 번은 멈칫한다. 왜 RS와 RA를 그냥 쓰지 않고 제곱해야 하는가?

솔직히 말하면, 빌 제임스도 처음에는 "왜인지는 모르겠지만 잘 맞는다"는 이유로 썼다. 단순한 비율 RS / (RS + RA) 도 시험해봤는데, 실제 승률보다 항상 완만하게 나왔다고 한다. 즉 잘 이긴 팀의 승률을 과소평가하고 못한 팀을 과대평가했다.

지수를 2로 올려서 RS² / (RS² + RA²) 로 쓰면 이게 더 잘 들어맞았다. 잘 이기는 팀은 더 잘 이기는 쪽으로, 못하는 팀은 더 못하는 쪽으로 결과를 벌려주기 때문이다.

직관적으로는 이렇게 이해해도 된다. 제곱은 큰 숫자를 더 크게 만들고 작은 숫자는 더 작게 만든다. 한 팀이 RS=900, RA=600으로 1.5배 차이를 냈다면, 단순 비율로는 0.6 정도지만 제곱하면 800,100 / (810,000 + 360,000) ≈ 0.69가 된다. 이 0.09 차이가 "큰 점수차에는 큰 승률 보상이 따른다"는 야구의 비선형성을 잡아준다.

이건 유도된 공식이 아니다. 야구 데이터를 보고, 어떤 형태가 가장 잘 들어맞는지 시행착오로 찾은 공식이다. 그래서 이름은 그리스 수학자에서 따왔지만, 본질은 경험적(empirical) 이다.

5시즌에 적용해봤다

이 공식이 우리 데이터에서 얼마나 잘 들어맞는지가 진짜 질문이다. 그래서 2021~2025, 5시즌 150개 팀의 RS, RA를 가져와 모든 팀에 대해 피타고라스 기댓값을 계산했다.

그리고 X축에 피타고라스 기댓값, Y축에 실제 승률을 놓고 산점도를 찍었다. 대각선(y=x)을 함께 그었다. 이 대각선 위에 점이 정확히 박히면 "공식이 완벽하게 맞췄다"는 뜻이다.

Q2 분석 페이지 산점도 — 5시즌 150팀, y=x 기준선

눈으로 봐도 이미 답이 나와 있다. 점들이 대각선 주변에 빽빽하게 줄지어 있다. 약간씩 위아래로 흩어져 있긴 하지만, 큰 흐름에서 벗어나는 점은 거의 없다.

그런데 r은… 거의 안 변했다

그러면 숫자로 확인해보자. Q1에서 우리는 r(Diff, Pct) = 0.95를 얻었다. 이번에 r(피타고라스, Pct)는 어떻게 나왔을까?

Q2 페이지 수치 카드 — r=0.9511, MAE=0.0219 (≈3.5승), 시즌별 r

5시즌 150개 점에서 r = 0.9511 이 나왔다. Q1의 0.9503과 비교하면… 0.0008 차이다. 거의 변화가 없다.

솔직히 김이 새는 결과다. 우리는 "더 똑똑한 공식을 쓰면 r이 확 올라가겠지"라는 기대로 시작했다. 그런데 지수를 2로 올린 비율 공식이 단순 뺄셈보다 거의 나아지지 않았다.

여기서 한 발짝 물러서서 생각해야 한다.

r은 두 변수가 같이 움직이는 정도를 잰다. Q1에서 봤듯 득실차와 승률은 정의상 단단하게 묶여 있다. 이미 0.95에 도달해 있다는 건 "선형 관계로도 거의 다 설명된다"는 뜻이고, 그 위에서 공식을 더 정교하게 만들어봐야 r은 더 오를 자리가 별로 없다.

그러면 피타고라스 기댓값은 의미가 없는 공식인가? 아니다. 우리가 r에만 집중했을 뿐이다. 다른 걸 봐야 한다.

r 말고, 잔차

피타고라스가 진짜로 가져다주는 건 공식이 예상한 승률 이라는 구체적인 숫자다. Q1의 r = 0.95는 "관계가 강하다"는 한 줄짜리 사실이지만, 피타고라스는 각 팀에 대해 "이 팀은 RS와 RA로 봤을 때 5할 8푼은 이겨야 한다"는 구체적인 예측치를 내준다.

예측치가 있으면 자연스럽게 따라오는 게 있다. 잔차(residual) 다.

잔차 = 실제 승률 − 피타고라스 예상 승률

같은 RS와 RA를 가진 두 팀이 있을 때, 한 팀은 잔차가 +0.04이고 다른 팀은 -0.04라면, 두 팀은 같은 점수를 냈음에도 불구하고 8% 차이만큼의 다른 결과를 냈다는 뜻이다. 그 차이는 어디서 왔는가? 공식이 설명하지 못하는 영역, 즉 점수의 분배 와 운이다.

이걸 다른 말로 정리하면, 우리는 승률에서 "공식으로 설명되는 부분"과 "그렇지 않은 부분"을 분리해낼 수 있게 됐다. Q1에서 봤던 5%의 틈에 이름이 붙는 순간이다.

평균 몇 승 빗나가나

잔차 이야기를 시작하면 자연스럽게 다음 질문이 따라온다.

그러면 이 공식은 평균적으로 얼마나 빗나가는가?

이걸 재는 표준 도구가 MAE(Mean Absolute Error, 평균 절대 오차) 다. 잔차를 절댓값으로 만들어서 평균을 낸다. 음수와 양수가 서로 상쇄되지 않게 하기 위해서다.

5시즌 전체에서 MAE는 0.0219가 나왔다. 승률 단위라서 직관적으로 와닿지 않는다. 162경기로 환산해보자.

0.0219 × 162경기 ≈ 3.55승

즉 평균적으로 피타고라스 공식은 시즌당 3.5승 정도 빗나간다. 어떤 팀에 대해 공식이 "85승 해야 한다"고 예측하면, 실제로는 81승에서 89승 사이에 있다고 생각하면 된다.

이 숫자가 대단한가? 162경기 시즌에서 3.5승은 약 2% 정도다. 그러니까 공식 하나로 승수의 98%를 설명할 수 있다는 얘기다. RS와 RA 두 숫자만 알면 그 팀의 시즌 끝 승수를 ±3승 안쪽으로 맞출 수 있다는 뜻이다.

처음에 r = 0.95에서 0.9511로 거의 안 움직인다는 결과를 보고 김이 샜는데, 이 각도에서 보면 얘기가 다르다. 단순히 "두 변수가 같이 움직인다"가 아니라, "RS와 RA만 알면 승수를 구체적으로 ±3승까지 좁힐 수 있다"라는 훨씬 강한 주장이 가능해졌다.

"운 좋았던 팀"과 "운 없었던 팀"

잔차의 진짜 재미는 상위와 하위에 누가 있는지 보는 데 있다.

잔차 Top/Bottom 10 — Mariners 2021 +14.8승, Padres 2023 −11.0승

5시즌 동안 공식보다 더 이긴 팀들 (잔차 양수, 즉 "운 좋았던 팀") 의 1위는 충격적이다.

2021 Mariners: 잔차 +0.091, 약 +14.8승

2021년 시애틀 매리너스는 RS와 RA만 보면 46.5%의 승률, 즉 75승짜리 팀이었다. 그런데 실제로는 90승을 했다. 약 15승을 더 한 셈이다. 162경기 중에 15경기를 더 이기는 건 거의 한 팀의 정체성을 통째로 바꾸는 수준이다. 매리너스 팬이라면 알 것이다 — 그 시즌은 "이상하게 접전을 다 잡아내던 시즌"으로 기억된다. 통계로도 그게 보인다.

반대편, 공식보다 덜 이긴 팀들 (잔차 음수, "운 없었던 팀") 의 1위도 야구 팬이라면 들어본 이름일 것이다.

2023 Padres: 잔차 −0.068, 약 −11승

2023년 샌디에이고 파드리스는 RS와 RA로 보면 57.4% 승률, 약 93승짜리 팀이었다. 그런데 실제로는 82승, 와일드카드도 못 갔다. 매니 마차도·후안 소토·잰더 보가츠가 한 라인업에 있던 그 슈퍼팀, 시즌 전 우승 후보로 꼽혔던 바로 그 팀이다. 시즌이 끝나고 미국 야구 매체들은 "올해 가장 실망스러운 팀"으로 입을 모았다. 통계가 그 직관을 숫자로 확인해준다 — RS와 RA만 봤다면 11승을 더 했어야 했다.

운 좋았던 팀과 운 없었던 팀의 거리는 약 25승이다. 같은 RS, 같은 RA를 가진 팀끼리도 이 정도 차이가 날 수 있다는 게 잔차가 말해주는 것이다.

"운"이라는 단어를 정확히 쓰자

여기서 한 가지 정직해질 필요가 있다. 잔차가 +0.091이라고 해서 그게 모두 순수한 운인 건 아니다.

피타고라스 기댓값이 잡지 못하는 부분에는 여러 요인이 섞여 있다.

접전을 잡는 능력: 좋은 마무리 투수, 클러치 타자, 노련한 감독
부상자 분포: 8월에 주전 4명이 한꺼번에 다친 시즌 vs 그러지 않은 시즌
상대 팀 일정의 강약: 약팀과 강팀 누구를 자주 만났는지
순수한 우연: 1점 차 경기 14번을 9승 5패로 끝낼지 7승 7패로 끝낼지

이 중에 "실력"이라 부를 만한 것도 있고, "운"이라 부를 만한 것도 있다. 데이터만으로는 둘을 분리할 수 없다.

그래서 잔차 상위 팀을 보고 "운이 좋았다"고 단정 짓기보다는, "이 팀은 RS와 RA로는 설명되지 않는 무언가를 가졌다" 정도로 읽는 게 안전하다. 그 무언가가 진짜 실력이라면 다음 시즌에도 양의 잔차가 나올 것이고, 운이라면 평균으로 회귀해서 사라질 것이다. 이걸 구분하려면 또 다음 단계의 분석이 필요하다.

Q1을 다시 읽기

이제 Q1으로 잠깐 돌아가보자. 우리는 r = 0.95라는 숫자를 봤다. 그 위의 5%를 두고 "같은 득실차여도 승률이 다른 팀이 있다"고 했다.

피타고라스 기댓값을 거치고 나니, 그 5%가 좀 더 또렷해졌다.

5%의 대부분은 "어떻게 점수를 분배해서 냈는가"라는 구조에서 나온다. 이건 RS와 RA를 따로 쓰는 공식으로 잡힌다. 즉 r이 0.9503에서 0.9511로 약간이라도 오른 부분이다.
그래도 남는 작은 잔차는 진짜 잡기 어려운 부분이다. 접전 운, 부상, 일정. 이게 평균 ±3.5승의 폭이다.

말하자면 우리는 5%라는 한 덩어리를 두 층으로 쪼갰다. 그리고 각 층에 이름을 붙였다 — 위 층은 "점수 분배의 구조", 아래 층은 (느슨하게) "운".

데이터 분석에서 자주 일어나는 일이다. 처음에는 한 덩어리로 보이던 게, 더 정교한 도구를 가져오면 더 작은 단위로 나뉘어 보인다.

다음 질문

여기까지 오니 또 의심이 든다.

빌 제임스는 지수를 2로 썼다. 시행착오로 찾았다고 했지만, 정말 2가 최적일까? 1.83이 더 잘 맞는다는 얘기를 야구 통계 사람들로부터 들어본 적도 있다. 누가 맞을까?

지수 2.0이 진짜 정답인가? 데이터로 직접 찾을 수 있을까?

이게 다음 글의 질문이다. 1.5부터 2.5까지 0.01 간격으로 모든 지수를 시험해보고, 어느 값에서 MAE가 최소가 되는지 직접 본다. 그리고 그 결과가 시즌마다 달라지는지도 같이 본다.

이 분석은 직접 만든 도구 just-mlb로 했습니다. Q2 분석 페이지의 산점도와 잔차 랭킹을 직접 보고, "당신이 응원하는 팀이 운 좋았던 팀인지 운 없었던 팀인지" 확인해보세요.