Ⅵ-2.1 ★ 첫 번째 측도 9수05-04 2022 개정 교육과정

자료의 중심을 잡는 —
세 가지 대표값

수십·수백 개의 측정값을 한 줄로 요약한다 — 평균·중앙값·최빈값. 셋은 모두 "자료를 대표하는 수"지만, 어느 것을 선택할지에 따라 자료가 전혀 다르게 해석된다. 이상치가 있을 때 — 어느 측도가 정직한가?

01자료를 한 수로

Summarize with one number
"어느 회사 직원 9명의 연봉: 3, 3, 3, 4, 4, 4, 5, 5, 30억.
이 회사의 대표 연봉은 얼마인가?"
평균을 내면 7억. 그러나 직원 8명은 5억 이하다. 평균은 사장 한 명의 연봉에 휘둘려 왜곡된 현실을 보여준다. 이때는 — 중앙값 4억이 더 정직한 답. 같은 자료에서도 어떤 측도를 쓰느냐에 따라 이야기가 완전히 달라진다.
이상치 중앙값 4 평균 7

02세 가지 대푯값

Three measures of central tendency
측도 ① · 평균

Mean — 평균

$\displaystyle \bar{x} = \dfrac{1}{n}\sum_{i=1}^{n} x_i = \dfrac{x_1 + x_2 + \cdots + x_n}{n}$

모든 자료를 더해서 개수로 나눈 값. 가장 자주 쓰이는 대푯값. 모든 자료의 정보를 포함한다.

✓ 모든 자료 활용 · 수학적 분석 용이 ✗ 이상치에 매우 민감
측도 ② · 중앙값

Median — 중앙값

자료를 크기순 정렬한 뒤 정 가운데 값
(짝수개면 가운데 두 값의 평균)

$n$ 이 홀수: $(\tfrac{n+1}{2})$ 번째 값. $n$ 이 짝수: $\tfrac{n}{2}$ 와 $\tfrac{n}{2}+1$ 번째 두 값의 평균.

✓ 이상치에 강함 (robust) ✗ 모든 자료를 다 쓰지는 않음
측도 ③ · 최빈값

Mode — 최빈값

자료 중 가장 자주 나타난 값
(없거나, 여러 개일 수도 있음)

도수가 가장 많은 값. 범주형 자료 (혈액형, 좋아하는 색 등) 에 특히 유용.

✓ 범주형 자료에 사용 가능 ✗ 자료가 흩어지면 의미 없음

예시 계산 — 시험 점수 5개

DATA · 80, 85, 90, 75, 95
STEP 1 · 정렬
75, 80, 85, 90, 95.
STEP 2 · 평균
$\bar{x} = \dfrac{75+80+85+90+95}{5} = \dfrac{425}{5} = 85$.
STEP 3 · 중앙값
$n=5$ (홀수). 3번째 값 $= 85$.
STEP 4 · 최빈값
모든 값이 한 번씩 나타나므로 최빈값 없음.
평균 $=$ 중앙값 $= 85$ · 최빈값 없음

03어느 것을 언제 쓰는가

When to use which
상황추천 대푯값이유
대칭적 분포평균대표성 높고 계산 간단
이상치 있음중앙값평균은 이상치에 휘둘림
범주형 자료최빈값평균·중앙값 정의 불가
매우 비대칭 분포 (연봉, 집값 등)중앙값대다수의 실제 모습 반영
"가장 일반적인" 답을 원할 때최빈값가장 흔한 값을 직접 알려줌

실생활 예시  뉴스에서 "가구당 평균 자산"이 5억 원이라 한다면, 절반 이상의 가구는 5억 미만일 수도 있다 (부동산·금융 부자의 영향). 그래서 정부 통계청은 중앙값도 함께 발표한다. 통계의 진짜 모습을 보려면 두 수를 모두 봐야 한다.

04실험실 — 자료 입력해 보기

Interactive calculator

자료를 쉼표로 구분해 입력

05개념 점검 5문항

Quick check
QC 01
5명의 점수 $80, 85, 90, 75, 95$ 의 평균은?
정답 보기
$\bar{x} = \dfrac{80+85+90+75+95}{5} = \dfrac{425}{5} = \mathbf{85}$.
QC 02
자료 $70, 75, 80, 85, 90$ 의 중앙값은?
정답 보기
정렬되어 있고 $n=5$. 3번째 값 $= \mathbf{80}$.
QC 03
자료 $1, 2, 2, 3, 4, 4, 4, 5$ 의 최빈값은?
정답 보기
$4$ 가 3번 등장 (가장 많음). 최빈값 $= \mathbf{4}$.
QC 04
자료 $10, 12, 12, 14, 15, 16, 100$ 의 평균과 중앙값 중 어느 것이 더 자료를 잘 대표하는가?
정답 보기
평균 $= 179/7 \approx 25.6$. 중앙값 $= 14$. 이상치 $100$ 때문에 평균이 왜곡됨. 중앙값이 더 대표적.
QC 05
짝수개 자료의 중앙값을 구하는 방법은?
정답 보기
정렬 후 가운데 두 값의 평균. 예: $2, 4, 6, 8$ → 중앙값 $= (4+6)/2 = 5$.

06예제 2선

Worked examples
예제 1 · 미지수 구하기 (평균)

자료 $2, 5, x, 8, 10$ 의 평균이 $6$ 일 때 $x$ 의 값을 구하여라.

평균 공식 · $\bar{x} = \dfrac{\sum x_i}{n}$.
식 세우기 · $\dfrac{2+5+x+8+10}{5} = 6$ → $25+x = 30$.
풀이 · $x = 5$.
$\therefore \; x = 5$
예제 2 · 평균과 중앙값 동시에

자료 $x, 5, 8, 10, 13$ 에서 평균과 중앙값이 모두 $8$ 이다. $x$ 의 값을 구하여라.

평균 조건 · $\dfrac{x+5+8+10+13}{5} = 8$ → $x+36 = 40$ → $x = 4$.
중앙값 확인 · $x=4$ 이면 정렬: $4, 5, 8, 10, 13$. 3번째 $= 8$. ✓
해석 · 평균과 중앙값이 같다는 사실은 자료가 대칭적임을 의미. ($4$ 와 $13$ 이 $8$ 에 대해 대칭? $8-4=4, 13-8=5$ — 완벽한 대칭은 아니지만 비교적 균형.)
$\therefore \; x = 4$

07연습 8문항

Practice · ★ basic / ★★ standard / ★★★ challenge
P01
자료 $4, 6, 8, 10, 12$ 의 평균은?
풀이 보기
$\bar{x} = 40/5 = 8$.
P02
자료 $5, 8, 12, 15, 20$ 의 중앙값은?
풀이 보기
정렬되어 있고 $n=5$. 3번째 값 $= 12$.
P03
자료 $2, 3, 4, 4, 5, 5, 5, 6$ 의 최빈값은?
풀이 보기
$5$ 가 3번 (가장 많음). 최빈값 $= 5$.
P04★★
자료 $2, 5, x, 8, 10$ 의 평균이 $6$ 일 때 $x$ 의 값은?
풀이 보기
$\dfrac{25+x}{5}=6$ → $x=5$.
P05★★
자료 $3, 5, 7, x, 9$ ($x$ 는 양의 정수) 의 중앙값이 $7$ 이려면 $x$ 의 최솟값은?
풀이 보기
정렬 후 3번째 값이 $7$ 이려면 $x \geq 7$. 따라서 최솟값 $= 7$.
P06★★
5개 자료의 평균이 $7$ 이고 그 중 3개가 $5, 6, 9$ 이다. 나머지 두 자료의 합은?
풀이 보기
전체 합 $= 35$. 알려진 3개의 합 $= 20$. 나머지 2개의 합 $= 35-20 = 15$.
P07★★★
자료 $1, 2, 3, 4, 5, 6, 7, 8, 9, 10$ 의 평균은? (소수 첫째 자리까지)
풀이 보기
합 $= 55$, $n=10$. $\bar{x} = 5.5$. (참고: 중앙값도 $(5+6)/2 = 5.5$ — 균등 분포에서 평균 = 중앙값.)
P08★★★
자료 $x, 5, 8, 10, 13$ 에서 평균과 중앙값이 모두 $8$ 일 때 $x$ 의 값은?
풀이 보기
평균: $\dfrac{x+36}{5}=8$ → $x=4$. 중앙값 확인: $4,5,8,10,13$ 정렬에서 3번째 $= 8$ ✓.

08한 줄로 정리

Synthesis

평균

$\bar{x} = \tfrac{1}{n}\sum x_i$. 모든 자료의 정보. 이상치에 민감.

중앙값

정렬했을 때 한가운데. 이상치에 강함.

최빈값

가장 자주 나타나는 값. 범주형 자료에 유용.

선택 기준

대칭 분포 → 평균, 이상치 있음 → 중앙값, 범주형 → 최빈값.

다음 단계 — Ⅵ-2.2 분산과 표준편차  자료의 중심이 어디인지 알게 되었으니, 이제 자료가 그 중심에서 얼마나 흩어졌는지를 측정한다. 같은 평균을 가진 두 자료가 전혀 다른 모습일 수 있다는 사실 — 분산이 답한다.