Ⅵ-2.6 수행과제 · 통계 마스터 · 중학교 수학 3학년

①시험 점수 — 대푯값 분석

Stage 1 · 대푯값 (Ⅵ-2.1)

STAGE 1 / 6

한 반의 시험 점수 분석

★ 기초

한 반 학생 10명의 수학 시험 점수가 다음과 같다. 70, 70, 75, 80, 85, 85, 90, 90, 90, 95. 이 자료의 평균·중앙값·최빈값을 모두 구하고, 어느 측도가 이 반의 실력을 가장 잘 대표하는지 판단하라.

물음. 세 가지 대푯값을 구하라.

① 평균

② 중앙값

③ 최빈값

④ 자료에 이상치가 있나? (네/아니오)

풀이 보기

① 평균: $\dfrac{70+70+75+80+85+85+90+90+90+95}{10} = \dfrac{830}{10} = 83$.
② 정렬되어 있고 $n=10$ (짝수). 중앙값 $= (5번째 + 6번째)/2 = (85+85)/2 = 85$.
③ $90$ 이 3번 등장 — 최빈값 $= 90$.
④ 자료가 70~95 사이로 균형 — 이상치 없음. 세 측도 모두 비슷한 값 (83, 85, 90) → 어느 것이든 자료를 잘 대표.

②홀수 자료 — 분산과 표준편차

Stage 2 · 분산·표준편차 (Ⅵ-2.2)

STAGE 2 / 6

5개 자료의 흩어짐

★★ 표준

자료 $5, 7, 9, 11, 13$ 의 분산과 표준편차를 4단계 절차에 따라 구하라.

① STEP 1 — 평균

② STEP 2 — 편차의 합 (확인용)

③ STEP 3 — 편차 제곱의 합

④ STEP 4 — 분산

⑤ 표준편차

⑥ 자료가 평균에서 평균적으로 얼마나 떨어진 셈? (소수 둘째 자리)

풀이 보기

① 평균 $= 45/5 = 9$.
② 편차 $-4, -2, 0, 2, 4$. 합 $= 0$ ✓.
③ 편차 제곱 $16, 4, 0, 4, 16$. 합 $= 40$.
④ 분산 $s^2 = 40/5 = 8$.
⑤ 표준편차 $s = \sqrt{8} = 2\sqrt{2}$.
⑥ $2\sqrt{2} \approx 2.83$. 자료들이 평균 $9$ 에서 평균적으로 약 $2.83$ 만큼 떨어져 있음.

③두 반 비교 — 같은 평균, 다른 분산

Stage 3 · 자료 비교

STAGE 3 / 6

두 반의 시험 점수 비교

★★ 표준

두 반의 5명씩 시험 점수:
반 A: $7, 8, 9, 10, 11$ 반 B: $3, 6, 9, 12, 15$
두 반의 평균은 모두 같다. 그러나 분산은 어떻게 다른가? 어느 반의 점수가 더 균등하게 분포해 있는가?

① 반 A의 평균

② 반 B의 평균

③ 반 A의 분산

④ 반 B의 분산

⑤ 점수가 더 균등한 반

⑥ 반 B의 표준편차 (분산 18의 제곱근)

두 반의 차이를 한 문장으로 서술하라.

풀이 보기

반 A: 편차 $-2,-1,0,1,2$. 제곱 합 $10$. 분산 $= 10/5 = 2$. 표준편차 $\sqrt{2}$.
반 B: 편차 $-6,-3,0,3,6$. 제곱 합 $90$. 분산 $= 90/5 = 18$. 표준편차 $3\sqrt{2}$.
평균이 같아도 자료의 모습은 전혀 다름. 분산이 작은 반 A 가 점수 분포가 더 균등.

④공부 시간과 점수 — 산점도

Stage 4 · 산점도와 상관 (Ⅵ-2.3)

STAGE 4 / 6

5명 학생의 공부 시간과 점수

★★ 표준

5명 학생의 (공부 시간, 점수) 자료가 다음과 같다.

학생	공부 시간 (시간)	점수
A	1	60
B	2	70
C	3	80
D	4	90
E	5	100

① 상관관계의 방향 (양/음/무)

② 상관관계의 강도 (강한/약한/완벽한)

③ 모든 점이 직선 $y = 10x + ?$ 위에 있다. ? 의 값

④ 상관계수 $r$ 의 추정값 (-1 ~ 1)

풀이 보기

모든 점 $(1,60), (2,70), (3,80), (4,90), (5,100)$ 이 직선 $y = 10x + 50$ 위에 정확히 놓여 있음.
① 공부 시간 ↑ 일 때 점수 ↑ → 양의 상관관계.
② 점들이 완벽한 직선 위 → 완벽한 양의 상관관계.
③ $y$ 절편 $50$ ($x=0$ 일 때 $y=60-10=50$, 또는 $x=1, y=60=10\cdot 1+50$ 으로부터).
④ 완벽한 양의 상관 → $r = +1$.

⑤함정 판별 — 상관 vs 인과

Stage 5 · 해석 (Ⅵ-2.4)

STAGE 5 / 6

세 시나리오의 함정 판정

★★★ 도전

다음 세 시나리오에서 어떤 함정 (잠복변수 / 역인과 / 우연 / 표본 편향) 이 작용하고 있는지 각각 판정하라.

시나리오 ① · "이 마을에서는 까마귀가 많이 사는 해에 옥수수 풍작이 일어났다. 그러므로 까마귀가 풍작을 일으킨다."

시나리오 ② · "병원이 많은 지역일수록 환자 수가 많다. 그러므로 병원이 환자를 만든다."

시나리오 ③ · "지난 10년간 미국 마가린 소비량 감소와 메인주 이혼율 감소가 거의 같은 비율로 진행되었다."

상관관계로부터 인과관계를 추론하려 할 때 가장 신뢰할 수 있는 검증 방법은?

풀이 보기

① 잠복변수: 날씨 (좋은 기후) 가 까마귀와 옥수수 둘 다에 영향.
② 역인과: 환자가 많은 곳에 병원이 들어선다 — 방향이 반대.
③ 우연한 일치: 무관한 두 시계열의 우연한 일치. 통계학에서 유명한 spurious correlation 사례.
④ 무작위 대조 실험 (RCT): 두 집단을 무작위로 나눠 한쪽에만 처치를 가하고 비교. 잠복변수와 역인과를 동시에 통제.

⑥종합 — 키와 몸무게 분석 보고서

Stage 6 · 네 측도 통합

STAGE 6 / 6

5명 학생의 키와 몸무게 분석

★★★ 종합

5명 학생의 키와 몸무게 측정 결과:

학생	키 (cm)	몸무게 (kg)
A	150	45
B	155	50
C	160	55
D	165	60
E	170	65

① 대푯값

① 키의 평균 (cm)

② 몸무게의 평균 (kg)

② 분산 (두 변수 모두 같은 분포 모양 — 같은 분산)

③ 키의 분산

④ 몸무게의 분산

③ 상관관계

⑤ 상관관계 종류·강도

⑥ 다섯 점이 모두 놓인 직선의 방정식 (y = x + ?)

데이터 분석가의 짧은 보고서 — 키와 몸무게의 관계를 2~3문장으로 서술하라.

풀이 보기

대푯값: 키 평균 $= 800/5 = 160$. 몸무게 평균 $= 275/5 = 55$.
분산: 키 편차 $-10,-5,0,5,10$. 몸무게 편차 $-10,-5,0,5,10$. 두 변수 모두 같은 편차 분포 → 분산 둘 다 $250/5 = 50$. 표준편차 $5\sqrt{2}$.
관계: 키가 $5$ cm 늘 때마다 몸무게도 정확히 $5$ kg 증가. 모든 점이 직선 $y = x - 105$ 위. 완벽한 양의 상관관계 ($r = 1$).
현실에서는 이렇게 완벽한 상관은 거의 없음. 이 자료는 교육용으로 정확히 짜여진 것.

데이터 분석 완료 — 최종 점검

여섯 단계의 통계 분석을 마쳤습니다. 빈 곳이 있다면 차분히 돌아가서 채우세요. 통계의 네 도구를 손에 익혔습니다.

0/6

완료 단계

입력 칸

정답 칸

정답률