Ⅵ-2.6 ★ 수행과제 · 6단계 통과형 자동 저장 2022 개정 교육과정

통계 마스터 — 데이터 분석가의 6단계

실제 데이터 분석가의 흐름. 한 변수의 중심 → 흩어짐 → 두 자료 비교 → 두 변수의 관계 → 함정 판별 → 종합 분석 보고서. 통계의 네 도구를 실생활 자료에 적용한다. 모든 입력은 자동 저장.

진행 0 / 6 단계

시험 점수 — 대푯값 분석

Stage 1 · 대푯값 (Ⅵ-2.1)
STAGE 1 / 6

한 반의 시험 점수 분석

★ 기초
한 반 학생 10명의 수학 시험 점수가 다음과 같다. 70, 70, 75, 80, 85, 85, 90, 90, 90, 95. 이 자료의 평균·중앙값·최빈값을 모두 구하고, 어느 측도가 이 반의 실력을 가장 잘 대표하는지 판단하라.
물음. 세 가지 대푯값을 구하라.
풀이 보기
① 평균: $\dfrac{70+70+75+80+85+85+90+90+90+95}{10} = \dfrac{830}{10} = 83$.
② 정렬되어 있고 $n=10$ (짝수). 중앙값 $= (5번째 + 6번째)/2 = (85+85)/2 = 85$.
③ $90$ 이 3번 등장 — 최빈값 $= 90$.
④ 자료가 70~95 사이로 균형 — 이상치 없음. 세 측도 모두 비슷한 값 (83, 85, 90) → 어느 것이든 자료를 잘 대표.

홀수 자료 — 분산과 표준편차

Stage 2 · 분산·표준편차 (Ⅵ-2.2)
STAGE 2 / 6

5개 자료의 흩어짐

★★ 표준
자료 $5, 7, 9, 11, 13$ 의 분산과 표준편차를 4단계 절차에 따라 구하라.
풀이 보기
① 평균 $= 45/5 = 9$.
② 편차 $-4, -2, 0, 2, 4$. 합 $= 0$ ✓.
③ 편차 제곱 $16, 4, 0, 4, 16$. 합 $= 40$.
④ 분산 $s^2 = 40/5 = 8$.
⑤ 표준편차 $s = \sqrt{8} = 2\sqrt{2}$.
⑥ $2\sqrt{2} \approx 2.83$. 자료들이 평균 $9$ 에서 평균적으로 약 $2.83$ 만큼 떨어져 있음.

두 반 비교 — 같은 평균, 다른 분산

Stage 3 · 자료 비교
STAGE 3 / 6

두 반의 시험 점수 비교

★★ 표준
두 반의 5명씩 시험 점수:
반 A: $7, 8, 9, 10, 11$    반 B: $3, 6, 9, 12, 15$
두 반의 평균은 모두 같다. 그러나 분산은 어떻게 다른가? 어느 반의 점수가 더 균등하게 분포해 있는가?
두 반의 차이를 한 문장으로 서술하라.
풀이 보기
반 A: 편차 $-2,-1,0,1,2$. 제곱 합 $10$. 분산 $= 10/5 = 2$. 표준편차 $\sqrt{2}$.
반 B: 편차 $-6,-3,0,3,6$. 제곱 합 $90$. 분산 $= 90/5 = 18$. 표준편차 $3\sqrt{2}$.
평균이 같아도 자료의 모습은 전혀 다름. 분산이 작은 반 A 가 점수 분포가 더 균등.

공부 시간과 점수 — 산점도

Stage 4 · 산점도와 상관 (Ⅵ-2.3)
STAGE 4 / 6

5명 학생의 공부 시간과 점수

★★ 표준
5명 학생의 (공부 시간, 점수) 자료가 다음과 같다.
학생공부 시간 (시간)점수
A160
B270
C380
D490
E5100
풀이 보기
모든 점 $(1,60), (2,70), (3,80), (4,90), (5,100)$ 이 직선 $y = 10x + 50$ 위에 정확히 놓여 있음.
① 공부 시간 ↑ 일 때 점수 ↑ → 양의 상관관계.
② 점들이 완벽한 직선 위 → 완벽한 양의 상관관계.
③ $y$ 절편 $50$ ($x=0$ 일 때 $y=60-10=50$, 또는 $x=1, y=60=10\cdot 1+50$ 으로부터).
④ 완벽한 양의 상관 → $r = +1$.

함정 판별 — 상관 vs 인과

Stage 5 · 해석 (Ⅵ-2.4)
STAGE 5 / 6

세 시나리오의 함정 판정

★★★ 도전
다음 세 시나리오에서 어떤 함정 (잠복변수 / 역인과 / 우연 / 표본 편향) 이 작용하고 있는지 각각 판정하라.
시나리오 ① · "이 마을에서는 까마귀가 많이 사는 해에 옥수수 풍작이 일어났다. 그러므로 까마귀가 풍작을 일으킨다."
시나리오 ② · "병원이 많은 지역일수록 환자 수가 많다. 그러므로 병원이 환자를 만든다."
시나리오 ③ · "지난 10년간 미국 마가린 소비량 감소와 메인주 이혼율 감소가 거의 같은 비율로 진행되었다."
상관관계로부터 인과관계를 추론하려 할 때 가장 신뢰할 수 있는 검증 방법은?
풀이 보기
잠복변수: 날씨 (좋은 기후) 가 까마귀와 옥수수 둘 다에 영향.
역인과: 환자가 많은 곳에 병원이 들어선다 — 방향이 반대.
우연한 일치: 무관한 두 시계열의 우연한 일치. 통계학에서 유명한 spurious correlation 사례.
무작위 대조 실험 (RCT): 두 집단을 무작위로 나눠 한쪽에만 처치를 가하고 비교. 잠복변수와 역인과를 동시에 통제.

종합 — 키와 몸무게 분석 보고서

Stage 6 · 네 측도 통합
STAGE 6 / 6

5명 학생의 키와 몸무게 분석

★★★ 종합
5명 학생의 키와 몸무게 측정 결과:
학생키 (cm)몸무게 (kg)
A15045
B15550
C16055
D16560
E17065
① 대푯값
② 분산 (두 변수 모두 같은 분포 모양 — 같은 분산)
③ 상관관계
데이터 분석가의 짧은 보고서 — 키와 몸무게의 관계를 2~3문장으로 서술하라.
풀이 보기
대푯값: 키 평균 $= 800/5 = 160$. 몸무게 평균 $= 275/5 = 55$.
분산: 키 편차 $-10,-5,0,5,10$. 몸무게 편차 $-10,-5,0,5,10$. 두 변수 모두 같은 편차 분포 → 분산 둘 다 $250/5 = 50$. 표준편차 $5\sqrt{2}$.
관계: 키가 $5$ cm 늘 때마다 몸무게도 정확히 $5$ kg 증가. 모든 점이 직선 $y = x - 105$ 위. 완벽한 양의 상관관계 ($r = 1$).
현실에서는 이렇게 완벽한 상관은 거의 없음. 이 자료는 교육용으로 정확히 짜여진 것.

데이터 분석 완료 — 최종 점검

여섯 단계의 통계 분석을 마쳤습니다. 빈 곳이 있다면 차분히 돌아가서 채우세요. 통계의 네 도구를 손에 익혔습니다.

0/6
완료 단계
0
입력 칸
0
정답 칸
0%
정답률