ν‘œμ€€νŽΈμ°¨λ‘œ λ°μ΄ν„°μ˜ νŠΉμˆ˜μ„±μ„ 평가

  • 데이터 Set 쀑에 μžˆλŠ” μ–΄λŠ ν•œ λ°μ΄ν„°μ˜ νŽΈμ°¨κ°€ ν‘œμ€€νŽΈμ°¨λ‘œ κ³„μ‚°ν•˜μ—¬ ±1λ°° 전후이닀 → ν‰λ²”ν•œ 데이터
  • 데이터 Set 쀑에 μžˆλŠ” μ–΄λŠ ν•œ λ°μ΄ν„°μ˜ νŽΈμ°¨κ°€ ν‘œμ€€νŽΈμ°¨λ‘œ κ³„μ‚°ν•˜μ—¬ ±2λ°° 전후이닀 → νŠΉμˆ˜ν•œ 데이터

데이터λ₯Ό 'νŠΉμˆ˜ν•˜λ‹€'λΌλŠ” 범주에 λ„£κΈ° μœ„ν•΄μ„œλŠ” μ •κ·œλΆ„ν¬λ‘œ 확인할 ν•„μš”κ°€ μžˆλ‹€. ν‰κ· κ°’μ—μ„œ ν‘œμ€€νŽΈμ°¨ ±1배의 λ²”μœ„ 내에 μ•½ 70%의 데이터가 λ“€μ–΄κ°„λ‹€κ³  λ³Ό 수 μžˆλ‹€. λ°˜λŒ€λ‘œ, ν‘œμ€€νŽΈμ°¨ ±2배보닀 멀리 λ–¨μ–΄μ§„ λ°μ΄ν„°λŠ” 쒌우 μ–‘μͺ½μ„ ν•©μ³μ„œ 5% 밖에 μ—†λ‹€κ³  λ³Ό 수 μžˆλ‹€. 

 

즉, μ–΄λ–€ 데이터가 평균값 λŒ€λΉ„ 큰 μͺ½μœΌλ‘œ 2λ°° μ΄μƒμ˜ ν‘œμ€€νŽΈμ°¨κ°€ λ–¨μ–΄μ Έ μžˆλ‹€λ©΄, 그것은 μ „μ²΄μ˜ 2.5% λ²”μœ„ 내에 λ“œλŠ” 데이터라고 ν•  수 μžˆλ‹€. 

 

μ—¬κΈ°μ—μ„œ "ν‘œμ€€νŽΈμ°¨μ˜ 'λͺ‡ λ°°' 전후이닀"라고 λ§ν•˜κΈ° μœ„ν•΄μ„œλŠ” {(데이터)-(평균)} ÷ (ν‘œμ€€νŽΈμ°¨)의 μ‹μœΌλ‘œ 계산해야 ν•˜λ©°, κ²°κ³Όκ°’μ˜ 크기에 따라 ν‰λ²”ν•œ 데이터 ν˜Ήμ€ νŠΉμˆ˜ν•œ 데이터라고 이야기 ν•  수 μžˆλ‹€.

 


 

μ—¬λŸ¬ 데이터 Set을 비ꡐ할 λ•Œμ˜ ν‘œμ€€νŽΈμ°¨

두 λͺ…μ˜ 학생이 μžˆλ‹€. 10번의 μ‹œν—˜μ—μ„œ Xꡰ은 평균 60점, ν‘œμ€€νŽΈμ°¨ 10점이고, Yꡰ은 평균 50점, ν‘œμ€€νŽΈμ°¨κ°€ 30점이닀.

 

ν‘œμ€€νŽΈμ°¨λ‘œ 따져봀을 λ•Œ, Xꡰ은 λŒ€λž΅ 50~70점 λ²”μœ„μ˜ 점수λ₯Ό λ§žλŠ” 학생이고, Yꡰ은 λŒ€λž΅ 20~80점 λ²”μœ„μ˜ 점수λ₯Ό λ§žλŠ” ν•™μƒμœΌλ‘œ λ³Ό 수 μžˆλ‹€. λ”°λΌμ„œ ν‰κ· μ μˆ˜λ§Œ 보면 Xꡰ이 곡뢀λ₯Ό 더 μž˜ν•œλ‹€κ³  λ³Ό 수 μžˆμ§€λ§Œ, 그것을 μ •λ‹΅μ²˜λŸΌ 말할 μˆ˜λŠ” μ—†λ‹€. μ• μ΄ˆμ— μ„±μ§ˆμ΄ λ‹€λ₯Έ κ²ƒμ΄λ―€λ‘œ 평가가 μ–΄λ ΅λ‹€.

 

 

 


 

κ°€κ³΅λœ λ°μ΄ν„°μ˜ 평균값과 ν‘œμ€€νŽΈμ°¨

1. Xλ°μ΄ν„°μ˜ λͺ¨λ“  데이터 μˆ˜μ— μΌμ •ν•œ 수 aλ₯Ό λ”ν•΄μ„œ μƒˆλ‘œμš΄ Y데이터λ₯Ό λ§Œλ“€λ©΄, Yλ°μ΄ν„°μ˜ 평균값은 Xλ°μ΄ν„°μ˜ 평균값에 aλ₯Ό λ”ν•œ κ²ƒλ§ŒνΌμ΄ 되고, Yλ°μ΄ν„°μ˜ λΆ„μ‚°κ³Ό ν‘œμ€€νŽΈμ°¨λŠ” μ›λž˜μ˜ X데이터와 κ°™λ‹€.

 

2. Xλ°μ΄ν„°μ˜ λͺ¨λ“  데이터 μˆ˜μ— μΌμ •ν•œ 수 kλ₯Ό κ³±ν•˜μ—¬ μƒˆλ‘œμš΄ Y데이터λ₯Ό λ§Œλ“€λ©΄, Yλ°μ΄ν„°μ˜ 평균값은 Xλ°μ΄ν„°μ˜ 평균값에 kλ₯Ό κ³±ν•œ 것이 되고, Yλ°μ΄ν„°μ˜ 뢄산은 k의 제곱배, ν‘œμ€€νŽΈμ°¨λŠ” kλ°°κ°€ λœλ‹€.

 

 

 

+ Recent posts