기타/통계

[통계] 평균(mean)과 중앙값(median) 그리고 최빈값(Mode)

소금깨 2022. 5. 21. 02:29

 

평균, 중앙값, 최빈값은 숫자 데이터 집합의 중심을 나타내는 수치입니다.

하지만, 데이터의 상황에 따라서 대표값을 무엇으로 선택해야 할 지는 달라집니다.

 

명목 척도로 측정된 데이터일 때는 -> 최빈값을 사용

분포가 대칭이고 이상값이 존재하지 않는다면 -> 표본 평균 사용

분포가 비대칭이거나, 이상값이 존재한다면 -> 중앙값을 사용

순위 척도로 측정된 데이터라면 -> 중앙값을 사용 

 

왜 무조건적으로 평균을 채택하지 않는가?

평균은 각 데이터의 영향을 많이 받습니다.

이상값이 포함되거나, 데이터간 편차가 큰 상황이라면 (ex:소득) 중앙값을 선택해야 합니다. 

 

 

해당 블로그에 좋은 내용이 많으니 참고해주시길 바랍니다.

https://www.beusable.net/blog/?p=3855 

 

데이터 분석을 위한 기본 통계, 대표 값과 평균의 종류 | 뷰저블

수치 해석의 기본, 대표값과 평균의 종류

www.beusable.net