
평균, 중앙값, 최빈값은 숫자 데이터 집합의 중심을 나타내는 수치입니다.
하지만, 데이터의 상황에 따라서 대표값을 무엇으로 선택해야 할 지는 달라집니다.
명목 척도로 측정된 데이터일 때는 -> 최빈값을 사용
분포가 대칭이고 이상값이 존재하지 않는다면 -> 표본 평균 사용
분포가 비대칭이거나, 이상값이 존재한다면 -> 중앙값을 사용
순위 척도로 측정된 데이터라면 -> 중앙값을 사용
왜 무조건적으로 평균을 채택하지 않는가?
평균은 각 데이터의 영향을 많이 받습니다.
이상값이 포함되거나, 데이터간 편차가 큰 상황이라면 (ex:소득) 중앙값을 선택해야 합니다.
해당 블로그에 좋은 내용이 많으니 참고해주시길 바랍니다.
https://www.beusable.net/blog/?p=3855
데이터 분석을 위한 기본 통계, 대표 값과 평균의 종류 | 뷰저블
수치 해석의 기본, 대표값과 평균의 종류
www.beusable.net
'기타 > 통계' 카테고리의 다른 글
[통계] 누적분포함수와 확률밀도함수는 무엇일까요? (0) | 2022.05.27 |
---|---|
[통계] 확률변수와 확률모형 (0) | 2022.05.27 |
[통계] 샘플링과 리샘플링이란? (0) | 2022.05.24 |
[통계] 신뢰구간의 정의는 무엇인가요? (0) | 2022.05.22 |
[통계]t 분포, F 분포, 카이제곱 분포 (0) | 2022.05.19 |