기타/통계

[통계] 확률변수와 확률모형

소금깨 2022. 5. 27. 23:22

확률변수(Random Variable)

확률변수는 확률로 표현하기 위한 event를 정의하는 것이다. 

어떤 것을 확률로 표현할 것인지에 대해 다양하게 정의가 가능하므로 변수라는 용어를 사용합니다. 그리고 확률이 정의된 Sample space내에서, 이러한 확률변수를 0과 1사이의 확률로 mapping하는 함수를 확률 함수(확률 분포 함수)라고 한다.

  • 표본공간의 단위 사건에 대해 실수값을 매핑하는 함수
  • 즉, 사건에 숫자를 부여하는 행위 

 

데이터 분석에서의 자료형 

Quantitative
(양적)
이산형(discrete) / 연속형(continuous) - 수치형 자료(numerical)
Qualitative
(질적)
명목형(nominal) / 순서형(ordinal) - 범주형 자료(categorical)

확률모형(Probability Model)

앞서 확률은 불확실성을 표혀하는 수단이라고 했는데, 이러한 불확실성을 확률로써 계량화하기 위해 확률함수로써 수학적으로 만든 모형을 확률모형이라고 한다. 그리고 함수에 쓰인 계수들을 모수(parameter)라고 부른다.

통계학에서 모수를 추정한다는 말을 많이 하고는 하는데, 바로 현재 갖고 있는 데이터의 분포를 알고자하는 일이 모수를 추정하는 것입니다.

확률분포를 안다고 함은 확률분포를 나타내는 확률분포함수를 안다는 것이고, 확률분포함수를 안다는 것은 함수식을 구성하는 parameter을 안다는 것입니다. 따라서, 어떤 확률변수의 분포를 안다는 것은 매우 의미있는 정보를 얻는 것이라고 할 수 있다. 분포를 알면 어떤 X값이든 그 X가 발생할 확률을 얻을 수 있습니다. 그래서 모수를 추정하는 많은 방법론들을 통계학에서 연구하고 발전시켰습니다. 

  • 확률 변수를 사용하여 데이터의 분포를 수학적으로 정의한 모형
  • 이때 수학적인 수식을 확률분포함수(Probability distribution func), 식을 결정짓는 값을 모수(parameter)라고 한다.
  • 가장 유명한 확률 모형 중 하나는 가우시안 정규분포가 있다

출처 

 

확률변수와 확률모형

통계학에서 주가 되는 확률에 대해 다루고자 합니다. 통계학을 배우면서 느낀 점은, 확률로부터 파생되는 여러 이론들로 실생활에 다가가는 학문이라는 것입니다. 주변에 일어나고 있는 여러

sumniya.tistory.com

 

확률변수와 확률모형

확률변수(Random Variable) 표본공간의 단위 사건에 대해 실수값을 mapping하는 함수 즉, 사건에 숫자를 부여하는 행위 가장 쉬운 예시는 주사위를 굴리는 상황 주사위를 굴렸을 때 나오는 어떤 값이

variety82p.tistory.com