통계 모델
건축가들은 실제 집을 짓기 전에 모형 집을 먼저 만든다. 모형 집을 통해 실제 집의 대략적인 구조를 가늠하고 계획을 세우기 위함이다. 확률과 통계에서도 이와 비슷하게, 현실 세계를 단순화하여 예측할 수 있게 만든 모형을 모델(Model) 이라고 부른다. 이러한 모델을 만드는 과정을 모델링(Modeling) 이라고 하며, 특히 통계 모델(Statistical Model) 을 만드는 것을 통계 모델링(Statistical Modeling) 이라고 한다. 즉, 모델을 통해 복잡한 현실을 간략히 표현하고 예측할 수 있는 형태로 바꾸는 것이다.
예시
음료수 매출을 예로 들어보자. 매출에 영향을 미치는 요인은 기온, 습도, 연령대 인구 분포, 원재료 공급량 등 다양하다. 그 중 기온과 매출의 관계에 집중하여, 기온에 따른 매출 모델을 만들 수 있다.
수학적 모델(Mathematical Model)
현상을 수식으로 표현한 것을 수학적 모델(Mathematical Model) 또는 수리 모델 이라고 한다. 예를 들어:
맥주 매출 = 15 + 3 × 온도
기온이 높을수록 매출이 증가한다는 단순 모델이다. 그러나 현실에서는 이런 수식이 정확히 맞아떨어지지 않는다. 날마다 예상과 다른 오차가 발생하기 때문이다.
확률 모델(Probabilistic Model)
이러한 오차를 확률적으로 표현한 것이 확률 모델이다. 오차는 보통 정규 분포, 푸아송 분포, 이항 분포 같은 확률 분포로 표현한다. 예를 들어 음료수 매출이 정규 분포를 따른다면, 기온을 고려한 매출의 확률 모델은 다음과 같이 표현할 수 있다.
음료수 매출 ~ N(15 + 3 × 온도, σ²)
통계 모델(Statistical Model)
이러한 확률 모델을 데이터에 적합하도록 만든 것이 통계 모델이다. 통계 모델을 만들기 위해서는 먼저 확률 모델의 구조를 설정한 뒤, 데이터를 활용하여 파라미터를 추정해야 한다. 이 과정에서는 파라미터 추정의 오류, 혹은 분석에 사용한 데이터 자체의 한계에 주의해야 한다. 오늘날 통계 모델은 데이터 분석의 표준적 방법론으로 활용되고 있다.
'확률과 통계' 카테고리의 다른 글
손실 함수와 최소제곱법, 그리고 최대가능도법의 연결고리 (1) | 2025.05.21 |
---|---|
가능도와 최대가능도추정법(MLE)의 개념과 특징 (0) | 2025.05.21 |
정규 선형 모델 이해하기: 선형 모델, 회귀, 분산 분석, 기계학습 관점까지 (0) | 2025.05.17 |
통계 모델의 기초: 모수적 모델, 선형 모델, 변수 선택 (0) | 2025.05.17 |
적합도, 교차검증, AIC, 상대엔트로피까지 — 모델 평가 핵심 개념 정리 (0) | 2025.05.12 |