통계모델링 2

통계 모델링 | 수학적 모델, 확률 모델, 통계 모델 쉽게 이해하기

통계 모델건축가들은 실제 집을 짓기 전에 모형 집을 먼저 만든다. 모형 집을 통해 실제 집의 대략적인 구조를 가늠하고 계획을 세우기 위함이다. 확률과 통계에서도 이와 비슷하게, 현실 세계를 단순화하여 예측할 수 있게 만든 모형을 모델(Model) 이라고 부른다. 이러한 모델을 만드는 과정을 모델링(Modeling) 이라고 하며, 특히 통계 모델(Statistical Model) 을 만드는 것을 통계 모델링(Statistical Modeling) 이라고 한다. 즉, 모델을 통해 복잡한 현실을 간략히 표현하고 예측할 수 있는 형태로 바꾸는 것이다.예시음료수 매출을 예로 들어보자. 매출에 영향을 미치는 요인은 기온, 습도, 연령대 인구 분포, 원재료 공급량 등 다양하다. 그 중 기온과 매출의 관계에 집중하여,..

확률과 통계 2025.05.16

적합도, 교차검증, AIC, 상대엔트로피까지 — 모델 평가 핵심 개념 정리

적합도(Fitness)와 예측 정확도(Accuracy) 적합도는 내가 가진 데이터를 모델에 적용했을 때 얼마나 잘 설명하는지를 의미한다.로그 가능도, 잔차 제곱합, 맞춘 비율 등이 적합도를 나타내는 지표다. 반면, 예측 정확도는 내가 갖고 있지 않은 미지의 데이터(unseen data)에 대해 모델이 얼마나 잘 맞추는지를 뜻한다. 적합도와는 개념이 다르다. 과적합(Overfitting)과 독립 변수 선택과적합은 적합도는 높지만, 정작 예측 정확도가 떨어지는 상황이다.갖고 있는 데이터에 너무 집착해서 불필요하게 복잡한 모델을 만들 때 주로 발생한다. 예를 들어 신발 판매량을 예측하는데, 바퀴벌레 개체수나 지진 빈도 같은 쓸데없는 변수를 넣으면 엉뚱한 결론이 나올 수 있다.이런 불필요한 독립 변수가 과적합을..

확률과 통계 2025.05.12