적합도(Fitness)와 예측 정확도(Accuracy) 적합도는 내가 가진 데이터를 모델에 적용했을 때 얼마나 잘 설명하는지를 의미한다.로그 가능도, 잔차 제곱합, 맞춘 비율 등이 적합도를 나타내는 지표다. 반면, 예측 정확도는 내가 갖고 있지 않은 미지의 데이터(unseen data)에 대해 모델이 얼마나 잘 맞추는지를 뜻한다. 적합도와는 개념이 다르다. 과적합(Overfitting)과 독립 변수 선택과적합은 적합도는 높지만, 정작 예측 정확도가 떨어지는 상황이다.갖고 있는 데이터에 너무 집착해서 불필요하게 복잡한 모델을 만들 때 주로 발생한다. 예를 들어 신발 판매량을 예측하는데, 바퀴벌레 개체수나 지진 빈도 같은 쓸데없는 변수를 넣으면 엉뚱한 결론이 나올 수 있다.이런 불필요한 독립 변수가 과적합을..