[BDA 11기] 데이터 분석 모델링(ML1) - 8주차
·
BDA-11th
📈 성능 - 교차검증성능의 목표와 향상1. 모델링의 목표모집단(population) : 우리가 알고 싶은 모든 데이터의 집합. 과거의 데이터, 미래의 데이터도 모집단의 부분집합에 포함. 우리가 가지고 있는 모든 데이터셋은 모집단의 부분집합임 = Training Set 역시 모집단의 부분집합.따라서 모델링의 목표는 부분집합을 학습해서 모집단(혹은 모집답의 다른 부분집합)을 적절히 예측하는. 즉 적절한 성능(일반화 성능)을 확보하는 것.2. 성능 향상을 위한 노력[일반화 성능]모델이 처음 보는 새로운 데이터에서도 얼마나 잘 예측하는지 나타내는 객관적인 성능 지표.단순히 훈련 데이터에서 높은 점수를 내는 것(=과적합)과는 구별해야 함! [성능을 높이는 방법]*방법 1. 성능의 평균으로 평가 *하나의 훈련/검..