모든 실험은 데이터의 다른 부분에 대해 수행되어야 한다.
훈련 데이터 세트 - 모델 훈련에 이 세트를 사용. 데이터의 70-80%가 표준.
검증/개발 데이터 세트 - 모델 하이퍼파라미터 튜닝 및 실험 평가를 위해 이 세트를 사용. 데이터의 10-15%가 표준.
테스트 데이터 세트 - 모델 테스트 및 비교를 위해 이 세트를 사용. 데이터의 10-15%가 표준.
이 양은 문제와 가지고 있는 데이터에 따라 약간 변동할 수 있다.
Underfitting - 훈련 데이터의 성능이 좋지 않다는 것은(Poor performance) 모델이 제대로 배우지 못하고 적합하지 않다는 것을 의미한다. 다른 모델을 시도하거나, 하이퍼파라미터를 통해 기존 모델을 개선하거나, 더 많은 데이터를 수집해서 개선한다.
Overfitting - 훈련 데이터의 성능은 우수하지만 시험 데이터의 성능은 좋지 않다는 것은 모델이 일반화되지 않는다는 것을 의미한다. 모델이 교육 데이터를 지나치게 적합하게 조정할 수 있습니다. 더 간단한 모델을 사용하거나 테스트 데이터가 모델에서 훈련하고 있는 것과 동일한 스타일인지 확인해야 한다.
훈련 데이터보다 시험 데이터의 성능이 더 좋다는 것은 훈련 데이터가 시험 데이터로 유출되어 모델이 과적합하게 될 수 있다는 것을 의미한다. 교육 및 테스트 데이터 세트가 항상 별도로 유지되도록 해야 한다.
(실제 세계에서) 한때 형편없는 성과는 당신이 당신의 모델을 훈련하고 시험한 것과 실제로 일어나고 있는 일에 차이가 있다는 것을 의미한다.실험 중에 사용하는 데이터가 생산에 사용하는 데이터와 일치하는지 확인합니다.
'Archive' 카테고리의 다른 글
프로그래머스_전화번호부_C++ (0) | 2020.04.08 |
---|---|
프로그래머스_탑_C++ (0) | 2020.04.08 |
데이터의 종류들 (0) | 2020.04.02 |
머신러닝의 종류 (0) | 2020.04.02 |
BigO Exercise 1 (0) | 2020.03.27 |