[혼자 공부하는 머신러닝+딥러닝] 2-1. 훈련 세트와 테스트 세트
·
ML & DL/머신러닝 기초
Intro.김 팀장🗣️"근데, 네가 훈련할 때 쓴 데이터로 평가를 하면 당연히 정확도가 100% 나오는 거 아냐...?"ㅇ ㅁㅇ ....1. 모델 개선 (1차)데이터 준비 및 알고리즘 객체 생성여기까진 이전 강의와 동일 (데이터 생성, KNN분류기 생성)훈련세트와 테스트세트 분할김 팀장 말을 듣고, 테스트 세트 떼어내야겠다고 판단 ⇒ 슬라이싱 사용함.그런데 ...훈련하고 평가해보니, 정확도가 0이 되어버림 ㅠㅠ2. 다시 문제 발생문제의 원인 (샘플링 편향)다시 살펴보니, 애초에 데이터 합칠 때 순서대로 이어붙였음 = 그걸 그대로 35번째에서 자르면, 훈련은 도미로만 하고 평가는 빙어로 하게 됨테스트세트 떼어내기 전에 샘플들을 골고루 섞었어야지! ⇒ 이런 문제를 "샘플링 편향"이라고 함!문제의 해결책골고..