구글 머신러닝 단기집중과정 - 실제 ML 시스템 - 암 예측
실제 예: 암 예측 모델은 의료 기록을 통해 '환자가 암에 걸렸을 가능성'을 예측하도록 학습되었습니다. 환자의 연령, 성별, 이전 질병, 병원 이름, 활력 징후, 검사 결과 등을 특징으로 사용했습니다. 모델은 지속된 테스트 데이터에서 뛰어난 예측 결과를 보였습니다. 그렇지만 새 환자의 경우 평가 결과가 제대로 나오지 않았습니다. 이유가 무엇일까요? 실제 예: 암 평가 왜 새 환자의 경우에는 모델에서 평가 결과가 제대로 나오지 않는다고 생각하시나요? 문제가 무엇인지 생각해 본 다음, 아래에 있는 재생 버튼(▶)을 클릭하여 내 생각이 맞았는지 확인하세요. 라벨 누출 : 약간의 학습 라벨이 기능에 유출되어 모델의 속임수를 허용하는 것