일상 속 공감을 공유하다.
728x90

ML 4

구글 머신러닝 단기집중과정 - 실제 ML 시스템 - 가이드라인

효과적인 ML 가이드라인 최초 모델은 단순하게 유지 데이터 파이프라인 정확성 확보에 중점 학습 및 평가를 위해 간단하고 관찰 가능한 측정항목 사용 입력 특성을 관리하고 모니터링 모델 구성을 코드로 취급하여 검토하고 체크인 모든 실험 결과(특히 '실패한 결과')를 기록

구글 머신러닝 단기집중과정 - 실제 ML 시스템 - 문헌

실제 예: 18세기 문학 18세기 문학을 연구하는 교수가 작가들이 사용한 '마음에 대한 은유'만을 토대로 작가의 정치적 소속이 어디인지를 예측하고자 했습니다. 18세기 문학을 연구하는 한 교수가 작가들이 사용한 '마음에 관한 은유'만을 토대로 작가의 정치적 소속이 어디인지를 평가하고자 했습니다. 연구팀은 다양한 작가의 작품을 문장별로 라벨을 지정하여 빅데이터 세트를 만들고 학습/검증/테스트 세트로 나누었습니다. 학습된 모델은 테스트 데이터에서 거의 완벽한 성능을 보였지만, 연구자들은 결과가 의심스러울 만큼 정확하다고 느꼈습니다. 무엇이 잘못되었을까요? 테스트 정확성이 의심스러울 정도로 높은 이유가 무엇이라고 생각하시나요? 문제가 무엇인지 생각해 본 다음, 아래에 있는 재생 버튼(▶)을 클릭하여 내 생각이..

구글 머신러닝 단기집중과정 - 실제 ML 시스템 - 암 예측

실제 예: 암 예측 모델은 의료 기록을 통해 '환자가 암에 걸렸을 가능성'을 예측하도록 학습되었습니다. 환자의 연령, 성별, 이전 질병, 병원 이름, 활력 징후, 검사 결과 등을 특징으로 사용했습니다. 모델은 지속된 테스트 데이터에서 뛰어난 예측 결과를 보였습니다. 그렇지만 새 환자의 경우 평가 결과가 제대로 나오지 않았습니다. 이유가 무엇일까요? 실제 예: 암 평가 왜 새 환자의 경우에는 모델에서 평가 결과가 제대로 나오지 않는다고 생각하시나요? 문제가 무엇인지 생각해 본 다음, 아래에 있는 재생 버튼(▶)을 클릭하여 내 생각이 맞았는지 확인하세요. 라벨 누출 : 약간의 학습 라벨이 기능에 유출되어 모델의 속임수를 허용하는 것

구글 머신러닝 단기집중과정_머신러닝 엔지니어링 실무지침서

* 해당 내용은 구글 머신러닝 단기집중과정 가이드 페이지에서 발췌하였다. 머신러닝 엔지니어링 실무지침서 Martin Zinkevich 본 문서의 목적은 머신러닝에 관한 기초 지식을 갖춘 독자들이 Google의 머신러닝 관련 권장사항을 참고할 수 있도록 돕는 것으로, Google C++ 스타일 가이드 등의 인기 있는 실무 프로그래밍 가이드처럼 머신러닝에 관한 스타일을 제시합니다. 머신러닝 수업을 들은 적이 있거나 머신러닝 모델을 개발하거나 다뤄본 경험이 있다면 이 문서를 읽는 데 필요한 배경 지식을 갖춘 것입니다. 용어 효과적인 머신러닝을 논하는 본 문서에서는 다음과 같은 용어가 반복적으로 사용됩니다. 인스턴스: 예측하려는 대상물을 의미합니다. 예를 들어 웹페이지를 '고양이와 관련됨' 혹은 '고양이와 무관..

반응형