일상 속 공감을 공유하다.
728x90

모델 4

구글 머신러닝 단기집중과정 - 실제 ML 시스템 - 가이드라인

효과적인 ML 가이드라인 최초 모델은 단순하게 유지 데이터 파이프라인 정확성 확보에 중점 학습 및 평가를 위해 간단하고 관찰 가능한 측정항목 사용 입력 특성을 관리하고 모니터링 모델 구성을 코드로 취급하여 검토하고 체크인 모든 실험 결과(특히 '실패한 결과')를 기록

구글 머신러닝 단기집중과정 - ML 엔지니어링 - 정적 학습과 동적 학습

정적 학습과 동적 학습 비교 개략적으로 모델을 학습시키는 방법에는 다음 두 가지가 있습니다. 정적 모델은 오프라인으로 학습됩니다. 즉, 모델을 한 번만 학습시키고 해당 모델을 일정 기간 사용합니다. 동적 모델은 온라인으로 학습됩니다. 즉, 데이터가 시스템에 계속 유입되며 지속적인 업데이트를 통해 해당 데이터를 모델에 통합합니다. ML 시스템 패러다임: 학습 정적 모델 -- 오프라인으로 학습 손쉬운 빌드 및 테스트 -- batch 학습 및 테스트, 만족스러울 때까지 반복 여전히 입력 모니터링 필요 노후화되기 쉬움 동적 모델 -- 온라인으로 학습 지속적으로 학습 데이터 공급, 정기적으로 업데이트된 버전 동기화 batch 학습 및 테스트가 아닌 점진적 검증 사용 모니터링, 모델 롤백 및 데이터 격리 기능 필요..

구글 머신러닝 단기집중과정 - ML 개념 - 학습 및 테스트 세트

학습 및 테스트 세트 테스트 세트는 학습 세트로부터 개발한 모델을 평가하는 데 사용되는 데이터 세트입니다. 데이터 세트 분할 학습 평가와 테스트 평가 데이터 세트가 하나뿐이라면 어떻게 하나요? 다음과 같이 두 세트로 분할합니다. 학습 세트 테스트 세트 기억해야 할 유의사항: 테스트 데이터로 학습하지 않기 손실이 이상할 정도로 적은가요? 기뻐하기는 이릅니다. 실수로 테스트 데이터로 학습하진 않았는지 확인해 보세요. 학습 및 평가 세트: 데이터 분할 이전 모듈에서는 데이터 세트를 다음과 같이 두 부분으로 나눈다는 개념을 소개했습니다. 학습 세트 - 모델을 학습시키기 위한 데이터 세트의 일부분 평가 세트 - 모델을 테스트하기 위한 데이터 세트의 일부분 데이터 세트 하나를 다음과 같이 분할하는 방법을 생각해 볼..

구글 머신러닝 단기집중과정 - ML 개념 - ML 문제로 표현하기

프레이밍 이 모듈에서는 작업을 머신러닝 문제로 프레이밍 하는 방법을 살펴보고 광범위한 머신러닝(ML) 방법에서 공통으로 사용되는 기본적인 용어를 설명합니다. (지도) 머신러닝이란 무엇인가요? ML 시스템은 입력을 결합하여 이전에 본 적이 없는 데이터를 적절히 예측하는 방법을 학습합니다. 지도 머신러닝에서는 입력을 결합하여 모델을 만들고 이전에 보지 못한 데이터도 적절히 예측하는 방법을 배움 용어: 라벨 및 특성 라벨은 예측하는 실제 항목(y)입니다. 기본 선형 회귀의 y 변수입니다. 특성은 데이터를 설명하는 입력 변수(xi)입니다. 기본 선형 회귀의 {x1, x2, ... xn} 변수입니다. 용어: 예 및 모델 예는 데이터(x)의 특정 인스턴스입니다. 라벨이 있는 예에는 {특성, 라벨}(x, y)이 포함..

반응형