-
구글 머신러닝 단기집중과정 - 결론 - 다음 단계오핸다음 단계 머신러닝 교육을 계속하고 텐서플로우 기술을 더욱 개발하려면 다음 리소스를 확인하세요. 머신러닝 실습 Google이 제품에서 어떻게 머신러닝을 활용하는지 보여주는 실제 우수사례를 동영상과 코딩 실습을 통해 알아보세요. 이미지 분류: Google이 어떻게 이미지 분류 모델을 개발하여 Google 포토의 검색 기능을 강화했는지 알아보고 나만의 이미지 분류 모델을 만들어 보세요. 더 많은 머신러닝 실습이 제공될 예정입니다. 기타 머신러닝 리소스 딥러닝: 이미지와 텍스트 모델을 광범위하게 다루는 신경망에 관한 고급 머신러닝 교육 과정 ML의 규칙: 머신러닝 엔지니어링 권장사항 TensorFlow.js: ML 모델 학습 및 배포를 위한 WebGL 가속 및 브라우저 기반 자바스크립트 라이브러리 텐서플로우 ..
-
2021-07-12 14:14:15
-
구글 머신러닝 단기집중과정 - 실제 ML 시스템 - 가이드라인오핸효과적인 ML 가이드라인 최초 모델은 단순하게 유지 데이터 파이프라인 정확성 확보에 중점 학습 및 평가를 위해 간단하고 관찰 가능한 측정항목 사용 입력 특성을 관리하고 모니터링 모델 구성을 코드로 취급하여 검토하고 체크인 모든 실험 결과(특히 '실패한 결과')를 기록
-
2021-07-12 14:09:48
-
구글 머신러닝 단기집중과정 - 실제 ML 시스템 - 문헌오핸실제 예: 18세기 문학 18세기 문학을 연구하는 교수가 작가들이 사용한 '마음에 대한 은유'만을 토대로 작가의 정치적 소속이 어디인지를 예측하고자 했습니다. 18세기 문학을 연구하는 한 교수가 작가들이 사용한 '마음에 관한 은유'만을 토대로 작가의 정치적 소속이 어디인지를 평가하고자 했습니다. 연구팀은 다양한 작가의 작품을 문장별로 라벨을 지정하여 빅데이터 세트를 만들고 학습/검증/테스트 세트로 나누었습니다. 학습된 모델은 테스트 데이터에서 거의 완벽한 성능을 보였지만, 연구자들은 결과가 의심스러울 만큼 정확하다고 느꼈습니다. 무엇이 잘못되었을까요? 테스트 정확성이 의심스러울 정도로 높은 이유가 무엇이라고 생각하시나요? 문제가 무엇인지 생각해 본 다음, 아래에 있는 재생 버튼(▶)을 클릭하여 내 생각이..
-
2021-07-12 14:07:36
-
구글 머신러닝 단기집중과정 - 실제 ML 시스템 - 암 예측오핸실제 예: 암 예측 모델은 의료 기록을 통해 '환자가 암에 걸렸을 가능성'을 예측하도록 학습되었습니다. 환자의 연령, 성별, 이전 질병, 병원 이름, 활력 징후, 검사 결과 등을 특징으로 사용했습니다. 모델은 지속된 테스트 데이터에서 뛰어난 예측 결과를 보였습니다. 그렇지만 새 환자의 경우 평가 결과가 제대로 나오지 않았습니다. 이유가 무엇일까요? 실제 예: 암 평가 왜 새 환자의 경우에는 모델에서 평가 결과가 제대로 나오지 않는다고 생각하시나요? 문제가 무엇인지 생각해 본 다음, 아래에 있는 재생 버튼(▶)을 클릭하여 내 생각이 맞았는지 확인하세요. 라벨 누출 : 약간의 학습 라벨이 기능에 유출되어 모델의 속임수를 허용하는 것
-
2021-07-12 14:00:22
-
구글 머신러닝 단기집중과정 - ML 엔지니어링 - 공정성오핸공정성 머신러닝 모델을 책임감 있게 평가하려면 단순한 손실 통계를 계산하는 것 이상의 활동이 필요합니다. 모델을 제품에 투입하기 전에 학습 데이터를 점검하고 예측에 편향성이 없는지 평가해야 합니다. 이 모듈에서는 데이터 학습에서 나타날 수 있는 다양한 유형의 사람이 갖는 편향을 살펴봅니다. 그런 다음 편향을 식별하고 그 영향을 평가할 수 있는 전략을 제시합니다. 무엇이 보이나요? 바나나 스티커 선반 위의 바나나 노란색 바나나 노란색은 가장 일반적인 바나나 색상 녹색 바나나 덜익은 바나나 너무 익은 바나나 바나나 빵에 적합 공정성을 위한 설계 문제 살펴보기 전문가에게 문의 모델이 편향을 고려하도록 학습시킴 결과 해석 맥락과 함께 게시 공정성: 편향의 유형 머신러닝 모델이라고 해서 본질적으로 객관적인 것은 ..
-
2021-06-22 17:13:36
-
구글 머신러닝 단기집중과정 - ML 엔지니어링 - 데이터 종속성오핸프로덕션 ML 시스템: 데이터 종속성 ML 개발자에게 있어 데이터는 기존 프로그래머에게 있어 코드만큼 중요합니다. 이 강의에서는 데이터에 관해 알아야 할 질문에 중점을 둡니다. 특성 관리 입력 데이터(특성)가 ML 시스템 행동을 결정합니다. 소프트웨어 라이브러리용 유닛 테스트는 작성하지만 데이터는 어떤가요? 입력 신호를 선택할 때는 주의해야 합니다. 어떤 소프트웨어 라이브러리에 종속될지 결정할 때보다 더 주의해야 할 수도 있습니다. 입력 데이터에 관해 물어야 할 질문 신뢰성 신호를 사용할 수 없으면 어떻게 되나요? 어떻게 알게 되나요? 버전 차별화 이 신호를 계산하는 시스템이 변경되기도 하나요? 얼마나 자주 변경되고 무슨 결과가 생기나요? 필요성 신호의 유용성이 신호를 포함하는 비용을 정당화하나요? 상관..
-
2021-06-22 16:38:46
-
구글 머신러닝 단기집중과정 - ML 엔지니어링 - 정적 추론과 동적 추론오핸정적 추론과 동적 추론 비교 선택할 수 있는 추론 전략은 다음과 같이 두 가지가 있습니다. 오프라인 추론: MapReduce 등을 사용하여 가능한 모든 예측을 일괄적으로 생성합니다. 그런 다음 예측을 SSTable 또는 Bigtable에 기록하고 캐시/조회 테이블에 입력합니다. 온라인 추론: 서버를 사용하여 요청 시 예측합니다. ML 시스템 패러다임: 추론 오프라인 추론 MapReduce 등을 사용하여 가능한 모든 예측을 일괄적으로 생성합니다. 테이블에 기록한 후 캐시/조회 테이블에 입력합니다. 장점: 추론 비용을 크게 신경 쓸 필요가 없습니다. 장점: batch quota를 사용할 수 있습니다. 장점: 데이터 예측값을 푸시하기 전에 사후 검증이 가능합니다. 단점: 알고 있는 항목만 예측할 수 있으며 길..
-
2021-06-22 16:16:31
-
구글 머신러닝 단기집중과정 - ML 엔지니어링 - 정적 학습과 동적 학습오핸정적 학습과 동적 학습 비교 개략적으로 모델을 학습시키는 방법에는 다음 두 가지가 있습니다. 정적 모델은 오프라인으로 학습됩니다. 즉, 모델을 한 번만 학습시키고 해당 모델을 일정 기간 사용합니다. 동적 모델은 온라인으로 학습됩니다. 즉, 데이터가 시스템에 계속 유입되며 지속적인 업데이트를 통해 해당 데이터를 모델에 통합합니다. ML 시스템 패러다임: 학습 정적 모델 -- 오프라인으로 학습 손쉬운 빌드 및 테스트 -- batch 학습 및 테스트, 만족스러울 때까지 반복 여전히 입력 모니터링 필요 노후화되기 쉬움 동적 모델 -- 온라인으로 학습 지속적으로 학습 데이터 공급, 정기적으로 업데이트된 버전 동기화 batch 학습 및 테스트가 아닌 점진적 검증 사용 모니터링, 모델 롤백 및 데이터 격리 기능 필요..
-
2021-06-22 16:03:06
-
구글 머신러닝 단기집중과정 - ML 엔지니어링 - 프로덕션 ML 시스템오핸프로덕션 ML 시스템 머신러닝에는 단순한 ML 알고리즘 구현 외에 훨씬 더 많은 것이 포함되어 있습니다. 프로덕션 ML 시스템에는 많은 구성요소가 포함됩니다. 지금까지 이에 대해 살펴보았습니다. 하지만 ML 시스템의 나머지 부분은 어떤가요? 지금까지 머신러닝 단기집중과정에서는 ML 모델을 만드는 데 초점을 맞췄습니다. 하지만 다음 그림에서 알 수 있듯이, 이 모델은 실제 프로덕션 ML 시스템 생태계의 한 부분에 지나지 않습니다. 그림 1. 실제 프로덕션 ML 시스템 ML 코드는 실제 ML 프로덕션 시스템의 중심에 있지만 일반적으로 전체 ML 프로덕션 시스템 코드의 5%만을 나타냅니다. 오타가 아닙니다. ML 프로덕션 시스템은 입력 데이터에 많은 리소스를 투입하여 데이터를 수집 및 확인하고 데이터에서 특성..
-
2021-06-22 15:55:56
-
구글 머신러닝 단기집중과정 - ML 개념 - 임베딩오핸임베딩 임베딩은 고차원 벡터의 변환을 통해 생성할 수 있는 상대적인 저차원 공간을 가리킵니다. 임베딩을 사용하면 단어를 나타내는 희소 벡터와 같이 커다란 입력값에 대해 머신러닝을 더 쉽게 수행할 수 있습니다. 임베딩이 잘 동작하는 경우 의미가 유사한 입력값들을 임베딩 공간 안에 서로 근접하게 위치시켜 입력값의 특정 의미를 포착합니다. 임베딩은 모델과 관계없이 학습과 재사용이 가능합니다. 협업 필터링에서 필요한 경우 입력: 사용자 500,000명이 선택한 영화 1,000,000편 작업: 사용자에게 영화 추천 이 문제를 해결하려면 어떤 영화가 서로 비슷한지 파악하는 방법이 필요합니다. 유사성별로 영화 정리(1차원) 유사성별로 영화 정리(2차원) 2차원 임베딩 d차원 임베딩 영화에 대한 사용자의 관심분야를 대..
-
2021-06-22 14:31:05
-
구글 머신러닝 단기집중과정 - ML 개념 - 다중 클래스 신경망오핸다중 클래스 신경망 앞서 다음과 같이 가능한 두 항목 중 하나를 선택할 수 있는 이진 분류 모델을 알아보았습니다. 주어진 이메일이 스팸 또는 스팸이 아님 주어진 종양이 악성 또는 양성임 이 모듈에서는 여러 가능한 항목 중에서 선택할 수 있는 다중 클래스 분류를 살펴보겠습니다. 예: 이 개는 비글인가요, 바셋하운드인가요, 아니면 블러드하운드인가요? 이 꽃은 시베리안 아이리스인가요, 더치 아이리스인가요, 블루 플래그 아이리스인가요, 아니면 드워프 비어디드 아이리스인가요? 이 비행기는 보잉 747인가요, 에어버스 320인가요, 보잉 777인가요, 아니면 엠브라에르 190인가요? 이 이미지는 사과, 곰, 사탕, 개, 계란 중 무엇의 이미지인가요? 실제로 수백만 개의 클래스 중에서 선택해야 하는 다중 클래스 문제..
-
2021-06-22 13:18:48
-
구글 머신러닝 단기집중과정 - ML 개념 - 신경망 학습오핸신경망 학습 역전파는 신경망의 가장 일반적인 학습 알고리즘입니다. 다계층 신경망에서 경사하강법을 사용하려면 이 알고리즘이 필요합니다. 텐서플로우는 역전파를 자동으로 처리하므로 알고리즘을 자세히 이해할 필요는 없습니다. 이 알고리즘의 원리를 이해하려면 역전파 알고리즘 시각적 설명을 참조하세요. 이 설명 과정을 진행하면서 다음 사항에 주목하세요. 데이터가 그래프를 통과하는 방식 동적 프로그래밍을 사용하면 기하급수적으로 증가하는 그래프 통과 경로를 일일이 계산할 필요가 없는 이유. 여기에서 '동적 프로그래밍'은 정방향 및 역방향 전달에서 중간 결과를 기록함을 의미합니다. 역전파: 숙지할 사항 경사의 중요성 미분 가능하면 학습이 가능할 확률이 높음 경사의 소실 가능성 레이어를 추가할수록 신호와 노이즈가 연속적으..
-
2021-06-22 11:20:42
-
구글 머신러닝 단기집중과정 - ML 개념 - 신경망오핸신경망 소개 신경망은 좀 더 정교한 버전의 특성 교차입니다. 기본적으로 신경망은 적절한 특성 교차를 학습합니다. 선형 모델 복잡성 추가: 비선형인가? 비선형성 추가하기 선호하는 비선형성 신경망은 임의적으로 복잡할 수 있음 신경망 소개: 해부 특성 교차 단원에서 설명한 대로 이제 비선형 분류 문제를 설명하겠습니다. 그림 1. 비선형 분류 문제 '비선형'이라는 의미는 $$ b=w_qx_q+w_2x_2 $$ 형태의 모델로 라벨을 정확하게 예측할 수 없다는 의미입니다. 다시 말해, '결정 표면'은 선이 아닙니다. 앞서 비선형 문제의 가능한 모델링 방식으로 특성 교차를 살펴보았습니다. 다음 데이터 세트를 고려해 보겠습니다. 그림 2. 더 복잡한 비선형 분류 문제 그림 2의 데이터 세트는 선형 모델로는 해결할 수 ..
-
2021-06-22 10:54:30
-
구글 머신러닝 단기집중과정 - ML 개념 - 정규화 : 희소성오핸희소성을 위한 정규화 이 모듈에서는 많은 차원을 갖는 특성 벡터에 대해 학습한 모델의 특수 요구사항에 중점을 둡니다. 특성 교차로 돌아가기 주의: 희소 특성 교차는 특성 공간을 크게 늘릴 수 있습니다. 가능한 문제: 모델 크기(RAM)가 매우 커질 수 있음 '노이즈' 계수(과적합의 원인) L1 정규화 L0 가중치 기준에 페널티를 주고자 함 볼록하지 않은 최적화, NP-난해 L1 정규화로의 완화: 절대값(가중치)의 합에 페널티를 줌 볼록 문제 L2와는 달리 희소성을 유도 희소성을 위한 정규화: L₁ 정규화 희소 벡터는 종종 많은 차원을 포함합니다. 특성 교차를 생성하면 더 많은 차원이 발생합니다. 이러한 고차원 특성 벡터가 주어지면 모델 크기가 커질 수 있으며 엄청난 양의 RAM이 필요합니다. 가능하다면 ..
-
2021-06-22 09:42:01
-
구글 머신러닝 단기집중과정 - ML 개념 - 분류오핸분류 이 모듈에서는 분류 작업에 로지스틱 회귀를 사용하는 방법을 보여주고 분류 모델의 효과를 평가하는 방법을 살펴봅니다. 분류 및 회귀 확률 결과에 로지스틱 회귀를 사용하기도 하는데, 이 회귀의 형태는 (0, 1)입니다. 다른 경우 별개의 이진 분류 값에 임계값을 설정합니다. 임계값 선택은 중요하며 값을 조정할 수 있습니다. 평가 측정항목: 정확성 분류 모델을 어떻게 평가해야 할까요? 가능한 한 가지 측정 방법: 정확성 올바른 예측의 비율 오해하기 쉬운 정확성 대부분의 경우 정확성은 잘못되거나 오해하기 쉬운 측정항목입니다. 다양한 종류의 실수에 여러 비용이 소요되는 경우가 많습니다. 대표적인 경우로 양성이나 음성이 거의 없는 클래스 불균형을 들 수 있습니다. TP 및 FP 클래스 불균형 문제의 경우 다양..
-
2021-06-21 17:52:21
-
구글 머신러닝 단기집중과정 - ML 개념 - 로지스틱 회귀오핸로지스틱 회귀 로지스틱 회귀는 정확히 0 또는 1을 예측하는 대신 확률(0과 1 사이의 값, 0과 1은 제외)을 생성합니다. 스팸 감지의 로지스틱 회귀 모델을 예로 들어보겠습니다. 모델이 특정 이메일 메시지에서 추론한 값이 0.932이면 이메일 메시지가 스팸일 확률이 0.932입니다. 더 정확히 말하면 무한히 학습할 경우 모델이 0.932로 예측했다면 그 데이터의 93.2%가 실제로 스팸이고 나머지 6.8%가 스팸이 아님을 의미합니다. 동전 던지기의 결과를 예측하려고 하세요? 구부러진 동전의 앞면이 나올 확률을 예측하는 문제를 생각해보세요. 구부러진 각도, 동전의 질량 등의 특성을 사용할 수 있습니다. 사용할 수 있는 가장 단순한 모델은 어떤 모델인가요? 어떤 문제가 발생할 수 있나요? 로지스틱 회귀 많..
-
2021-06-21 17:01:03
-
구글 머신러닝 단기집중과정 - ML 개념 - 정규화 : 단순성오핸단순성을 위한 정규화 정규화란 모델의 복잡도에 페널티를 줌으로써 과적합을 줄이는 것입니다. 일반화 곡선 모델 복잡도에 페널티 부여 가능하면 모델 복잡도를 방지하려고 합니다. 학습 단계에서 수행하는 최적화에 이 아이디어를 적용할 수 있습니다. 경험적 위험 최소화 학습 오류를 낮추는 것이 목표 \( 최소화:\,손실(데이터|모델) \) 또한 복잡도를 낮출 수 있도록 조정 \( 최소화:\,손실(데이터|모델)\,+\,복잡도(모델) \) 정규화 복잡도(모델)를 정의하는 방법 더 작은 가중치 선호 여기에서 벗어나면 비용이 발생함 L2 정규화(일명 능선)를 통해 이 아이디어를 구현할 수 있음 복잡도(모델) = 가중치의 제곱의 합 아주 큰 가중치에 대한 페널티 부여 선형 모델에서는 더 평평한 기울기를 선호 베이지안 사전..
-
2021-06-21 16:24:53
-
구글 머신러닝 단기집중과정 - ML 개념 - 특성 교차오핸특성 교차 특성 교차는 두 개 이상의 특성을 곱하여(교차하여) 구성되는 합성 특성입니다. 여러 특성을 교차하면 각 특성의 개별적인 예측 기능 이상의 기능을 이용할 수 있습니다. 특성 교차 특성 교차가 이 방식의 이름입니다. 양식 [A x B]의 템플릿을 정의합니다. 양식이 더 복잡할 수도 있습니다. [A x B x C x D x E] A와 B가 빈과 같은 부울 특성인 경우 곱의 결과 범위가 매우 희소하게 나타날 수 있습니다. 특성 교차: 몇 가지 예 주택시장 가격 예측: [latitude X num_bedrooms] 틱택토 예측: [pos1 x pos2 x ... x pos9] 특성 교차: 특성 교차를 사용해야 하는 이유 선형 학습자는 대량의 데이터(예: Vowpal Wabbit, sofia-ml)에 맞..
-
2021-06-21 15:37:22
-
구글 머신러닝 단기집중과정 - ML 개념 - 표현오핸* 특이사항으로는 프로그래밍 실습 페이지가 들어가지지 않는다. 참고하길 바란다. 표현 머신러닝 모델은 입력 예를 직접적으로 보거나 듣거나 감지할 수 없습니다. 대신 데이터의 표현을 만들어 모델이 데이터의 핵심적인 특징을 들여다 볼 수 있는 유용한 관측 지점을 제공해야 합니다. 즉, 모델을 학습시키려면 데이터를 가장 잘 표현하는 특성 세트를 선택해야 합니다. 원시 데이터를 특성으로 변환 원리는 왼쪽에 있는 벡터의 각 요소를 오른쪽에 있는 특성 벡터의 하나 이상의 필드로 매핑하는 것입니다. 만약 'Main Street' 처럼 문자열이 있다면? 사전으로 각 거리 이름을 {0, ...,V-1} 범위의 정수에 매핑 이제 위의 원-핫 벡터를 로 표현 좋은 특성의 조건 특성 값은 데이터 세트에서 너무 적지 않은 일정..
-
2021-06-21 14:15:27
-
구글 머신러닝 단기집중과정 - ML 개념 - 검증세트오핸검증: 직관력 테스트 이 모듈을 시작하기 전에 학습 및 테스트 세트에 제시된 학습 프로세스를 사용하는 데 문제점이 있는지 확인해 보시기 바랍니다. 아래 옵션을 확인하세요. 테스트 세트 및 학습 세트를 사용하여 모델 개발 반복 과정을 진행하는 프로세스를 살펴보았습니다. 각 반복 과정에서는 학습 데이터를 학습하고 테스트 데이터로 평가하면서 테스트 데이터에 대한 평가 결과를 근거로 학습률, 특성 등의 다양한 모델 초매개변수를 선택하고 변화를 줍니다. 이 접근법에 잘못된 점이 있나요? 정답을 하나만 고르세요. 이 방식은 연산 효율이 낮습니다. 기본 초매개변수 세트를 선택하고 그대로 사용하여 리소스를 절약해야 합니다. 이러한 유형의 반복 과정은 많은 리소스를 사용하지만 모델 개발에서 핵심적인 부분을 차지합니다. ..
-
2021-06-21 10:26:41
-
구글 머신러닝 단기집중과정 - ML 개념 - 학습 및 테스트 세트오핸학습 및 테스트 세트 테스트 세트는 학습 세트로부터 개발한 모델을 평가하는 데 사용되는 데이터 세트입니다. 데이터 세트 분할 학습 평가와 테스트 평가 데이터 세트가 하나뿐이라면 어떻게 하나요? 다음과 같이 두 세트로 분할합니다. 학습 세트 테스트 세트 기억해야 할 유의사항: 테스트 데이터로 학습하지 않기 손실이 이상할 정도로 적은가요? 기뻐하기는 이릅니다. 실수로 테스트 데이터로 학습하진 않았는지 확인해 보세요. 학습 및 평가 세트: 데이터 분할 이전 모듈에서는 데이터 세트를 다음과 같이 두 부분으로 나눈다는 개념을 소개했습니다. 학습 세트 - 모델을 학습시키기 위한 데이터 세트의 일부분 평가 세트 - 모델을 테스트하기 위한 데이터 세트의 일부분 데이터 세트 하나를 다음과 같이 분할하는 방법을 생각해 볼..
-
2021-06-18 17:53:47
-
구글 머신러닝 단기집중과정 - ML 개념 - 일반화오핸일반화 일반화는 모델이 이를 만들기 위해 사용된 것과 같은 분포에서 추출된 이전에 보지 못했던 새로운 데이터에 제대로 적합할 수 있는지를 나타냅니다. 개요 목표: 숨겨진 실제 분포에서 추출된 새로운 데이터를 제대로 예측 문제: 진실을 알 수 없음 분포에서 추출된 샘플만 볼 수 있음 모델 h가 현재 샘플에 적합하면 다른 새로운 샘플도 잘 예측할 것이라고 신뢰할 수 있나요? 모델이 적합한지 어떻게 알 수 있나요? 이론적인 측면: 흥미로운 분야: 일반화 이론 모델의 단순성/복잡성 측정 아이디어를 기반으로 함 직관: 오컴의 면도날 원칙의 형식화 모델이 덜 복잡할수록 샘플 자체의 특성을 벗어나 좋은 경험적 결과를 얻을 가능성이 높음 경험적인 측면: 질문: 모델이 새로운 데이터 샘플에 효과적으로 작동하나요? 평가:..
-
2021-06-18 17:34:37
-
구글 머신러닝 단기집중과정 - ML 개념 - TF 첫걸음오핸* 특이사항으로는 TF 첫걸음의 동영상 강의가 들어가지지 않는다. 참고하길 바란다. 텐서플로우 첫걸음: 도구 다음 그림은 텐서플로우 도구함의 현재 계층구조를 보여 줍니다. 그림 1. 텐서플로우 도구함 계층구조 다음 표에는 여러 레이어의 목적이 요약되어 있습니다. 도구함 설명 에스티메이터(tf.estimator) 높은 수준의 OOP API tf.layers/tf.losses/tf.metrics 일반 모델 구성요소용 라이브러리 텐서플로우 낮은 수준의 API 텐서플로우는 다음 두 요소로 구성됩니다. 그래프 프로토콜 버퍼 분산된 그래프를 실행하는 런타임 이 두 구성요소는 자바 컴파일러 및 JVM과 유사합니다. JVM이 여러 하드웨어 플랫폼에서 구현되는 것과 마찬가지로 텐서플로우도 여러 CPU와 GPU에서 구현됩..
-
2021-06-18 14:54:47
-
구글 머신러닝 단기집중과정 - ML 개념 - 손실 줄이기오핸손실 줄이기 모델을 학습하려면 모델의 손실을 줄이기 위한 좋은 방법이 필요합니다. 반복 방식은 손실을 줄이는 데 사용되는 일반적인 방법 중 하나로 매우 간편하고 효율적입니다. 손실을 줄이는 방법 가중치와 편향에 대한 도함수 \( (y - y')^2 \)는 주어진 예제의 손실 변화 정도를 보여줍니다. 계산하기 간편하며 볼록 모양 손실을 최소화하는 방향으로 작은 보폭을 반복하여 취합니다. 이를 가리켜 기울기 보폭이라고 합니다.(하지만 실제로는 음의 기울기 보폭임). 이 최적화 전략을 경사하강법이라고 합니다. 손실 줄이기: 반복 방식 이전 모듈에서는 손실의 개념을 소개했습니다. 이 모듈에서는 머신러닝 모델이 반복을 통해 어떻게 손실을 줄이는지 알아보겠습니다. 반복 학습은 골무와 같이 숨겨진 물건을 찾는 아이들..
-
2021-06-18 09:47:17
-
구글 머신러닝 단기집중과정 - ML 개념 - ML로 전환하기오핸선형 회귀 점 집합에 가장 잘 맞는 직선 또는 초평면을 찾기 위한 방법. 이 모듈에서는 선형 회귀를 직관적으로 탐구한 후 선형 회귀에 대한 머신러닝적 접근 방식의 기초를 다집니다. 데이터에서 학습 데이터에서 학습하는 데는 여러 가지 복잡한 방법이 있습니다. 하지만 간단하고 익숙한 방법부터 시작해 보겠습니다. 간단한 방법에서부터 시작하면 더 광범위하고 유용한 방법에 접근할 수 있을 것입니다. 회귀에 사용할 때 편리한 손실 함수 주어진 예의 L2 손실은 제곱 오차라고도 합니다. = 예측과 라벨 간의 차이 제곱 = \((관찰 - 예측)^2\) = \((y - y')^2\) 데이터 세트에서 L2 손실 정의하기 $$ L_2 Loss\,=\,\sum_{(x,y)\in D}{(y−prediction(x))^2} $$..
-
2021-06-17 16:44:46
-
구글 머신러닝 단기집중과정 - ML 개념 - ML 문제로 표현하기오핸프레이밍 이 모듈에서는 작업을 머신러닝 문제로 프레이밍 하는 방법을 살펴보고 광범위한 머신러닝(ML) 방법에서 공통으로 사용되는 기본적인 용어를 설명합니다. (지도) 머신러닝이란 무엇인가요? ML 시스템은 입력을 결합하여 이전에 본 적이 없는 데이터를 적절히 예측하는 방법을 학습합니다. 지도 머신러닝에서는 입력을 결합하여 모델을 만들고 이전에 보지 못한 데이터도 적절히 예측하는 방법을 배움 용어: 라벨 및 특성 라벨은 예측하는 실제 항목(y)입니다. 기본 선형 회귀의 y 변수입니다. 특성은 데이터를 설명하는 입력 변수(xi)입니다. 기본 선형 회귀의 {x1, x2, ... xn} 변수입니다. 용어: 예 및 모델 예는 데이터(x)의 특정 인스턴스입니다. 라벨이 있는 예에는 {특성, 라벨}(x, y)이 포함..
-
2021-06-17 15:22:40
-
구글 머신러닝 단기집중과정 - ML 개념 - ML 소개오핸본격적인 머신러닝(ML) 개념에 대해서 학습이 시작된다. 3분짜리 간략한 영상인데, 영상을 요약하면 다음과 같다. ML을 이용했을 때에 누릴 수 있는 소프트웨어 엔지니어로서 3가지 장점 프로그래밍 시간을 줄일 수 있는 도구를 얻음 제품을 맞춤 설정하여 특정 집단 사용자에게 제공 가능 수동으로 못할 것 같은 방법을 해결 가능 이것 이외에도 철학적인 이유가 한번 언급되었다. 논리적이고 수학적인 사고 : 수리과학적 사고방식 에서 관찰하고 실험하며 통계를 사용하는 과학적인 사고 : 자연과학적 사고방식 으로 문제에 대한 사고방식을 바꿔준다는 것이다. 짧은 영상이었지만 왜 우리가 ML을 배우는지에 대해 상기할 수 있는 좋은 영상이다.
-
2021-06-16 17:27:09
-
구글 머신러닝 단기집중과정_머신러닝 용어집오핸* 해당 내용은 구글 머신러닝 단기집중과정 용어집 페이지에서 발췌하였다. 머신러닝 용어집 이 용어집에서는 머신러닝과 관련된 일반 용어 및 텐서플로우에서만 사용하는 용어를 정의합니다. ★ 참고: 영어 외 버전의 머신러닝 단기집중과정은 2019년 4월부터 업데이트되지 않습니다. 최신 콘텐츠는 영어 버전을 참조하세요. A A/B 테스트(A/B testing) 둘 이상의 기법을 통계적으로 비교하는 방법으로서, 일반적으로 기존 기법과 새로운 기법을 서로 비교합니다. A/B 테스트의 목표는 더 우수한 기법을 찾는 것뿐만 아니라 그 차이가 통계적 유의성을 갖는지 여부를 파악하는 것입니다. A/B 테스트에서는 일반적으로 단일 측정항목을 사용하여 두 기법을 비교하지만, 적용 가능한 기법 및 측정항목의 수에는 유한성의 범..
-
2021-06-16 16:19:05
-
구글 머신러닝 단기집중과정_머신러닝 엔지니어링 실무지침서오핸* 해당 내용은 구글 머신러닝 단기집중과정 가이드 페이지에서 발췌하였다. 머신러닝 엔지니어링 실무지침서 Martin Zinkevich 본 문서의 목적은 머신러닝에 관한 기초 지식을 갖춘 독자들이 Google의 머신러닝 관련 권장사항을 참고할 수 있도록 돕는 것으로, Google C++ 스타일 가이드 등의 인기 있는 실무 프로그래밍 가이드처럼 머신러닝에 관한 스타일을 제시합니다. 머신러닝 수업을 들은 적이 있거나 머신러닝 모델을 개발하거나 다뤄본 경험이 있다면 이 문서를 읽는 데 필요한 배경 지식을 갖춘 것입니다. 용어 효과적인 머신러닝을 논하는 본 문서에서는 다음과 같은 용어가 반복적으로 사용됩니다. 인스턴스: 예측하려는 대상물을 의미합니다. 예를 들어 웹페이지를 '고양이와 관련됨' 혹은 '고양이와 무관..
-
2021-06-16 16:11:19
-
구글 머신러닝 단기집중과정_실습오핸본격적인 실습에 앞서 실습 페이지를 탐색한다. 앞선 페이지에서 설명드렸듯이 우리는 Colaboratory 플랫폼을 사용한다. 구글에서 하는 교육이고 하니 웬만하면 'Chrome'을 이용하는 걸 추천한다. 대부분의 프로그래밍 실습은 캘리포니아 주택 데이터 세트 를 이용한다. 실습은 프로그래밍과 이해도 확인, 플레이그라운드 탭으로 구성되어 있는데 아래는 먼저 프로그래밍 탭 구성이다. Tensorflow를 활용한 프로그래밍의 A to Z가 쓰여 있다. 다음은 이해도 확인을 위한 내용이 쓰여있다. 마지막으론 아래 이미지와 같이 플레이그라운드 탭이 있는데... 실습 내용 구성을 미루어 보았을 때, 단기 집중 과정이라는 특징상 자세한 설명은 아닐 것으로 추측한다. 추가적으로 스터디를 해야 하는 내용일 것이다.
-
2021-06-16 16:01:16
스킨 업데이트 안내
현재 이용하고 계신 스킨의 버전보다 더 높은 최신 버전이 감지 되었습니다. 최신버전 스킨 파일을
다운로드 받을 수 있는 페이지로 이동하시겠습니까?
("아니오" 를 선택할 시 30일 동안 최신
버전이 감지되어도 모달 창이 표시되지 않습니다.)