코딩야학 - 보스턴 집값 예측
·
데이터 분석/코딩야학
실습을 진행하기전에 데이터를 먼저 살펴 보자. 각각의 행은 타운을 의미하고 각 열은 특성들을 의미한다. 이중에서 제일 중요한 열은 14번째 열인데, 해당 타운에있는 집값의 중앙 값이다. 일반적으로 평균값이 집단을 대표하기 좋은 지표이다. 하지만 어떤 경우에는 집단을 대표하기에는 매우취약하다. 단적으로 평균연봉을 보면 연봉이 매우높은사람의 금액이 너무 높아서 전체 평균연봉에 영향을 주고 그 때문에 전체를 대표하는 연봉으로 하기에는 괴리가 생긴다. 전체 집단의 수치와 비교하여 상이하고 높거나 낮아서 평균의 대표성을 무너트리는 값들을 이상치 라고 한다. 이러한 이상치 때문에 평균값이 대표성을 띄지 못할 때 중앙값을 쓴다. 이제 코드를 살펴보자 .. 위 코드에서 #2. 모델의 구조를 만듭니다 이부분에 대해 알아..
코딩야학-레모네이드 판매 예측 실습
·
데이터 분석/코딩야학
위 그림은 학습을 10번 하는 코드의 출력 값이다. 출력 부분을 자세히 살펴 보자. 먼저 파랑색 부분은 학습이 얼마나 진행 되었는지 진행 상황을 알려준다. 가운데 주황색 부분은 각 학습마다 소요된 시간을 알려주고, 마지막에 loss 부분은 각 학습이 정답을 얼마나 맞추고 있는지 나타내고 있는 것이다. 독립 변수와 종속 변수를 모델에 넣으면 모델은 각 학습 과정에서 예측을 진행하고 종속 변수와 예측 결과의 차이. 즉, 오차 제곱의 평균을 loss 라고 한다. loss는 0에 가까울 수록 좋다 레모네이드 판매 예측 실습 # 라이브러리 사용 import tensorflow as tf import pandas as pd # 데이터를 준비합니다. 파일경로 = 'https://raw.githubusercon..
코딩야학-딥러닝 1
·
데이터 분석/코딩야학
위 지도는 머신러닝으로 해결 할 수 있는 많은 문제들을 보여줍니다. 이 수업에서 텐서플로우를 이용해서 해결하려는 문제는 지도학습의 회귀와 분류입니다. 회귀는 숫자로 된 결과를 예측하는 것이고, 분류는 범주형문제의 결과를 예측 하는 것입니다. 회귀와 분류 문제를 해결하기 위해 사용하는 머신러닝 알고리즘에는 DecisionTree,RandomForest,K-NN,support vector machine ,neural network 등이 있다. 이중 이 수업은 Neural Network에 대해 배우는 수업이다. 사람의 두뇌가 동작하는 방법을 모방해서 기계가 학습을 할 수 있게 고안된 것이 Neural Network 알고리즘이다. 우리의 두뇌는 뉴런이라는 세포들이 촘촘하게 연결 되어있다. 뉴런들로 연결된 신경망..
ariz1623
'딥러닝' 태그의 글 목록 (2 Page)