데이터 시각화 기초
·
데이터 분석/데이터 분석 기초
기본 그래프 그리기 import matplotlib.pyplot as plt plt.plot([1,5,10,15,20]) plt.show() # y축 / x축 plt.plot([1,5,10,15,20],[1,4,8,10,30]) plt.show() 그래프에 제목 넣기 - title() #title() 함수를 통해 제목을 넣을 수 있다. plt.title("Title") plt.plot([1,5,10,15,20]) plt.show() 그래프에 범례 넣기 #범례 plt.title('cross') plt.plot([10,20,30,40],label ='asc') #증가를 의미하는 asc 범례 plt.plot([40,30,20,10],label='desc') #감소를 의미하는 desc 범례 plt.legend(..
매년 새해 첫날의 기온 그래프 - 데이터 분석 기초
·
데이터 분석/데이터 분석 기초
새해 첫날의 기온 그래프 그리기 # 데이터 읽어오기 import csv f = open('./excel/seoul.csv') data = csv.reader(f) next(data) # 헤더 부분을 next() 함수를 사용해 제외 result = [] for row in data: if row[-1] != '': #최고 기온의 값이 존대한다면 result.append(float(row[-1])) # result 리스트에 최고 기온의 값 추가 print(len(result)) import pandas as pd data =pd.read_csv('./excel/seoul.csv',encoding='cp949') print(data.info()) data.head() RangeIndex: 40221 entri..
pandas 기초 (2)
·
데이터 분석/데이터 분석 기초
데이터 누락 다루기 pandas는 결측치를 numpy.nan 을 사용해서 표기하는데 이는 숫자와 달라 혼동을 피할 수 있다. 또 pandas는 결측치를 탐지하고 보정하는 함수를 제공한다. 결측치는 반드시 삭제하거나 맥락에 맞는 다른 값으로 교체해서 보정해야한다. 결측치 삭제 dropna() 함수는 결측치를 가진 열(axis=0,기본값) 이나 행(axis=1)의 일부 (how="any",기본값) 또는 전체 (how="all")를 삭제하고, '정제된' 데이터 프레임 복사본dmf 반환 한다. 데이터 프레임의 구조자체를 파괴하지 않는 한 결측치만 제거할 수는 없다.. nan_alco Beer Wine Spirits Water State South Carolina 1.36 0.24 0.77 NaN South Da..
pandas 기초(1)
·
데이터 분석/데이터 분석 기초
Pandas 파이썬의 데이터 구조 셋은 이미 잘갖추어져 있지만, pandas 모듈은 여기에 두가지 컨테이너인 Series와 DataFrame을 추가한다. 시리즈는 레이블이 붙은 1차원 벡터다. 프레임은 레이블이 붙은 행과 열로 구성된 테이블이다. 프레임의 각 열은 시리즈다. 몇 가지 예외를 제외하면 pandas는 프레임을 시리즈와 유사하게 취급한다 프레임과 시리즈는 다음과 같이 다양한 데이터 전처리함수를 가진다. - 단순 혹은계층적 인덱싱 - 결측치 처리 - 전체 열과 테이블에서 사칙 ,논리 연산 - 데이터 베이스 - 타입연산 (결합이나 집계 등) - 단일 열이나 전체 테이블 시각화 - 파일에서 데이터 읽고 쓰기 시리즈 : 1차원 벡터 import pandas as pd series = pd.Series..
토이 프로젝트 - foilum을 이용한 지도 시각화
·
데이터 분석/토이프로젝트
지도 시각화 카카오 맵 api와 '위치명 ' 데이터를 이용하여 위도 경도를 추출한다. foilum 을 이용하여 지도에 마커를 그려준다. #위치정보 가져오기 위치_빈도수 = df['위치'].value_counts( ) 위치_빈도수 Busan 釜山, South Korea 92 Busan, South Korea 82 부산 광안리해수욕장 - 廣安里海水浴場 GwangalliBeach, Busan, South Korea 52 Haeundae, Busan 22 흰여울문화마을 17 .. 부산주당 1 0731커피로스터스 1 수영구 광안동 1 한창정보타운 1 카페밀유 1 Name: 위치, Length: 578, dtype: int64 #등록된 위치정보별 빈도수 데이터 위치_빈도수 = pd.Da..
토이프로젝트 - 워드 클라우드
·
데이터 분석/토이프로젝트
워드클라우드 해쉬태그의 빈도수를 워드 클라우드로 표현해 보자. 먼저 크롤링한 데이터에서 해쉬태그만 불러옵니다. 그리고 빈도수를 확인한후 워드 클라우드로 시각화 합니다. df['해쉬태그'] 0 ['#KPGA', '#시티원골프연습장', '#레슨프로', '#부산', '#부산골프레... 1 [] 2 ['#부산맛집', '#부산밥집', '#food', '#foodstagram', '#... 3 ['#부산맛집', '#신평맛집', '#영진돼지국밥', '#수육백반', '#돼지국밥'] 4 [] ... 2413 ..
ariz1623
코딩의 숲