pandas 기초 (2)
·
데이터 분석/데이터 분석 기초
데이터 누락 다루기 pandas는 결측치를 numpy.nan 을 사용해서 표기하는데 이는 숫자와 달라 혼동을 피할 수 있다. 또 pandas는 결측치를 탐지하고 보정하는 함수를 제공한다. 결측치는 반드시 삭제하거나 맥락에 맞는 다른 값으로 교체해서 보정해야한다. 결측치 삭제 dropna() 함수는 결측치를 가진 열(axis=0,기본값) 이나 행(axis=1)의 일부 (how="any",기본값) 또는 전체 (how="all")를 삭제하고, '정제된' 데이터 프레임 복사본dmf 반환 한다. 데이터 프레임의 구조자체를 파괴하지 않는 한 결측치만 제거할 수는 없다.. nan_alco Beer Wine Spirits Water State South Carolina 1.36 0.24 0.77 NaN South Da..