[Pandas] series 데이터 심플분석 (개수, 빈도 등)
30 Jan 2020 | Pandasseries 함수
size : 개수 반환
shape : 튜플형태로 shape 반환
unique : 유일한 값만 ndarray로 반환
count : NaN을 제외한 개수를 반환
mean : NaN을 제외한 평균
value_counts : NaN을 제외하고 각 값들의 빈도를 반환
이 때 NaN 이란?
Not a Number 숫자가 아닌 것으로 데이터가 누락됐거나 다른 값이 들어와서 대체된 값.
사이즈를 얻어옴.
형태를 튜플로 반환해줌.
중복을 없애고 유일한 값만 반환
NaN값을 제외한 나머지 15개의 값 개수를 반환
NumPy는 NaN이 포함되면 계산을 못하지만
series의 경우는 NaN을 제외하고 나머지 값들에 대해서 평균을 계산함.
value_counts 함수를 통해 각 값의 빈도수를 얻을 수 있다.
이 때 인덱스는 NaN을 제외한 유니크한 값들이 된다.
자주 쓰는 함수니까 기억해둘것!!!
head, tail 함수
head : 상위 n개 출력 –> default : 5개
tail : 하위 n개 출력 –> default : 5개
위 내용은 fastcampus 강의 내용을 정리한 것입니다.
Comments