pandas & numpy

[pandas] DataFrame 원하는 컬럼 추출, astype(),groupby() 사용하기

heeeeh 2019. 5. 10. 23:02

data.info()
data.describe()

- data.info()는 데이터의 기본 정보를 나타냄

- data.describe()는 숫자값을 가지는 컬럼별로 count, mean,std,min, Q1,median,Q3,max 값의 정보를 알려줌

- 개별컬럼의 summary를 보고 싶다면 data.컬럼명.describe()

dataframe의 기본적인 형태를 보기 위해 data.head()로 확인

 


  •  컬럼명(column name)바꾸기

컬럼명 한글에서 영어로 바꿈

  • 원하는 column만 추출하기

- 한 개의 column만 추출 할 때에는 data['컬럼명']

- 두 개 이상의 column을 추출 할 때에는 data[['컬럼명1','컬럼명2',...]] 

원하는 column만 추출한 dataframe


  • data type 바꾸기

DataFrame. astype ( dtype ,  copy=True ,  errors='raise' ,  **kwargs )

- astype()은 어떤 type이던지 원하는 다른 type으로 바꿔준다


  • 원하는 column만 선택하여 그 column에 해당하는 값 계산하기

- 해당 데이터프레임을 일자별, 업종별, 구별로 각 call 수를 sum

20180101 부터 20180131까지 일자별, 구별, 업종별 call 수의 합계를 나타내는 dataframe