pandas & numpy
[pandas] DataFrame 원하는 컬럼 추출, astype(),groupby() 사용하기
heeeeh
2019. 5. 10. 23:02
-
data 기본 구조 및 정보 파악하기 (*데이터 출처: SKT big data hub http://www.bigdatahub.co.kr)
- data.info()는 데이터의 기본 정보를 나타냄
- data.describe()는 숫자값을 가지는 컬럼별로 count, mean,std,min, Q1,median,Q3,max 값의 정보를 알려줌
- 개별컬럼의 summary를 보고 싶다면 data.컬럼명.describe()
-
컬럼명(column name)바꾸기
-
원하는 column만 추출하기
- 한 개의 column만 추출 할 때에는 data['컬럼명']
- 두 개 이상의 column을 추출 할 때에는 data[['컬럼명1','컬럼명2',...]]
-
data type 바꾸기
- astype()은 어떤 type이던지 원하는 다른 type으로 바꿔준다
- 원하는 column만 선택하여 그 column에 해당하는 값 계산하기
- 해당 데이터프레임을 일자별, 업종별, 구별로 각 call 수를 sum