목록10 minutes to pandas (9)
초보 개발자의 일기
데이터 선택 Getting 데이터 프레임의 단일 컬럼(column)을 선택하여 Series를 생성한다. ( ↓예시용 데이터 프레임) 열 인덱싱 df['A'] # column 인덱싱 - 인덱스도 함께 출력됨 2013-01-01 -0.824017 2013-01-02 -0.585061 2013-01-03 1.296661 2013-01-04 -1.111253 2013-01-05 0.963859 2013-01-06 -0.778794 Freq: D, Name: A, dtype: float64 행 인덱싱 데이터프레임명[시작행:종료행] : 종료행 이전까지 출력된다. df[0:3] # row 인덱싱 특정 행 값 인덱싱 데이터프레임명[시작행 인덱스 : 종료행 인덱스] : 종료행을 포함하여 출력된다. df['20130102..
데이터 확인 객체 생성 후 데이터를 확인하는 방법이다. shape 데이터의 모양(틀)을 출력한다. df.shape # 데이터 프레임에 적용하면 (행,열)이 출력된다. 행이 6개, 열이 4개인 데이터 프레임에 적용하면 아래와 같이 출력된다. (6, 4) head() 데이터를 위에서부터 출력한다. df.head() # 0행부터 출력 데이터프레임명.head() 형태로 사용한다. 인자를 비워두면 첫번째 0 ~ 4 행이 출력된다. 인자를 입력하면 그 수 만큼의 행이 위에서부터 출력된다. 행이 6개인 데이터 프레임에 적용하면 왼쪽과 같이 5개의 행만 출력된다. 인덱스와 column명이 함께 출력된다. tail() 데이터를 아래에서부터 출력한다. df.tail(3) # 마지막 행부터 출력 head와 같은 형태로 사용..
Series? 행(Row)만 존재하는 1차원 데이터 # pandas.core.series.Series s = pd. Seiries ([1, 3, 5, np.nan, 6, 8]) s[0]을 지정하면 1.0이 출력된다. np.nan의 type은 float으로 지정되어있어 나머지 값들도 자동으로 float64 형태로 지정된다. DataFrame? 행(Row)과 열(Column)이 존재하는 2차원 데이터 df2 = pd.DataFrame({'A':1, 'B':pd.Timestamp('20130102'), #시간 지정 'C':pd.Series(1, index=list(range(4)), dtype='float32'), 'D':np.array([3]*4, dtype='int32'), 'E':pd.Categorica..