Notice
Recent Posts
Recent Comments
Link
초보 개발자의 일기
Pandas - Viewing data 본문
데이터 확인
객체 생성 후 데이터를 확인하는 방법이다.
shape
데이터의 모양(틀)을 출력한다.
df.shape # 데이터 프레임에 적용하면 (행,열)이 출력된다.
행이 6개, 열이 4개인 데이터 프레임에 적용하면 아래와 같이 출력된다.
(6, 4)
head()
데이터를 위에서부터 출력한다.
df.head() # 0행부터 출력
- 데이터프레임명.head() 형태로 사용한다.
- 인자를 비워두면 첫번째 0 ~ 4 행이 출력된다.
- 인자를 입력하면 그 수 만큼의 행이 위에서부터 출력된다.
- 행이 6개인 데이터 프레임에 적용하면 왼쪽과 같이 5개의 행만 출력된다.
- 인덱스와 column명이 함께 출력된다.
tail()
데이터를 아래에서부터 출력한다.
df.tail(3) # 마지막 행부터 출력
- head와 같은 형태로 사용한다.
- tail 역시 인자를 비워두면 마지막행을 포함한 5개의 행이 출력된다.
- 인자를 입력하면 그 수 만큼의 행이 위에서부터 출력된다.
index
데이터프레임의 인덱스를 출력한다.
df.index
DatetimeIndex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04',
'2013-01-05', '2013-01-06'],
dtype='datetime64[ns]', freq='D')
columns
데이터프레임의 column(속성)을 출력한다.
df.columns
Index(['A', 'B', 'C', 'D'], dtype='object')
values
데이터프레임 값을 출력(인덱싱하여 출력 가능)한다.
df.values
array([[ 0.37753714, 0.27769328, 0.87042079, 1.53997498],
[ 1.69971219, -0.35337166, -0.54663603, 0.94620926],
[ 0.50779514, -1.25576435, 1.07565613, -0.32989057],
[ 0.18387158, -1.63141258, -0.61084871, 0.6195722 ],
[ 0.17863378, 1.9987923 , -0.42481859, 0.09658842],
[ 1.92958785, 0.0914769 , -0.06137307, -1.72653313]])
T
행(row)과 열(column)을 전환한다.
df.T
sort_index
행 또는 열 기준으로 정렬한다.
df.sort_index(axis=1, ascending=False)
- axis = 1 : 행 기준으로 정렬한다.
- axis = 0 : 열 기준으로 정렬한다.
- ascending = False : 내림차순으로 정렬 (True : 오름차순 정렬)
sort_values
특정 column 기준으로 값을 정렬한다. 정렬기준인자(ascending=True,Fale)를 추가 가능하다.
df.sort_values(by='B', ascending=False)
※ 10 minutes to pandas를 바탕으로 한 학습 기록입니다 ※
'소소한 공부 일기 > 데이터 분석' 카테고리의 다른 글
Pandas - Missing data (0) | 2021.05.08 |
---|---|
Pandas - Selection (0) | 2021.05.08 |
Pandas - Object creation (0) | 2021.05.05 |
NumPy - 선형대수 연산 (0) | 2021.05.05 |
NumPy - ndarray의 정렬 (0) | 2021.05.05 |
Comments