Notice
Recent Posts
Recent Comments
Link
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
Archives
Today
Total



GitHub Contribution
Loading data ...
관리 메뉴

초보 개발자의 일기

Pandas - Viewing data 본문

소소한 공부 일기/데이터 분석

Pandas - Viewing data

Da다 2021. 5. 8. 17:57

데이터 확인 

객체 생성 후 데이터를 확인하는 방법이다.


shape

데이터의 모양(틀)을 출력한다.

df.shape    # 데이터 프레임에 적용하면 (행,열)이 출력된다.

행이 6개, 열이 4개인 데이터 프레임에 적용하면 아래와 같이 출력된다.

(6, 4)

head()

데이터를 위에서부터 출력한다.

df.head()    # 0행부터 출력

  • 데이터프레임명.head() 형태로 사용한다.
  • 인자를 비워두면 첫번째 0 ~ 4 행이 출력된다.
  • 인자를 입력하면 그 수 만큼의 행이 위에서부터 출력된다.
  • 행이 6개인 데이터 프레임에 적용하면 왼쪽과 같이 5개의 행만 출력된다. 
  •  인덱스와 column명이 함께 출력된다.

tail()

데이터를 아래에서부터 출력한다.

df.tail(3)    # 마지막 행부터 출력

  • head와 같은 형태로 사용한다.
  • tail 역시 인자를 비워두면 마지막행을 포함한 5개의 행이 출력된다.
  • 인자를 입력하면 그 수 만큼의 행이 위에서부터 출력된다.

 


index

데이터프레임의 인덱스를 출력한다.

df.index
DatetimeIndex(['2013-01-01', '2013-01-02', '2013-01-03', '2013-01-04',
                     '2013-01-05', '2013-01-06'],
                     dtype='datetime64[ns]', freq='D')

columns

데이터프레임의 column(속성)을 출력한다.

df.columns 
Index(['A', 'B', 'C', 'D'], dtype='object')

values

데이터프레임 값을 출력(인덱싱하여 출력 가능)한다.

df.values
array([[ 0.37753714, 0.27769328, 0.87042079, 1.53997498],
          [ 1.69971219, -0.35337166, -0.54663603, 0.94620926],
          [ 0.50779514, -1.25576435, 1.07565613, -0.32989057],
          [ 0.18387158, -1.63141258, -0.61084871, 0.6195722 ],
          [ 0.17863378, 1.9987923 , -0.42481859, 0.09658842],
          [ 1.92958785, 0.0914769 , -0.06137307, -1.72653313]])

T

행(row)과 열(column)을 전환한다.

df.T 

 

shape이 (6, 4)였던 데이터 프레임에 적용하면 (4, 6) 형태로 전환된다. 

sort_index

행 또는 열 기준으로 정렬한다.

df.sort_index(axis=1, ascending=False)

 

  • axis = 1 : 행 기준으로 정렬한다.
  • axis = 0 : 열 기준으로 정렬한다.
  • ascending = False : 내림차순으로 정렬 (True : 오름차순 정렬)

 

 

sort_values

특정 column 기준으로 값을 정렬한다. 정렬기준인자(ascending=True,Fale)를 추가 가능하다.

df.sort_values(by='B', ascending=False)

 

 

 

 

 

 

 

 

 

 

10 minutes to pandas를 바탕으로 한 학습 기록입니다

'소소한 공부 일기 > 데이터 분석' 카테고리의 다른 글

Pandas - Missing data  (0) 2021.05.08
Pandas - Selection  (0) 2021.05.08
Pandas - Object creation  (0) 2021.05.05
NumPy - 선형대수 연산  (0) 2021.05.05
NumPy - ndarray의 정렬  (0) 2021.05.05
Comments