Notice
Recent Posts
Recent Comments
Link
«   2024/11   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
Archives
Today
Total



GitHub Contribution
Loading data ...
관리 메뉴

초보 개발자의 일기

Pandas - Missing data 본문

소소한 공부 일기/데이터 분석

Pandas - Missing data

Da다 2021. 5. 8. 21:46

결측값 처리

결측값은 보통 np.nan으로 표시된다.

아래의 메소드는 대부분 원본을 변경하지 않는다.

df1 = df.reindex(index=dates[0:4], columns=list(df.columns)+['E'])    # 예시를 위한 df 변조
df1

데이터 삽입

df1.loc[dates[0]:dates[1], 'E'] = 1
df1

'E'열에 데이터를 삽입하여 NaN값을 줄인다.

행 삭제

df1.dropna(how='any')    # df1.dropna(axis = 0)와 동일한 결과. 열 기준(axis = 1)도 가능

NaN값이 하나라도 있는 행들을 모두 삭제한다. 

df1.dropna(how='all')로 삭제하면 모두 NaN값인 행을 삭제한다.

NaN값이 있는 자리에 Value 채우기

df1=df1.fillna(value=5)

NaN값이 있는지 확인

pd.isna(df1)

 

 

10 minutes to pandas를 바탕으로 한 학습 기록입니다

'소소한 공부 일기 > 데이터 분석' 카테고리의 다른 글

Pandas - Merge  (0) 2021.05.09
Pandas - Operations  (0) 2021.05.08
Pandas - Selection  (0) 2021.05.08
Pandas - Viewing data  (0) 2021.05.08
Pandas - Object creation  (0) 2021.05.05
Comments