Notice
Recent Posts
Recent Comments
Link
초보 개발자의 일기
Pandas - Missing data 본문
결측값 처리
결측값은 보통 np.nan으로 표시된다.
아래의 메소드는 대부분 원본을 변경하지 않는다.
df1 = df.reindex(index=dates[0:4], columns=list(df.columns)+['E']) # 예시를 위한 df 변조
df1
데이터 삽입
df1.loc[dates[0]:dates[1], 'E'] = 1
df1
'E'열에 데이터를 삽입하여 NaN값을 줄인다.
행 삭제
df1.dropna(how='any') # df1.dropna(axis = 0)와 동일한 결과. 열 기준(axis = 1)도 가능
NaN값이 하나라도 있는 행들을 모두 삭제한다.
df1.dropna(how='all')로 삭제하면 모두 NaN값인 행을 삭제한다.
NaN값이 있는 자리에 Value 채우기
df1=df1.fillna(value=5)
NaN값이 있는지 확인
pd.isna(df1)
※ 10 minutes to pandas를 바탕으로 한 학습 기록입니다 ※
'소소한 공부 일기 > 데이터 분석' 카테고리의 다른 글
Pandas - Merge (0) | 2021.05.09 |
---|---|
Pandas - Operations (0) | 2021.05.08 |
Pandas - Selection (0) | 2021.05.08 |
Pandas - Viewing data (0) | 2021.05.08 |
Pandas - Object creation (0) | 2021.05.05 |
Comments