목록판다스 (5)
초보 개발자의 일기
학원에서 Finishers Boston Marathon 2015, 2016 & 2017 데이터셋으로 데이터 전처리와 시각화방법을 배웠는데요! 캐글에 검색해보니 Boston Marathon 2019 데이터가 있어서 복습도 할 겸 전처리와 시각화를 해보려고 합니다. Finishers Boston Marathon 2015, 2016 & 2017 This data has the names, times and general demographics of the finishers www.kaggle.com Boston Marathon 2019 Analysis of the Boston Marathon 2019 results based on different properties www.kaggle.com 데이터 전처리를..
예시용 df생성 df = pd.DataFrame(np.arange(16).reshape(4,4), index=None, columns=['price', 'qty', 'price', 'qty']) df 새 column 추가하기 마지막에 컬럼 추가 df['name'] = '-' # name 컬럼을 추가한다. df 원하는 위치에 컬럼 추가 예시용 df 생성 컬럼 추가 df.insert(2, 'name', '-', allow_duplicates=False) # 중복허용 안함 df 중복허용을 하지 않으면 같은 이름의 컬럼을 중복 생성할 수 없다. 기본 테이블을 멀티 column, index로 바꾸기 예시용 df생성 멀티 컬럼으로 만들기 import pandas as pd df2 = pd.DataFrame(df1...
변형 예시를 위한 튜플 생성 tuples = list(zip(*[['bar', 'bar', 'baz', 'baz', 'foo', 'foo', 'qux', 'qux'], ['one', 'two', 'one', 'two', 'one', 'two', 'one', 'two']])) tuples [('bar', 'one'), ('bar', 'two'), ('baz', 'one'), ('baz', 'two'), ('foo', 'one'), ('foo', 'two'), ('qux', 'one'), ('qux', 'two')] Multi Index 생성 index = pd.MultiIndex.from_tuples(tuples, names=['first', 'second']) index MultiIndex(levels=..
그룹화 groupby 예시를 위한 데이터프레임 생성 df = pd.DataFrame({'A': ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B': ['one', 'one', 'two', 'three', 'two', 'two', 'one', 'three'], 'C': np.random.randn(8), 'D': np.random.randn(8)} ) df 'A' 열을 기준으로 grouping.sum df.groupby('A').sum() 'A', 'B'열을 기준으로 grouping.sum df.groupby(['A', 'B']).sum() ※ 10 minutes to pandas를 바탕으로 한 학습 기록입니다 ※
병합 데이터프레임 간 결합이나 병합 형태의 연산을 말한다. Concat (데이터 합치기) 예시를 위해 데이터프레임을 생성한다. df = pd.DataFrame(np.random.randn(10, 4)) # 랜덤값으로 예시용 df 생성 df 데이터를 분할한다. pieces = [df[:3], df[3:7], df[7:]] pieces [ 0 1 2 3 0 -0.448821 -1.977129 1.611909 -2.037749 1 2.444068 -1.851920 1.410597 0.031063 2 0.090880 3.285175 -0.362880 -1.425051, 0 1 2 3 3 1.171016 -0.572153 -0.219454 -0.197718 4 0.075812 -0.574685 -0.397964 ..