목록소소한 공부 일기 (25)
초보 개발자의 일기
데이터 확인 객체 생성 후 데이터를 확인하는 방법이다. shape 데이터의 모양(틀)을 출력한다. df.shape # 데이터 프레임에 적용하면 (행,열)이 출력된다. 행이 6개, 열이 4개인 데이터 프레임에 적용하면 아래와 같이 출력된다. (6, 4) head() 데이터를 위에서부터 출력한다. df.head() # 0행부터 출력 데이터프레임명.head() 형태로 사용한다. 인자를 비워두면 첫번째 0 ~ 4 행이 출력된다. 인자를 입력하면 그 수 만큼의 행이 위에서부터 출력된다. 행이 6개인 데이터 프레임에 적용하면 왼쪽과 같이 5개의 행만 출력된다. 인덱스와 column명이 함께 출력된다. tail() 데이터를 아래에서부터 출력한다. df.tail(3) # 마지막 행부터 출력 head와 같은 형태로 사용..
Series? 행(Row)만 존재하는 1차원 데이터 # pandas.core.series.Series s = pd. Seiries ([1, 3, 5, np.nan, 6, 8]) s[0]을 지정하면 1.0이 출력된다. np.nan의 type은 float으로 지정되어있어 나머지 값들도 자동으로 float64 형태로 지정된다. DataFrame? 행(Row)과 열(Column)이 존재하는 2차원 데이터 df2 = pd.DataFrame({'A':1, 'B':pd.Timestamp('20130102'), #시간 지정 'C':pd.Series(1, index=list(range(4)), dtype='float32'), 'D':np.array([3]*4, dtype='int32'), 'E':pd.Categorica..
행렬 내적과 전치 행렬을 구하는 방법이다. A = np.array([[1, 2, 3],# 예시용 행렬 생성 [4, 5, 6]]) B = np.array([[7, 8], [9, 10], [11, 12]]) 행렬 내적 내적이란 2개의 벡터가 서로 얼마나 닮았는지, 얼마나 유사한 방향을 지녔는지를 의미한다. 이 공부가 필요하므로 이후 수정할 예정이다. 자세한 내용이 설명되어있는 링크를 첨부한다. angeloyeo.github.io/2019/08/20/correlation_and_inner_product.html 상관계수는 벡터의 내적이다. - 공돌이의 수학정리노트 angeloyeo.github.io dot_product = np.dot(A, B) print('행렬 내적 결과:\n', dot_product) p..
행렬을 정렬하는 방법이다. sort() org_array = np.array([ 3, 1, 9, 5,7])# 예시 원본행렬 생성 print('원본 행렬:', org_array) 원본 행렬: [3 1 9 5 7] 행렬을 오름차순으로 정렬할 때 np.sort()로 정렬할 경우 객체 자체(원본행렬)는 변경되지 않는다. sort_array1 = np.sort(org_array) print ('np.sort( ) 호출 후 반환된 정렬 행렬:', sort_array1) print('np.sort( ) 호출 후 원본 행렬:', org_array) np.sort( ) 호출 후 반환된 정렬 행렬: [1 3 5 7 9] np.sort( ) 호출 후 원본 행렬: [3 1 9 5 7] ndarray.sort()로 정렬할 경우..
ndarray에서 특정 위치의 값을 추출하는 방법이다. 인덱싱 Indexing 특정 위치의 단일값을 추출한다. # 예시를 들기 위해 1에서 부터 9 까지의 1차원 ndarray 생성 array1 = np.arange(start=1, stop=10) # 10 포함 안함 print('array1:',array1) array1: [1 2 3 4 5 6 7 8 9] index는 0부터 시작한다. 아래 코드의 array1[2]는 3번째 index위치의 데이터 값을 의미한다. value = array1[2] print('value:',value) print(type(value)) value: 3 맨 뒤를 기준으로도 indexing이 가능하다. print('맨 뒤의 값:', array1[-1], ', 맨 뒤에서 두번..
ndarray를 편리하게 생성할 수 있는 방법이다. arange arange 메소드를 이용하면 일일히 값을 입력하지 않아도 쉽게 ndarray를 생성할 수 있다. sequence_array = np.arange(20) print(sequence_array) print(sequence_array.dtype, sequence_array.shape) [ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19] int32 (20,) zeros zeros 메소드를 이용하면 모든 값이 0으로 된 ndarray를 생성할 수 있다. zero_array = np.zeros((3,2)) # default = float print(zero_array) print(zero_array.dtyp..