[Python] 판다스(pandas)_8. 파일 쓰기/읽기 (CSV, EXCEL, JSON)
#정리 #13to_csv - csv파일 작성하기 #csv : ,를 구분자로 하는 파일 #csv 파일 생성 - df_emp.to_csv('pd13a.csv',sep=',') #index,header(column)포함 저장 - df_emp.to_csv('pd13b.csv',sep=',',index=False) #index제거 - df_emp.to_csv('pd13c.csv',sep=',',index=False,header=False) #index,header제거 #전치를 통해 컬럼별로 데이터를 모아둘 수 있다. - df_emp.T.to_csv('pd13d.csv',sep=',',index=False,header=False) #tap(\t)을 구분자로 지정(.tsv)하여 저장할 수 있다. - df_emp.to..
[Python] 판다스(pandas)_7.concatenate - 데이터프레임 병합, groupby - 데이터 그룹바이
#정리 #10concatenate - 데이터프레임 병합 #(넘파이)np.concatenate([df1,df2]) - print(np.concatenate([df1,df2])) - print(np.concatenate([df2,df3],axis=1)) #(판다스)pd.merge(df1,df2) ** inner join 형태는 공통 컬럼(key)가 있을 때, 병합 가능 - print(pd.merge(df1,df2,on='key',how='inner')) #양측 다 있는 key(a,b)로만 조인 - print(pd.merge(df1,df2,on='key',how='outer')) #full outer - print(pd.merge(df1,df2,on='key',how='left')) #left outer (좌..
[Python] 판다스(pandas)_3. 딕셔너리(dict), set_index, indexing, slicing, OrderedDict
#정리 #03dict - 딕셔너리를 활용하여 데이터프레임을 다룬다. #데이터 프레임은 dict 타입으로 생성하며, 데이터는 list,tuple type만 사용 가능, set type X - emp = {'emp_id':[100,101,200,201,300,400], , ,} #전체 데이터 확인 (select * from emp) - print(pd.DataFrame(emp)) # pd.DataFrame(emp).info() : 데이터 정보 확인 - print(pd.DataFrame(emp).info()) #pd.DataFrame(emp).set_index('emp_id') : 컬럼을 인덱스로 지정 : 중복 값이 없어야 한다. - print(pd.DataFrame(emp).set_index('emp_id'..
[Python] 판다스(pandas)_2. 인덱스 변경(reindex)
#정리 #02reindex - 인덱스 재설정, 빈 값 채우기 #기존에 없는 인덱스로 변경: index['A','B','C'] >> index[1,2,3] - 인덱스 변경 뒤, index 매칭이 안되는 데이터는 NaN으로 표기됨. >> col = col.reindex([i for i in range(65,65+5)]) #기존 인덱스의 순서를 변경 :index['A','C','B'] >>index['A','B','C'] - 기존에 있는 인덱스의 순서만 변경되면, 변경된 인덱스 순서에 맞춰 값도 같이 움직인다. - 새로 추가되어 매친되는 값이 없는 인덱스는 데이터가 NaN으로 표기됨. >> col = col.reindex(['A','B','C','D','E']) - fill_value : 새로운 인덱스의 경우..