ADP/실기

데이터 정렬, 결합, 요약

hyerimir 2024. 1. 21. 16:18

 

df_t.sort_index(axis = 0, ascending = False)
# axis = 0은 행 기준을 의미

df_t.sort_index(axis = 1, ascending = False)
# column 명으로 정렬

df_t.sort_values(by = ['age', 'fare'], ascending = False)
# R과 다른점 : 결합하려는 데이터프레임의 행과 열의 개수가 맞지 않아도, NaN 값이 채워짐

# pd.concat()
# default 값으로 axis = 0이 적용되어, 행 방향으로 데이터프레임 붙임
customer = pd.concat([customer1, customer2]).reset_index(drop = True)

# merge
# 두 데이터프레임에 존재하는 고유값(key)를 기분으로 병합
pd.merge(id_name, id_number, how = 'right', on = 'ID')
# how에 들어갈 수 있는 매개변수 : 'inner', 'outer', 'left', 'right'
df_iris.groupby(['target']).mean()

df_iris.groupby(['target']).mean().reset_index()