# 범주형 변수의 도수분포표, 이원분할표
df_t['survived'].value_counts()
pd.DataFrame(df_t['class'].value_counts())
# 기준이 두 개일때, pd.crosstab()
pd.DataFrame(df_t[['class', 'survived']].value_counts())
pd.crosstab(df_t['class'], df_t['survived'], dropna = True)
# 범주형 변수에 대한 상대도수비율
pd.crosstab(index, columns, dropna = , normalize = )
pd.crosstab(df_t['sex'], df_t['survived'])
pd.crosstab(df_t['sex'], df_t['survived'], normalize = True)
pd.crosstab(df_t['sex'], df_t['survived'], normalize = 'index')
pd.crosstab(df_t['sex'], df_t['survived'], normalize = 'columns')
# 데이터 모양 변경
# 데이터 재구조화(melt)
df_student.info()
# id_vars 자리에 주로 명목형 변수 들어감
melt_st = pd.melt(df_student, id_vars = ['id'], value_vars = ['kor', 'math', 'eng'],
var_name = 'subject', value_name = 'score', ignore_index = True)
# 데이터 재구조화(pivot_table)
pd.pivot_table(melt_st, index = 'id', columns = 'subject', values= 'score')
'ADP > 실기' 카테고리의 다른 글
데이터프레임에 함수 적용 (1) | 2024.01.21 |
---|---|
문자열 변환 (0) | 2024.01.21 |
데이터 정렬, 결합, 요약 (1) | 2024.01.21 |
Row/Column 선택, 추가, 삭제, 조건에 따른 선택 및 삭제 (1) | 2024.01.21 |
DataFrame 기본 (0) | 2024.01.21 |