# 범주형 변수의 도수분포표, 이원분할표
df_t['survived'].value_counts()
pd.DataFrame(df_t['class'].value_counts())

# 기준이 두 개일때, pd.crosstab()
pd.DataFrame(df_t[['class', 'survived']].value_counts())
pd.crosstab(df_t['class'], df_t['survived'], dropna = True)

# 범주형 변수에 대한 상대도수비율
pd.crosstab(index, columns, dropna = , normalize = )
pd.crosstab(df_t['sex'], df_t['survived'])
pd.crosstab(df_t['sex'], df_t['survived'], normalize = True)
pd.crosstab(df_t['sex'], df_t['survived'], normalize = 'index')
pd.crosstab(df_t['sex'], df_t['survived'], normalize = 'columns')
# 데이터 모양 변경
# 데이터 재구조화(melt)

df_student.info()

# id_vars 자리에 주로 명목형 변수 들어감
melt_st = pd.melt(df_student, id_vars = ['id'], value_vars = ['kor', 'math', 'eng'],
	var_name = 'subject', value_name = 'score', ignore_index = True)
    
# 데이터 재구조화(pivot_table)
pd.pivot_table(melt_st, index = 'id', columns = 'subject', values= 'score')

'ADP > 실기' 카테고리의 다른 글

데이터프레임에 함수 적용  (1) 2024.01.21
문자열 변환  (0) 2024.01.21
데이터 정렬, 결합, 요약  (1) 2024.01.21
Row/Column 선택, 추가, 삭제, 조건에 따른 선택 및 삭제  (1) 2024.01.21
DataFrame 기본  (0) 2024.01.21

+ Recent posts