ADP/실기

DataFrame 기본

hyerimir 2024. 1. 21. 15:52

 

# 라이브러리 불러오기
import pandas as pd

 

# 경로 확인
%pwd
iris_data = pd.read_csv("../data/iris.csv")
# 여기서 ../은 이전 폴더로 가겠다는 것으르 의미한다

iris_data.to_csv('example.csv', header = True, index = False, encoding = 'utf-8-sig')

pd.read_csv('example.csv', encoding = 'utf-8-sig')

 

# DataFrame 요약/통계 정보 확인

iris_data.info()
iris_data.describe()

iris_data['speal length'].min()
iris_data['sepal length'].size()
iris_data[['sepal length']].shape

iris_data['target'].unique()
# 범주형 변수 분포 확인
iris_data['target'].value_counts()
# DataFrame 인덱스 확인, 추가, 리셋
iris_data.index

iris_data.set_index('target', inplace = True)

iris_data.reset_index(inplace = True)

# DataFrame Value 값 확인
iris_data.values[:5]

 

# DataFrame 컬럼명 확인, 변경

iris_data.columns

iris_data.rename({'old1':'new1', 'old2':'new2'}, axis = 1, inplace = True)

# 컬럼명 특정문자 대체
iris_data.columns = iris_data.columns.str.replace('%%', '_')
# DataFrame 컬럼 변수 타입 변경
iris_data.info()

iris_data['sepal_length'] = iris_data['sepal_length'].astype(int)