ADP/실기

문자열 변환

hyerimir 2024. 1. 21. 17:43

 

# 인덱싱
# 시리즈.str[:n] : 문자열 인덱스로 추출

import pandas as pd
import numpy as np

df_sejong = pd.read_csv('../../data/'  .csv')
df_sejong.drop(columns = 'Unnamed: 0', inplace = True)

df_sejong['시군구'].str[0:7]

# 앞자리만 추출
df_sejong['시'] = df_sejong['시군구'].str[0:7]
# 분할 - expand = True로 데이터프레임으로 가져옴
df_sejong_split = df_sejong['시군구'].str.split(" ", expand = True)

# 시작, 끝, 포함 글자 인식
df.str.startswith("시작글자")
df.str.endswith("끝글자")
df.str.contains("포함글자")
# 정수타입으로 변환
df_off['거래금액(만원)'] = df_off['거래금액(만원)'].str.replace(",", "")
df_off['거래금액(만원)'] = df_off['거래금액(만원)'].astype(int)