ADsP/3과목
3장_1절 데이터 변경 및 요약3
hyerimir
2022. 2. 10. 16:21
4. sqldf 패키지
- R에서 sql 명령어를 사용가능하게 해주는 패키지로 SAS의 proc sql과 같은 기능
- head([df]) -> sqldf('select * from [df] limit 6')
- subset([df], [col] %in% c('BF', 'HF')) -> sqldf('select * from [df] where [col] in ('BF', 'HF')')
- merge([df1], [df2]) -> sqldf('select * from [df1], [df]')
5. plyr 패키지
- apply 함수를 기반으로 데이터와 출력변수를 동시에 배열로 치환하여 처리하는 패키지
- split - apply - combine 방식으로 데이터를 분리하고 처리한 다음, 다시 결합하는 등 필수적인 데이터 처리 기능 제공
6. data.table
- R에서 가장 많이 사용하는 데이터 핸들링 패키지 중 하나로 대용량 데이터의 탐색, 연산, 병합에 유용
- 기존 data.frame 방식보다 월등히 빠른 속도
- 특정 column을 key 값으로 색인을 지정한 후 데이터를 처리
- 빠른 grouping과 ordering, 짧은 문장 지원 측면에서 데이터프레임보다 유용함