4. sqldf 패키지
- R에서 sql 명령어를 사용가능하게 해주는 패키지로 SAS의 proc sql과 같은 기능
- head([df]) -> sqldf('select * from [df] limit 6')
- subset([df], [col] %in% c('BF', 'HF')) -> sqldf('select * from [df] where [col] in ('BF', 'HF')')
- merge([df1], [df2]) -> sqldf('select * from [df1], [df]')
5. plyr 패키지
- apply 함수를 기반으로 데이터와 출력변수를 동시에 배열로 치환하여 처리하는 패키지
- split - apply - combine 방식으로 데이터를 분리하고 처리한 다음, 다시 결합하는 등 필수적인 데이터 처리 기능 제공
6. data.table
- R에서 가장 많이 사용하는 데이터 핸들링 패키지 중 하나로 대용량 데이터의 탐색, 연산, 병합에 유용
- 기존 data.frame 방식보다 월등히 빠른 속도
- 특정 column을 key 값으로 색인을 지정한 후 데이터를 처리
- 빠른 grouping과 ordering, 짧은 문장 지원 측면에서 데이터프레임보다 유용함
'ADsP > 3과목' 카테고리의 다른 글
3장_3절 기초 분석 및 데이터 관리 (0) | 2022.02.11 |
---|---|
3장_2~3절 (0) | 2022.02.10 |
3장_1절 데이터 변경 및 요약2 (0) | 2022.02.10 |
3장_1절 데이터 변경 및 요약1 (0) | 2022.02.10 |
2장_5절 데이터 구조와 데이터 프레임 2-3 (0) | 2022.02.10 |