4. sqldf 패키지

- R에서 sql 명령어를 사용가능하게 해주는 패키지로 SAS의 proc sql과 같은 기능

- head([df]) -> sqldf('select * from [df] limit 6')

- subset([df], [col] %in% c('BF', 'HF')) -> sqldf('select * from [df] where [col] in ('BF', 'HF')')

- merge([df1], [df2]) -> sqldf('select * from [df1], [df]')

 

5. plyr 패키지

- apply 함수를 기반으로 데이터와 출력변수를 동시에 배열로 치환하여 처리하는 패키지

- split - apply - combine 방식으로 데이터를 분리하고 처리한 다음, 다시 결합하는 등 필수적인 데이터 처리 기능 제공

 

6. data.table

- R에서 가장 많이 사용하는 데이터 핸들링 패키지 중 하나로 대용량 데이터의 탐색, 연산, 병합에 유용

- 기존 data.frame 방식보다 월등히 빠른 속도

- 특정 column을 key 값으로 색인을 지정한 후 데이터를 처리

- 빠른 grouping과 ordering, 짧은 문장 지원 측면에서 데이터프레임보다 유용함

 

+ Recent posts