7.28 왜 read.table() 이 대용량 데이터 입력시 비효율적인가요?

November 7, 2010
By

This post was kindly contributed by Open Statistics with GNU R - go there to comment and to read the full post.

Print PDF 기본적으로 read.table() 은 데이터를 character 형으로 읽어들인 후에 어떤 변수 (variable) 을 numeric 인지 factor 형인지를 구별하고자 합니다. 따라서 용량이 큰 데이터셋인경우에는 많은 양의 메모리와 시간을 필요로 합니다. 이런 비효율성을 피하고자 한다면, colClasse 란 인자의 값을 지정하여 테이블의열이 어떤 데이터형인지를 구분해주시면 됩니다.

Tags:

Comments are closed.