2.1 Variations on read.table

November 23, 2010
By

This post was kindly contributed by Open Statistics with GNU R - go there to comment and to read the full post.

Print PDF 2.1 Variations on read.table read.table은 사각형 격자 형태의 데이터를 읽기 위한 가장 편리한 방법입니다. 다양한 가능성 때문에, read.table 기능을 하는 다른 다양한 기능들이 존재하지만, 이러한 기능들은 단지 몇 개의 디폴트 지정만 달리한 것입니다. 주의할 점은 read.table은 대용량 수치 행렬을 읽기에는 비효율적인 방법이라는 점입니다. 보다 자세한 내용은 다음에 나올 scan을 참고하십시오. 몇 개의 중요한 사항은 다음과 같습니다. 1. Encoding 만약 파일에 ASCII 형태가 아닌 문자 변수들이 포함되어 있다면, 그것이 제대로 부호화 되어 읽어졌는지 반드시 확인해야 합니다. 이것은 주로 UTF-8 locale에서 Latin-1 파일을 읽는 것과 관련된 문제인데, 이것은 아래와 같은 방법으로 해결할 수 있습니다.   read.table(file(“file.dat”, encoding=”latin1″))   중요한 것은 Latin-1으로 표현된 모든 locale에 대해 이 방법을 사용할 수 있다는 점입니다. 2. Header line 우리는 여러분들에게 헤더를 분명하게 표기하라고 권하고 싶습니다. 전통적으로 헤더에는 행 이름 대신 열 이름들만 들어가 있었는데, 그래서 하나의 변수가 다른 것들에 비해 길이가 짧습니다(만약 R이 이것을 판단할 수 있으면, header = TRUE로 세팅 할 것입니다). 만약에, 어떤 파일이 행 이름에 대한(입력이 되지 않았을 수 있는) 헤더 변수를 포함한다면, 아래와 같은 방법으로 이 파일을 읽을 수 있습니다.   read.table(“file.dat”, header = TRUE, row.names = 1) 열 이름들은 col.names을 사용해서 따로 정의될 수 있으며, 따로 정의된 이름은 헤더(만약 존재한다면)에 대해 우선합니다. 3. Separator   보통은 파일을 보면 파일에 [...]

Tags:

Comments are closed.